La Chine poursuit son ascension fulgurante dans le domaine de l’intelligence artificielle (IA), jusqu’à remettre en question la suprématie des entreprises américaines telles que OpenAI, Google et Microsoft. 🤖⚡Dernièrement, deux acteurs chinois, Alibaba et DeepSeek, ont dévoilé des modèles d’IA chinoises prometteurs, capables de rivaliser avec les meilleures solutions occidentales, et ainsi pris de court la Silicon Valley. LabSense revient pour vous sur leurs principales caractéristiques et les enjeux que ces nouveaux concurrents apportent sur le marché. 🔍📊
DeepSeek R1 fait trembler la Silicon Valley
La semaine dernière, DeepSeek a marqué un grand coup avec son modèle DeepSeek R1. Ce dernier a atteint la 7ᵉ place sur Chatbot Arena en quelques jours et pris la première place des applications IA les plus téléchargées sur l’App Store américain, surpassant même ChatGPT. Son succès fulgurant a provoqué une onde de choc à Wall Street, entraînant une baisse de capitalisation boursière de plus de 1 000 milliards de dollars pour des entreprises comme Nvidia et Microsoft.
Avantages des modèles DeepSeek
Code librement accessible
DeepSeek propose des modèles open source comme V3 et R1. Contrairement à ChatGPT, qui repose sur des modèles propriétaires comme o1, cela signifie que leur code est librement accessible, même si les données d’entraînement restent privées. Six modèles dérivés (1,5B, 7B, 8B, 14B, 32B, 70B) sont disponibles en accès libre.
Coûts réduits
L’API DeepSeek serait 96,4 % moins chère que celle d’OpenAI (0,55 $ contre 15 $ pour un million de tokens en entrée). Une réduction qui pourrait démocratiser encore plus l’usage des LLM. De plus, selon la start-up, l’entraînement de DeepSeek-R1 aurait coûté moins de 6 millions de dollars, contre plusieurs milliards pour OpenAI et son architecture très optimisée a permis de réduire encore plus les dépenses de développement et d’exploitation. Cette disproportion entre les budgets de développement nourrit toutefois des débats.
Capacités avancées de raisonnement
L’entreprise a développé DeepSeek-R1-Zero, un modèle basé sur l’apprentissage par renforcement (RL) à grande échelle, sans ajustement fin supervisé (SFT). Ce modèle présente des capacités de raisonnement remarquables, mais souffre de problèmes de lisibilité et de mélanges linguistiques.
Pour améliorer ces performances, la start-up introduit DeepSeek-R1, qui utilise un entraînement en plusieurs étapes et des données de démarrage à froid avant le RL. Avec une architecture de 671 milliards de paramètres, celui-ci active seulement 37 milliards de paramètres lors de la plupart des opérations.
En termes de performances, DeepSeek-R1 surpasse ou égalise les résultats des versions o1-1217 et o1-mini dans la plupart des benchmarks. De plus, la version distillée DeepSeek-R1-Distill-Qwen-32B dépasse o1-mini sur divers benchmarks, tout en étant proposée à un coût inférieur pour les développeurs.
Un plus pour l’environnement ?
Avec une efficacité énergétique potentiellement 75% supérieure à celle de ses concurrents, DeepSeek pourrait aider à réduire l’empreinte écologique de l’IA. Cependant, selon l’Agence Internationale de l’Énergie1, cette optimisation pourrait au contraire accélérer l’adoption massive de l’IA et entraîner une hausse globale de la consommation énergétique, un phénomène connu sous le nom d’effet rebond (paradoxe de Jevons2).
NB : Tous les chiffres cités dans ce passage proviennent des documents de recherche de DeepSeek et sont en attente d’une validation par une tierce partie.
ChatGPT vs DeepSeek : le récap’ des performances
- Qualité des réponses ✨: ChatGPT privilégie des réponses détaillées et argumentées, DeepSeek propose plus de points, mais plus concis.
- Accès aux informations en temps réel 🌍: DeepSeek nécessite une activation manuelle de la recherche, ChatGPT l’active automatiquement.
- Créativité 🎨: DeepSeek produit des textes plus longs mais moins fluides et expressifs que ChatGPT.
- Censure 🚫: DeepSeek évite les sujets sensibles liés à la Chine.
- Fiabilité et vitesse⚡: DeepSeek rencontre des ralentissements dus à une forte demande, contrairement à ChatGPT qui reste plus stable.
DeepSeek Janus-Pro-7B : un pas vers l’IA multimodale
DeepSeek ne s’arrête pas là. L’entreprise développe Janus-Pro-7B, dévoilé le 27 janvier 2025, un modèle multimodal capable de générer à la fois texte et images, visant à concurrencer DALL-E 3 d’OpenAI.
Le Janus-Pro-7B se démarque clairement parmi les modèles existants, affichant des résultats prometteurs. En tant que modèle le plus imposant de la série Janus Pro, il offre des variantes dont le nombre de paramètres s’étend de 1 à 7 milliards. En outre, bien que sa taille soit relativement modeste comparée à d’autres modèles tels que GPT-4 ou DALL-E 3, le Janus-Pro-7B démontre des performances intéressantes, sans toutefois bouleverser le domaine pour le moment. Il a néanmoins surpassé des modèles bien établis comme DALL-E 3 et Stable Diffusion XL dans des tests sur des benchmarks reconnus, tels que GenEval et DPG-Bench3, notamment en matière de production d’images détaillées et cohérentes.
Qwen2.5-Max : la réponse d’Alibaba aux LLM occidentaux
De son côté, Alibaba a dévoilé ce 29 janvier 2025 Qwen2.5-Max, un modèle d’IA entraîné sur plus de 20 000 milliards de données. Présenté comme plus performant que GPT-4 d’OpenAI et Claude-3.5-Sonnet d’Anthropic, il présente déjà des avantages qu’il est difficile d’ignorer.
Les points forts de Qwen2.5-Max
- Haute performance : rivalise avec les meilleures IA du marché, démontrant des performances impressionnantes lors de tests de référence sur des plateformes telles qu’Arena-Hard, LiveBench et MMLU-Pro
- Coût réduit : également plus économique que certaines solutions occidentales
- Compatibilité API : accessible aux développeurs via le cloud d’Alibaba et intégration facile dans les écosystèmes existants
Cette accessibilité renforce son potentiel de déploiement massif, en particulier sur le marché asiatique. Qwen2.5-Max est désormais disponible pour les développeurs via le cloud d’Alibaba et peut être utilisé à travers Qwen Chat, l’agent conversationnel de la plateforme.
L’émergence des IA chinoises redéfinit le paysage numérique
Les États-Unis en alerte
L’émergence rapide de ces alternatives chinoises presse Washington, qui a investi des milliards de dollars dans le développement de l’IA. De plus, certains acteurs du secteur tech américain, comme Meta et Nvidia, ont même mis en place des war rooms pour analyser l’enjeu posé par les IA chinoises. Ces modèles, performants mais développés avec des coûts moindres, pourraient remettre en question la domination des géants américains du numérique.
Dans ce climat de compétition, des accusations de plagiat ont émergé. OpenAI a récemment allégué que DeepSeek avait utilisé des parties de ses propres modèles pour former ses systèmes d’IA. Bien que ces accusations ne soient pas prouvées, elles révèlent les tensions croissantes dans ce secteur en pleine explosion.
Une opportunité pour l’Europe ?
Tandis que les États-Unis voient leur suprématie technologique contestée, l’Europe pourrait bien y trouver une opportunité. Certains experts estiment que les avancées chinoises prouvent que développer une IA compétitive avec des moyens limités est possible, ouvrant ainsi la voie aux startups européennes comme Mistral AI et Aleph Alpha.
Les questions de censure et de protection des données
DeepSeek stocke ses données sur des serveurs situés en Chine, ce qui soulève de sérieuses inquiétudes en matière de confidentialité. En effet, la loi chinoise permet aux autorités d’accéder librement à ces données, ce qui pose un risque majeur pour les entreprises européennes et américaines. Certains pays de l’UE, comme l’Irlande, enquêtent déjà sur leur conformité au RGPD, tandis que l’Italie aurait déjà interdit l’application par le biais de l’organisme équivalent italien de la CNIL.
Toutefois, grâce à son code open source, DeepSeek peut être déployé sur des serveurs privés et sécurisés. Certaines entreprises, comme la start-up américaine Perplexity, intègrent déjà DeepSeek tout en garantissant le stockage des données en Europe ou aux États-Unis. Dans cette même optique, LabSense travaille aussi activement à son intégration sécurisée sur sa plateforme SaaS Allready.😉
La course à l’IA se poursuit
Ainsi, les IA chinoises ne sont plus de simples alternatives, mais des challengers crédibles face aux solutions américaines. Leur progression rapide pourrait redéfinir la course mondiale à l’intelligence artificielle, forçant les entreprises occidentales à réagir. L’Europe, quant à elle, devra trouver une stratégie pour tirer profit de cette nouvelle dynamique tout en garantissant la sécurité des données et la conformité aux réglementations, et ainsi se démarquer de ses concurrents.
Alors que des acteurs comme Alibaba et DeepSeek émergent avec des solutions innovantes 🚀, il est essentiel pour les entreprises occidentales de s’adapter et de réagir face à cette nouvelle réalité. Dans ce contexte, LabSense se positionne comme un partenaire stratégique incontournable. Avec plus de 10 ans d’expérience en R&D 🔬 et une expertise reconnue dans l’analyse et la génération de contenus basés sur l’IA, LabSense vous offre des solutions sur mesure pour optimiser votre présence en ligne et tirer parti des données disponibles. Ne laissez pas la concurrence vous distancer et contactez-nous ! ✉️
Et vous ?
*Réalisé avec AllReady, la solution IA de LabSense