La startup chinoise d'IA DeepSeek a mis à jour son modèle phare d'IA V3 et a supprimé la mention du réseau de neurones raisonneur R1 dans le chatbot. C'est ce qu'écrit le SCMP.
La société a annoncé le lancement de V3.1 sur WeChat. La mise à jour étend la fenêtre contextuelle du modèle à 128 000 tokens, lui permettant de conserver plus d'informations lors des interactions avec l'utilisateur. Ce volume correspond à un livre d'environ 300 pages.
Il est également noté une grande efficacité dans l'utilisation des jetons.
Données : X. Dans le benchmark Aider Polyglot, évaluant les LLM dans la résolution de tâches de programmation complexes dans plusieurs langues, DeepSeek V3.1 surpasse Claude 4 Opus.
DeepSeek V3.1 bat Claude 4 Opus sur Aider Polyglot
Cela en fait le meilleur modèle de codage non-TTC et tout cela pour environ 1 $ pic.twitter.com/QyJZnVRdVK
— Lisan al Gaib (@scaling01) 19 août 2025
V3.1 maintient un équilibre entre la vitesse et la qualité de génération. Elle contient 685 milliards de paramètres et repose sur une architecture hybride, offrant des performances élevées dans les tâches de dialogue, de raisonnement et de programmation.
DeepSeek a supprimé la mention de R1 dans la fonction de pensée profonde. Dans le SCMP, il a été suggéré que cela pourrait indiquer des difficultés dans le développement de la version R2 attendue.
La startup IA DeepSeek a attiré l'attention en janvier avec le lancement de son modèle R1, axé sur le raisonnement. Il a démontré une grande efficacité avec peu d'investissements, suscitant des doutes parmi les experts quant à la nécessité d'injections de milliards dans le secteur de l'IA et à l'inflation de l'industrie.
Rappelons qu'en juin, une startup chinoise a commencé à recruter des stagiaires pour marquer des données médicales afin d'améliorer l'application de l'intelligence artificielle dans les hôpitaux.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
DeepSeek a lancé un nouveau modèle IA V3.1
La startup chinoise d'IA DeepSeek a mis à jour son modèle phare d'IA V3 et a supprimé la mention du réseau de neurones raisonneur R1 dans le chatbot. C'est ce qu'écrit le SCMP.
La société a annoncé le lancement de V3.1 sur WeChat. La mise à jour étend la fenêtre contextuelle du modèle à 128 000 tokens, lui permettant de conserver plus d'informations lors des interactions avec l'utilisateur. Ce volume correspond à un livre d'environ 300 pages.
Il est également noté une grande efficacité dans l'utilisation des jetons.
V3.1 maintient un équilibre entre la vitesse et la qualité de génération. Elle contient 685 milliards de paramètres et repose sur une architecture hybride, offrant des performances élevées dans les tâches de dialogue, de raisonnement et de programmation.
DeepSeek a supprimé la mention de R1 dans la fonction de pensée profonde. Dans le SCMP, il a été suggéré que cela pourrait indiquer des difficultés dans le développement de la version R2 attendue.
La startup IA DeepSeek a attiré l'attention en janvier avec le lancement de son modèle R1, axé sur le raisonnement. Il a démontré une grande efficacité avec peu d'investissements, suscitant des doutes parmi les experts quant à la nécessité d'injections de milliards dans le secteur de l'IA et à l'inflation de l'industrie.
Rappelons qu'en juin, une startup chinoise a commencé à recruter des stagiaires pour marquer des données médicales afin d'améliorer l'application de l'intelligence artificielle dans les hôpitaux.