La startup de l’intelligence artificielle chinoise (IA) Deepseek a créé un buzz parmi les amateurs d’IA avec sa sortie d’une mise à niveau vers son modèle phare, à savoir Deepseek-V3.1, jeudi.
La société a déclaré que le nouveau modèle peut fonctionner plus rapidement que le modèle précédent et est optimisé pour les puces de fabrication chinoise.
Le Deepseek-V3.1 présente une structure d’inférence hybride qui permet au modèle de fonctionner dans les modes de raisonnement et de non-relance, a indiqué la société dans un poste WeChat jeudi.
Les utilisateurs peuvent basculer entre ces modes à l’aide d’un bouton « pensée profonde » sur l’application et la plate-forme Web officielles de l’entreprise, qui exécutent désormais la version V3.1.
Le consensus des critiques initiaux est très positif, beaucoup considèrent le modèle comme un puissant concurrent des IA de haut niveau de niveau fermé.
Le modèle est loué pour ses capacités de raisonnement supérieur et de résolution de problèmes, en particulier en mathématiques et en codage. Dans plusieurs tests, il a montré une capacité impressionnante pour décomposer des tâches complexes et générer du code fonctionnel, y compris la création de jeux et d’applications simples à partir de zéro.
Deepseek a secoué le monde de la technologie cette année lorsqu’il a publié des modèles d’IA qui rivalisent avec les Western comme le chatppt d’Openai avec des coûts opérationnels nettement inférieurs. Le nouveau modèle a suivi cette tradition rentable. Ses capacités sont considérées comme une alternative viable et plus abordable pour les développeurs et les utilisateurs qui souhaitent des performances élevées sans le prix élevé de certains modèles commerciaux.
Pour le support des puces domestiques, Deepseek a déclaré que dans un poste WeChat, son format de précision UE8M0 FP8 du modèle Deepseek-V3.1 est optimisé pour « les puces domestiques de nouvelle génération qui seront bientôt publiées ».
FP8, ou point flottant 8 bits, est un format de traitement des données qui permet aux modèles d’IA de fonctionner plus efficacement, en utilisant moins de mémoire tout en fonctionnant plus rapidement que les méthodes traditionnelles.
L’entreprise n’a pas identifié quels modèles ou fabricants de puces spécifiques seraient pris en charge.
L’accent mis sur la compatibilité des puces domestiques peut signaler que les modèles d’IA de Deepseek sont positionnés pour travailler avec l’écosystème de semi-conducteur émergent de la Chine.
(Avec entrée de Reuters)
