La startup chinoise d’IA DeepSeek a publié vendredi la version préliminaire de son dernier modèle, DeepSeek-V4, et l’a rendu open source simultanément, 15 mois après le lancement de son modèle DeepSeek-V3 de génération précédente.
La nouvelle version perpétue la réputation de DeepSeek en matière de rapport coût-performance tout en ajoutant la prise en charge des puces développées au niveau national, y compris les processeurs Ascend de Huawei, dans une démarche considérée comme renforçant l’écosystème informatique indépendant de l’IA de la Chine et remettant en question la domination de Nvidia dans le secteur.
Huawei a annoncé plus tard que, grâce à une coordination étroite entre les technologies de modèle et de puce, sa gamme complète de supernodes Ascend prend désormais en charge la série DeepSeek V4. Les produits Ascend A2, A3 et 950 sont compatibles avec les modèles DeepSeek V4-Flash et DeepSeek V4-Pro.
Selon DeepSeek, la série V4 étend la longueur du contexte de 128 000 jetons à 1 million de jetons, ce qui représente une capacité de traitement presque décuplée et permet des tâches à contexte long plus avancées.
La société a déclaré que DeepSeek V4-Pro a atteint le plus haut niveau parmi les modèles open source actuellement disponibles et fonctionne à égalité avec les principaux systèmes fermés dans plusieurs domaines. Il a mis en évidence des gains majeurs dans les capacités des agents, permettant au modèle de mieux gérer les tâches en plusieurs étapes et basées sur des outils.
