Le PDG de NVIDIA, Jensen Huang, interagit avec un petit robot sur scène lors de la conférence NVIDIA GPU Technology Conference (GTC) au SAP Center de San Jose, Californie, États-Unis, 18 mars 2025. / Reuters

Le PDG de NVIDIA, Jensen Huang, a présenté les dernières progrès de l’intelligence artificielle (IA) de l’entreprise lors de sa conférence annuelle de développeurs à San Jose, en Californie, visant à solidifier sa position dans un marché en évolution rapide. Les annonces, couvrant de nouvelles puces, des solutions de réseautage et des cadres robotiques, ont souligné la poussée de Nvidia pour répondre aux demandes croissantes d’une formation et d’une inférence efficaces sur l’IA.

Huang a présenté l’unité de traitement graphique Blackwell Ultra (GPU), définie pour la libération dans la seconde moitié de 2025, mettant l’accent sur sa capacité de mémoire élargie pour prendre en charge les modèles d’IA plus importants. Cependant, les produits Blackwell actuels sont confrontés à des retards de fabrication en raison d’un défaut de conception compliquant son déploiement alors que les changements de l’industrie se concentrent de la formation des systèmes d’IA à les déployer pour des tâches d’inférence du monde réel.

NVIDIA a également introduit le système informatique Vera Rubin, qui combine un processeur conçu sur mesure avec des GPU de nouvelle génération pour surpasser l’architecture Blackwell. Prévu pour le lancement à la fin de 2026, Vera Rubin sera suivie de la Vera Rubin Ultra en 2027 et de l’architecture Feynman en 2028.

Nommé d’après l’astronome pionnier Vera Rubin, le système cible les charges de travail Hyperscale AI, avec des vitesses de transfert de données ChIP à puce améliorées critiques pour les modèles complexes.

Jensen Huang livre le discours d'ouverture de Nvidia à San Jose, États-Unis, 18 mars 2025. / Reuters

Pour les développeurs, NVIDIA a dévoilé des ordinateurs AI personnels DGX alimentés par Blackwell Ultra et construits par des partenaires comme Dell, HP et Lenovo. Les systèmes de bureau visent à rivaliser avec les appareils grand public haut de gamme, permettant l’inférence locale de grands modèles. « Voilà à quoi devrait ressembler un PC », a fait remarquer Huang, tenant une carte mère pendant la présentation.

Les mises à jour logicielles comprenaient Dynamo, un outil gratuit pour accélérer le raisonnement de l’IA et Isaac GR00T N1, un cadre robotique avec un modèle à double système « Fast and Slow Thinking ». Développé avec Google Deepmind et Disney Research, GR00T N1 intègre Newton, un moteur de physique open source pour la simulation de robot avancée.

Malgré les affirmations confiantes de Huang selon lesquelles Nvidia reste « bien positionnée » pour la transition de l’IA vers des charges de travail lourdes de l’inférence, le scepticisme des investisseurs a persisté. Les actions ont chuté de 3,4% après la présentation, reflétant les préoccupations concernant la concurrence et les retards. Huang a rejeté les doutes, faisant valoir que l’IA agentique et les tâches motivées pour le raisonnement pourraient nécessiter « 100 fois plus de calcul » que prévu précédemment.

(Avec la contribution des agences)