L’intelligence artificielle (IA) est devenue de plus en plus capable de générer du texte, des images et des vidéos. Mais l’IA peut-elle comprendre comment fonctionne le monde physique ?
Les chercheurs de l’Académie d’intelligence artificielle de Pékin (BAAI) estiment que cela pourrait constituer l’une des prochaines frontières majeures du développement de l’IA.
Lors de la 8e conférence de l’Académie d’IA de Pékin lancée vendredi, BAAI a dévoilé Physis-v0.1, qu’elle décrit comme le premier modèle de fondation mondial général au monde.
Contrairement aux grands modèles linguistiques qui apprennent principalement des modèles à partir du texte, les modèles mondiaux sont conçus pour apprendre et prédire le comportement du monde réel.
Les chercheurs affirment que de tels systèmes pourraient aider les applications d’IA à comprendre les lois physiques, les relations spatiales et les connaissances de bon sens tout en intégrant des informations provenant de sources multiples, notamment des textes, des images et des vidéos.
L’objectif est de construire un modèle du fonctionnement du monde. Tout comme les humains construisent des modèles mentaux pour anticiper la façon dont les objets bougent, interagissent ou se cassent, les modèles du monde visent à permettre aux systèmes d’IA de prédire ce qui pourrait se passer ensuite et de prendre des décisions basées sur une compréhension des causes et des effets.

Wang Zhongyuan, président de BAAI, a déclaré que les systèmes d’IA actuels sont encore confrontés à des limitations importantes lorsqu’ils sont déployés dans des environnements réels.
Par exemple, les humains peuvent instinctivement juger si un objet est fragile ou reconnaître les dangers potentiels dans leur environnement, tandis que les robots ont souvent du mal à accomplir de telles tâches.
Les chercheurs affirment que ce défi devient de plus en plus important à mesure que l’IA dépasse les applications numériques pour s’étendre à la robotique et à d’autres contextes du monde réel. Ils considèrent l’IA incarnée et la robotique comme l’un des domaines d’application les plus critiques pour les modèles mondiaux.
Wang a déclaré que la demande future devrait également augmenter dans des domaines tels que la recherche scientifique, la simulation et les jumeaux numériques, où les systèmes d’IA doivent modéliser des processus complexes du monde réel avant d’agir.

Les experts du secteur estiment que les avancées dans les modèles mondiaux pourraient marquer une nouvelle phase dans le développement de l’IA. Alors que les grands modèles linguistiques ont transformé la façon dont les machines traitent l’information, les modèles mondiaux visent à aider l’IA à raisonner et à interagir avec le monde lui-même.
Andrew Barto, lauréat du prix Turing et professeur émérite à l’Université du Massachusetts à Amherst, a déclaré que la combinaison des capacités informatiques de l’apprentissage par renforcement profond avec une connaissance croissante des systèmes de récompense du cerveau pourrait contribuer à stimuler la prochaine vague de progrès en matière d’IA.
La conférence a réuni des chercheurs, des leaders de l’industrie de l’IA et de jeunes scientifiques pour discuter de sujets tels que les modèles mondiaux, les agents d’IA, l’intelligence incorporée et la sécurité de l’IA.
