Openai a publié mardi Sora 2, son modèle de génération vidéo le plus avancé à ce jour, aux côtés d’une application sociale de style Tiktok qui permettra aux utilisateurs de s’insérer dans des scènes créées par AI à travers une fonctionnalité intitulée « Cameos ».
L’entreprise derrière Chatgpt a décrit la version comme un saut majeur en avant dans la capacité de l’IA à créer une vidéo réaliste.
Le système peut désormais générer un dialogue synchronisé, des effets sonores et un mouvement physiquement précis, selon la société.
« Sora 2 peut faire des choses exceptionnellement difficiles – et dans certains cas, carrément impossibles – pour les modèles de génération de vidéos antérieurs », a déclaré Openai, pointant des exemples comme la capture de routines olympiques de gymnastique ou de mouvements de basket-ball.
Contrairement aux systèmes antérieurs qui « transformeraient les objets et déformeraient la réalité » pour réaliser des invites de texte, Sora 2 suit mieux la physique du monde réel, a déclaré la société.
Sora 2 remplace Sora l’année dernière et représente la dernière salve de la course aux armements de l’IA qui a commencé par le lancement de Chatgpt en 2022.
Dans la génération de vidéos, Openai fait face à une concurrence rigide de Google, de la piste AI et de MidJourney, qui offrent toutes des applications qui peuvent produire de courts clips en quelques secondes – des outils qui sont célébrés ou craints comme remplacements potentiels pour le contenu créé par l’homme.
Peut-être plus surprenant que Sora 2 lui-même est l’application sociale autonome, Sora.
La plate-forme permettra aux utilisateurs d’apparaître dans des vidéos générées par AI-AI avec ce que OpenAI appelle « une fidélité remarquable » de l’apparence et de la voix.
« Nous pensons qu’une application sociale construite autour de cette fonctionnalité » Cameos « est la meilleure façon de découvrir la magie de Sora 2 », a déclaré la société.
L’application est actuellement disponible par invitation uniquement aux États-Unis et au Canada.
Le générateur vidéo Sora 2 sera initialement gratuit avec des «limites généreuses», bien que l’utilisation soit limitée par la pénurie de puissance de calcul nécessaire pour la génération de vidéos.
Sur l’application, les utilisateurs peuvent partager leurs créations dans un flux similaire à Tiktok ou Instagram Reels.
Meta, qui possède Instagram, a ajouté la semaine dernière son propre flux vidéo AI appelé « vibrations » pour encourager les utilisateurs à expérimenter la génération d’images sur son application META AI.
La libération rapide des outils d’IA de plus en plus puissants intervient au milieu des préoccupations croissantes concernant la prolifération du contenu généré par l’IA et le bilan environnemental de la puissance de calcul massive requise pour la créer.
OpenAI a également reconnu le débat en cours sur l’impact des médias sociaux sur la santé mentale – y compris les inquiétudes quant à la « condamnation, à la dépendance et à l’isolement » – et a déclaré qu’elle mettait en œuvre des garanties comme les contrôles de bien-être des utilisateurs et les contrôles de contenu.
