Des modèles texte-vidéo existent déjà, mais aucun n’a encore fonctionné aussi bien que Sora d’OpenAI.
OpenAI , les développeurs derrière ChatGPT, ne dorment pas et travaillent sur toujours plus d’outils d’IA. Ils viennent de présenter Sora, un nouveau modèle de text-to-vidéo.
Selon le (site officiel)Sora doit générer des « scènes réalistes et imaginatives » à partir d’une seule invite.
La plus grande différence par rapport aux autres modèles de text-to-vidéo réside clairement dans la représentation précise du contenu, qui était jusqu’à présent en constante évolution dans la plupart des vidéos d’IA.
Sora : des vidéos réalistes en un clin d’œil
Sora, la dernière réalisation d’OpenAI en matière d’IA, promet de révolutionner la manière dont l’intelligence artificielle comprend le monde physique, ou du moins de faire un pas en avant.
En permettant de créer des scènes avec plusieurs personnes, différents types de mouvements et des objets détaillés, Sora se démarque des autres plateformes d’IA.
C’est le moment « holy shit » de l’IA 🤯
OpenAI vient de lancer Sora, une IA capable de créer des vidéos hyperréalistes à partir de simples invites textuelles.
Il sera quasiment impossible de dire la différence entre l’IA et le réel en 2024.
(THREAD 🧵) 1/13 pic.twitter.com/QMlg2j2wXC
– Barsee 🐶 (@heyBarsee) February 16, 2024
Pas seulement des messages-guides : les utilisateurs peuvent télécharger des images fixes en plus des messages-guides, étendre des vidéos existantes ou faire compléter des cadres manquants. Les vidéos générées se distinguent par un rendu remarquablement naturel, même si un certain degré de fausseté est toujours perceptible en y regardant de plus près.
Pas parfait : OpenAI aborde ouvertement certains problèmes que Sora rencontre encore. Ainsi, l’IA peut confondre la gauche et la droite, ne pas simuler correctement la physique de certains objets et ne pas représenter correctement certaines séquences de réaction.
Un bon exemple dans lequel la fonction texte/vidéo a moins bien fonctionné est présenté ici:
even the sora mistakes are mesmerizing pic.twitter.com/OvPSbaa0L9
– Charlie Holtz (@charliebholtz) February 15, 2024
OpenAI prend ces défis au sérieux et prévoit de collaborer avec une équipe d’experts du secteur (Red Teamers
) afin d’évaluer les risques potentiels. Leur objectif est de s’assurer que Sora ne génère pas de fausses informations et qu’il est exempt de contenus haineux ou de préjugés. En conséquence, une classification des textes sera mise en place pour rejeter les demandes qui ne respectent pas les directives.
Quand pourrai-je utiliser Sora ? Pour l’instant, nous n’avons pas encore de date de lancement pour l’IA text-to-vidéo. Dès que nous en saurons plus, nous vous en parlerons.
L’écriture d’invites pour de telles IA s’apprend. N’hésitez pas à consulter cet article:
À vous de jouer : que pensez-vous de la nouvelle IA text-to-vidéo d’OpenAI ? Vous réjouissez-vous déjà de cet outil ou avez-vous des craintes ? Quelles sont ces préoccupations ? Utiliserez-vous Sora lorsqu’il sera disponible ? Et quel genre de vidéo vous créeriez en premier lieu ? Pourriez-vous même utiliser Sora à des fins professionnelles ? N’hésitez pas à nous le dire dans les commentaires!