Esistono già modelli di video-testo, ma nessuno ha funzionato bene come Sora di OpenAI
OpenAI , gli sviluppatori di ChatGPT, non dormono e stanno lavorando a sempre più strumenti di intelligenza artificiale. Ora hanno presentato il nuovo modello text-to-video Sora.
Secondo il sito ufficiale di ()Sora è progettato per creare “scene realistiche e fantasiose” a partire da un singolo prompt.
La differenza più grande rispetto ad altri modelli text-to-video risiede chiaramente nella rappresentazione precisa del contenuto, che è stato in costante mutamento nella maggior parte dei video AI fino ad oggi.
Sora: video realistici in un batter d’occhio
Cosa può fare Sora? L’ultimo risultato dell’AI di OpenAI, Sora, promette di rivoluzionare il modo in cui l’intelligenza artificiale comprende il mondo fisico – o almeno di fargli fare un passo avanti.
Con la capacità di creare scene con più persone, diversi tipi di movimento e oggetti dettagliati, Sora si distingue dalle altre piattaforme di AI.
Questo è il momento “holy shit” dell’IA 🤯
OpenAI ha appena lanciato Sora, un’intelligenza artificiale in grado di creare video iperrealistici partendo da semplici indicazioni testuali.
Nel 2024 sarà quasi impossibile distinguere l’IA dalla realtà.
(THREAD 🧵) 1/13 pic.twitter.com/QMlg2j2wXC
– Barsee 🐶 (@heyBarsee) 16 febbraio 2024
Non solo prompt: oltre ai prompt, gli utenti possono anche caricare immagini fisse, estendere video esistenti o aggiungere fotogrammi mancanti. I video generati sono caratterizzati da una presentazione straordinariamente naturale, anche se un certo grado di falsità è ancora visibile a un esame più attento.
Non perfetto: OpenAI affronta apertamente alcuni dei problemi che Sora ancora presenta. Di conseguenza, l’IA può confondere la destra e la sinistra, non riesce a simulare correttamente la fisica di alcuni oggetti e non rappresenta correttamente alcune sequenze di reazioni.
Un buon esempio in cui la funzione text-to-video ha funzionato meno bene può essere visto qui:
anche gli errori di sora sono ipnotici pic.twitter.com/OvPSbaa0L9
– Charlie Holtz (@charliebholtz) February 15, 2024
OpenAI prende sul serio queste sfide e intende lavorare con un team di esperti del settore (Red Teamers
) per valutare i potenziali rischi. L’obiettivo è garantire che Sora non generi informazioni false e sia privo di contenuti di odio o di pregiudizi. Di conseguenza, viene introdotta una classificazione del testo per rifiutare le richieste che violano le linee guida.
Quando posso usare Sora? Non c’è ancora una data di lancio per l’AI text-to-video. Non appena scopriremo qualcosa, ve lo comunicheremo.
La scrittura dei messaggi per queste IA deve essere appresa. Perché non date un’occhiata a questo articolo:
Ora tocca a voi: cosa ne pensate della nuova AI text-to-video di OpenAI? Non vedete l’ora di utilizzare questo strumento o avete dei dubbi? Quali sarebbero le preoccupazioni? Utilizzerete Sora quando verrà rilasciato? E quale tipo di video creereste per primo? Potreste utilizzare Sora a livello professionale? Fatecelo sapere nei commenti qui sotto: