Modely pro převod textu na video již existují, ale žádný z nich nefunguje tak dobře jako Sora od OpenAI
OpenAI , vývojáři stojící za ChatGPT, nespí a pracují na dalších a dalších nástrojích umělé inteligence. Nyní představili nový model převodu textu na video Sora.
Podle (oficiálních webových stránek)Sora je navržena tak, aby vytvářela „realistické a nápadité scény“ z jediného podnětu.
Největší rozdíl oproti ostatním modelům převodu textu na video spočívá jednoznačně v přesné reprezentaci obsahu, který se ve většině dosavadních videí s umělou inteligencí neustále mění.
Sora: Realistická videa v mžiku oka
Co umí Sora?Nejnovější počin umělé inteligence OpenAI, Sora, slibuje revoluci v chápání fyzického světa umělou inteligencí – nebo přinejmenším posun o celý krok vpřed.
Schopností vytvářet scény s více osobami, různými typy pohybu a detailními objekty se Sora odlišuje od ostatních platforem umělé inteligence.
Toto je „holy shit“ moment umělé inteligence 🤯.
Společnost OpenAI právě uvedla na trh Soru, umělou inteligenci, která dokáže vytvářet hyperrealistická videa pouze na základě textových pokynů.
V roce 2024 bude téměř nemožné rozeznat umělou inteligenci od skutečné.
(THREAD 🧵) 1/13 pic.twitter.com/QMlg2j2wXC
– Barsee 🐶 (@heyBarsee) 16. února 2024
Nejen výzvy: Kromě výzev mohou uživatelé také nahrávat statické snímky, rozšiřovat stávající videa nebo si nechat přidat chybějící snímky. Vygenerovaná videa se vyznačují pozoruhodně přirozeným podáním, i když při bližším zkoumání je stále patrná jistá míra falešnosti.
Není dokonalé: OpenAI otevřeně řeší některé problémy, které Sora stále má. V souladu s tím může umělá inteligence zaměňovat levou a pravou stranu, nedokáže správně simulovat fyziku některých objektů a nezobrazuje správně některé sekvence reakcí.
Dobrý příklad, kdy funkce převodu textu na video fungovala méně dobře, můžete vidět zde:
i chyby sory jsou fascinující pic.twitter.com/OvPSbaa0L9
– Charlie Holtz (@charliebholtz) February 15, 2024
OpenAI bere tyto výzvy vážně a plánuje spolupracovat s týmem odborníků z oboru (Red Teamers
) na posouzení možných rizik. Jejich cílem je zajistit, aby Sora negenerovala falešné informace a neobsahovala nenávistný obsah nebo předsudky. V souladu s tím je zavedena klasifikace textu, která odmítá žádosti porušující pokyny.
Kdy mohu Soru používat?Datum spuštění UI pro převod textu na video zatím nebylo stanoveno. Jakmile něco zjistíme, dáme vám vědět.
Popisování výzev pro takové UI je třeba se naučit. Proč se nepodíváte na tento článek:
Teď je řada na vás: Co si myslíte o nové umělé inteligenci pro převod textu na video od společnosti OpenAI? Těšíte se na tento nástroj, nebo máte obavy? Jaké obavy by to měly být? Budete nástroj Sora používat, až bude vydán? A jaké video byste vytvořili jako první? Dokázali byste snad Soru používat i profesionálně? Dejte nám vědět v komentářích níže: