Modele zamiany tekstu na wideo już istnieją, ale żaden nie działał tak dobrze jak Sora od OpenAI
OpenAI , deweloperzy stojący za ChatGPT, nie śpią i pracują nad coraz większą liczbą narzędzi AI. Teraz zaprezentowali nowy model text-to-video Sora.
Według (oficjalna strona)Sora została zaprojektowana do tworzenia „realistycznych i pomysłowych scen” z pojedynczej podpowiedzi.
Największa różnica w porównaniu z innymi modelami przetwarzania tekstu na wideo wyraźnie polega na precyzyjnej reprezentacji treści, która do tej pory była w ciągłym ruchu w większości filmów AI.
Sora: Realistyczne filmy w mgnieniu oka
Co potrafi Sora? Najnowsze osiągnięcie OpenAI w dziedzinie sztucznej inteligencji, Sora, obiecuje zrewolucjonizować sposób, w jaki sztuczna inteligencja rozumie świat fizyczny – a przynajmniej zrobić krok naprzód.
Dzięki możliwości tworzenia scen z wieloma osobami, różnymi rodzajami ruchu i szczegółowymi obiektami, Sora wyróżnia się na tle innych platform AI.
This is the „holy shit” moment of AI 🤯
OpenAI właśnie uruchomiło Sora, sztuczną inteligencję, która może tworzyć hiperrealistyczne filmy wideo na podstawie samych poleceń tekstowych.
W 2024 roku prawie niemożliwe będzie odróżnienie sztucznej inteligencji od prawdziwej.
(THREAD 🧵) 1/13 pic.twitter.com/QMlg2j2wXC
– Barsee 🐶 (@heyBarsee) 16 lutego 2024
Nie tylko podpowiedzi: Oprócz podpowiedzi użytkownicy mogą również przesyłać zdjęcia, rozszerzać istniejące filmy lub dodawać brakujące klatki. Wygenerowane filmy charakteryzują się niezwykle naturalną prezentacją, nawet jeśli przy bliższym przyjrzeniu się można dostrzec pewien stopień fałszu.
Nieidealne: OpenAI otwarcie odnosi się do niektórych problemów, z którymi wciąż boryka się Sora. W związku z tym SI może mylić lewą i prawą stronę, nie może poprawnie symulować fizyki niektórych obiektów i nie reprezentuje poprawnie niektórych sekwencji reakcji.
Dobry przykład, w którym funkcja text-to-video działała gorzej, można zobaczyć tutaj:
nawet błędy sory są hipnotyzujące pic.twitter.com/OvPSbaa0L9
– Charlie Holtz (@charliebholtz) February 15, 2024
OpenAI traktuje te wyzwania poważnie i planuje współpracować z zespołem ekspertów branżowych (Red Teamers
) w celu oceny potencjalnych zagrożeń. Ich celem jest zapewnienie, że Sora nie generuje fałszywych informacji i jest wolna od nienawistnych treści lub stronniczości. W związku z tym wprowadzono klasyfikację tekstu w celu odrzucenia żądań, które naruszają wytyczne.
Kiedy mogę korzystać z Sory? Nie ma jeszcze daty uruchomienia sztucznej inteligencji tekst-wideo. Jak tylko się czegoś dowiemy, damy ci znać.
Pisania podpowiedzi dla takich SI trzeba się nauczyć. Zapoznaj się z tym artykułem:
Teraz twoja kolej: co sądzisz o nowej sztucznej inteligencji tekst-wideo od OpenAI? Cieszysz się na to narzędzie czy masz obawy? Jakie to mogą być obawy? Czy będziesz używać Sory, gdy zostanie wydana? Jaki rodzaj wideo stworzyłbyś jako pierwszy? Czy mógłbyś nawet używać Sora profesjonalnie? Daj nam znać w komentarzach poniżej: