Модели преобразования текста в видео уже существуют, но ни одна из них не работает так хорошо, как Sora от OpenAI
OpenAI, разработчики ChatGPT, не дремлют и работают над все новыми и новыми инструментами искусственного интеллекта. Теперь они представили новую модель преобразования текста в видео Sora.
По словам представителей (
официальный сайт)Sora предназначена для создания «реалистичных и фантазийных сцен» из одного запроса.
Самое большое отличие от других моделей преобразования текста в видео, очевидно, заключается в точном представлении контента, который постоянно меняется в большинстве видеороликов ИИ на сегодняшний день.
Sora: реалистичные видео в мгновение ока
Что может Sora?Последнее достижение OpenAI, Sora, обещает произвести революцию в понимании искусственным интеллектом физического мира — или, по крайней мере, продвинуть его на целый шаг вперед.
Благодаря возможности создавать сцены с несколькими людьми, различными типами движения и детализированными объектами, Sora выделяется среди других платформ искусственного интеллекта.
Это момент «святого дерьма» в искусственном интеллекте 🤯
OpenAI только что запустил Sora, ИИ, который может создавать гиперреалистичные видеоролики из одних только текстовых подсказок.
В 2024 году будет практически невозможно отличить ИИ от настоящего.
(THREAD 🧵) 1/13 pic.twitter.com/QMlg2j2wXC
— Barsee 🐶 (@heyBarsee) February 16, 2024
Не только подсказки: помимо подсказок, пользователи могут загружать неподвижные изображения, расширять существующие видео или добавлять недостающие кадры. Созданные видеоролики отличаются удивительно естественной подачей, хотя при ближайшем рассмотрении все же можно заметить некоторую долю фальши.
Неидеально: OpenAI открыто решает некоторые проблемы, которые все еще остаются у Sora. Так, ИИ может путать левое и правое, не может правильно смоделировать физику некоторых объектов и не совсем корректно отображает некоторые последовательности реакций.
Хороший пример того, как функция преобразования текста в видео работала не так хорошо, можно увидеть здесь:
даже ошибки соры завораживают pic.twitter.com/OvPSbaa0L9
— Charlie Holtz (@charliebholtz) February 15, 2024
OpenAI серьезно относится к этим проблемам и планирует работать с группой отраслевых экспертов (Red Teamers
) для оценки потенциальных рисков. Их цель — убедиться, что Sora не генерирует ложную информацию и не содержит ненавистного контента или предвзятости. Соответственно, для отклонения запросов, нарушающих рекомендации, введена текстовая классификация
Когда я смогу использовать Sora?Пока нет даты запуска ИИ «текст-видео». Как только мы что-то узнаем, мы сообщим вам.
Написанию подсказок для таких ИИ нужно учиться. Почему бы вам не взглянуть на эту статью:
А теперь ваша очередь: что вы думаете о новом ИИ «текст в видео» от OpenAI? Вы с нетерпением ждете появления этого инструмента или у вас есть опасения? Что именно вас беспокоит? Будете ли вы использовать Sora, когда она выйдет? И какое видео вы бы создали в первую очередь? Может быть, вы даже сможете использовать Sora на профессиональном уровне? Дайте нам знать в комментариях ниже: