Sora 2 взорвала интернет — нейросеть уже называют новым «ИИ-ТикТоком». Она умеет создавать максимально реалистичные видео, а также переносить цифровые аватары людей в любые ситуации и локации.
В этой статье разберем, в чем особенность нейросети, как работает технология «камео» и как пользоваться Sora 2 в России. А также протестируем возможности нейросети на десяти реальных задачах.
Нейросеть Sora 2 — что это
Sora — генеративная модель от OpenAI (создателей ChatGPT), которая преобразует текстовый запрос в короткий видеоролик.
Первая версия Sora появилась в 2024 году и сразу поразила реалистичными результатами. Однако доступ к ИИ был закрытым, в основном нейросеть применяли блогеры и режиссеры.
30 сентября вышла новая версия Sora, которая объединяет несколько моделей OpenAI. Они анализируют запрос, формируют сцену, задают движение и освещение. Картинка максимально приближена к кино: нейросеть понимает контекст, выстраивает композицию и удерживает цельность сюжета.
Раньше нейросети ограничивались генерацией отдельных кадров, но Sora 2 умеет создавать полноценные сцены с естественной физикой движения и согласованным аудио. Новая модель открывает большие возможности для контент-мейкеров, дизайнеров и предпринимателей и берет на себя функции целой студии.
Как выглядит соцсеть Sora
Вместе с нейросетью Sora для создания видео OpenAI запустила собственную платформу-соцсеть. Это лента коротких ИИ-роликов, которые можно лайкать, комментировать, пересылать друзьям и «ремиксить». То есть пользователи могут взять чужой ролик за основу, немного подкорректировать его и опубликовать свою версию.
Буквально за первый день после релиза приложение стало лидером среди бесплатных программ в американском App Store:
За первые 48 часов нейросеть Sora 2 установили примерно 164 тысячи раз, опередив по скачиваниям конкурентов вроде Google Gemini и даже ChatGPT от OpenAI.
Sora напоминает приложение ТикТок только с ИИ-контентом. После входа открывается простой интерфейс: здесь есть лента рекомендаций, вкладка поиска и уведомлений. А создать видео можно по клику на плюс:
Вы можете написать запрос и получить готовое видео примерно через 3 минуты. Также можно залить сразу несколько вариантов одного видео, они будут доступны в нейросети, если листать текущее видео вправо.
У Sora есть десктопная версия. Здесь можно создать ролик, введя промпт в специальном окне на вкладке drafts или под видео других авторов:
Функции «камео» в нейросети Sora 2
Именно «камео» выделяет Sora среди других нейросетей. Функция позволяет записать образец своей внешности и голоса, после чего ИИ начинает генерировать ролики с вашим участием. Это могут быть сцены с вами в главной роли или коллаборации с другими персонажами.
Чтобы создать свой ИИ-аватар, нужно кликнуть на кнопку добавить Cameo, которая появляется над строкой промпта:
Затем нейросеть Sora 2 попросит записать короткое видео и повторить нужные цифры. После чего вы сможете:
- генерировать видео с собой в любой ситуации;
- разрешать другим пользователям использовать ваш аватар (или запретить в настройках);
- задавать индивидуальные параметры, например, «не участвую в сценах с насилием».
Когда аватар готов, его можно использовать прямо в промпте для Sora, добавив упоминание профиля. Помимо, личного аватара можно создавать видео и с другими людьми. Например, сам Сэм Альтман, сооснователь и генеральный директор OpenAI, разрешил добавлять видео с ним:
Это работает как тег в соцсетях: нужно написать в запросе, что делает персонаж, и система сгенерирует видео с его участием:
Хозяин «камео» видит уведомления обо всех роликах с его образом и может удалять нежелательные публикации.
В первые дни большая часть роликов внутри нейросети Sora оказалась «камео»-контентом. Даже с ошибками в озвучке или мимике аватары легко узнаваемы, а возможность примерять разные эмоции, стили и сценарии сделали функцию вирусной.
Однако система не всегда корректно копирует лица и интонации: иногда появляется ощущение «зловещей долины» — образ похож, но выглядит неестественно.
Еще одно важное условие — создать образ реального человека без его согласия невозможно: он должен сам должен зарегистрироваться в Sora и активировать функцию.
Как использовать Sora 2 в России
Официально сервис доступен только в США и Канаде. Тем не менее существуют способы обойти этот барьер и получить доступ даже за пределами указанных стран.
Войти в Sora можно:
1. Через сайт sora.chatgpt.com (нужен IP-адрес США или Канады). Но доступ к сайту открывается только после получения инвайта.
2. Через iOS-приложение Sora by OpenAI. К сожалению, приложения на Android пока нет.
Чтобы скачать приложение из App Store, достаточно сменить страну на США на вашем устройстве. Для этого в настройках нажмите на ваше Имя → Контент и покупки → Страна и регион.
Далее вместо ввода карты можно выбрать любой штат и адрес для выставления счета:
Регистрация в нейросети Sora 2 пока проходит по инвайтам. После визита в приложение пользователи получают коды и могут делиться ими с другими людьми. Вы можете получить код:
- В Telegram-группе N2D2 под этим постом;
- на сайте.
3. Через подписку ChatGPT и сторонние сервисы. Доступ к Sora есть у пользователей платных версий ChatGPT.
Вы также можете использовать нейросеть через другие сервисы, которые открывают доступ к ИИ-сервисам. Например, в GPTunneL можно сгенерировать видео в Sora 2 Pro по 37.5 рублей за штуку.
10 промтов и примеров работ Sora 2
1. Нативная реклама продукта Jivo в стиле «Дьявол носит Прада»
Нейросеть хорошо справилась с задачей, точно передала фразу, а также добавила немного текста от себя. Однако можно заметить, что планшет или бумаги в руках начальницы выглядят немного странно:
Нас огорчило, что нейросеть Sora для создания видео так и не смогла изобразить героев из фильма «Дьявол носит Прада». Мы пытались 3 раза, но сервис отказался делать видео по более конкретным промптам про фильм, поскольку такие ролики нарушают авторское право.
При этом в приложении есть другие ролики по фильмам, мультфильмам и аниме. Возможно, в этот раз мы попросили передать персонажа слишком близко к оригиналу, и поэтому нейросеть не стала генерировать такие ролики.
2. Тренд «норм или стрем» для соцсетей ветклиники.
С первой попытки девушка получилась живая и правдоподобная, а вот кот был похож на игрушку, совсем не шевелил глазами и телом, и у него не хватало одной лапы.
Мы попробовали этот промпт снова, тогда Sora 2 успешно справилась с задачей: и девушка, и кот получились правдоподобными. Правда, ударение от нейросети, как всегда, подкачало. Такого произношения слова «Вискас» мы не ожидали 🙂
Плюс, в конце девушка четко не произнесла «стрем», возможно, наш сценарий не уложился в 10 секунд. Такие ограниченные лимиты — большой минус нейросети.
3. Тренд на интервью по поводу одежды
Sora справилась хорошо, хоть и немного переиначила текст на свой лад, но это не портит основную идею видео:
4. Реклама тура на Мальдивы
Нейросеть Sora 2 справилась успешно и выполнила все инструкции в промпте. Правда, кадры выглядят слишком неестественными:
Также у нейросети проблемы с русским текстом, она странно написала многие буквы. Лучше просить нейросеть не отображать слова на экране, а самостоятельно добавить нужный текст в другом видеоредакторе.
5. Видео с другим человеком (cameo)
Представьте, если Bill Peebles, директор Sora, вдруг решит прорекламировать зубную щетку. С новой нейросетью это вполне возможно.
Видео довольно кринжовое, взгляд мужчины неискренне-радостный, а щетка смотрится смешно:
Интересно, что изначально мы хотели сделать видео с другим cameo от Bill Peebles — маленьким мальчиком, который получает подарок:
Но после трех попыток нейросеть так и не выдала нужный результат. Все видео получались лишь со взрослым Bill Peebles.
6. Реклама в стиле фильма-катастрофы
Здесь сервис снова справился хорошо и точно передал фразу. Но перекати-поле вышли довольно странными, как и логотип Jivo, который нейросеть исказила.
7. Тренд о постоянном клиенте
Мы решили обыграть известный в соцсетях тренд о постоянном клиенте, который настолько подружился с руководством и сотрудниками компании, что его уже не воспринимают как посетителя. В подобных роликах клиенты ведут себя неформально, сами заходят за стойку и оплачивают свои покупки.
Ролик получился хорошим, однако из-за ограничения в 10 секунд речь героев вышла слишком торопливой. Также очень явно считывается работа ИИ по жестам, движениям, поведению героев. Сотрудники и клиент выглядят слишком радостными, в итоге теряется естественность видео. Особенно странно выглядит конец, когда девушка вместо оплаты покупки наклоняет монитор.
8. Видео для товара на маркетплейсе
Этот ролик мы сделали в GPTunnel, который тоже открывает доступ к Sora 2. Видео получилось качественным. Его вполне можно было бы использовать для рекламы товара на маркетплейсах, если удалить странный закадровый шум.
9. Видео с рекламой автосервиса
Мы попросили нейросеть сделать видео без надписей, поскольку она часто допускает ошибки в текстах на русском языке. В итоге получился неплохой ролик, но слишком «торопливый» из-за ограничения в 10 секунд. Этот лимит сильно мешает, в конце ролика нейросеть даже съела часть фразы:
10. Тренд с подкастами
Здесь мы решили обыграть еще одну популярную рубрику — подкасты. Нейросеть снова выдала качественный результат и успешно справилась с задачей:
Но логотип Jivo снова получился не таким, как в оригинале. У Sora вообще проблема с логотипами: мы присылали нейросети файл с исходником лого, но она исказила его.
Мы попробовали вставить корректный логотип несколько раз, но нейросеть не слушалась, поэтому пришлось отказаться от этой затеи.
Главное о работе в нейросети для создания видео Sora 2
- Нейросеть Sora 2 — это отличное решение для создания реалистичных видео. Она хорошо передает движения, интонации и голос человека, так, что в большинства случаев персонажи смотрятся естественно.
- Sora 2 простая в использовании: достаточно ввести нужный вам промпт и подождать пару минут, чтобы получить качественный результат. При этом необязательно писать подробный запрос и расписывать сцены покадрово, нейросеть хорошо считывает идею и сама достраивает нужные действия в видео.
- Хотя в интернете часто пишут, что нейросеть Sora 2 может копировать сцены из фильма, в нашем случае система отказалась это делать.
- Сервис лагает, например, мы попросили сделать видео по промпту, но Sora 2 не сгенерировала видео, а просто удалила промпт.
- Нейросеть Sora 2 не застрахована от галлюцинаций. Например, во время подготовки одного из видео она зачем-то развернула экран ноутбука в другую сторону.
- Нейросеть плохо перерисовывает логотипы, она почти не может вставить их правильно.
- Десять секунд на одно видео — очень мало, многое не влезает в кадр, а слова персонажей обрезаются.
- Пока наилучшее применение нейросети для компаний — это создание мемов. Можно сгенерировать смешное видео по популярному тренду и разместить его как в самой Sora, так и в других социальных сетях.