Новая модель создает видео с аудио, реалистичной физикой и интеграцией людей.

Компания OpenAI анонсировала Sora 2, обновленную модель искусственного интеллекта для генерации видео, которая теперь поддерживает создание реалистичного звукового сопровождения, устраняя недостатки предыдущей версии и конкурируя с разработками Google, в частности моделью Veo 3, сообщили в компании.

Sora 2 получила функцию синхронизации аудио, позволяющую генерировать диалоги и фоновые звуки, которые гармонично сочетаются с видеорядом. Модель также улучшила воспроизведение физических движений, устранив деформации объектов и нелогичные действия, например, точно моделируя спортивные трюки. Новая функция «камео» позволяет добавлять реальных людей в видео на основе их коротких аудио- или видеозаписей, сохраняя естественность голоса и движений.

OpenAI запустила мобильное приложение Sora для iOS, которое позволяет создавать, редактировать и распространять видео со смартфона с инструментами защиты контента, в частности возрастными ограничениями. Доступ к приложению ограничен США и Канадой, работает по приглашениям (каждый пользователь может пригласить четырех человек).

Версии для Android пока нет. Sora 2 бесплатна с ограничениями, а подписчики ChatGPT Pro получат доступ к расширенной версии Sora 2 Pro.

