Инструмент, который готов составить конкуренцию Sora от OpenAI, способен создавать двухминутные ролики в 4К.
Подразделение Google DeepMind, отвечающее за разработки в области искусственного интеллекта, представило Veo 2. Это новая версия основанного на ИИ генератора видео от Google. По заявлению компании, инструмент может создавать видеоролики в разрешении 4K (4096 × 2160 пикселей) продолжительностью до двух минут. Таким образом, он в четыре раза превосходит Sora от OpenAI по разрешению и в шесть раз — по продолжительности видео.
Как работает Veo 2
Veo 2, как и предыдущая версия, генерирует видео по текстовым подсказкам пользователя, которые можно сопровождать изображениями. По сравнению с первой версией ИИ-сервиса новая модель лучше понимает физику объектов, а у создаваемых изображений более высокая чёткость. Кроме того, в новой версии разработчики усовершенствовали механизмы движения виртуальной камеры.
Скриншот: Google Blog / Skillbox Media
А ещё Veo 2 более реалистично моделирует движение (например, при создании видео, где кофе наливают в чашку) и свойства света (тени и отражения). Кроме того, ИИ-инструмента получается довольно правдоподобно имитировать различные линзы на виртуальной камере и кинематографические эффекты при создании видео.
Скриншот: Google Blog / Skillbox Media
В Google также уверяют, что новая модель гораздо меньше страдает галлюцинациями: у объектов гораздо реже появляются дополнительные пальцы или другие неожиданные детали. Но на демовидео с дрифтующим автомобилем можно заметить, что дорога при ближайшем рассмотрении получилась очень гладкой, пешеходы сливаются друг с другом, а у некоторых фасадов домов вид противоречит законам физики.
Veo 2 обучили на огромном количестве роликов — в Google не уточнили, какие источники для этого использовались, но одним из них, вероятно, был YouTube. Чтобы снизить риск возникновения дипфейков, в Veo 2 встроили систему SynthID — невидимую маркировку генерируемых видео.
Пока в тестовом формате
Сегодня, увы, пока нет возможности оценить видео в 4К от Veo 2. Опробовать ИИ-инструмент в деле в деле можно лишь на экспериментальной площадке VideoFX, где разрешение ограничено 720 пикселями, а длина видео — 8 секундами. В то же время генератор видео Sora от OpenAI может создавать видео в 1080p и длиной до 20 секунд.
Стоит также отметить, что для тест-драйва Veo 2 на VideoFX необходимо записаться в список ожидания, хотя Google пообещала на этой неделе расширить аудиторию для тестирования. В перспективе Veo 2 появится на платформе для бизнес-пользователей Vertex AI, но точные сроки в Google не указали.