Google DeepMind запускає Veo 3.1 з покращеними функціями аудіо та текстур
Google DeepMind анонсувала вихід нової версії своєї моделі генерації відео Veo 3.1, що порадує користувачів підвищеною якістю зображення, вдосконаленими текстовими підказками і більш реалістичним відтворенням текстур.
Ключові зміни у Veo 3.1, яка стала частиною оновлення Flow — інструменту для створення відео на базі штучного інтелекту, включають інтеграцію аудіо у всі його функції. Тепер, завдяки можливостям Ingredients to Video, Frames to Video та Extend, користувачі можуть збагачувати свої відео звуковою атмосферою, що забезпечує кінематографічнішу подачу. З моменту запуску всього п’ять місяців тому Flow вже згенерував понад 275 мільйонів роликів.
Окрім цього, Flow отримав нові можливості для редагування — функції Insert та Remove, що полегшують додавання або видалення елементів у відео без помітних слідів монтажу. Модель Veo 3.1 тепер доступна через Gemini API, Vertex AI для бізнесу та у додатку Gemini.
Цей розвиток є частиною загальної тенденції до інтеграції штучного інтелекту в творчі процеси, дозволяючи не лише зменшити час на виробництво контенту, але і підвищити його якість. Хоча раніше застосування Veo у відеорекламі нібито спричинило неоднозначну реакцію серед фанатів Тейлор Свіфт через чутки про її використання, прямих доказів цього не було.
| Функція | Опис |
|---|---|
| Ingredients to Video | Додавання звукової атмосфери до відео |
| Frames to Video | Звукове супроводження при переході між кадрами |
| Extend | Розширення сцен зі збереженням звукової атмосфери |
| Insert | Додавання нових об’єктів чи персонажів |
| Remove | Видалення зайвих елементів з автоматичним відновленням фону |




