Блог

Runway анонсує GEN-2 — нейромережу для перетворення тексту у відео

20/3/23

Штучний інтелект, який перетворює текст на зображення, є дуже популярним, але перетворення тексту на відео ще чекає свого часу.

Головна ідея цієї технології полягає в тому, що ви можете ввести опис і створити відповідне відео в будь-якому зручному стилі.

Хоча сучасні можливості ще не відповідають цій мрії, для тих, хто цікавиться прогресом технологій, нова модель створення відео з штучним інтелектом Runway (анонсована тут) заслуговує на увагу.

Runway пропонує веб-редактор відео, який спеціалізується на таких інструментах штучного інтелекту, як видалення фону та визначення пози.

Компанія допомогла розробити модель Stable Diffusion із відкритим вихідним кодом для перетворення тексту в зображення, а також анонсувала свою першу модель редагування відео Gen-1 (у лютому).

Gen-1 зосереджувався на трансформації наявного відеоматеріалу, дозволяючи користувачам вводити грубу 3D-анімацію або тремтливий кліп зі смартфона та застосовувати згенероване штучним інтелектом накладання.

Gen-2, для порівняння, має на меті створення відео з нуля, хоча є багато застережень, на які слід звернути увагу.

Зокрема, демонстраційні ролики, якими ділиться Runway, короткі, нестабільні та, звичайно, не фотореалістичні, а доступ обмежений.

Зараз ми можемо оцінити лише демонстраційний ролик Gen-2 та кілька кліпів (більшість із яких вже рекламувалися як частина Gen-1).

Відео штучного інтелекту, створене за допомогою Gen-2 із підказкою «Око крупним планом»
Відео, створене штучним інтелектом за допомогою підказки «Зйомка гірського пейзажу з повітря»
Відео, створене штучним інтелектом за допомогою підказки «Захід сонця через вікно в квартирі в Нью-Йорку»

Тим не менш, результати захоплюючі, а перспектива використання штучного інтелекту для перетворення тексту на відео — обіцяє як нові творчі можливості, так і нові загрози для дезінформації.

Також варто порівняти роботу Runway з дослідженнями перетворення тексту на відео, якими поділилися гіганти, такі як Meta та Google.

Робота цих компаній є більш просунутою (їхні кліпи, згенеровані штучним інтелектом, довші та згуртованіші), але залишається питання про величезні ресурси, що витрачаються на ці дослідження (команда Runway складається лише з 45 осіб).

Іншими словами, стартапи продовжують виконувати захоплюючу роботу в галузі генеративного штучного інтелекту, включаючи ще недосліджену територію перетворення тексту на відео. Незабаром очікуйте більше відео, створених штучним інтелектом.

Усі статті