Новий штучний інтелект від Meta дозволить перетворювати текст у відео

Генеральний директор Meta Марк Цукерберг представив нову версію штучного інтелекту Make-a-Video, яка дозволяє перетворювати текст на відео. Це оновлення системи Make-a-Scene, що раніше могла перетворювати текст лише у фото.

Функціонально Video працює так само як і Scene. Система покладається на поєднання обробки природної мови та генеративних нейронних мереж для перетворення невізуальних описів у зображення. Фактично, вона просто генерує контент в іншому форматі.

Наразі відео тривають не більше п’яти секунд і не містять звуку, але охоплюють величезний спектр підказок. Хоча зрозуміло, що відео згенеровані комп’ютером, якість таких моделей штучного інтелекту швидко покращиться в найближчому майбутньому.

Для навчання моделі дослідникам потрібно було вивчити, як виглядає світ і як його описують парні набори даних текст-зображення, а також дослідити, як рухається світ, використовуючи відео.

«Створювати відео набагато складніше, ніж фотографії, тому що крім правильної генерації кожного пікселя, система також повинна передбачити, як вони будуть змінюватися з часом», — прокоментував розробку генеральний директор Meta, Марк Цукерберг.

На думку розробників, такі інструменти для створення відео можуть бути неоціненними для творців і художників.

Джерело: MC.Today

465
CASES
Україна, Київ