Компанія Nvidia представила нейромережу, що генерує відео за текстовим описом
Американська компанія Nvidia розробила нейромережу під назвою «VideoLDM», яка здатна генерувати відео за текстовим описом. В її основі — технологія Stable Diffusion.
Роздільна здатність відео — до 1280×2048 пікселів з частотою 24 кадри/секунду і враховує близько 4,1 млрд параметрів, з яких 2,7 млрд навчаються на відео.
Як приклади Nvidia показала згенеровані відео за описами: «Вдягнена в костюм лисиця, що танцює в парку», «Самотній мандрівник у туманному лісі на світанку», «Снігова людина у заметіль» та інші.
Наразі це лише дослідницька розробка, тож про появу нової нейромережі у публічному доступі поки не йдеться.
Джерело: Telegraf. Design