Happy Horse 1 - нова НЕ найкраща відео модель. Але ось чому вона потрібна АІ кріатору!

Сьогодні вийшла нова потужна відео модель під назвою Happy Horse. Вона дійсно змінює ринок АІ генерації. В нашій агенції maibutne ми протестували її. Розклад короткий: розумна як ніхто, але виглядає візуал далекій від ідеалу. Якщо вам хтось скаже, що це найкраща відео модель - не слухайте авторів, а краще прочитайте цю статтю. В ній детальний огляд та пайплани де її реально використовувати.
Ось вам відео для натхнення і починаємо!
Що ми маємо?
Якщо коротко, то ось порівняння всіх топів, включно з Happy Horse. А нижче детальний розклад по параметрам.
Motion quality (якість анімації). 9,5 з 10.
Анімація стабільна, плавна, контрольована. Немає звичного для Pixverse страху, що ось зараз щось змутує. Усе йде так, як ви описали. Особливо круто в танцях - тут модель прям тримає форму. Реалістична фізика в звичайних сценах теж нормальна.
Емоції людини - найкраще серед усіх протестованих моделей. Міміка, переходи, послідовність - усе на місці. Видно по сцені з дівчиною (приклад 6 у тесті). Для новачка це взагалі найкращий вибір на ринку, краще за Klling, бо мутацій помітно менше.
Проблеми починаються, коли додаються VFX. Ось тут відео модель може жорстко плавити, через що вона далеко не універсальна. Кулі, постріли, вибухи можуть давати дивні мутації. Не в стилі з'явилось щось зайве, а скоріше в плані фізика поводиться неправильно. Приклад: мисливець стріляє, утки чують і злітають, і тільки після їхнього зльоту собака біжить по воді, як Ісус. Послідовність формально під промпт, але виглядає неприродно.
Ну так, в t2v модель дісйно потужна. Краща за Kling майже в усьому і в певних моментах за Seedance. Ймовірно саме цю модель тестували на лідерборд аренах. Але text to video, це лише одна із технік анімації.
Нижче 10 прикладів таких генерацій.
Візуальна Естетика. 8,3 з 10.
Картинка постійно трохи змазана. Не так погано як LTX чи Grok, але до Luma, Klling і особливо Seedance Full HD далеко. Luma виграє в реалістичності навіть у низькій роздільній здатності. Seedance після появи Full HD - це взагалі топ, до якого тут далеко. З Pixverse приблизно зрівнюється за рахунок resolution. Один окремий плюс по естетиці - мультиплікаційний стиль. Як і Pixverse, Happy Horse не вбиває мультиплікаційну стилістику, а навпаки, розвиває і підсилює.
Alignment (наскільки точно модель відтворює саме те, що ви описали в промпті і розуміє, що взагалі в ньому) - 10 з 10.
Найкраще, з чим ми працювали, навіть кращий за Seedance 2.0. Модель розуміє все і відтворює послідовність дій правильно. У мережі пишуть, що з довгими промптами працює погано і треба писати коротко - неправда. Ліміт у моделі 2500 символів, і в ці рамки впишеться будь-який детальний промпт на анімацію без мутацій. Проблеми починаються, якщо лізти за 2500 (через API на сторонніх ресурсах) або якщо працювати з мультишотом. Висновок: пишіть довгі деталізовані промпти, просто тримайтеся ліміту.
Консистентність. 9,6 з 10.
У межах однієї генерації - дуже добре. Стабільніше за Klling і навіть за Seedance. Менше мутацій на крупних планах, краще тримає персонажа між кадрами. В image-to-video взагалі одна з найстабільніших моделей.
А ось між генераціями за референсом - проблема. Seedance відтворює персонажа з референсу майже однаково раз у раз, тому можна тримати єдиного героя по серії відео. Happy Horse кожною новою генерацією трохи зміщує обличчя. Поведінка близька до Klling, але м'якше - не так радикально перемальовує. Серію відео по одному рефу зібрати важко.
Аудіо візуальна синхронізація 8 з 10.
Друга модель на ринку після Veo, яка взагалі здатна вимовляти українські слова без помилок. Проте бажить частіше за Veo, але з правильними паузами і таймінгом мову витягує. З англійською взагалі круто, краще за Klling і Seedance.
Є цікавий нюанс в поведінці при невідповідності таймінгу. Seedance у такому випадку пришвидшує мову до скоромовки, але вписує в ліпсінк. Klling намагається синхронізувати і не встигає але слова норм. Happy Horse іде іншим шляхом: коли слова не влазять, він скидає їх у войсовер без ліпсінку. Це НЕ зручно, за це знімаємо бали. Загалом ліпсінк тут один з найкращих, але одночасно один з найнестабільніших, інколи нагадує Sora - могла говорити чудово, а могла видавати дивні мутації. Проблеми виникають і коли часу мало, і коли його забагато.
Resolution. 8 з 10.
Слабке місце номер два. Картинка і в 720, і в 1080 зовсім трошки краще за Grok Imagine, LTX, Midjourney. Full HD не рятує: на масштабних сценах усе милиться, виникає сіточка, погано рендеряться вибухи, вода й волосся. Для моделі з такою ціною це проблема.
Функціонал. 4,7 з 10.
- Що є: мультишот, референсна модель, відео-інпеінтинг через окрему кнопку editing (можна редагувати промптом і додавати своє аудіо), апскейл 720 в 1080.
- Чого немає: кейфреймів, пресетів камери, способу подовжити відео. При завантаженні щоразу пропонує вибір з ватермаркою чи без - дрібниця, але незручно.
Цензура одна з найлагідніших на ринку. Не рівень Grok, але приблизно як Pixverse, і помітно краще за Klling. Нічого не забракувала за весь тест.
Висновок
Ось тут 29 наших прикладів: Всі можете передивитись.
В цілому ж:
- Беріть Happy Horse, якщо вам потрібні емоції, танці, мультиплікація і англомовний ліпсінк - тут йому рівних мало, плюс це найкомфортніший варіант для новачка.
- Не беріть, якщо потрібна топова Full HD картинка, складні спецефекти з реалістичною фізикою або робота з референсом по серії генерацій.
Це ТОП-3 на ринку, після Seedance та Kling 4k. Гарно доповнить пайплайни стабільною передбачуваною анімацію реалізму, де байдуже на пласку шкіру. Тобто це дійсно корисний інструмент, але інструмент для доповнення пайплайну. Точно тестуйте, освоюйте, але завжди думайте де і куди її застосуватива.

