Практичне застосування нейромереж в рекламі, на прикладі Midjourney

Сьогодні багато говорять про нейромережу Chat GPT та її надможливості. Але якщо придивитися, то з практичної точки зору її використання в рекламі дуже обмежене - лише створити ідею поста та основу для майбутнього тексту. Так вона може писати код, відповідати на складні питання, написати сценарій серіалу чи есе, скласти резюме, але це все не має відношення саме до реклами. Бо коли потрібно інтегрувати бренд в креатив - ореол міфічності кудись зникає. Майже всі нейромережі на цьому ламаються і без супроводу не працюють. Але є одна, з якою можна щось витягнути. Це Midjourney

Протягом останнього року ви бачили дивні картинки з героями Марвел в сетінгу середньовіччя в Instagram, різні підбірки футуристичних картинок в TikTok, або читали статті про те як нейромережа створила живу людину. Все це, скоріш за все було написано про Midjourney - нейромережу яка генерує візуальний контент. За останні півроку ми зробили близько 2 тис. тестів нейромережі в межах агенції New Strategies Group і можемо напевне відповісти на три питання:
1. Як почати користуватися Midjourney

2. Які є можливості в Midjourney та що вона вміє

3. Де саме в рекламі вже сьогодні реально застосувати нейромережу. 

Почнемо! (ПС в кінці статті згенеровані світлини героїв Дісней в образі адептус астартес з Warhammer 40 000. 

Як почати користуватися Midjourney

Крок 1 - переходимо на сайт https://midjourney.com/home

Крок 2 - тиснемо кнопку Join in Beta

Крок 3 - проходимо реєстрацію в Discord (якщо вас там ще немає) та приєднуємося до чату. Вибір розробників стосовно Discord трохи не звичний, але вся робота з нейромережею буде проходити тут. 

Крок 4 - обираємо одну з кімнат newbies. Ці кімнати і є простором де створюють контент автори з усього світу. Різниці між ними немає. Кожна – це окремий канал просто, щоб розподілити кількість одночасних запитів. 

Крок 5 - пишемо свою першу команду. Для цього ставимо "/" та обираємо тег "imagine". Команди пишемо англійською, інші мови нейромережа розуміє гірше. Команди можна писати не дотримуючись пунктуації або ідеальної граматики. Нейромережа працює через сприйняття набору тегів. Тому їй все одно на рівень англійської - рівня google translate буде достатньо. 

Все. Далі чекаємо на результат витвору. Ваше завдання буде підсвічено жовтеньким кольором. Процес генерації триває від декількох секунд до пари хвилин. Все залежить від навантаження на сервер та кількості одночасних запитів від авторів. 

Ми поставили завдання згенерувати "борщ з котлетою по-київськи які літають в небі". Ось що вийшло =). 

Які є можливості в Midjourney та що вона вміє

Деталізація обраної картинки. 

Знизу під згенерованою картинкою є 4 опції upscale. Кожна з них дозволяє обрати свій варіант картинки (зліва направо перша картинка U1, друга U2 ... четверта U4) та покращити її якість та кількість деталей в кадрі. 


В нашому випадку обрали варіант U1. Ось що вийшло. Лебідь мутував, ложка змінилась, хвіст з низу став ногами. На цьому етапі вже потрібно зрозуміти, що ідеальний варіант нейромережа видасть не одразу. Потрібно експериментувати. 

Щоб покращити якість можна спробувати натиснути Beta Upscale Redo. Ця опція доступна в платній версії. Нейромережа з великою ймовірністю надасть якісніше фото. В нашому випадку лебідь повернув голову, а ноги з низу стали схожими на хвіст. Не ідеально, але краще. Опція deteiled upscale redo працює приблизно за таким самим принципом та робить фото ще більш деталізованим.

Створення декількох варіантів обраної картинки. 

Окрім upscale користувач може отримати декілька видозмінених варіантів обраної картинки. Для цього потрібно натиснути одну з кнопок v1-v4. Ми обрали варіант v3 та отримали різні його варіації. Таким чином постійно обираючи між опціями u1-u4 та v1-v4 автор може експериментувати та обирати кращий варіант креативу. 

Вартість. 

В безкоштовній версії зробити можна лише до 25 генерацій. Після сервіс нагадає, що ліміт вичерпано і запропонує декілька варіантів підписки. Щоб побачити їх потрібно перейти за посиланням в чаті. 

Нейромережа пропонує три варіанти підписок. На наш погляд оптимальний за 30 доларів на місяць. Він пропонує 15 годин генерацій, прискорену швидкість генерацій та розширення можливостей по генерації картинок. Особливість нейромережі - вона рахує генерацію картинок не кількістю, а годинами. Тобто 15 hr це не 1500 тисяч картинок, а 15 годин генерацій. Чому так зроблено? Бо кожна картинка в залежності від складності опису, кількості деталей та параметрів може генеруватися від декількох секунд до декількох хвилин. Ось цей період генерації нейромережа і враховує під списання з коштів. Нам на місяць головую вистачає стандартного плану за 30 доларів. Тому можна не хвилюватися, що вам не вистачить його. 

Створення картинки по заданому фото.

В нейромережі можна згенерувати картинку по обраному фото. Для цього потрібно зробити декілька дій. Спочатку завантажити саме фото в нейромережу. Нехай в нашому випадку це буде Бред Пітт.

Потім скопіювати посилання на це фото

І потім додати це фото одразу після команди "imagine". До фото прописати команду нейромережі. Ми вирішили зробити Бреда Пітта залізною людиною з коміксів Марвел. Ось що вийшло. 

Також фото можна створити об'єднавши два фото між собою. Цю опцію потрібно обрати в налаштуваннях нейромережі. Для цього вводимо команду /settings та обираємо Remix mode. Після цього можна додати посилання на два різні фото. 

До нашого Бреда Пітта ми додали фото супермена Генрі Кавілла та окремо вирішили зробити фото в образі Гендальфа. Вийшло досить цікаво і трохи крінжово =)

Версії Midjourney

Нейромережа оновлюється постійно. На сьогодні є чотири версії від 1 до 4, а також ніндзя мод. 

Різниця між ними в якості розуміння команд та генерації віжуалу. Для порівняння показали кожну з них по запиту з Бредом Піттом та залізною людиною. Так можна визначити еволюцію нейромережі. Як бачимо - 4 версія ТОП, а інші досить слабко розпізнають команди на об'єднання фото. 

Фреймворки. 

Окрема ланка роботи з нейромережею - це спілкування з нею. Щоб отримати гарне фото потрібно внести такий опис, який зрозуміє нейромережа. Вона мислить тегами. Але просто накидати те, що хочете побачити - замало. Потрібно задати параметри деталізації, стилістику (наприклад стиль Вангога чи гіпер реалізм), характеристики обʼєктива камери, що знаходиться на передньому плані, а що на задньому та інше. Таких тегів неймовірно багато. Мало того, що їх всі потрібно знати. На їх введення потрібен час. Коли ви генеруєте по декілька десятків картинок за день - це можете стати проблемою. Щоб це спростити на сьогодні вже існують сервіси по роботі з тегами для midjourney. Такі собі фреймворки. Один з найкращих https://promptomania.com/midjourney-prompt-builder/

Робота з сервісом гідна окремої статті. Але ми скріншотами та короткими поясненнями опишемо, головні моменти. 

Ось так виглядає запит на Бреда Пітта залізну людину. 

Де саме в рекламі вже сьогодні реально застосувати Midjourney

Не дивлячись на всі можливості нейромережі в неї все ще є критичні мінуси через які не можливо віддати на неї повноцінний проєкт в креативі. 

Головні мінуси наступні:

Мутації.

Нейромережа досить часто домішує артефакти або змінює природу речей. Так, наприклад ми хотіли створити котика космонавта. Все начебто гарно. Але придивившись розуміємо, що 5 лапка йому певно буде заважати в житті. Так само і з леопардом який грає на ноутбуці - кігті ввібрали мутаген черепашок ніндзя. Через це створювати креативи з живими об'єктами досить не надійно та потребує багато часу. 

Розпізнавання назви бренду. 

Це просто жахлива проблема нейромережі. За всі 2000 тестів нейромережа жодного разу правильно не написала назву бренду, якщо вона мала бути в кадрі. Просто забудьте про логотип бренду в кадрі та його збільшення чи зменшення за бажанням клієнта. Скоріш за все це спеціальний нерф нейромережі від розробників під майбутній платний модуль чи окремий пакет для брендів. Вгадайте які бренди в кадрі нижче?

Проблеми з реалізмом.

Нейромережа прославилася створенням штучних людей, які дійсно схожі на реальних. Але створити людину чи продукт по необхідним тегам в яких присутній конкретний продукт бренду - нейромережа поки не здатна. Можна додавати теги гіперреалізм, ультра деталі, реалістичні фото та інше. Але отримати якість схожу на фото зроблене професійною фототехнікою не вийде. Тому все що стосується створення реалістичного контенту для брендів теж відпадає. 

Відсутність можливості редагувати фото.

Отриманий результат нейромережі неможливо скорегувати в самій нейромережі. Можна отримати або поліпшені варіанти, або інші варіанти по заданим тегам. Опції, щоб поправити логотип, шрифт, або внести якісь дрібні правки - не має. Такий формат праці ускладнює взаємодію з бренд командою. Їй залишається лише прийняти ситуацію і змиритися з обставинами. Але ж ми розуміємо, що так рекламний ринок не працює і фінальний креатив проходить багато ітерацій та змін. В майбутньому така опція скоріш за все зʼявиться. Тоді нейромережа стане повноцінним сервісом, а в креативній сфері зʼявляться нові процесії: артдиректори та дизайнери графічних нейромереж. Але поки це не так.  

Це все накладає певні обмеження в використанні нейромережі. Але сфери реклами де її можна застосувати є і вони наступні. 

Створення концептів ідей

Описати ідею кейвіжуалу можна словами, а відтепер і абстрактною картинкою згенерованою в нейромережі. Створити скетчі для ілюстрації сторібордів відео роликів для тендерних презентацій стає неймовірно просто. Тепер праця мізками стає ще більш актуальною - вам залишається придумати ідею, описати їх на рівні тегів, а нейромережа зробить роботу дизайнера за декілька хвилин. Наприклад, створюємо концепцію реклами смартфона у кіберпанк всесвіті. 15 хвилин і концепт готовий. 

Створення логотипів.

Нейромережа гарно вміє працювати з логотипами та видає майже готовий до роботи логотип. Головна перевага - генерація дуже великої кількості ідей з яких можна обрати потрібний варіант, або просто надихнутися та зрозуміти, що саме ти хочеш. Ми от спробували створити логотип діджитальної агенції на базі нашого гексагона. Ось що вийшло.

Створення мокапів лендінг пейджів або мобільних додатків.

Створити мокап сайту діджитал агенції або для автобренду? Без проблем. Нейромережа дуже добре заточена під подібні задачі та може легко спростити розробку для артдиректора. 

Ну і звісно створення картинок для постів в соцмережах. 

З єдиною поправкою - такий контент можливо використовувати лише компаніям зі сфери послуг та сервісів: гемблінг, онлайн сервіси, банкінг, страхування, ейчар, таксі, оператори мережі та подібне. Все, де в комунікації не потрібно показувати живий продукт, а достатньо обмежитись віртуальним простором. Створити такий контент легко. Потрібно знати основні атрибути бренду та задати колір фону. Наприклад беремо бренд де присутня територія космосу, футуризму та фан при цьому брендовий колір фіолетовий. 

Отже, якщо зробити висновки - нейромережі не настільки вдалі на практиці, як про них роздмухують чутки. Багато які марні, але Midjourney одна з тих з якою вже можна працювати на рівні концептів і генерації ідей, пробувати створювати логотипи, мокапи та контент для соцмереж (там де непотрібні реальні об'єкти в кадрі). Що буде далі? Далі буде лише цікавіше! Успіхів всім!

На завершення, як і обіцяли, концепти Діснеївських героїв в образах Warhammer 40 000.

8841