Генератор унікальних логотипів на основі штучного інтелекту
Історія створення
Все почалось з того, що друг засновника попросив його згенерувати специфічну фотографію для нього. Midjourney не видавав якісних результатів. Почалось дослідження Stable Diffusion — це технологія з відкритим вихідним кодом. Наприклад, одним із завдань було згенерувати людину в спортивному костюмі в ковбойському капелюсі, з обличчям певного актора. Через Midjourney виходило погано, точніше виходило добре лише одне – лише один якийсь елемент (обличчя, капелюх, костюм), але ніяк не вдавалося досягти бажаної синергії усіх елементів зображення.
Задача була вирішена завдяки іншим інструментам, включно зі StableDiffusion, що вимагають більш глибоких знань щодо генерації. Також були спроби генерації зображень іншого типу, але все це було б тяжко монетизувати. Потім спала на думку ідея стосовно генерації логотипів. Зараз Midjourney та інші інструменти дуже погано генерують логотипи і було багато спроб покращити генерацію, але результат був незадовільний.
Вийшло знайти технологію, завдяки якій можна генерувати якісні логотипи. Якщо цей стартап буде нікому не потрібен — технологія буде додана у відкритий доступ, чи, можливо, далі ця технологія буде використовуватись для того, щоб іще більше покращити точність і якість зображень.
В проектах часто допомагає спілкування з людьми. Часто вони дають якусь цікаву та нову інформацію. Взагалі підхід до роботи з штучним інтелектом починався з більш низькорівневих штук таких як математика, статистика, проектування різних низькорівневих моделей, але на даний час відбуваються спроби роботи з більш високорівневими інструментами, які не вимагають таких глибоких знань.
Основний функціонал
Наразі додаток може генерувати логотипи по текстовому короткому опису. Це найкращий інструмент для натхнення. Тобто фінальний логотип бот не згенерує та дизайнерів точно не замінить, це більше для отримання ідей, натхнення. Особливо допомагає тоді, коли немає уявлення про те, що хочеться зробити, або коли навіть сам клієнт його не має, то можна дати посилання на бота, щоб він згенерував бажані варіанти, від яких потім можна відштовхуватись дизайнеру.
Цей сервіс не для того, щоб замінити дизайнерів, це в першу чергу для того, щоб допомогти швидше і якісніше виконувати їх роботу. За 3 години після публікації посилання в Телеграм чатах ми отримали більше 100 користувачів, які написали боту. Наразі зроблено більше 1000 генерацій більш ніж 250 користувачами.
Технологія
Ми використовуємо генерацію власними розробками та орендованими ресурсами. При створенні сервісу було витрачено багато часу на тренування моделей та досліди. Тренування в основному відбувались на відеокарті NVIDIA A100-SXM4 з 40GB відео-пам'яті та 85GB оперативної пам'яті. CPU – Intel Xeon 2.20GHz. Логотипи генеруються модифікованою моделлю Stable Diffusion. Зараз ведеться активна робота по покращенню як самої генерації, так і продукту в цілому. Логотипи генеруються на сервері з потужною відео-картою runpod.io. Планували робити генерацію на серверах Amazon, але поки ведемо переговори по отриманню дозволу на хоча б базові потужності.
Зараз ми стоїмо перед складним вибором з трьома моделями:
1. Непогано притримується заданого промпту, але зустрічаються не дуже гарні логотипи
2. Дуже погано притримується заданого промпту, але майже всі логотипи дуже гарні
3. Добре притримується заданого промпту, але часто додає "не логотипну" графіку
Поки що використовуємо перший варіант, але активно шукаємо компроміс. Хочеться знайти баланс між моделями і отримувати лого більш високого рівня.
Генерація
Основний його функціонал – генерувати логотипи по запиту з 1-2 слів максимум. Чим більше слів – тим менш точний результат. Також можна просто натиснути на кнопку /random і тоді буде генерація випадкових логотипів.
Дизайн
Для тренування мережі були задіяні професійні дизайнери, які провели глибоку аналітику, дослідили десятки дизайн книг, серед яких більшість – збірники логотипів. Ці дизайнери провели колосальну роботу – було створено більше 3000 спеціальних графічних елементів – від примітивів, до більш складних фігур, від безформених елементів, до елементів з ідеальними формами. Графічні елементи можна поділити на 14 основних груп, кожна з яких має додатковий поділ на кількість базових елементів в одній формі – від 2 до 12.
Команда
Засновник: Олег Копил (ідея, AI-engineering, telegram bot, DevOps) – розробник і дизайнер, який працює з відомими світовими компаніями. Являється засновником відомого стартапу по онлайн-заповітам iDied.org.
Маркетолог: Богдан Щербаков (просування, проведення аналітики та тестування гіпотез).
Маркетинг
На етапі тестування ідеї були використані лише Telegram чати, які уже принесли більш ніж 250 користувачів. Поки що відбувається збір фідбеку для покращення сервісу. Надалі буде розроблена повноцінна маркетингова стратегія, яка буде використовуватися для просування сервісу.
Конкуренти
Серед основних конкурентів у нас сервіси по генерації логотипів, які можна знайти в Google за запитом “створити логотип”. Тобто це ті сервіси, які начебто “генерують” логотипи, але по факту відбувається вибір готових шаблонних графічних елементів зі статичного переліку, відбираються готові стокові фігури, вибирається колір, додається назва, слоган, опис і готово.
Основний недолік наших конкурентів в тому, що при однакових вхідних даних ймовірність створення однакових логотипів досягає 90-100%. Тоді про яку ідентифікацію за рахунок унікальності можна говорити?
Такі сервіси як Logomaster, який має домен .ai знову ж таки начебто “генерує” варіанти, але по факту це просто вибірка з бази даних готових варіантів з різними кольорами. Або такі сервіси як Wix, який взагалі видає іноді 500 помилку (помилка сервера). Або такі сервіси як Canva, VistaCreate, Logaster та інші – це все просто пережитки минулого. Стандартні, в більшості випадків не красиві форми, які всі уже бачили та знають, шаблонні варіанти, кліше – це все про старі варіанти і можливості генерації лого.
Витрати
1. В районі $200 на обчислювальні потужності, але треба більше ($1000-$2000) тому що зараз генерації відбуваються довго через велике навантаження та великі черги. Якщо ботом будуть користуватись, будемо збільшувати витрати на "залізо"
2. На маркетинг поки $100-$500 для валідації ідеї.
Що далі?
Найближчим чином наші основні плани: розміщення на ProductHunt найближчим часом, тестування маркетингових гіпотез, отримання платних користувачів, збільшення обчислювальних потужностей, покращення якості і варіативності логотипів, запуск повноцінної реклами.
Скоро, ймовірно, логотипи будуть генеруватися в форматі SVG, що кратно збільшить можливості та ефективність бота. Поки що ми отримали доволі велику кількість трафіку саме завдяки реактивному вірусному розповсюдженню, тому що цей бот дійсно цікавить людей. Багато хто обговорює його, багато хто уже користується.
В планах зробити як мобільний додаток, так і веб, але для тестування гіпотези поки що достатньо і телеграм-боту. Простими словами – якщо ми зрозуміємо що цей продукт потрібен людям та за нього готові платити, тоді будемо його покращувати.
Посилання на сервіс: http://logojinn.com/