Нейромережа краща за Midjourey?
Всім нейрошинобі, привіт!
Сьогодні говоримо про Flux! Це нова потужна open-source нейромережа, яка вже встигла увірватися в топ-3 за якістю генерацій. Flux – це НЕ чергова "зірка на годину" у світі ШІ. DALL-E 3, Stable Diffusion, Leonardo – всі вони вже залишилися позаду. Flux кинув виклик навіть самому Midjourney! Ця нейромережа увірвалася на сцену ШІ так само несподівано, як Юсуф Дікеч на цьогорічних Олімпійських іграх.
У статті та відео я розкрию всі карти: як робити 100 безкоштовних генерацій на день (так, ви не помилились – ДВІСТІ!), як встановити Flux на вашому власному комп'ютері, і навіть поділюся кількома секретними лайфхаками. А на десерт – порівняння тестів генерацій між Flux та Midjourney. Спойлер: буде гаряче!
Тож влаштовуйтеся зручніше, готуйте ваші нейрони, бо ми вирушаємо у захопливу подорож світом Flux!
Окремо для вас записав відео версію нижче, а після неї буде текстова.
Що це за модель?
Нейромережу Flux створила команда розробників, які раніше працювали над Stable Diffusion. Їхня нова компанія, Black Forest Labs, має амбітні плани щодо завоювання ринку ШІ, особливо з огляду на останні фінансові показники Stability AI.
Black Forest Labs, хоч і нова на ринку, вже має власний веб-сайт. Там представлені приклади генерацій, але варто пам'ятати, що такі демонстрації зазвичай показують найкращі результати, які можуть бути додатково оброблені.
Розробники стверджують, що Flux перевершує всі інші моделі, включаючи Midjourney. Особливо відзначають високий рівень деталізації, когерентності та вміння поєднувати кінематографічний текст із зображеннями.
Користувачі також звернули увагу на надзвичайно реалістичні фотографії людей, які генерує модель.
Flux.1 Dev: Призначена для розробників, без права комерційного використання самої моделі.
Flux.1 Schnell: Знаходиться у відкритому доступі під ліцензією Apache 2.0. Дозволяє як особисте, так і комерційне використання за умови дотримання умов ліцензії.
Для комерційного застосування найкраще підходять версії Flux Pro та Schnell. Всі три моделі можна знайти на github.
Далі розглянемо, як почати працювати з цими нейромоделями.
Як почати користуватись Flux онлайн
Для роботи з Flux є кілька варіантів. Хоча Flux доступний на платформах Replicate та Fal AI, вони мають обмеження на безкоштовні генерації. Тому найкращим рішенням вважаю сервіс Glif.
Платформа пропонує до 100 безкоштовних генерацій на день, що значно більше ніж інші сервіси. Крім того, він використовує Pro версію Flux, забезпечуючи високу якість результатів.
Щоб почати роботу з Glif, потрібно зареєструватися на сайті. Після цього натисніть кнопку "Build" і додайте блоки текстової та Image генерації. Оберіть модель Flux Pro, впишіть свій промпт у текстовий блок, а в Image блоці вкажіть Input 1. Налаштуйте параметри зображення за своїм бажанням - і можна генерувати! Приклад налаштувань на скріншоті нижче. А детальний огляд у відео.
Важливою перевагою Glif є можливість створювати власні гліфи та ділитися ними з іншими користувачами. Це особливо зручно для командної та проєктної роботи. Інтерфейс сервісу приємний та інтуїтивно зрозумілий.
Якість генерацій на Glif не поступається Fal AI, тому можна бути впевненим у результатах. Враховуючи всі ці переваги, Glif виглядає найоптимальнішим вибором для роботи з Flux Pro.
Як встановити Flux локально на ПК
Встановлення Flux локально - це альтернативний спосіб використання нейромережі. Найпростіше це зробити через браузер Pinokio, який доступний для Windows, Mac і Linux. Ось покроковий процес:
1. Спочатку встановіть браузер Pinokio за інструкцією.
2. Потім оберіть встановлення ComfyUI. Цей процес може зайняти деякий час, оскільки потрібно завантажити всі необхідні моделі.
3. Після завершення установки, зайдіть у ComfyUI та знайдіть Flux серед завантажених моделей. Інсталюйте Flux Sсhnell
4. Натисніть "Старт" у ComfyUI і дочекайтесь поки запуститься інтерфейс.
5. Потім перетягніть файл Flux з папки моделей в інтерфейс ComfyUI.
Тепер модель готова до роботи - залишається лише ввести промпт і зачекати результату. У відео детально показав як це робиться.
Важливо зазначити, що для комфортної роботи з Flux потрібен досить потужний комп'ютер. Навіть з версією Schnell процес генерації може бути повільним. Наприклад, на MacBook Pro 2023 року з процесором Apple M2 Max і 32 Гб оперативної пам'яті генерація однієї картинки у версії Schnell займає від 15 до 20 хвилин. При недостатній потужності комп'ютер може сильно нагріватися.
Для комфортного використання важлива саме відеопам'ять (VRAM). Для Flux бажано більше 24 ГБ. Хоча і ОЗУ теж важливе.
Якщо вас не турбує тривалий час генерації або у вас дуже потужний ПК, локальне використання Flux може бути хорошим варіантом.
Нещодавно також з'явився окремий веб-інтерфейс для Flux у браузері Pinokio. Він працює аналогічно, але може часто видавати помилки.
Отже, локальне встановлення Flux - це варіант для тих, хто має потужне обладнання і готовий до можливих технічних нюансів. Для більшості користувачів онлайн-сервіси, як-от Glif, можуть бути зручнішим рішенням.
Тести та порівняння з Midjourney
Презентація з детальними порівняннями доступна за посиланням. Нижче ж я пропишу ключові коментарі та надам певні приклади.
Портрети людей: Flux демонструє перевагу в реалістичності та анатомічній точності. Пальці, руки та пропорції передаються майже ідеально, хоча іноді може програвати в естетиці.
Пейзажі: Тут спостерігається паритет. Midjourney створює більш деталізовані та креативні пейзажі, але Flux краще враховує деталі з промпту та передає рефлексії.
Продуктова фотографія: Обидві нейромережі показують майже ідеальні результати. Flux здатен відтворювати логотипи брендів, але іноді поступається в естетиці.
Відтворення текстів: Flux значно випереджає конкурентів, включаючи Midjourney. Він здатен відтворювати тексти, не втрачаючи в креативності сцени.
Абстракції та нереальні об'єкти: Тут Midjourney має перевагу, створюючи більш інноваційні та надихаючі композиції.
Медіауми та Стилізація: Flux зосереджується на фотореалізмі та когерентності, але програє у відтворенні інших стилів. Він майже не відтворить жодний з відомих медіумів: акварель, пастель, гуаш, вугілля і тд. Це серйозний недолік.
Динамічні сцени: Flux точніше відтворює деталі з промпту, але може поступатися в креативності та кінематографічності.
Мультфільми: Flux краще справляється з мультиплікаційною стилістикою, але Midjourney (особливо модель Niji) перевершує у створенні аніме.
Геймдев: Flux має значну перевагу завдяки поєднанню креативності та уваги до деталей промпту.
Головний недолік Flux - відсутність можливості переносу контенту, персонажів та стилю, де він поступається Leonardo та Midjourney.
Загалом, Flux показує себе як потужний інструмент, особливо в сферах, де важливі реалістичність та точність деталей, але має свої обмеження в певних творчих аспектах.
Висновки
Якщо коротко: Flux зараз "зробить" більшість нейромереж на ринку. Навіть знаменитий Leonardo відступає перед його могутністю. Але до Midjourney Flux поки не дотягує, якщо дивиться на все комплексно і попроєктно.
Що заважає Flux стати новим фаворитом? Є три моменти, які трохи псують загальне враження.
- Перший і найважливіший – Flux не вміє переносити персонажів, стилі та контент з одного зображення на інше. А це, між іншим, ключова фішка для створення AI-фільмів.
- Далі, Flux не дуже дружить з різними стилями та медіумами. Якщо ви шукаєте інструмент для художньої творчості – це не той випадок.
- І нарешті, це відсутність будь яких додаткових функцій по типу апскейлу, редагування чи розширення зображень – серйозний мінус для проєктів великого масштабу.
Про Flux чудово підходить для генерації контенту для соцмереж або для креативних концепцій. Він може створювати кінематографічні кадри та точно відтворювати анатомію людини – і все це абсолютно безкоштовно. З огляду на те, що Midjourney коштує 60 доларів, це серйозний аргумент.
Ще один козир Flux – здатність правильно працювати з текстом і зберігати кінематографічність. Якщо вам потрібно створити мем, листівку чи стікер – Flux тут незамінний.
І, до речі, цікавий факт: Flux дозволяє налаштовувати рівень цензури, тож можна навіть генерувати зображення з роздягненими людьми (звісно, без натяків на порнографію).
Якщо ви працюєте з багатьма проєктами, моя порада – використовуйте Flux разом із Midjourney та Leonardo. У Midjourney купуйте ПРО-пакет для створення АІ відеоконтенту та творчих генерацій, Flux використовуйте для завдань із текстом в кадрі чи точним зображенням людей, а Leonardo – для апскейлу. І не забувайте слідкувати за оновленнями – розробники нещодавно анонсували нову модель Сота, яка обіцяє ще більше можливостей.
Підписуйтесь на мій YouTube-канал, Telegram, TikTok та Instagram і залишайте коментарі. Давайте разом розвивати AI в Україні!
До нових зустрічей!