Собрали главных конкурентов Midjourney и пытаемся с их помощью продать нарисовать слона.
Изображения, сгенерированные нейросетями, заполонили интернет и стали настолько востребованными, что разработчикам самой известной из них, Midjourney, пришлось даже ограничить бесплатный доступ.
Однако на одной Midjourney свет клином не сошёлся. Команда ProductStar вместе с Павлом Исаенко, дизайн-директором в «Яндексе», составила подборку нейросетей для генерации изображений по текстовым запросам. Мы выбрали наиболее популярные сервисы и каждому давали одно и то же задание — сгенерировать симпатичного слона в городе.
Павел Исаенко
Дизайн-директор в «Яндексе». Эксперт на курсе по UX/UI-дизайну в ProductStar.
Итак, представляем победителей.
А теперь подробно о каждой.
Kandinsky 3.1 — бесплатная нейросеть от «Сбера»
Изображение: Kandinsky / Skillbox MediaПопробовать онлайн →
Нейросеть «Сбера» может создавать изображения по текстовому запросу, рисовать по фотографии, генерировать фон вокруг основной картинки или заменять отдельные элементы с помощью AI.
Основная функциональность реализована на платформе Fusion Brain, для начала работы с которой достаточно ввести email и подтвердить регистрацию. После этого вы попадёте в раздел «Картинки» и сможете описать изображение. Также на сайте есть раздел «Видео», где можно сгенерировать короткий ролик или анимацию с помощью нейросети Kandinsky Video 1.1.
Помимо платформы Fusion Brain, нейросеть Kandinsky доступна в приложении «СберБанк Онлайн», а также в ботах во «ВКонтакте» и в Telegram. Причём в телеграм-боте используется версия Kandinsky 3.1 Flash, которая генерирует изображения в десять раз быстрее базовой версии.
В последней версии появилась возможность работать со слоями — теперь вы можете генерировать отдельные части изображений, не затрагивая элементы на других слоях.
Картинка симпатичного слона в городе, сгенерированного через телеграм-бот Kandinsky
Изображение: Kandinsky / Skillbox Media
Текст промпта можно написать на русском или английском языке — достаточно в произвольной форме описать то, что вы хотите получить. Для описания можно использовать ИИ-ассистента ArtGPT, который поможет уточнить контекст и создать более детализированное изображение. Ещё есть вкладка «Негативный промпт», в которой можно записать всё, что искусственный интеллект изображать не должен.
После подготовки запроса вы можете выбрать стиль картинки — например, цифровая живопись, мультфильм, аниме, киберпанк, детальное фото, пиксельный арт и другие. Можно описать стиль рисунка текстом или загрузить фото в качестве референса. Также можно выбрать ориентацию изображения или оставить его квадратным.
В декабре 2024 года «Сбер» представил Kandinsky 4.0 — бета-версию нейросети, которая может создавать HD-видео длиной до 12 секунд по текстовому описанию или произвольному кадру. Модель поддерживает различные соотношения сторон и станет доступной в первой половине 2025 года.
Stable Diffusion 3.5 — нейросеть с открытым исходным кодом
Изображение: Stable Diffusion / Skillbox MediaПопробовать онлайн →
Stable Diffusion — это нейронная сеть с открытым исходным кодом. Если её обучить, вы получите больше ИИ-инструментов для самовыражения. Чтобы использовать все возможности генерации изображений, Stable Diffusion нужно установить на компьютер. Вот минимальные требования:
- 25 ГБ свободного места на жёстком диске;
- видеокарта NVIDIA с памятью от 10 ГБ;
- операционная система Windows.
Есть и онлайн-версия, которая работает через платформы DreamStudio и Stable Assistant. Для авторизации потребуется аккаунт Google или Discord.
Нейросеть позволяет создавать картинки по фото или по текстовому запросу на английском языке. Stable Diffusion также понимает русский язык, но результат генерации может быть менее точным. Вы можете выбрать стиль изображения — например, создать собственный портрет в стиле аниме или сгенерировать 3D-модель домашнего животного. Кроме того, можно задать разные соотношения сторон и установить нужное количество вариантов, которые будут генерироваться по одному промпту.
За один раз мы сгенерировали сразу четырёх слонов на онлайн-платформе DreamStudio. Из 25 кредитов осталось 24,1. Затем мы повторили процесс: после генерации 12 изображений у нас осталось 10,5 кредита, а после создания 24 — всего 0,1.
В последней версии AI-модель способна генерировать изображения в разных форматах: от 3D-графики и фотографий до живописи и других визуальных стилей. Например, можно создать портрет в стиле масляной живописи или превратить эскиз в детализированную 3D-модель. А с помощью сервиса Stable Assistant вы получите доступ к AI-моделям для создания видео, аудио и текста в одном интерфейсе с GPT-ботом.
Скриншот: Stable Diffusion / ProductStar
Мы в Skillbox Media давно рассказываем о Stable Diffusion, поэтому, если вас заинтересовала эта нейросеть, рекомендуем следующие статьи:
Scribble Diffusion — генерирует изображения по эскизам
Изображение: Scribble Diffusion / Skillbox MediaПопробовать онлайн →
Scribble Diffusion — это нейросеть, которая генерирует картинки на основе ваших рисунков. Для начала работы вам нужен персональный токен, который новые пользователи получают после авторизации через гитхаб-аккаунт. Зарегистрируйтесь, введите токен и можете начинать.
После регистрации вы попадёте на главную страницу, где сможете создать скетч и детализировать его с помощью описания. Укажите в запросе стиль картинки, элементы на переднем плане и на фоне, действия объекта и любые другие детали, которые помогут дополнить набросок.
Стартовая страница Scribble Diffusion, доступная после успешной регистрации
Изображение: Scribble Diffusion / Skillbox Media
Попробуем нарисовать слона. Для этого нам необходимо создать эскиз и добавить текстовое описание. Если что-то будет пропущено, кнопка Go останется неактивной и нейросеть не сможет сгенерировать картинку.
Из простого эскиза и короткого описания у нас не получился шедевр. Однако для профессиональных иллюстраторов сервис Scribble Diffusion может стать отличным инструментом для создания качественных работ и быстрой генерации вариантов визуализации идей. Например, иллюстратор может за несколько минут набросать персонажа для детской книги, а нейросеть сразу предложит несколько предварительных концептов.
Изображение: Scribble Diffusion / Skillbox Media
«Шедеврум» — AI-модель «Яндекса», которая рисует картинки по текстовым запросам
Изображение: «Шедеврум» / «Яндекс» / Skillbox MediaПопробовать онлайн →
«Шедеврум» — это платформа с простым интерфейсом, предназначенная для создания изображений и видео. Она работает на основе нейросетей YandexART и YandexGPT, которые обучены на большом объёме данных и поддерживают ввод промптов на русском, английском и казахском языках.
Также «Шедеврум» действует как социальная сеть, где пользователи могут публиковать свои сгенерированные работы, ставить лайки, комментировать рисунки других участников и подписываться на их профили. Что интересно: вы можете узнать, какой промпт был использован при генерации изображения.
Сервис доступен в онлайне и в мобильных приложениях на iOS и Android. В онлайн-версии есть ограничение по количеству картинок в день, причём это число периодически меняется. В приложении можно генерировать неограниченное количество изображений, получать по два варианта за раз и создавать видео по описанию. Для начала работы войдите через «Яндекс ID», введите запрос и заберите сгенерированные шедевры.
При работе с «Шедеврум» вы можете выбрать AI-модель: сейчас доступны YandexArt от «Яндекса» и Janus Pro от нашумевшей компании DeepSeek.
В отличие от других сервисов, нейросеть от «Яндекса» работает только с текстовыми запросами — нельзя задать стиль или загрузить фото в качестве референса. Единственная настройка — выбор формата. При этом все создаваемые изображения обладают характерным стилем с фэнтезийной эстетикой, который подходит не для всех типов иллюстраций.
Для создания эффективных промптов в приложении работает специальный ИИ-бот. Он предлагает готовые варианты описаний и подсказывает, какие детали стоит добавить для получения нужного изображения.
Также у AI-модели от «Яндекса» есть ограничения. Сервис не генерирует изображения по описаниям с именами известных личностей (для защиты от дипфейков), а также по запросам на политические и религиозные темы, сценам насилия и контенту 18+. Если нейросеть обнаружит нарушение этих ограничений, бот уведомит вас и попросит переформулировать запрос.
Craiyon — позволяет генерировать изображения на ПК и на смартфоне
Изображение: Craiyon / Skillbox MediaПопробовать онлайн →
Craiyon генерирует изображения на основе текстовых запросов, но не может работать с фотографиями. Запрос для генерации необходимо писать на английском языке. На сайте доступны две версии AI-моделей: v3 и v4.
В Craiyon v3 вы можете выбрать один из трёх стилей: Art, Drawing или Photo. Также доступна кнопка None, которая позволяет создавать изображения без определённой стилистики. AI-модель Craiyon v4 работает в двух режимах: автоматический подбор и ручная настройка стилей Photo, Drawing и Vector.
Когда вы выберете подходящую AI-модель и стиль, дальше всё просто: введите запрос и получите несколько вариантов от искусственного интеллекта. При желании можно добавить негативный промпт и указать элементы, которых на сгенерированной картинке быть не должно.
Получать картинки можно с компьютера и из приложения на смартфоне. За одну генерацию сервис создаёт девять вариантов в разрешении 256×256 пикселей. Вы можете выбрать понравившееся изображение и улучшить его с помощью ИИ-функции Upscale до разрешения 1024×1024 пикселя.
Подписка на платную версию нейросети Craiyon начинается от 5 долларов в месяц. За эту сумму вы можете убрать рекламу и водяной знак, использовать функцию удаления фона за 15 секунд, а также генерировать неограниченное количество изображений — по 9 картинок за 45 секунд.
Также в ленте на сайте собраны уже сгенерированные изображения разных стилей для вашего вдохновения. Там можно найти как давно созданные работы, так и недавно сгенерированные изображения. Есть даже наш слон!
Получать картинки можно с компьютера и из приложения на смартфоне. За одну генерацию сервис создаёт девять вариантов в разрешении 256×256 пикселей. Вы можете выбрать понравившееся изображение и улучшить его с помощью ИИ-функции Upscale до разрешения 1024×1024 пикселя.
Подписка на платную версию нейросети Craiyon начинается от 5 долларов в месяц. За эту сумму вы можете убрать рекламу и водяной знак, использовать функцию удаления фона за 15 секунд, а также генерировать неограниченное количество изображений — по 9 картинок за 45 секунд.
Изображение: Craiyon / Skillbox Media
Dream by Wombo — бесплатно создаёт эстетичные иллюстрации
Изображение: Dream by Wombo / Skillbox MediaПопробовать онлайн →
На главной странице сервиса сразу открывается раздел Create, где вы можете ввести промпт длиной до 350 символов и выбрать стиль — от чернильной графики до стрит-арта. Нейросеть создаст вертикальные изображения, которые подходят в качестве иллюстраций для соцсетей и обоев для смартфонов. Сервис доступен без регистрации. Но если вы создадите аккаунт, то получите доступ к вашим последним запросам. Однако на сайте нет AI-бота для улучшения формулировок промптов.
В бесплатной версии вам доступно одно сгенерированное изображение по запросу. При оформлении подписки сервис позволяет генерировать сразу четыре варианта и редактировать результат с помощью кнопки Make variations. На момент обзора действует трёхдневный бесплатный пробный период, но для его активации необходимо пополнить счёт на 90 долларов.
Помимо онлайн-версии, вы можете скачать мобильное приложение для iOS и Android. Однако на момент обзора в нём не получится бесплатно сгенерировать картинки — требуется подписка. В приложении можно редактировать фотографии и загружать собственные изображения для добавления различных эффектов с помощью нейросети. Например, можно вставить фото известной личности рядом с вашим фотопортретом.
Изображение: Dream by Wombo / Skillbox Media
Image Creator — нейросеть, интегрированная в Bing
Изображение: Image Creator / Skillbox MediaПопробовать онлайн →
Image Creator — это нейросеть Microsoft, которая позволяет создавать картинки через чат-бота Bing или на отдельной странице в любом браузере. Для начала работы вам достаточно перейти по ссылке и авторизоваться.
Image Creator отлично воплощает текстовые описания, но разработчики предупреждают: некоторые картинки могут выглядеть неправдоподобно или искажать определённые элементы. Этот недостаток присущ многим нейросетям, так как развитие любой новой технологии требует времени.
Стиль изображения следует указывать в запросе, где также можно указать настроение рисунка и другие детали. Нейросеть генерирует квадратные картинки в высоком разрешении, размер выбрать нельзя.
В день вы можете использовать 25 улучшений, позволяющих создавать картинки без очереди. Как только улучшения закончатся, время ожидания рисунка увеличится. Нейросеть создаёт сразу четыре иллюстрации за один запрос и сохраняет их историю. Таким образом, вы можете сгенерировать несколько вариантов и выбрать из них лучший.
Интерфейс нейросети Image Creator Microsoft Edge
Изображение: Image Creator / Microsoft / Skillbox Media
Starryai — рисует картинки по референсам
Изображение: Starryai / Skillbox MediaПопробовать онлайн →
Нейросеть Starryai создаёт изображения по текстовым запросам, а также на основе готовых фотографий. После авторизации вы получите пять Lumen — внутренней валюты сервиса. На генерацию одного изображения в разрешении 2048×2560 пикселей уходит 1–2 монеты в зависимости от выбранного стиля. Нейросетью можно пользоваться в онлайне или в iOS-приложении. Версия для Android пока недоступна.
Если бесплатных генераций вам оказалось недостаточно, Lumen можно купить отдельно — от 40 до 1000 штук. За 40 штук нужно заплатить 15,99 доллара. Также Lumen можно зарабатывать, рассказывая о сервисе в различных соцсетях и на других платформах. Например, вы можете заработать 3 Lumen, опубликовав своё творение и упомянув tarryai на любом сабреддите.
Для начала работы выберите стиль изображения. Нейросеть умеет создавать художественные рисунки, реалистичные фотографии, детализированные, плоские и 3D-иллюстрации. Вы также можете создать собственный стиль. Для этого выберите от 5 до 60 фото в желаемом стиле, и нейросеть сможет сгенерировать рисунки на их основе.
После выбора стиля сгенерируйте текстовый запрос. Если у вас есть фотореференс, нажмите на кнопку «Загрузить изображение», и нейросеть возьмёт её за основу. Кнопка Prompt builder предлагает выбрать стилистику: текстуры, направления в живописи, а также имена известных художников. Кнопка Inspire me генерирует с помощью искусственного интеллекта случайный запрос, который вы можете взять для вдохновения.
Изображения создаются в формате 4:5. Если вы хотите изменить разрешение или улучшить готовый образ, потребуется оформить подписку. Также за дополнительную плату сервис предлагает улучшение качества рисунка, эксклюзивные стили и возможность масштабирования картинок. Подписку можно оформить на неделю или на год. Минимальный тариф стоит 1,99 доллара в неделю и включает 50 Lumen.
Интерфейс нейросети Starryai с четырьмя вариантами картинок по одному запросу
Изображение: Starryai / Skillbox Media
Lexica — платный генератор с большой медиатекой
Изображение: Lexica / Skillbox MediaПопробовать онлайн →
Lexica — это платный онлайн-сервис, доступный только авторизованным пользователям. Минимальный тариф стоит 8 долларов в месяц при плате за год и включает 1000 быстрых генераций, при которых используются самые мощные серверы компании. Если вы исчерпаете лимит генераций на стартовом тарифном плане, то до начала следующего месяца создавать новые изображения будет невозможно.
Однако доступны тарифы Pro и Max, которые предлагают до 7000 быстрых генераций и позволяют продолжать создание иллюстраций даже после исчерпания лимита. В этом случае новые картинки будут обрабатываться в медленной очереди, а их количество не будет ограничено.
Для начала работы перейдите во вкладку Generate, введите текстовый запрос и при необходимости добавьте негативный промпт — элементы, которые вы не хотите видеть на фото. Также можно изменить разрешение и ориентацию изображения, а после генерации отредактировать его.
Lexica не предлагает бесплатного тарифа для пробного периода и знакомства с ИИ-сервисом. Однако на главной странице есть поисковая строка, где вы можете ввести запрос и просмотреть примеры работ. Также вы можете кликнуть на любое изображение, чтобы увидеть его вариации.
Подборка картинок со слоном в медиатеке Lexica. Даже Джокер здесь как-то оказался
Изображение: Lexica / Skillbox Media
Easy-Peasy.AI — агрегатор популярных нейросетей на выбор
Картинка от нейросети Recraft v3, сгенерированная в сервисе Easy-Peasy.AI
Изображение: Easy-Peasy.AI / Skillbox MediaПопробовать онлайн →
Easy-Peasy.AI — это онлайн-сервис, который позволяет создавать изображения с помощью одной из доступных нейросетей: DALL-E 3, Midjourney v6, Stable Diffusion 3.5, Stable Diffusion 3.0 и других. Помимо выбора нейросети, вы можете задать стиль изображения или указать имя художника, чей стиль искусственный интеллект должен будет воспроизвести. Однако есть ограничение: стили современных художников нельзя скопировать из-за авторских прав.
По умолчанию сервис рекомендует использовать модель DALL-E 3. Одна стандартная картинка в разрешении 1024×1024 пикселя стоит два кредита. Пример такого рисунка вы можете увидеть выше. За дополнительные кредиты можно изменить разрешение и повысить качество изображения.
Для получения лучших результатов сервис предлагает использовать Midjourney v6. За генерацию одной картинки нейросеть берёт два кредита и создаёт четыре картинки за раз — то есть для одного промпта нужно восемь кредитов. На бесплатном тарифе протестировать нейросеть не получится, так как вам доступно всего пять кредитов. За дополнительную плату можно изменять соотношение сторон изображения в диапазоне от 1:1 до 9:21.
За создание картинки размером 1024×1024 пикселя нейросеть Stable Diffusion 3.0 берёт 2 кредита. За дополнительную плату можно повысить качество изображения и выбрать другое соотношение сторон вместо 1:1.
Картинка от нейросети Stable Diffusion 3.0, сгенерированная через сервис Easy-Peasy.AI
Изображение: Easy-Peasy.AI / Skillbox Media
Самой экономичной является нейросеть Stable Diffusion XL, которая берёт 0,25 кредита за одно изображение. За 1 кредит можно создать 4 картинки.
Картинка от нейросети Stable Diffusion XL, сгенерированная через сервис Easy-Peasy.AI
Изображение: Easy-Peasy.AI / Skillbox Media
Минимальная стоимость подписки на Easy-Peasy.AI начинается от 4,99 доллара в месяц при плате за год. Подписка включает все инструменты сервиса, но для генерации картинок на базовом тарифе доступно всего 25 кредитов. За 40 долларов в месяц вы можете приобрести максимальный пакет, но он ограничен 700 кредитами.
Для точной генерации изображений в сервисе доступны чат-боты, которые помогут создать описание и получить желаемый результат. Рекомендуем протестировать разных ботов и AI-модели, чтобы выбрать свой вариант.
AI Banner — генератор рекламных баннеров
Изображение: AI Banner / Skillbox MediaПопробовать онлайн →
AI Banner — сервис для автоматического создания рекламных баннеров. Он генерирует изображения на основе URL-адреса сайта, текстового описания или заданного промпта. Этот инструмент будет полезен маркетологам и всем, кто хочет повысить эффективность своих рекламных кампаний.
Сервис предлагает девять стилей изображений и пять размеров баннеров, которые вы можете подобрать в зависимости от рекламной площадки. По умолчанию AI Banner использует стиль «Быстрая генерация» и ставит скорость приоритетнее детализации. Вам доступны два квадратных варианта с соотношением сторон 1:1 (512×512 и 1024×1024 пикселей), а также форматы 16:9 (1024×576), 4:5 (792×992) и 9:16 (576×1024 пикселей).
Интерфейс AI Banner можно переключать между русским и английским языками, однако текстовое описание должно быть только на английском и ограничено 1000 знаков. Кроме того, сервис предоставляет возможности AI-улучшения фотографий — можно заменить фон, расширить область изображения, подкорректировать отдельные цвета и так далее. После трёх генераций вам нужно будет создать аккаунт, чтобы продолжить работу.
Пользовательский интерфейс нейросети AI Banner
Скриншот: AI Banner / Skillbox Media
Playground — нейросеть для творчества с удобным AI-редактором
Изображение: Playground / Skillbox MediaПопробовать онлайн →
После регистрации вы попадаете на главную страницу, где можете выбрать нужный тип дизайна или загрузить свою картинку. Playground предлагает готовые шаблоны для создания логотипов, постов для соцсетей, стикеров, постеров, мемов, принтов на футболках, поздравительных открыток, обложек для электронных книг, мобильных обоев и других материалов.
После добавления исходного изображения просто опишите, что хотите увидеть в выбранном дизайне, — AI сгенерирует варианты изображений по вашему запросу. Промпты нужно добавлять на английском языке, или можно воспользоваться готовыми подсказками сервиса. В процессе работы вы также можете изменить соотношение сторон и стиль картинки. Готовый вариант можно отправить по ссылке или скачать, нажав на кнопку Export.
Бесплатная версия сервиса Playground не позволяет использовать сгенерированные изображения в коммерческих целях. Для этого необходима подписка, стоимость которой начинается от 12 долларов в месяц. В рамках подписки вы можете генерировать до 75 изображений каждые три часа. Также вам будут доступны функции улучшения качества изображений, удаления фона и дополнительные стили для генерации.
Стартовая страница сервиса Playground с коллекцией готовых макетов
Скриншот: Playground / Skillbox Media
Кому принадлежат права на сгенерированные нейросетью изображения?
На данный момент ответ — никому.
Нейросеть не человек, поэтому никакие права принадлежать ей не могут. Создатели нейросетей никакого участия в генерации изображений не принимают, поэтому также не могут претендовать на авторские права. Вам, в свою очередь, права тоже не принадлежат: вы не принимали значительного участия в создании картинки (пока что идея и текстовый запрос активным участием не считаются).
Пока не введено никакого регулирования, вы можете генерировать сколько угодно изображений и использовать их где и как захотите.
Рисующие нейросети хорошо справляются с абстрактными запросами, но могут испытывать трудности в отрисовке конкретных деталей. Если интересно, попробуйте сами и напишите такой запрос: «Слонёнок ест бананы на фоне города, закатное солнце, стиль Pixar». Скорее всего, только три из восьми нейросетей смогут изобразить бананы, а стиль Pixar удастся воспроизвести лишь двум.
Хоть логика построения запросов везде примерно одинаковая, в каждой нейросети есть свои нюансы. Поэтому рекомендуем выбрать одну, самую удобную, и тренироваться писать запросы в ней. Тогда результат получится более предсказуемым.