logo
Ещё

Нейросети для создания картинок

Появление генеративного ИИ, способного создавать уникальные и реалистичные изображения, произвело революцию – теперь разработчики воплощают своё художественное видение с помощью текстовых подсказок. Но выбор генератора может оказаться сложным, т.к. существует множество сервисов с разным функционалом и ограничениями. В представленном обзоре описаны принципы, функционал и ограничения наиболее популярных нейросетей; это поможет Вам сделать выбор.

Adobe Firefly

По оценкам многих экспертов генеративная нейросеть Firefly от компании Adobe – это лучший инструмент создания изображений на базе текстовых запросов. Он генерирует привлекательные, живые и разнообразные иллюстрации. Здесь лучше всего получаются изображения в художественном стиле, но, немного потрудившись над промптом, Вы можете добиться и отличной фотореалистичности. Готовые работы способны оживить любые посты в социальных сетях, блогах, печатных материалах, а также стать отличной альтернативой платным стоковым фотографиям.

Бесспорным преимуществом нейронной сети Firefly стала её тесная связь с творческими продуктами Adobe Creative Cloud; она позволяет искусно управлять художественными и стилистическими эффектами. Благодаря этому Вы можете придать своим работам уникальный характер и сгладить те недочёты, которые присущи иллюстрациям, сгенерированным с помощью сервисов искусственного интеллекта – анатомические несоответствия, смещение или пересечение объектов и пр.

Adobe Firefly интегрирована непосредственно в графический редактор Adobe Photoshop, но также есть web-версия генератора на более мощном «движке» Firefly Image 2.

Dall-E

Нейронная сеть Dall-E разработана компанией OpenAI – создателем революционного чат-бота ChatGPT на базе генеративного искусственного интеллекта. Она стала одним из первых инструментов конвертации текстовых запросов в изображения и сегодня остаётся в числе лидеров среди аналогов. С сентября 2023 г. пользователям доступна нейросеть третьего поколения, способная генерировать полезные, креативные изображения, максимально соответствующие промпту.

Главное преимущество Dall-E 3 – это умение понимать многословные, сложные запросы. Более того, при их составлении не нужно изучать правила синтаксиса, Вы можете ввести текст в любом стиле – разговорном, художественном, научном – и даже использовать эмодзи. Нейросеть проанализирует промпт, самостоятельно модифицирует, усилит его и выдаст наиболее правдоподобный результат.

Dall-E 3 доступен бесплатно в сервисе Bing Image Creator, а также платно по подписке в ChatGPT.

Leonardo AI

Платформа Leonardo.AI – это полноценный сервис проектирования и оптимизации контента. Используя инструменты на базе генеративного искусственного интеллекта, здесь Вы сможете создавать высокохудожественные изображения в разных стилях на основе текстовых запросов. Картинки всегда получаются интересными, имеют высокую степень прорисовки и сбалансированную гамму цветов.

По функциональности, производительности и качеству изображений Leonardo.AI превосходит многих конкурентов; он стоит примерно на одном уровне с генератором Firefly от Adobe и существенно опережает инструменты от Canva и Google. Нейросеть хорошо понимает подсказки, но, как правило, берёт за основу общий сюжет; уточнить прорисовку отдельных элементов сложно. Сервис содержит минимум инструментов редактирования, но станет полезным и любителям, и профессионалам.

Midjourney

Midjourney – молодая, но очень популярная нейросеть, созданная на базе 2 мощных технологий машинного обучения – большой языковой (БЯМ) и диффузионной моделей. С её помощью разработчики контена создают живые, хорошо прорисованные концепт-арты, персонажи и просто иллюстрации.

Midjourney требует предварительного обучения и может показаться сложной, если Вы новичок. Чтобы получить именно те изображения, которые нужны, предстоит хорошо поработать над промптом – создать подробный и точный запрос с соблюдением правил синтаксиса. Но после того как Вы освоите основы, Midjourney станет удобным, креативным инструментом, который может конкурировать на равных даже с таким мощным сервисом как Dall-E 3.

Midjourney интегрирован в мессенджер Discord; генерировать картинки с помощью этой нейросети возможно только здесь. Оправляйте текстовый запрос прямо в чат; нейросеть сгенерирует изображение и автоматически опубликует его в онлайн-галерее.

Kandinsky

Нейронная сеть Kandinsky 3.1 от «Сбербанка» генерирует реалистичные иллюстрации на основе текстовых запросов или готовых фото. Она способна создавать не только статичные изображения, но также анимации и короткие видео. В приложении имеется более 20 предустановленных стилей, объединяя которые, пользователь получает уникальные работы.

Особенности приложения – высокая скорость загрузки и высокое разрешение иллюстраций. Нейросеть Kandinsky 3.1 доступна на разных платформах, в т.ч. на fusionbrain.ai, rudalle.ru, в сетях Telegram и VK.

«Шедеврум»

Нейросеть «Шедеврум» – отечественная разработка от компании «Яндекс». В отличие от русифицированных зарубежных сервисов она намного лучше понимает запросы на русском языке, создавая иллюстрации, приближенные к текстовому описанию. По качеству изображения приблизительно соответствуют ранним версиям популярных генераторов, например Midjourney; они хорошо прорисованы, имеют высокое разрешение, но лишены фотореалистичности.

Хотя «Шедеврум» – несколько «сырая» генеративная нейросеть, она широко используется разработчиками контента, т.к. представляющий её сервис фактически является полноценной соцсетью. Здесь можно общаться с коллегами, обсуждать их работы и обмениваться опытом.

Looka

Специализированная нейросеть Looka в корне отличается от ранее описанных; она генерирует логотипы и иную визуальную айдентику бренда на базе предпочтений пользователя. При запуске сервиса Вам необходимо указать исходные сведения (отрасль, название компании) и выбрать желаемые цвета, формы и образы из представленных в каталоге. Система сгенерирует несколько простых, но стильных логотипов; Вы можете выбрать понравившийся и кастомизировать его.

Looka использует библиотеку машинного обучения TensorFlow от Google и собственные алгоритмы. Сервис хранит огромный набор качественных фотографий, иконок и иных графических элементов, на основе которых и генерирует изображения. Благодаря этому процесс проектирования логотипа и фирменного стиля становится максимально простым и понятным.

Что выбрать – сводная таблица

Название

Краткое описание

Поддержка

русского языка

Доступность

Adobe Firefly

Лучший генератор изображений на базе искусственного интеллекта для профессионалов

Есть

Платно

Dall-E 3

Одна из лучших нейросетей, генерирующих текст в качественные изображения, максимально соответствующие запросу

Есть

Бесплатно в Bing Image Creator/

платно в ChatGPT

Leonardo AI

Универсальный генератор высокохудожественных изображений, который подходит и любителям, и профессионалам

Нет

Бесплатно с ограничениями/

платно без ограничений

Midjourney

Генератор качественных концепт-артов, персонажей и иллюстраций, который может потребовать немало работы при детализации

Нет

Платно

Kandinsky

Отличный русскоязычный генератор качественных, хорошо прорисованных изображений

Есть

Бесплатно

«Шедеврум»

Нейросеть, хорошо понимающая запросы на русском языке

Есть

Бесплатно с ограничениями/

платно без ограничений

Looka

Простая нейросеть для создания логотипов и айдентики бренда

Нет

Платно

Как создать изображение с помощью ИИ – разберём на примере

Как правило, принцип генерации изображений с помощью сервисов на базе искусственного интеллекта одинаков. Чтобы понять его и перейти к практике, разберём процесс проектирования на примере универсальной нейронной сети Leonardo.ai.

Шаг 1. Авторизация в системе

Чтобы начать пользоваться платформой, Вам необходимо пройти авторизацию, которая гарантирует конфиденциальность и безопасность персональных сведений. Эта процедура осуществляется максимально просто и быстро; выполните всего несколько шагов:

  1. Откройте сайт проекта Leonardo.ai и запустите генератор, нажав кнопку «Get Started».
  2. Выберите наиболее удобный способ и авторизуйтесь. Вы можете зарегистрироваться и/или войти в систему по email, либо с помощью аккаунтов Apple, Google, Microsoft.

  3. Придумайте и введите имя пользователя; выберите интересы (минимум 1) и нажмите «Next».

  4. Выберите роль и нажмите кнопку «Done».

  5. Ознакомьтесь с условиями обслуживания и примите их.

По завершении регистрации и авторизации перед Вами откроется базовый функционал. Обратите внимание, что на Вашем счету лежит 150 токенов – внутренней валюты платформы; их можно израсходовать на пробные генерации.

Шаг 2. Настройка параметров

Чтобы войти на страницу генератора, нажмите кнопку «Image Creation» основного меню. Система предложит краткий обзор инструментов по созданию изображений; рекомендуется ознакомиться с ним.

Чтобы создать первое изображение, сначала определите его параметры:

  1. На панели инструментов (слева) выберите пресет (например, Leonardo Phoenix).
  2. Выберите размер, разрешение изображений.

  3. Выберите количество изображений, которое хотите сгенерировать.

  4. Введите промпт в специальную строку и сгенерируйте изображения, нажав кнопку «Generate».

Шаг 3. Создание промта – запроса к нейронной сети

Создайте промпт – запрос к нейронной сети. Опишите, какое изображение Вы хотите сгенерировать; формулируйте мысли ясно и однозначно, предпочтительно на английском языке, т.к. нейросети понимают его лучше.

  1. Создайте базовое описание. Сначала укажите объект и его окружение.

    Простой пример промта №1: «Рыбацкая лодка попала в шторм. В ней один рыбак. Небо затянуто тучами».

  2. Уточните описание. Просто назвать объекты недостаточно: зачастую они не связаны между собой логически и эмоционально. Поэтому детализируйте концепцию, используя существительные, глаголы, прилагательные. Также Вы можете попытаться оперировать абстрактными понятиями, поработать с освещением и пр.

    Пример промта №2. «Рыбацкая лодка попала в шторм. В ней один рыбак, который изо всех сил пытается грести. Небо затянуто тучами, сквозь которые пробиваются редкие лучи солнца».

  3. Задайте стиль. Базы нейронных сетей содержат множество образцов разных жанров и авторских стилей известных художников; поэтому Вы можете указать их названия в описании.

    Пример промта №3: «Рыбацкая лодка попала в шторм. В ней один рыбак, который изо всех сил пытается грести. Небо затянуто тучами, сквозь которые пробиваются редкие лучи солнца. Изображение в стиле Ван Гога».

  4. Попробуйте задать другой стиль, например минимализм.

    Обратите внимание, что при модификации единственной подсказки изображение существенно изменилось. Более того, на нём появилось 2 персонажа вместо 1. Это стандартная ситуация, когда нейросеть совершает ошибку. Вам предстоит тщательно поработать над промптом, чтобы получить желаемый результат.

Именно так осуществляется взаимодействие с большинством генеративных нейросетей.

FAQ

Почему изображения, созданные с помощью генеративных нейронных сетей, зачастую выглядят странно?

Изображениям, созданным с помощью сервисов на базе искусственного интеллекта, присущи недочёты – анатомические несоответствия, нереальный рендеринг и пр. Как правило, этому есть 2 причины:

  1. Несовершенство языковых моделей, на базе которых созданы нейросети. Не располагая объёмом информации, необходимым для получения ожидаемых результатов, интеллектуальные системы совершают ошибки или, как принято говорить, порождают «галлюцинации».
  2. Неточный промптинг. При формировании текстового запроса пользователи нередко вводят много абстрактных понятий, упускают нюансы или вовсе не описывают контекст. В таком случае самые продвинутые генераторы могут совершать грубые ошибки.

Как создать качественное изображение с помощью нейросети?

Залог успеха – это правильно спроектированный промпт, или текстовый запрос. Когда Вы описываете, какое изображение хотите получить, обязательно отметьте стиль, эстетические нюансы, размеры и иные характеристики. Выражайтесь точно и лаконично.

Каждая нейросеть предъявляется свои правила синтаксиса. Изучите и неукоснительно следуйте им.

Кому принадлежат авторские права на изображения, сгенерированные с помощью нейронных сетей?

В России авторские права на изображения, сгенерированные с помощью ИИ, принадлежат их создателю. Это положение регламентировано нормами Гражданского кодекса РФ, в частности ст. 1257, 1267, 1270.

В мировой практике автором таких иллюстраций также признаётся их разработчик – отдельный человек или организация, но при условии внесения существенного вклада в творческий процесс. В спорных ситуациях суд не всегда встаёт на его сторону; при недостаточном участии права могут быть переданы создателю нейросети и/или программного обеспечения, использованного в работе.

Однако вопрос определения авторства на контент, созданный с помощью ИИ, по-прежнему остается обсуждаемой и сложной темой, находящейся на стыке технологий, права и этики.

Вывод

Практически все генераторы изображений на базе ИИ способны создавать качественные изображения на базе текстовых запросов. Но они существенно отличаются по функциональности, уровню безопасности и ограничениям. Чтобы выбрать оптимальный вариант, учитывайте несколько аспектов:

  • соответствие результата описанию;
  • привлекательность, качество иллюстраций;
  • скорость генерации;
  • функциональные возможности: типы и количество инструментов;
  • простоту/сложность управления;
  • наличие/отсутствие бесплатного тарифного плана.

Практически все нейросети предлагают тестовые генерации. Воспользуйтесь инструкцией и создайте несколько изображений; это поможет Вам сделать выбор.