Появление генеративного ИИ, способного создавать уникальные и реалистичные изображения, произвело революцию – теперь разработчики воплощают своё художественное видение с помощью текстовых подсказок. Но выбор генератора может оказаться сложным, т.к. существует множество сервисов с разным функционалом и ограничениями. В представленном обзоре описаны принципы, функционал и ограничения наиболее популярных нейросетей; это поможет Вам сделать выбор.
По оценкам многих экспертов генеративная нейросеть Firefly от компании Adobe – это лучший инструмент создания изображений на базе текстовых запросов. Он генерирует привлекательные, живые и разнообразные иллюстрации. Здесь лучше всего получаются изображения в художественном стиле, но, немного потрудившись над промптом, Вы можете добиться и отличной фотореалистичности. Готовые работы способны оживить любые посты в социальных сетях, блогах, печатных материалах, а также стать отличной альтернативой платным стоковым фотографиям.
Бесспорным преимуществом нейронной сети Firefly стала её тесная связь с творческими продуктами Adobe Creative Cloud; она позволяет искусно управлять художественными и стилистическими эффектами. Благодаря этому Вы можете придать своим работам уникальный характер и сгладить те недочёты, которые присущи иллюстрациям, сгенерированным с помощью сервисов искусственного интеллекта – анатомические несоответствия, смещение или пересечение объектов и пр.
Adobe Firefly интегрирована непосредственно в графический редактор Adobe Photoshop, но также есть web-версия генератора на более мощном «движке» Firefly Image 2.
Нейронная сеть Dall-E разработана компанией OpenAI – создателем революционного чат-бота ChatGPT на базе генеративного искусственного интеллекта. Она стала одним из первых инструментов конвертации текстовых запросов в изображения и сегодня остаётся в числе лидеров среди аналогов. С сентября 2023 г. пользователям доступна нейросеть третьего поколения, способная генерировать полезные, креативные изображения, максимально соответствующие промпту.
Главное преимущество Dall-E 3 – это умение понимать многословные, сложные запросы. Более того, при их составлении не нужно изучать правила синтаксиса, Вы можете ввести текст в любом стиле – разговорном, художественном, научном – и даже использовать эмодзи. Нейросеть проанализирует промпт, самостоятельно модифицирует, усилит его и выдаст наиболее правдоподобный результат.
Dall-E 3 доступен бесплатно в сервисе Bing Image Creator, а также платно по подписке в ChatGPT.
Платформа Leonardo.AI – это полноценный сервис проектирования и оптимизации контента. Используя инструменты на базе генеративного искусственного интеллекта, здесь Вы сможете создавать высокохудожественные изображения в разных стилях на основе текстовых запросов. Картинки всегда получаются интересными, имеют высокую степень прорисовки и сбалансированную гамму цветов.
По функциональности, производительности и качеству изображений Leonardo.AI превосходит многих конкурентов; он стоит примерно на одном уровне с генератором Firefly от Adobe и существенно опережает инструменты от Canva и Google. Нейросеть хорошо понимает подсказки, но, как правило, берёт за основу общий сюжет; уточнить прорисовку отдельных элементов сложно. Сервис содержит минимум инструментов редактирования, но станет полезным и любителям, и профессионалам.
Midjourney – молодая, но очень популярная нейросеть, созданная на базе 2 мощных технологий машинного обучения – большой языковой (БЯМ) и диффузионной моделей. С её помощью разработчики контена создают живые, хорошо прорисованные концепт-арты, персонажи и просто иллюстрации.
Midjourney требует предварительного обучения и может показаться сложной, если Вы новичок. Чтобы получить именно те изображения, которые нужны, предстоит хорошо поработать над промптом – создать подробный и точный запрос с соблюдением правил синтаксиса. Но после того как Вы освоите основы, Midjourney станет удобным, креативным инструментом, который может конкурировать на равных даже с таким мощным сервисом как Dall-E 3.
Midjourney интегрирован в мессенджер Discord; генерировать картинки с помощью этой нейросети возможно только здесь. Оправляйте текстовый запрос прямо в чат; нейросеть сгенерирует изображение и автоматически опубликует его в онлайн-галерее.
Нейронная сеть Kandinsky 3.1 от «Сбербанка» генерирует реалистичные иллюстрации на основе текстовых запросов или готовых фото. Она способна создавать не только статичные изображения, но также анимации и короткие видео. В приложении имеется более 20 предустановленных стилей, объединяя которые, пользователь получает уникальные работы.
Особенности приложения – высокая скорость загрузки и высокое разрешение иллюстраций. Нейросеть Kandinsky 3.1 доступна на разных платформах, в т.ч. на fusionbrain.ai, rudalle.ru, в сетях Telegram и VK.
Нейросеть «Шедеврум» – отечественная разработка от компании «Яндекс». В отличие от русифицированных зарубежных сервисов она намного лучше понимает запросы на русском языке, создавая иллюстрации, приближенные к текстовому описанию. По качеству изображения приблизительно соответствуют ранним версиям популярных генераторов, например Midjourney; они хорошо прорисованы, имеют высокое разрешение, но лишены фотореалистичности.
Хотя «Шедеврум» – несколько «сырая» генеративная нейросеть, она широко используется разработчиками контента, т.к. представляющий её сервис фактически является полноценной соцсетью. Здесь можно общаться с коллегами, обсуждать их работы и обмениваться опытом.
Специализированная нейросеть Looka в корне отличается от ранее описанных; она генерирует логотипы и иную визуальную айдентику бренда на базе предпочтений пользователя. При запуске сервиса Вам необходимо указать исходные сведения (отрасль, название компании) и выбрать желаемые цвета, формы и образы из представленных в каталоге. Система сгенерирует несколько простых, но стильных логотипов; Вы можете выбрать понравившийся и кастомизировать его.
Looka использует библиотеку машинного обучения TensorFlow от Google и собственные алгоритмы. Сервис хранит огромный набор качественных фотографий, иконок и иных графических элементов, на основе которых и генерирует изображения. Благодаря этому процесс проектирования логотипа и фирменного стиля становится максимально простым и понятным.
Название |
Краткое описание |
Поддержка русского языка |
Доступность |
Лучший генератор изображений на базе искусственного интеллекта для профессионалов |
Есть |
Платно |
|
Одна из лучших нейросетей, генерирующих текст в качественные изображения, максимально соответствующие запросу |
Есть |
Бесплатно в Bing Image Creator/ платно в ChatGPT |
|
Универсальный генератор высокохудожественных изображений, который подходит и любителям, и профессионалам |
Нет |
Бесплатно с ограничениями/ платно без ограничений |
|
Генератор качественных концепт-артов, персонажей и иллюстраций, который может потребовать немало работы при детализации |
Нет |
Платно |
|
Отличный русскоязычный генератор качественных, хорошо прорисованных изображений |
Есть |
Бесплатно |
|
Нейросеть, хорошо понимающая запросы на русском языке |
Есть |
Бесплатно с ограничениями/ платно без ограничений |
|
Простая нейросеть для создания логотипов и айдентики бренда |
Нет |
Платно |
Как правило, принцип генерации изображений с помощью сервисов на базе искусственного интеллекта одинаков. Чтобы понять его и перейти к практике, разберём процесс проектирования на примере универсальной нейронной сети Leonardo.ai.
Чтобы начать пользоваться платформой, Вам необходимо пройти авторизацию, которая гарантирует конфиденциальность и безопасность персональных сведений. Эта процедура осуществляется максимально просто и быстро; выполните всего несколько шагов:
По завершении регистрации и авторизации перед Вами откроется базовый функционал. Обратите внимание, что на Вашем счету лежит 150 токенов – внутренней валюты платформы; их можно израсходовать на пробные генерации.
Чтобы войти на страницу генератора, нажмите кнопку «Image Creation» основного меню. Система предложит краткий обзор инструментов по созданию изображений; рекомендуется ознакомиться с ним.
Чтобы создать первое изображение, сначала определите его параметры:
Создайте промпт – запрос к нейронной сети. Опишите, какое изображение Вы хотите сгенерировать; формулируйте мысли ясно и однозначно, предпочтительно на английском языке, т.к. нейросети понимают его лучше.
Простой пример промта №1: «Рыбацкая лодка попала в шторм. В ней один рыбак. Небо затянуто тучами».
Пример промта №2. «Рыбацкая лодка попала в шторм. В ней один рыбак, который изо всех сил пытается грести. Небо затянуто тучами, сквозь которые пробиваются редкие лучи солнца».
Пример промта №3: «Рыбацкая лодка попала в шторм. В ней один рыбак, который изо всех сил пытается грести. Небо затянуто тучами, сквозь которые пробиваются редкие лучи солнца. Изображение в стиле Ван Гога».
Обратите внимание, что при модификации единственной подсказки изображение существенно изменилось. Более того, на нём появилось 2 персонажа вместо 1. Это стандартная ситуация, когда нейросеть совершает ошибку. Вам предстоит тщательно поработать над промптом, чтобы получить желаемый результат.
Именно так осуществляется взаимодействие с большинством генеративных нейросетей.
Изображениям, созданным с помощью сервисов на базе искусственного интеллекта, присущи недочёты – анатомические несоответствия, нереальный рендеринг и пр. Как правило, этому есть 2 причины:
Залог успеха – это правильно спроектированный промпт, или текстовый запрос. Когда Вы описываете, какое изображение хотите получить, обязательно отметьте стиль, эстетические нюансы, размеры и иные характеристики. Выражайтесь точно и лаконично.
Каждая нейросеть предъявляется свои правила синтаксиса. Изучите и неукоснительно следуйте им.
В России авторские права на изображения, сгенерированные с помощью ИИ, принадлежат их создателю. Это положение регламентировано нормами Гражданского кодекса РФ, в частности ст. 1257, 1267, 1270.
В мировой практике автором таких иллюстраций также признаётся их разработчик – отдельный человек или организация, но при условии внесения существенного вклада в творческий процесс. В спорных ситуациях суд не всегда встаёт на его сторону; при недостаточном участии права могут быть переданы создателю нейросети и/или программного обеспечения, использованного в работе.
Однако вопрос определения авторства на контент, созданный с помощью ИИ, по-прежнему остается обсуждаемой и сложной темой, находящейся на стыке технологий, права и этики.
Практически все генераторы изображений на базе ИИ способны создавать качественные изображения на базе текстовых запросов. Но они существенно отличаются по функциональности, уровню безопасности и ограничениям. Чтобы выбрать оптимальный вариант, учитывайте несколько аспектов:
Практически все нейросети предлагают тестовые генерации. Воспользуйтесь инструкцией и создайте несколько изображений; это поможет Вам сделать выбор.