Сбер не отстаёт от современных трендов и наравне с другими корпорациями создал свою Нейросеть под названием Kandinsky. В качестве преимуществ разработчики заявляют о том, что данный ИИ лучше понимает запросы на русском языке, а также может генерировать изображения, максимально приближенные к реальности. На сколько это соответствует действительности — рассказали в статье.
Официально нейросеть Kandinsky 2.1 была запущена весной 2023 года. На тот момент функционал Кандинского хоть и был значительно улучшен по сравнению с первой версией — моделью ruDALL-E XL (2021 год), но все же отставал от своих конкурентов (проектов Midjourney и Stable Diffusion). Созданные им изображения были далеки от фотореализма.
Разработчики постарались учесть недостатки и в июле 2023 представили обновлённую версию. Главной особенностью проекта была объявлена генерация крайне реалистичных изображений в высоком качестве. В скором времени модель шагнула вперёд и позволила пользователям создавать короткие видеоролики (до 4 секунд). Как и другие нейросети, Кандинский создает контент согласно текстовым запросам пользователей.
Осенью 2023 года разработчики представили новую версию — Kandinsky 3.0, а также модель Kandinsky Video. Создатели познакомили нейросеть с русским фольклором, культурой и искусством, известными российскими актёрами, персонажами из сказок и пр. Это позволило создавать новые интересные изображения без развернутого словесного описания.
Последней и самой актуальной версией нейросети от Сбера является Kandinsky 3.1 — она была выпущена в мае 2024 года.
В функционале нейросети Кандинский есть:
Использовать изображения, полученные с помощью Kandinsky, можно только в некоммерческих целях.
Нейросеть “Кандинский” представлена сразу в нескольких форматах, благодаря чему вы можете пользоваться функционалом ИИ с разных устройств:
1) Сайт Fusion Brain. Он считается официальным сайтом, где быстрее всего появляются все последние обновления. Владельцы сайта — институт AIRI, научно-исследовательский институт искусственного интеллекта. Помимо Кандинского, здесь можно протестировать и другие нейросети, однако “Кандинский” стал первым ИИ, размещённым тут. Через веб версию вы можете:
Большое преимущество “Кандинского” — это интуитивно понятный интерфейс полностью на русском языке, благодаря которому работать с изображениями будет быстро и просто.
Интерфейс “Кандинского” на сайте Fusion Brain
2) Сайт ruDALL-E. На данном сайте вы можете попробовать не только последнюю версию 3.1, но и архивные версии 2.1, 2.2, ruDALL-E Malevich и пр. Минусы сервиса — он не всегда работает исправно, а также имеет урезанный функционал, плюс — не требуется регистрация.
3) Чат-боты во “ВКонтакте” и Telegram. Это очень удобный вариант для тех, кто хотел бы быстро сгенерировать какое-либо изображение прямо со своего смартфона. Бот в ВК имеет очень урезанный функционал: в нём вы сможете лишь создать изображение на основе команды. Задать расширенные настройки, а также загрузит изображение для редактирования/смешивания и пр. не получится.
Интерфейс “Кандинского” в боте в ВК
Вот такой результат получился в боте в ВК
Телеграм-бот имеет более расширенный функционал и поддерживает последнюю версию 3.1. Вы сможете не только генерировать картинки по словесному описанию, но и загружать изображения для смешивания, редактирования, создания стикеров и пр. Вы также можете получить несколько вариаций для желаемого изображения. Также в “Телеграм” есть отдельный бот для создания видео. Если у вас есть смартфон и доступ в “Телеграм”, то вы можете воспользоваться практическим всем функционалом ИИ через него.
Интерфейс в Телеграм-боте
В Телеграме был отправлен следующий запрос: “Нарисуй белого пушистого котёнка с полупрозрачными блестящими крылышками”. И вот, что получилось:
4) Мобильное приложение “Салют”. Нейросеть интегрирована внутри приложения и доступна не только через смартфон, но и Салют ТВ при использовании команды “Включи художника”.
Нейросеть Кандинский может предложить своим пользователям следующий функционал:
Промпт — это команда, которую вы задаёте нейросети. Именно по вашему промпту, т.е. задаче, ИИ будет создавать изображение. Важно описать задачи наиболее подробно, указать детали (например, цвета), которые играют для вас важную роль.
Помимо описания от себя, интерфейс нейросети позволяет задать стиль (киберпанк, аниме, карандашный рисунок и пр.) и размер изображения. Если с первого раза рисунок удался не таким, как вы задумывали: попросите ИИ доработать изображение или предложить вам ещё несколько вариантов.
На официальном сайте нейросети Fusion Brain можно задать не только положительный, но и негативный промпт, то есть чего не должно быть на изображении. Это также поможет вам уточнить желаемые детали и получить именно то, что вы хотите.
Также можно пробовать добавлять эмодзи в промпт, однако пока нейросеть распознаёт не все — тут нужно пробовать.
“Кандинский” и СhatGPT — это две абсолютно разные нейросети, которые используются для разных целей. Выше мы рассказали подробнее о том что в первую очередь “Кандинский” используется для создания реалистичных изображений.
ChatGPT способен вести диалог с человеком, предметно отвечать на его вопросы, писать развёрнутые объяснения. Искусственный интеллект в Chat GPT способен анализировать поступающую информацию и на её основе давать информативные ответы.
Итак, к “Кандинскому” обращаемся, когда нам нужно создать уникальную и красивую картинку, а к GPT когда хотим получить ответ на какой-либо вопрос, например “в какие страны россиянам не нужна виза?”.
В отличие от GPT, Midjourney и “Кандинский” являются прямыми конкурентами. И первая и вторая нейросеть работает с созданием изображений. При этом, Midjourney является более обученной, в связи с чем её картинки выходят более яркими и реалистичными. Сравним две эти нейросети по нескольким параметрам:
Кандинский |
Midjourney |
|
Стоимость |
Бесплатно. |
От 10$ в месяц. |
Доступность |
Для работы в ботах дополнительная регистрация не требуется, на официальном сайте Fusion Brain достаточно почты и пароля. |
Работает через бот в Дискорде, недавно заблокированном сервисе в России. Перед началом работы сначала нужно зарегистрироваться Дискорде, а затем уже подключиться к Midjourney за дополнительную плату. |
Обученность |
“Кандинский” — это более новая нейросеть. По этой причине она может уступать Midjourney в качестве изображений и реалистичности. |
Более обученная нейросеть, которая способна создавать фото и короткие видео, максимально приближенные к реальности. Также нейросеть имеет бОльшее число доступных стилей. |
Качество изображений |
Качество изображений довольно высокое, с высоким разрешением. |
Высокое качество изображений. |
Язык |
Так как нейросеть создана российскими разработчиками, лучше всего понимает русский язык. Хотя в общей сложности обучена 100+ языкам. |
Для точного изображения необходимо вводить промпты на английском языке. |
Кандинский — это нейросеть, которая была создана институтом AIRI совместно со Сбером. Первая версия была запущена в 2021 году, а весной 2024 года было выпущено последнее обновление.
Нейросеть “Кандинский” специализируется на создание изображений, максимально приближенных к реальным. С каждым обновлением разработчики стараются улучшить качество фото, а также расширить функционал. Помимо фото, ИИ способна создавать короткие видео и анимировать изображения.
“Кандинский” может быть доступен не только с компьютера, но и с телефона. Для удобства пользователей нейросеть доступна не только в качестве веб-версии, но и в формате чат-бота в ВК и в Telegram. Функционал в чат-боте Telegram почти не отличается от компьютерной версии на сайте Fusion Brain.