Kandinsky: нейрохудожник по-русски

от команды Sber AI и SberDevices
Сложность
2/5

Команды Sber AI и SberDevices  начали разработку базовой модели ruDALL-E XL уже давно, и представили первую версию полгода назад – ее результаты уже были очень впечатляющими. Летом 2022 была представлена новая версия, дообученная и вместе с этим одна из самых мощных нейросетей для создания цифровых изображений из словосочетаний или текстовых сюжетов на русском языке – Kandinsky. Она названа в честь русского художника – абстракциониста. Модель позволяет создавать разные типы изображений – от иллюстраций и фотографий до промышленного дизайна.

Получение итогового результата проходит в три этапа:

  1. Нейросеть Kandinsky из текста создает заданное число изображений
  2. Нейросеть ruCLIP Large отбирает наиболее схожие с описанием изображения
  3. Выбранные изображения увеличиваются в размере по диффузионному принципу или Real-ESRGAN.

На выходе пользователь получает набор итоговых изображений высокого разрешения. Важно, что в сравнении с другими нейросетями, детализация финальных изображений получается более качественной.

Полную информацию про создание модели и функциям можно прочитать по️ ссылке.

Как пользоваться Kandinsky:

Сейчас все функции нейросети доступны любому пользователю без ограничений. Для этого необходимо:

  • Активизировать нейросеть в мобильном приложении Салют и умных устройствах Sber по запросу: «Салют, включи художника»
  • Присоединиться к сообществу Discord и ввести сюжет будущей картины в ветке чата “BOT GALLERY”, после чего дождаться окончания работы нейросети