Команды Sber AI и SberDevices начали разработку базовой модели ruDALL-E XL уже давно, и представили первую версию полгода назад – ее результаты уже были очень впечатляющими. Летом 2022 была представлена новая версия, дообученная и вместе с этим одна из самых мощных нейросетей для создания цифровых изображений из словосочетаний или текстовых сюжетов на русском языке – Kandinsky. Она названа в честь русского художника – абстракциониста. Модель позволяет создавать разные типы изображений – от иллюстраций и фотографий до промышленного дизайна.
Получение итогового результата проходит в три этапа:
- Нейросеть Kandinsky из текста создает заданное число изображений
- Нейросеть ruCLIP Large отбирает наиболее схожие с описанием изображения
- Выбранные изображения увеличиваются в размере по диффузионному принципу или Real-ESRGAN.
На выходе пользователь получает набор итоговых изображений высокого разрешения. Важно, что в сравнении с другими нейросетями, детализация финальных изображений получается более качественной.
Полную информацию про создание модели и функциям можно прочитать по️ ссылке.
Как пользоваться Kandinsky:
Сейчас все функции нейросети доступны любому пользователю без ограничений. Для этого необходимо:
- Активизировать нейросеть в мобильном приложении Салют и умных устройствах Sber по запросу: «Салют, включи художника»
- Присоединиться к сообществу Discord и ввести сюжет будущей картины в ветке чата “BOT GALLERY”, после чего дождаться окончания работы нейросети