У Stable Diffusion появился конкурент с открытым исходным кодом. В своей последней версии PixArt становится быстрее и точнее, имея при этом очень высокое разрешение.
Программисты из Даляньского технологического университета представили PixArt-δ (Delta), усовершенствованную структуру генерации текста в изображение, разработанную для конкуренции с семейством Stable Diffusion .
Эта модель является значительным улучшена по сравнению с предыдущей моделью PixArt-α (Alpha), которая уже умела быстро генерировать изображения с разрешением 1024 x 1024 пикселей.
Реклама. ЧОУ ЧАСТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ДОПОЛНИТЕЛЬНОГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ СКИЛБОКС (КОРОБКА НАВЫКОВ), ИНН 9704088880, erid: LdtCJzD4K
Генерация изображений высокого разрешения за 0,5 секунд
PixArt-δ интегрирует модель скрытой согласованности (LCM) и ControlNet в модель PixArt-α, что значительно ускоряет скорость вывода. Модель может генерировать высококачественные изображения с разрешением 1024 x 1024 пикселей всего за два-четыре шага всего за 0,5 секунды, что в семь раз быстрее, чем PixArt-α.
SDXL Turbo , представленный Stability AI в ноябре 2023 года, может генерировать изображения размером 512 x 512 пикселей всего за один шаг, или примерно за 0,2 секунды.
Однако результаты PixArt-δ имеют более высокое разрешение и кажутся более законченными по сравнению с SDXL Turbo и четырехэтапным вариантом SDXL с LCM. На изображениях меньше ошибок, и модель более точно следует инструкциям.
Новая модель PixArt предназначена для эффективного обучения на графических процессорах V100 с 32 ГБ видеопамяти менее чем за 24 часа. Кроме того, его возможности 8-битного вывода позволяют синтезировать 1024-пиксельные изображения даже на 8-Гбайт графических процессорах, что значительно повышает удобство использования и доступность.