Интерфейс Stable Diffusion

Описание элементов интерфейса Stable Diffusion WebUI Automatic 1111

Первая генерация

Если вы хотите создать свое первое изображение, введите строку из слов(промтов) на английском языке, относящуюся к изображению, которое вы хотите вывести, в поле «Подсказка (Promt)» и нажмите «Создать (Generate)».

Но даже если «Подсказка» пуста, изображение будет создано, но картинка будет нечеткой и непонятной.

Что касается того текста, который можно вставить в «Подсказку», обратитесь к Lexica или подобный сайтам, где вы можете посмотреть, какая подсказка была написана для конкретных изображений.

Генерация изображения занимает от 3 секунд до 30 секунд с настройками по умолчанию, в зависимости от мощности вашего ПК. Если вы хотите остановиться в середине генерации, нажмите «Прерывание (Interrupt)».

Сгенерированные изображения будут сохранены в «txt2img-grids» и «txt2img-images» в папке «output», где установлен «Stable Diffusion web UI».

  • «txt2img-grids» сохраняет список изображений, когда одновременно создается несколько изображений.
  • «txt2img-images» хранит все изображения, созданные в прошлом.

Файл, сохраненный в этом «txt2img-images», содержит в названии промт, автоматически вставленный в имя, а значения и настройки встроены в качестве метаданных, поэтому с теми же настройками изображение может быть восстановлено.

Если вы хотите снова использовать метаданные, встроенные в изображение, откройте вкладку «PNG Info» и перетащите изображение.

Затем в правой части экрана отобразятся подсказки, параметры и начальные значения во время генерации.

Что означает каждый элемент на вкладке «txt2img»

Каждый элемент веб-интерфейса Stable Diffusion (версия AUTOMATIC 1111) имеет всплывающую справку. 

«Прокрутка (Roll)» справа от столбца «Подсказка (Prompt)» добавляет случайное имя художника к подсказке создания изображения. Каждый раз, когда вы нажимаете кнопку, добавляется одно новое имя художника.

Художники могут отображаться по категориям, список категорий можно увидеть в нижней части вкладки «Настройки».

 

Ниже приведены настройки, которую необходимо отрегулировать перед созданием изображения. Они находятся в левой части экрана веб-интерфейса Stable Diffusion (версия AUTOMATIC1111).

«Количество шагов (Sampling Steps)» означает, сколько раз нужно выполнить процесс обратной связи для создания изображения. Чем больше это число, тем детальнее будет картинка, но, чем больше это число, тем больше времени займет генерация. Также трудно сказать, что увеличение числа делает картинку хорошей – перебарщивать не стоит. Значение в диапазоне 20-50, выдаст достойный результат.

«Метод семплирования (Sampling method)» позволяет выбрать, какой алгоритм использовать в процессе генерации. «Euler а», который выбран по умолчанию, является самым достойным и универсальным. Хотя, с ним сложно добиться шедевральных результатов.

Отметься галочками опцию «Восстановление лиц (Restore faces)» при генерации реалистичных изображений лиц. «Мозаика (Tiling)» упорядочивает сгенерированные изображения, как плитки.

Stable Diffusion выполняет генерацию изображений «пакетами (batches)». «Количество пакетов(Batch count)» — это количество пакетов, которое нужно сгенерировать за один раз. А «Размер пакета(Batch size)» — количество изображений для создания в одном пакете.

Больший размер пакета требует больше видеопамяти VRAM , А вот время как большее количество пакетов не требует много памяти, потому что процесс выполняется больше раз. Используйте размер пакета 1 с большим количеством пакетов, чтобы иметь возможность генерировать несколько изображений с более высоким разрешением. Это медленнее, но качество изображений намного выше

«Масштаб CFG (CFG Scale)»  указывает, насколько вы следуете подсказкам. Значения от 7 до 11 обычно считается наиболее подходящими.

«Высота (Height)» и «Ширина (Width)» — это размер генерируемого изображения. Поскольку стандартная модель была оптимизирована в первую очередь для 512×512, генерация изображений именно в таком разрешении дает самое высокое качество. Кроме того, размеры изображения напрямую отражаются на объеме используемой видеопамяти – если вы хотите создать длинное по вертикали изображение размером 512×1024, то при малом объеме видеопамяти может возникнуть ошибка и изображение не сгенерируется.

«Семя (Seed)» — это начальное значение генерации. Если это «-1», оно будет генерироваться случайным образом каждый раз. Если вы хотите воспроизвести композицию этого изображения, потому что она было сделано хорошо, вы можете ввести “семя” этого изображения, чтобы создать изображение с другим рисунком, но сохранив при этом ту же композицию и атмосферу.

«Сценарий (Script)» может подключить сценарии. По умолчанию «Нет».

В нижней части сгенерированного изображения отображаются несколько кнопок для управления изображениями. Если выбрано «Сохранить (Save)», сгенерированные изображения сохраняются вместе с файлом CSV в папке «log/images». Выберите одно из сгенерированных изображений и нажмите «Send to img2img», чтобы отправить его на вкладку «img2img». Точно так же «Send to в inpaint» будет отправлено в функцию inpaint на вкладке «img2img», чтобы вы могли повторно сгенерировать неудачную часть изображения. «Send to extras» отправит его на вкладку «Extras».