Промты для Stable Diffusion. Часть 2

Минус- промты и веса ключевых слов
Продолжение статьи "Промты для Stable Diffusion. Часть 1"

Минус- промты (Negative promts)

Использование минус- промтов—  отличный способ управлять качеством изображения, но вместо того, чтобы вставлять то, что вы хотите, вы вставляете то, чего не должно быть на изображении. Они могут быть стилями и нежелательными атрибутами (например, ugly, deformed и тд)

Использование минус- промтов является обязательным для моделей SDv2 . Без него изображения выглядят намного хуже, чем в v1. Они необязательны для моделей v1, но зачастую они либо помогают, либо не мешают.

Мы будем использовать универсальную отрицательную подсказку. 

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face, blurry, draft, grainy

Процесс создания хорошего промта

Пошаговое быстрое построение

Вы должны подходить к быстрому построению подсказки как к повторяющемуся процессу. Как вы увидели из предыдущего раздела, изображения могут быть довольно хорошими, если к теме добавить всего несколько ключевых слов.

Всегда начинайте с простой подсказки только с предметом, категорией и стилем. Создавайте как минимум 4 изображения за раз, чтобы увидеть, что у вас получится. Большинство промтов не работают в 100% случаев. Полученное представление о том, что они могут сделать поможет наметить правильный путь для доработки промта.

Добавляйте не более двух ключевых слов за раз. Точно так же создайте как минимум 4 изображения, чтобы оценить эффект изменений.

Использование минус- промтов

Вы можете использовать универсальную отрицательную подсказку, если вы только начинаете разбираться со Stable Diffusion.

Ключевые слова в минус- промтах могут быть объектами или частями тела, которых нужно избежать (поскольку модели v1 не очень хорошо отображают руки, было бы неплохо использовать «extra hand and extra fingers»)

Дополнительные возможности промтов

Вы можете изменить важность ключевого слова, переключившись на другое на определенном шаге выборки.

Следующие синтаксисы применяются к AUTOMATIC1111 GUI

Вес ключевого слова

Вы можете настроить вес ключевого слова с помощью синтаксиса (ключевое слово: фактор)факторэто значение, при котором меньше 1 означает менее важное, а больше 1 означает более важное. Увеличение значения приведет к более выраженному акценту на это ключевое слово, либо к увеличению его масштаба на изображении.

() и [] синтаксис

Эквивалентным способом настройки силы ключевого слова является использование ()и []

(ключевое слово)увеличивает силу ключевого слова в 1,1 раза и совпадает с (ключевое слово:1.1)

[ключевое слово]уменьшает силу ключевого слова в 0,9 раза и равно (ключевое слово:0.9).

Например, следующие настройки будут иметь одинаковую силу ключевого слова:

(ключевое слово): 1,1
((ключевое слово)): 1,21
(((ключевое слово))): 1,33

или

[ключевое слово]: 0,9
[[ключевое слово]]: 0,81
[[[ключевое слово]]]: 0,73

Смешение ключевых слов

Вы можете смешать два ключевых слова:

[ключевое слово1 : ключевое слово2: фактор]

факторконтролирует, на каком шаге ключевое слово1 переключается на ключевое слово2. Это число от 0 до 1.

Например, если использовать подсказку

Фотография [Утка: Курица: 0,5] , мы получим изображение, взявшее 50% от утки и 50% от курица. При уменьшении фактора – изображение будет все больше походить на утку, при увеличении – на курицу.

 

Насколько длинным может быть промт?

В зависимости от того, какой сервис для Stable Diffusion вы используете, максимальное количество ключевых слов, которые вы можете использовать в приглашении, может быть различным. В базовой модели Stable Diffusion v1 этот лимит составляет 75 токенов .

Обратите внимание, что токены — это не то же самое, что слова. Модель CLIP, которую использует Stable Diffusion, автоматически преобразует подсказку в токены — числовое представление слов, которые она знает. Если вы вставите слово, которое SD не знает, оно будет разбито на 2 или более подслов, пока SD не узнает, что это такое. Слова, которые SD знает, называются токенами, которые представлены в виде чисел. Например, Dream— это один токен, Beach— это один токен. Но Dreambeach — это две лексемы, потому что модель не знает этого слова, и поэтому модель разбивает слово на два, dreamи beach, которые известны.

AUTOMATIC1111 не имеет ограничений по количеству токенов . Если промт содержит более 75 токенов, создастся новый блок из еще 75 токенов, и новый «лимит» станет 150. Процесс может продолжаться вечно или до тех пор, пока на вашем компьютере не закончится память… Но, как правильно, очень длинные промты генерируют “мазню” вместо нормальных изображений