4 место Stable Diffusion и ZennoPoster - Генерируем картинки в домашних условиях

indigo666

Client
Регистрация
10.05.2014
Сообщения
1 187
Реакции
406
Баллы
83
Что такое Stable Diffussion?

Stable Diffusion - это бесплатный аналог ( с открытым исходным кодом ) Midjourney, который позволяет создавать изображения на основе текстовых описаний. Он был выпущен в 2022 году и разработан группой компаний CompVis в Мюнхенском университете совместно с Runway, EleutherAI и LAION.

Stable Diffusion представляет собой инновационный подход к генерации изображений, который использует текстовые данные для создания высококачественных визуальных контентов.

Это предоставляет пользователям возможность превратить текстовые описания в уникальные и привлекательные изображения.

Примеры сгенерированных мною картин на Stable Diffusion на своем ноутбуке

107377
107378
107379
107380

107381


Кому это нужно?

Всем, кому нужны уникальные картинки для контента. Их можно использовать для автоматического наполнения своих сайтов, групп и пабликов в социальных сетях, для наполнения товарами интернет магазинов и т.д.

Применение широкое.

Что мы будем делать в рамках статьи?

Мы установим у себя на домашнем ПК / Ноуте Stable Diffusion и будем генерировать картинки через наш любимый Zennoposter )

Требования

Для того, чтобы поднять Stable Diffusion у себя на ПК по данному примеру, у вас должна быть Видеокарта Nvidia хотя бы с 4гб оперативной памятью.


Характеристики Ноутбука на котором поднимался StableDiffusion в данном эксперименте

7oaFulH.png
gUwgc7w.png
iK8jjQg.png



Качаем Stable Difussion с WebUI и обученные модели

Stable Diffusion с WebUI - Официальный можно скачать отсюда -> GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
Модели Stable Diffusion - Качаем отсюда CompVis/stable-diffusion-v-1-4-original · Hugging Face

Дообученная модель для более качественной генерации лиц - stabilityai/sd-vae-ft-mse-original · Hugging Face
* Я в данном эксперименте взял vae-ft-mse-840000-ema-pruned.ckpt так как характеристики ноута позволяют, если у вас характеристики поменьше, можете взять более слабые версии

Дообученные обычными пользователями модели можно взять отсюда: https://civitai.com/
Для данного эксперимента я скачал несколько дообученных моделей

KhqAsBH.png


ИМХО из них лучший Deliberate https://civitai.com/models/4823/deliberate , на нем и сгенерированы картинки выше в примерах.

После того как скачали модели, их всех кидаем в папку models/Stable-diffusion
Следующее, что нам нужно сделать - чутка подкорректировать файл webui-user.bat для лучшей генерации лиц. Для этого открываем файл в любом текстовом редакторе, например Notepad++

Вот содержимое файла у меня:

Код:
Развернуть Свернуть Копировать
@echo off

set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS= --api --xformers --vae-path "models\Stable-diffusion\vae-ft-mse-840000-ema-pruned.ckpt"

call webui.bat

Сохраняем и закрываем.


Все, теперь можно запустить у нас Stable Diffusion. Для этого запускаем webui-user.bat
У вас должна открыться консоль и там вы увидите нечто такое:

WW7mz2R.png


Это значит, что у нас webui запущен и можно поэкспериментировать с моделями, генерировать картинки. Для этого в браузере переходим:

http://127.0.0.1:7860/

Перед вами откроется веб интерфейс:
1CDW22e.png


ZennoPoster

Шаблон у нас минимальный. Генерирует изображение согласно промту ( описанию ) во входных настройках, или же берет с файла, тоже указывается во входных настройках.


Работает шаблон через API.

Шаблон прикладываю.


Заключение

Это просто был эксперимент. Мне на данный момент генерация изображений не очень то и нужно )) Но скоро понадобиться.

Точно также можно на домашнем ПК поднять аналоги Chat GPT. Я уже пробовал на CPU запустить языковую модель Alpasta. Работает конечно очень медленно на cpu, долго генерирует, на GPU еще не запускал, но на следующем конкурсе возможно напишу статью и про него ))

В чем преимущество локального поднятия? Это генерация контента БЕСПЛАТНО и БЕЗ ограничений.

Если учитывать, что картинки размером 500x500 генерируются примерно за 3-4 секунды, то в сутки можно будет генерировать примерно 20-30к картинок для контента. А это неплохой результат.

Также SD и шаблон можно использовать для автогенерации видео через ffmpeg например. Где визуальную часть будет генерировать SD например )

В общем применений много, все на ваше усмотрение.

А вам желаю много трафика и рекордного профита :-)
 
Номер конкурса статей
  1. Девятнадцатый конкурс статей
Тема статьи
  1. Нестандартные хаки
  2. Генерация
  3. Другое

Вложения

Последнее редактирование:
Ого
Что такое Stable Diffussion?

Stable Diffusion - это бесплатный аналог ( с открытым исходным кодом ) Midjourney, которое позволяет создавать изображения на основе текстовых описаний. Оно было выпущено в 2022 году и разработано группой компаний CompVis в Мюнхенском университете совместно с Runway, EleutherAI и LAION.

Stable Diffusion представляет собой инновационный подход к генерации изображений, который использует текстовые данные для создания высококачественных визуальных контентов.

Это предоставляет пользователям возможность превратить текстовые описания в уникальные и привлекательные изображения.

Примеры сгенерированных мною картин на Stable Diffusion на своем ноутбуке

Посмотреть вложение 107377 Посмотреть вложение 107378 Посмотреть вложение 107379Посмотреть вложение 107380
Посмотреть вложение 107381

Кому это нужно?

Всем, кому нужны уникальные картинки для контента. Их можно использовать для автоматического наполнения своих сайтов, групп и пабликов в социальных сетях, для наполнения товарами интернет магазинов и т.д.

Применение широкое.

Что мы будем делать в рамках статьи?

Мы установим у себя на домашнем ПК / Ноуте Stable Diffusion и будем генерировать картинки через наш любимый Zennoposter )

Требования

Для того, чтобы поднять Stable Diffusion у себя на ПК по данному примеру, у вас должно быть Видеокарта Nvidia хотя бы с 4гб оперативной памятью.


Характеристики Ноутбука на котором поднимался StableDiffusion в данном эксперименте

7oaFulH.png
gUwgc7w.png
iK8jjQg.png



Качаем Stable Difussion с WebUI и обученные модели

Stable Diffusion с WebUI - Официальный можно скачать отсюда -> GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
Модели Stable Diffusion - Качаем отсюда CompVis/stable-diffusion-v-1-4-original · Hugging Face

Дообученная модель для более качественной генерации лиц - stabilityai/sd-vae-ft-mse-original · Hugging Face
* Я в данном эксперименте взял vae-ft-mse-840000-ema-pruned.ckpt так как характеристики ноута позволяют, если у вас характеристики поменьше, можете взять более слабые версии

Дообученные обычными пользователями модели можно взять отсюда: https://civitai.com/
Для данного эксперимента я скачал несколько дообученных моделей

KhqAsBH.png


ИМХО из них лучший Deliberate https://civitai.com/models/4823/deliberate , на нем и сгенерированы картинки выше в примерах.

После того как скачали модели, их всех кидаем в папку models/Stable-diffusion
Следующее, что нам нужно сделать - чутка подкорректировать файл webui-user.bat для лучшей генерации лиц. Для этого открываем файл в любом текстовом редакторе, например Notepad++

Вот содержимое файла у меня:

Код:
Развернуть Свернуть Копировать
@echo off

set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS= --api --xformers --vae-path "models\Stable-diffusion\vae-ft-mse-840000-ema-pruned.ckpt"

call webui.bat

Сохраняем и закрываем.


Все, теперь можно запустить у нас Stable Diffusion. Для этого запускаем webui-user.bat
У вас должен открыться консоль и там вы увидите нечто такое:

WW7mz2R.png


Это значит, что у нас webui запущен и можно поэкспериментировать с моделями, генерировать картинки. Для этого в браузере переходим:

http://127.0.0.1:7860/

Перед вами откроется веб интерфейс:
1CDW22e.png


ZennoPoster

Шаблон у нас минимальный. Генерирует изображение согласно промту ( описанию ) во входных настройках, или же берет с файла, тоже указывается во входных настройках.


Работает шаблон через API.

Шаблон прикладываю.


Заключение

Это просто был эксперимент. Мне на данный момент генерация изображений не очень то и нужно )) Но скоро понадобиться.

Точно также можно на домашнем ПК поднять аналоги Chat GPT. Я уже пробовал на CPU запустить языковую модель Alpasta. Работает конечно очень медленно на cpu, долго генерирует, на GPU еще не запускал, но на следующем конкурсе возможно напишу статью и про него ))

В чем преимущество локального поднятия? Это генерация контента БЕСПЛАТНО и БЕЗ ограничений.

Если учитывать, что картинки размером 500x500 генерируются примерно за 3-4 секунды, то в сутки можно будет генерировать примерно 20-30к картинок для контента. А это неплохой результат.

Также SD и шаблон можно использовать для автогенерации видео через ffmpeg например. Где визуальную часть будет генерировать SD например )

В общем применений много, все на ваше усмотрение.

А вам желаю много трафика и рекордного профита :-)
Довольно такие интересная статья!
Можно делать лицо одного и того-же человека (нужно для заполнения профилей вк)? было бы хорошо
 
  • Спасибо
Реакции: indigo666
Эх, и снова только для зеленых((( На радеоне не запустить?
 
Ого

Довольно такие интересная статья!
Можно делать лицо одного и того-же человека (нужно для заполнения профилей вк)? было бы хорошо
Думаю да, надо покопаться )
 
  • Спасибо
Реакции: indigo666
По моему четвёртая картинка очень похожа на актрису. Правда не помню фамилию.
 
По моему четвёртая картинка очень похожа на актрису. Правда не помню фамилию.
Дженнифер Лав Хюит. Если посмотрите видео, поймете )) Именно она и была в промте.

Промт который сгенерировал эту картину:

Дженнифер Лав Хюит пьет пиво с большого бокала )
 
Кстати, если кому интересно - недавно запустили еще и модель без цензуры - называется unstable diffusion, но его я не тестировал )

Отлично подойдет для адалта
 
А как же http://www.unstability.ai ?) Регистрируем аккаунт и используем.)
Тоже без цензуры! 8-)

Кстати, если кому интересно - недавно запустили еще и модель без цензуры - называется unstable diffusion, но его я не тестировал )

Отлично подойдет для адалта
upd не заметил сообщение ниже) Ну зато ссылочка есть. Можно считать, что дополнил.)
 
Четкий плейлист по SD. Сам весь не смотрел, тк на моей видюхе не завелось и подзабил. Автор вроде очень подробно разжевывает особенности работы с нейронкой. Очень крутой результат выжимает.
 
за статью проголосовал, но не особо понял, зачем на комп что-то скачивать, если уже есть куча сервисов для генерации в браузере...
у меня в подписи рефка на платформу, там можно генерить через stable diffusion онлайн, зарегав фри-аккаунт.
кому не нравится рефка, вот прямая ссылка: https://ai.e-r-c.ru
107425


P.S. для тех кто не в курсе, промты для stable diffusion нужно писать на английском, иначе она вас не поймет и выдаст совсем не то, что вы хотели...
 
Последнее редактирование:
за статью проголосовал, но не особо понял, зачем на комп что-то скачивать, если уже есть куча сервисов для генерации в браузере...
У локальной версии есть как свои плюсы, так и минусы.

Из плюсов:

1. Независимость
2. Модели - онлайн сервис не подкорректируешь под разные модели, например deliberate или другие
3. Скорость - если онлайн сервис большое количество пользователей перегрузят, то твои ресурсы всегда сам используешь )

Минусы:

1. Используешь свои ресурсы


А вообще в идеале совместить одно с другим )) Пока онлайн сервис норм летит, то можно свои ресурсы экономить, а если что-то не так пойдет, то отправить запросы на свое железо )
 
  • Спасибо
Реакции: Sho и smartmail
Что такое Stable Diffussion?

Stable Diffusion - это бесплатный аналог ( с открытым исходным кодом ) Midjourney, который позволяет создавать изображения на основе текстовых описаний. Он был выпущен в 2022 году и разработан группой компаний CompVis в Мюнхенском университете совместно с Runway, EleutherAI и LAION.

Stable Diffusion представляет собой инновационный подход к генерации изображений, который использует текстовые данные для создания высококачественных визуальных контентов.

Это предоставляет пользователям возможность превратить текстовые описания в уникальные и привлекательные изображения.

Примеры сгенерированных мною картин на Stable Diffusion на своем ноутбуке

Посмотреть вложение 107377 Посмотреть вложение 107378 Посмотреть вложение 107379Посмотреть вложение 107380
Посмотреть вложение 107381

Кому это нужно?

Всем, кому нужны уникальные картинки для контента. Их можно использовать для автоматического наполнения своих сайтов, групп и пабликов в социальных сетях, для наполнения товарами интернет магазинов и т.д.

Применение широкое.

Что мы будем делать в рамках статьи?

Мы установим у себя на домашнем ПК / Ноуте Stable Diffusion и будем генерировать картинки через наш любимый Zennoposter )

Требования

Для того, чтобы поднять Stable Diffusion у себя на ПК по данному примеру, у вас должна быть Видеокарта Nvidia хотя бы с 4гб оперативной памятью.


Характеристики Ноутбука на котором поднимался StableDiffusion в данном эксперименте

7oaFulH.png
gUwgc7w.png
iK8jjQg.png



Качаем Stable Difussion с WebUI и обученные модели

Stable Diffusion с WebUI - Официальный можно скачать отсюда -> GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
Модели Stable Diffusion - Качаем отсюда CompVis/stable-diffusion-v-1-4-original · Hugging Face

Дообученная модель для более качественной генерации лиц - stabilityai/sd-vae-ft-mse-original · Hugging Face
* Я в данном эксперименте взял vae-ft-mse-840000-ema-pruned.ckpt так как характеристики ноута позволяют, если у вас характеристики поменьше, можете взять более слабые версии

Дообученные обычными пользователями модели можно взять отсюда: https://civitai.com/
Для данного эксперимента я скачал несколько дообученных моделей

KhqAsBH.png


ИМХО из них лучший Deliberate https://civitai.com/models/4823/deliberate , на нем и сгенерированы картинки выше в примерах.

После того как скачали модели, их всех кидаем в папку models/Stable-diffusion
Следующее, что нам нужно сделать - чутка подкорректировать файл webui-user.bat для лучшей генерации лиц. Для этого открываем файл в любом текстовом редакторе, например Notepad++

Вот содержимое файла у меня:

Код:
Развернуть Свернуть Копировать
@echo off

set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS= --api --xformers --vae-path "models\Stable-diffusion\vae-ft-mse-840000-ema-pruned.ckpt"

call webui.bat

Сохраняем и закрываем.


Все, теперь можно запустить у нас Stable Diffusion. Для этого запускаем webui-user.bat
У вас должна открыться консоль и там вы увидите нечто такое:

WW7mz2R.png


Это значит, что у нас webui запущен и можно поэкспериментировать с моделями, генерировать картинки. Для этого в браузере переходим:

http://127.0.0.1:7860/

Перед вами откроется веб интерфейс:
1CDW22e.png


ZennoPoster

Шаблон у нас минимальный. Генерирует изображение согласно промту ( описанию ) во входных настройках, или же берет с файла, тоже указывается во входных настройках.


Работает шаблон через API.

Шаблон прикладываю.


Заключение

Это просто был эксперимент. Мне на данный момент генерация изображений не очень то и нужно )) Но скоро понадобиться.

Точно также можно на домашнем ПК поднять аналоги Chat GPT. Я уже пробовал на CPU запустить языковую модель Alpasta. Работает конечно очень медленно на cpu, долго генерирует, на GPU еще не запускал, но на следующем конкурсе возможно напишу статью и про него ))

В чем преимущество локального поднятия? Это генерация контента БЕСПЛАТНО и БЕЗ ограничений.

Если учитывать, что картинки размером 500x500 генерируются примерно за 3-4 секунды, то в сутки можно будет генерировать примерно 20-30к картинок для контента. А это неплохой результат.

Также SD и шаблон можно использовать для автогенерации видео через ffmpeg например. Где визуальную часть будет генерировать SD например )

В общем применений много, все на ваше усмотрение.

А вам желаю много трафика и рекордного профита :-)
Скинь архив с полностью готовым решением у меня не хочет скачивается)
 
Может есть у кого рабочий мануал по запуску на красных картах?
 
  • Спасибо
Реакции: samsonnn, isaacfks и Sho
Может есть у кого рабочий мануал по запуску на красных картах?
Убедитесь, что необходимые зависимости соблюдены, и следуйте инструкциям, доступным как для графических процессоров NVidia (рекомендуется), так и для графических процессоров AMD .

Вроде бы и на AMD должна запускаться
 
  • Спасибо
Реакции: Sho и Dr.Pipetka
  • Спасибо
Реакции: Sho и indigo666
Нифига короче не получается :ak:На процессоре работает.
 
  • Спасибо
Реакции: indigo666
Нифига короче не получается :ak:На процессоре работает.
На проце слишком долго наверно будет генерить. Я на днях попытаюсь еще и на маке сделать ) Посмотрим что из этого выйдет. Хотел Alpasta на маке запустить ( аналог чатгпт ), но там чет не то пошло ))
 
  • Спасибо
Реакции: Dr.Pipetka
Видеокарта rx580 8gb. Стандартная модель и настройки.
Промт: Jennifer Love Hewitt drinks beer from a large glass
Время: 38-41 сек
107460

107461
107462

107463

107464
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)