Настраиваем локальный GPT сервис на своем ПК. Экономим сотни $$$

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 737
Благодарностей
1 131
Баллы
113

gospodinkot

Client
Регистрация
04.03.2019
Сообщения
141
Благодарностей
38
Баллы
28
Может кто подскажет смотрю генерит процом а не картой
/QUOTE]
GTX 1050 Ti вообще не задействуется. вся нагрузка на проц. Графическое ядро процессора отключил в диспетчере.
 

Patcher

Client
Регистрация
06.05.2011
Сообщения
85
Благодарностей
72
Баллы
18
На ноуте и правда странное поведение, в первую очередь грузит процессор и только потом видеокарту. Исключить камень из работы ни какими настройками не получается. На стационарном железе такой проблемы нет камень и карта +- одинаковые
126270
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 737
Благодарностей
1 131
Баллы
113
На ноуте и правда странное поведение, в первую очередь грузит процессор и только потом видеокарту. Исключить камень из работы ни какими настройками не получается. На стационарном железе такой проблемы нет камень и карта +- одинаковые Посмотреть вложение 126270
У меня было нечто похоже на компе, не смотря на то, что модель меньше памяти видюхи. Удаляешь конфиг и создаешь его заново, с нуля настраиваешь все параметры.
 
  • Спасибо
Реакции: Patcher

samsonnn

Client
Регистрация
02.06.2015
Сообщения
1 802
Благодарностей
1 474
Баллы
113
как отправить в Post запросе изображение + текст? нашел какой то api, все ровно не пойму - тык
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 737
Благодарностей
1 131
Баллы
113
как отправить в Post запросе изображение + текст? нашел какой то api, все ровно не пойму - тык
Я тоже по началу подумывал генерировать картинки коболдом, но поняв, сколько это займет ресурсов отказался от этой идеи. А покопавшись в инете нашел бесплатный апи, который можно дрочить в хвост и в гриву. Пользуйся, картинки фото качества. https://zenno.club/discussion/threads/flux-1-besplatno-generiruem-kartinki-po-svoemu-promptu.122632/
 
  • Спасибо
Реакции: Asmus003

Asmus003

Client
Регистрация
25.03.2018
Сообщения
274
Благодарностей
67
Баллы
28
Я тоже по началу подумывал генерировать картинки коболдом, но поняв, сколько это займет ресурсов отказался от этой идеи. А покопавшись в инете нашел бесплатный апи, который можно дрочить в хвост и в гриву. Пользуйся, картинки фото качества. https://zenno.club/discussion/threads/flux-1-besplatno-generiruem-kartinki-po-svoemu-promptu.122632/
подскажи, если взять видюху на 16гб, можно ли будет одновременно запускать слабую и сильную модель (при условии что хватает ресурсов видеокарты). например, для одной задачи нужны простые генерации 1 общей фразы, которую можно сделать легкой моделью. а для другой задачи - нужно написать текст, либо осмысленно отвечать на сообщения (насколько это вообще реально в этом ИИ?:-)), то там нужна помощнее модель. вот можно так разделять, или придется делать большущую модель для всего?
было бы круто собрать отдельный мощный ПК (видяха всего-то 1.5к баксов) и генерить фото+текст локально. если в небольших объемах то можно потянуть.
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 737
Благодарностей
1 131
Баллы
113
подскажи, если взять видюху на 16гб, можно ли будет одновременно запускать слабую и сильную модель (при условии что хватает ресурсов видеокарты). например, для одной задачи нужны простые генерации 1 общей фразы, которую можно сделать легкой моделью. а для другой задачи - нужно написать текст, либо осмысленно отвечать на сообщения (насколько это вообще реально в этом ИИ?:-)), то там нужна помощнее модель. вот можно так разделять, или придется делать большущую модель для всего?
было бы круто собрать отдельный мощный ПК (видяха всего-то 1.5к баксов) и генерить фото+текст локально. если в небольших объемах то можно потянуть.
В LM Studio можно загружать несколько моделей, главное, что бы они суммарно поместились в памяти карты и по апи обращаться к той, либо иной.
 

Asmus003

Client
Регистрация
25.03.2018
Сообщения
274
Благодарностей
67
Баллы
28
В LM Studio можно загружать несколько моделей, главное, что бы они суммарно поместились в памяти карты и по апи обращаться к той, либо иной.
спасибо.
FLUX - тоже интересно, но насколько там картинки соответствуют заданию? я нейронками не пользуюсь, и не знаю как оценить. лучше ли она, чем ставить локально (ее или другую) для генерации картинок?
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 737
Благодарностей
1 131
Баллы
113
спасибо.
FLUX - тоже интересно, но насколько там картинки соответствуют заданию? я нейронками не пользуюсь, и не знаю как оценить. лучше ли она, чем ставить локально (ее или другую) для генерации картинок?
Для генерации картинок локально нужна карта не ниже 500к рублей, иначе не имеет смысла с этим связываться, лучше использовать метод, который я дал в соседней статье.
 

Asmus003

Client
Регистрация
25.03.2018
Сообщения
274
Благодарностей
67
Баллы
28
Для генерации картинок локально нужна карта не ниже 500к рублей, иначе не имеет смысла с этим связываться, лучше использовать метод, который я дал в соседней статье.
ну в теме про флюкс человек написал, что у него стоит локально и 1 картинка генерится минуту, он пока не отписал какая видяха. видяха за 1.5к баксов на 16 гиг думаю справится с этим, если время устраивает. метод по апи - классный, но его всегда могут прикрыть/сделать платным.
 

samsonnn

Client
Регистрация
02.06.2015
Сообщения
1 802
Благодарностей
1 474
Баллы
113
видяха за 1.5к баксов на 16 гиг
Хмм... аж интересно стало, что же это за видяха такая на 16гб и за такую цену? К примеру стоимость новой RTX 4070 ti Super около +- 1000$
Наверное RTX 4080 или 4090?
 

Asmus003

Client
Регистрация
25.03.2018
Сообщения
274
Благодарностей
67
Баллы
28
Хмм... аж интересно стало, что же это за видяха такая на 16гб и за такую цену? К примеру стоимость новой RTX 4070 ti Super около +- 1000$
Наверное RTX 4080 или 4090?
может в Украине цены другие. вот описание:

Видеокарта NVIDIA PCI-Ex GeForce RTX 4080 Founders Edition 16GB GDDR6X (256bit) (2510/21000) (1 x HDMI, 3 x DisplayPort) (900-1G136-2560-000)

стоит 54к грн = 1320 баксов

Видеокарта MSI PCI-Ex GeForce RTX 4070 Ti Super 16G Gaming X Slim 16GB GDDR6X (256bit) (2685/21000) (HDMI, 3 x DisplayPort) (RTX 4070 Ti SUPER 16G GAMING X SLIM)
стоит 1к баксов.

какая из них лучше для нейронок?
 

samsonnn

Client
Регистрация
02.06.2015
Сообщения
1 802
Благодарностей
1 474
Баллы
113
нейронкам нужна память, а тут память одинаковая а цена разная, RTX 4070 Ti SUPER дешевле, зачем переплачивать.
И да у самого RTX 4070 Ti SUPER вот лично для моих хотелок по нейронкам хватает с головой.
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 737
Благодарностей
1 131
Баллы
113
какая из них лучше для нейронок?
У меня две карты: 3060 12gb и 4060 16gb, разница в производительности в среднем - 10%, а разница в цене - 30%.
За скорость отвечают CUDA ядра, за объем вмещаемой модели количество оперативы.
Если ответы нужны простые - достаточно и 3060 с 8 гигами, а если ответы должны быть качественные и быстро - то готовь котлету.
 
Регистрация
23.03.2015
Сообщения
1 222
Благодарностей
764
Баллы
113
Для генерации картинок локально нужна карта не ниже 500к рублей, иначе не имеет смысла с этим связываться, лучше использовать метод, который я дал в соседней статье.
Метод безусловно классный, я не много картинок твоим шаблоном наделал, но сейчас шаблон не фурычит( Прикрыли лавочку. Разве что на веб переделать
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 737
Благодарностей
1 131
Баллы
113
Метод безусловно классный, я не много картинок твоим шаблоном наделал, но сейчас шаблон не фурычит( Прикрыли лавочку. Разве что на веб переделать
Смотри внимательно апи, метод для внимательных :al:
127173
 
  • Спасибо
Реакции: KolkaPetkinSyn
Регистрация
23.03.2015
Сообщения
1 222
Благодарностей
764
Баллы
113
Смотри внимательно апи, метод для внимательных :al:
Хочешь поржать? Я раз 5, если не 10, сравнивал адрес конечной точки из документации с тем что в шаблоне и у меня они были одинаковые. Точно, метод для внимательных!
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 737
Благодарностей
1 131
Баллы
113
Регистрация
23.03.2015
Сообщения
1 222
Благодарностей
764
Баллы
113
При чем здесь поржать?
У меня почему-то создает задания, и генерит картинки.

Посмотреть вложение 127180
Ты меня не понял. Я имел в виду, что я кучу раз смотрел API и проверял адрес конечной точки и мне казалось что всё совпадает. А на самом деле адрес слегка изменился. Вот с этого и стоит поржать! Как ты сам и написал, метод для внимательных!
 
  • Спасибо
Реакции: zarufakis

Asmus003

Client
Регистрация
25.03.2018
Сообщения
274
Благодарностей
67
Баллы
28
нейронкам нужна память, а тут память одинаковая а цена разная, RTX 4070 Ti SUPER дешевле, зачем переплачивать.
И да у самого RTX 4070 Ti SUPER вот лично для моих хотелок по нейронкам хватает с головой.
Видеокарта MSI PCI-Ex GeForce RTX 4070 Ti Super 16G Gaming X Slim 16GB GDDR6X (256bit) (2685/21000) (HDMI, 3 x DisplayPort) (RTX 4070 Ti SUPER 16G GAMING X SLIM)
нужен ли для нейронок выделенный параметр и на что он вообще влияет? на 3060 он вообще 1500/15000.
на RTX 4070 Ti SUPER генеришь картинки или только текст? я думаю что лучше ее брать просто потому что туда может влезть лучшая модель и будет лучший результат, чем в 12 гиговой. даже если скорость работы будет одинаковая.
 

dima2121

Client
Регистрация
09.02.2020
Сообщения
143
Благодарностей
16
Баллы
18
Добрый день, а тексты можно переводить этой моделью ?
 

kagorec

Client
Регистрация
24.08.2013
Сообщения
994
Благодарностей
540
Баллы
93

KokaSEO

Client
Регистрация
17.01.2015
Сообщения
408
Благодарностей
157
Баллы
43
Автор спасибо за статью, в очередной раз дал полезную фичу.

Не подскажете, как radeon 570 16gb раскочегарить для этой нейронки?
Ставил форк koboldcpp_rocm, вроде он для AMD GPU.
Видеопамять занята, но вычисления идут на CPU вместо GPU.
 

promusik

Client
Регистрация
05.02.2021
Сообщения
59
Благодарностей
16
Баллы
8
Как заставить kobolt выдавать результат более 512 токенов по api? Вроде в json прописываю и max_tokens, а он игнорирует и все
 

promusik

Client
Регистрация
05.02.2021
Сообщения
59
Благодарностей
16
Баллы
8
Это ответ на мой вопрос. Вкраце: разрабы специально зашили ограничение. Больше 1024 не сделать вроде даже через вебку. Но мнехотя бы api до 1024 увеличить, но этого все равно мало.
 

Кто просматривает тему: (Всего: 11, Пользователи: 0, Гости: 11)