- Регистрация
- 01.05.2015
- Сообщения
- 5 051
- Благодарностей
- 4 539
- Баллы
- 113
Год назад я проводил вебинар по этой теме, но мне кажется, что эта тема ещё до сих пор не известна многим веб-мастерам и автоматизаторам. Кроме того, за это время добавлены новые фичи и симбиоз Зенки и А-Парсера становится всё более привлекательным инструментом сильно экономящим время и деньги.
Давайте рассмотрим настройку и работу этой схемы на очень злободневной задаче: получение данных с бесплатных веб-версий популярных нейросетей. Сейчас в А-парсере доступны 6 нейросетей, которые можно бесплатно юзать (именно абсолютно бесплатны, те для которых нужны ключи и/или аккаунты отдельно). Да, отсутствует выбор версий моделей, но обычно в чатах по дефолту производится работа с самыми актуальными версиями. Какие-то требуют решение капчи, но я остановился на четырёх, результатом которых более чем доволен: Perplexity, ChatGPT, DeepSeek, и - не всем известная, но довольно популярная китайская модель, Kimi.
Вот представьте сколько труда и времени потребует написание шаблонов под каждую нейронку. А отслеживания ошибок, уведомлений, смены верстки, изменения запросов? Тут же всё поддерживается командой софта в рабочем состоянии и, я надеюсь, будет работать ещё долго.
Погоди, скажут критики, но ведь нужны прокси, а они стоят денег. К счастью, есть отличное решение, которое я сам юзаю, это шаблон ProxyHab. Сохраняете спарсенные им прокси в директорию files/proxy А-Парсера и настраиваете на них прокси-чекер и сотни отличных прокси помогут вам генерить тысячи текстов в сутки без всяких проблем.
Пошагово рассмотрим работу связки на реальном примере.
1. Создаём пресет в А-парсере того парсера с которым вы планируете работать. Например мы решили парсить Web версию Perplexity. Создаём свой кастомный пресет как на скриншоте и называем его как угодно, в моём случае - ai_perplexity.
Настроек не так много, экспериментальным путём подбираем какие работают лучше, но у меня стоят дефолтные и всё отлично.
Обязательно указываем использовать прокси и назначаем прокси чекер.
2. Сразу на сервере А-парсера настраиваем брандмауэр создавая входящее правило где указываем айпишники машин, которые будут обращаться к А-парсеру.
Если у вас Зенно и А-парсер на одной машине, то пропускаем этот шаг.
3. В ЗенноПостере кубиками накидываем тестовый проект. Экшеном POST делаем запрос по ip к вашему серверу: http://ip:port/API с таким JSON:
Код:
{
"password": "",
"action": "oneRequest",
"data": {
"query": "{-Variable.req-}",
"parser": "FreeAI::Perplexity",
"configPreset": "default",
"preset": "ai_perplexity"
}
}
Дай пояснения термина: \"связка A-Parser и ZennoPoster\"
Потом разбираем ответ и получаем ответ нейронки в переменной
{-Json.data.resultString-}
Плюсы связки ЗенноПостера и А-парсера:
+ Нет необходимости постоянно поддерживать свои шаблоны в рабочем состоянии. Команда А-парсера поддерживает все свои пресеты актуальными, либо, по вашему запросу, стараются починить и исправить при изменениях верстки.
+ Большой выбор готовых пресетов. Например, недавно пилил шаблон по "очеловечивании" текстов сгенеренных нейронками, а оказалось, что и такой пресет уже есть. Я не считал, но десятка 3-4 парсеров там точно есть.
+ С разных серверов или одной своей локальной машины можно по АПИ Зенкой обратиться к серверу где запущен софт А-парсера, отправить и получить данные. Это очень удобно.
+ А-парсер работает очень быстро и довольно мало потребляет ресурсов.
+ А-парсер можно запускать не только на Винде, но и на Линуксе и на Маке и это даёт свои преимущества.
+ Тех. поддержка реально помогает и даже в сложных вопросах. Не всегда, не с первого раза, но выручали многократно. Не в укор команде ЗенноПостера, наши ребята тоже огромные молодцы, но поучиться есть чему.
Минусы:
- Дорогая вечная лицензия Энтерпрайз А-парсера.
По сути это единственный, но очень большой минус. Однако, если вам постоянно нужны в работе как минимум два сервиса А-парсера, например бесплатные нейронки и парсер выдачи Гугла, то приобретение лицензии А-парсера уже более чем оправдано.
Последнее редактирование: