Парсер-чекер прокси

OlegR

Client
Регистрация
11.06.2015
Сообщения
252
Реакции
255
Баллы
63
Не секрет, что в паблике полно приличных прокси, которые сложно собирать из-за того, что владельцы ресурсов закрывают свои списки прокси каптчами, кнопками перехода и т.д. от автоматического парсинга. В этой связи представляем шаблон для сбора и проверки прокси со "сложных сайтов"...


Требования к системе:
Windows 64 бита, было проверено на windows 10 и windows 7
Zennoposter 7.3+ или ZennoBox

Значения кнопок диалога:
Пропуск - переход на другой url, без парсинга текущего ресурса;
Проверка - досрочная проверка имеющихся (в файле proxy_ready.txt) прокси, без посещения других url;
Далее (кнопка автозакрытия) - сбор прокси с текущего сайта и переход на следующий url ресурс;
Выход - прекращение работы шаблона без сохранения прокси.

Снимок.PNG


Файлы необходимые для работы:
1.proxy_ready.txt - сюда собираются прокси для последующей проверки
2.proxy.txt - сюда сохраняются проверенные прокси
3.url.txt - файл с источниками прокси для работы скрипта (proxy_parserb.exe), шаблон автоматически сохраняет сюда url из посещенных сайтов. Можно ручками записать свои.
4.proxy_parserb.exe - исполняемый файл скрипта для 64 битной windows
5.source_proxy_v2.zp - файл шаблона
6.profile.zpprofile - файл для работы с профилем

76853
76854


Условия работы скрипта проверки прокси:
1. 500 потоков проверки, проверка идет через тестовые запросы к различным поисковым системам, ищутся соксы.
2. будет проверять прокси в файлах (proxy_ready.txt и proxy.txt), если изменения не проводились больше 3 дней.
3. будет проверять прокси в proxy.txt, если в нем меньше 3500 проксей.
4. будет проверять прокси в proxy_ready.txt, если в нем больше 200 проксей.

76858


Последовательность действий:
1. Шаблон однопоточный, поэтому всегда выставляете "Максимум потоков" равное 1
76856

2. Выставляете нужные вам url-ресурсы.
76886

3. прописываете пути либо оставляете по умолчанию.
76887

4. Если на сайтах нужно совершать действия (решать каптчу, кликать для скачивания на кнопки, выставлять параметры...), то работайте в отображенном инстансе. Два раза кликните на него.
111.PNG
5. Устанавливаете количество дней, через которое нужно удалять файлы с сохраненными прокси в папке загрузки. Парсер использует ранее собранные прокси для новых проверок
76990

6.Всё.


Оригинальные пути:

  • папка загрузки {-Project.Directory-}download\
  • proxy_ready.txt {-Project.Directory-}proxy_parser\proxy_ready.txt
  • proxy.txt {-Project.Directory-}proxy_parser\proxy.txt
  • proxy_parserb.exe {-Project.Directory-}proxy_parser\proxy_parserb.exe
80999
222.PNG

В случае необходимости(!) можно импортировать во входные настройки файл "экспорт входных настроек, оргинал.xml", чтобы прописать оригинальные пути шаблона. А лучше ручками.
04/08/2021 года за 50 мин - прочекал 7500 штук
https://zennolab.com/discussion/threads/parser-cheker-proksi.92202/post-633342 из 30000 грабленых. при работе процессор i5-3570K, 3600 MHz (36 x 100) может грузить на 30% память до 850 мб забирает
Telegram: @zenno_C_plus_plus
 

Вложения

  • 1620563153618.png
    1620563153618.png
    17,5 KB · Просмотры: 296
  • 1620563184722.png
    1620563184722.png
    6,7 KB · Просмотры: 267
  • 1620563230145.png
    1620563230145.png
    3,5 KB · Просмотры: 259
  • 1620563415639.png
    1620563415639.png
    29,3 KB · Просмотры: 301
  • 1620563636676.png
    1620563636676.png
    29,6 KB · Просмотры: 291
  • 111.PNG
    111.PNG
    22,8 KB · Просмотры: 285
Последнее редактирование:
  • Спасибо
Реакции: garikn
Не секрет, что в паблике полно приличных прокси, -спорно. хотя опять же под какие задачи. и ни слова о цене)
 
Не секрет, что в паблике полно приличных прокси, -спорно. хотя опять же под какие задачи. и ни слова о цене)
вот например:
 
На HideIP Me есть кнопка экспорта,
если каждый раз разгадывать капчу, зачем тогда автоматизация ?
 
На HideIP Me есть кнопка экспорта,
если каждый раз разгадывать капчу, зачем тогда автоматизация ?
сильно усложняется задача и потому возможны ошибки, тут выбран именно ручной режим. В таком режиме можно добавить любой сайт где раздают прокси (не важно какая там защита). Урлы и прокси сохраняются в базу и потому последующая добыча прокси идет на автомате. У меня например собрана база соксов под 40000 и постоянно идет их перепроверка. Можно отдавать собранные прокси через файл проксичекеру для дальнейший действий и дополнительных проверок. В принципе можно добавить опцию автомататической разгадки каптч. Будет желание, то сделаю. Пока не вижу в этом смысла. за 21 число прокси в прикреплённом файле. Там много нормальных соксов несмотря на время.
 

Вложения

прокси 2000 штук
 

Вложения

очень мало - на hideip.me БЕЗ ПАРСЕРА, кнопкой экспорт можно загрузить приблизительно 10 000 прокси
оттуда парсер тоже берет, 2000 это проверенные прокси выборка шла из 50 000 штук
 
5500 прокси 31.07.2021
 

Вложения

  • proxy.txt
    proxy.txt
    115,2 KB · Просмотры: 9 945
7500 штук 4.08.2021
 

Вложения

  • proxy.txt
    proxy.txt
    152,6 KB · Просмотры: 285
обновлен движок) для теста - распакуйте .7z и запустите .exe в папке, где находится список прокси proxy.txt
 

Вложения

не скачивает, пишет вирус
 
и я так и не понял какая цена
 
нет здесь вирусов
 
пока не продаю
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)