Парсер-чекер прокси

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
Не секрет, что в паблике полно приличных прокси, которые сложно собирать из-за того, что владельцы ресурсов закрывают свои списки прокси каптчами, кнопками перехода и т.д. от автоматического парсинга. В этой связи представляем шаблон для сбора и проверки прокси со "сложных сайтов"...


Требования к системе:
Windows 64 бита, было проверено на windows 10 и windows 7
Zennoposter 7.3+ или ZennoBox

Значения кнопок диалога:
Пропуск - переход на другой url, без парсинга текущего ресурса;
Проверка - досрочная проверка имеющихся (в файле proxy_ready.txt) прокси, без посещения других url;
Далее (кнопка автозакрытия) - сбор прокси с текущего сайта и переход на следующий url ресурс;
Выход - прекращение работы шаблона без сохранения прокси.

Снимок.PNG


Файлы необходимые для работы:
1.proxy_ready.txt - сюда собираются прокси для последующей проверки
2.proxy.txt - сюда сохраняются проверенные прокси
3.url.txt - файл с источниками прокси для работы скрипта (proxy_parserb.exe), шаблон автоматически сохраняет сюда url из посещенных сайтов. Можно ручками записать свои.
4.proxy_parserb.exe - исполняемый файл скрипта для 64 битной windows
5.source_proxy_v2.zp - файл шаблона
6.profile.zpprofile - файл для работы с профилем

76853
76854


Условия работы скрипта проверки прокси:
1. 500 потоков проверки, проверка идет через тестовые запросы к различным поисковым системам, ищутся соксы.
2. будет проверять прокси в файлах (proxy_ready.txt и proxy.txt), если изменения не проводились больше 3 дней.
3. будет проверять прокси в proxy.txt, если в нем меньше 3500 проксей.
4. будет проверять прокси в proxy_ready.txt, если в нем больше 200 проксей.

76858


Последовательность действий:
1. Шаблон однопоточный, поэтому всегда выставляете "Максимум потоков" равное 1
76856

2. Выставляете нужные вам url-ресурсы.
76886

3. прописываете пути либо оставляете по умолчанию.
76887

4. Если на сайтах нужно совершать действия (решать каптчу, кликать для скачивания на кнопки, выставлять параметры...), то работайте в отображенном инстансе. Два раза кликните на него.
111.PNG
5. Устанавливаете количество дней, через которое нужно удалять файлы с сохраненными прокси в папке загрузки. Парсер использует ранее собранные прокси для новых проверок
76990

6.Всё.


Оригинальные пути:

  • папка загрузки {-Project.Directory-}download\
  • proxy_ready.txt {-Project.Directory-}proxy_parser\proxy_ready.txt
  • proxy.txt {-Project.Directory-}proxy_parser\proxy.txt
  • proxy_parserb.exe {-Project.Directory-}proxy_parser\proxy_parserb.exe
80999
222.PNG

В случае необходимости(!) можно импортировать во входные настройки файл "экспорт входных настроек, оргинал.xml", чтобы прописать оригинальные пути шаблона. А лучше ручками.
04/08/2021 года за 50 мин - прочекал 7500 штук
https://zennolab.com/discussion/threads/parser-cheker-proksi.92202/post-633342 из 30000 грабленых. при работе процессор i5-3570K, 3600 MHz (36 x 100) может грузить на 30% память до 850 мб забирает
Telegram: @zenno_C_plus_plus
 

Вложения

Последнее редактирование:
  • Спасибо
Реакции: garikn

antyspama

Client
Регистрация
13.07.2019
Сообщения
324
Благодарностей
121
Баллы
43
Не секрет, что в паблике полно приличных прокси, -спорно. хотя опять же под какие задачи. и ни слова о цене)
 

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
Не секрет, что в паблике полно приличных прокси, -спорно. хотя опять же под какие задачи. и ни слова о цене)
вот например:
 

zl0

Новичок
Регистрация
21.12.2016
Сообщения
18
Благодарностей
20
Баллы
3
На HideIP Me есть кнопка экспорта,
если каждый раз разгадывать капчу, зачем тогда автоматизация ?
 

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
На HideIP Me есть кнопка экспорта,
если каждый раз разгадывать капчу, зачем тогда автоматизация ?
сильно усложняется задача и потому возможны ошибки, тут выбран именно ручной режим. В таком режиме можно добавить любой сайт где раздают прокси (не важно какая там защита). Урлы и прокси сохраняются в базу и потому последующая добыча прокси идет на автомате. У меня например собрана база соксов под 40000 и постоянно идет их перепроверка. Можно отдавать собранные прокси через файл проксичекеру для дальнейший действий и дополнительных проверок. В принципе можно добавить опцию автомататической разгадки каптч. Будет желание, то сделаю. Пока не вижу в этом смысла. за 21 число прокси в прикреплённом файле. Там много нормальных соксов несмотря на время.
 

Вложения

indigo666

Client
Регистрация
10.05.2014
Сообщения
1 154
Благодарностей
374
Баллы
83

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
прокси 2000 штук
 

Вложения

zl0

Новичок
Регистрация
21.12.2016
Сообщения
18
Благодарностей
20
Баллы
3

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
очень мало - на hideip.me БЕЗ ПАРСЕРА, кнопкой экспорт можно загрузить приблизительно 10 000 прокси
оттуда парсер тоже берет, 2000 это проверенные прокси выборка шла из 50 000 штук
 

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
5500 прокси 31.07.2021
 

Вложения

  • 115,2 КБ Просмотры: 5 677

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
7500 штук 4.08.2021
 

Вложения

  • 152,6 КБ Просмотры: 166

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
обновлен движок) для теста - распакуйте .7z и запустите .exe в папке, где находится список прокси proxy.txt
 

Вложения

skscomp

Новичок
Регистрация
29.11.2021
Сообщения
4
Благодарностей
1
Баллы
1
не скачивает, пишет вирус
 

skscomp

Новичок
Регистрация
29.11.2021
Сообщения
4
Благодарностей
1
Баллы
1
и я так и не понял какая цена
 

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
нет здесь вирусов
 

OlegR

Client
Регистрация
11.06.2015
Сообщения
240
Благодарностей
250
Баллы
63
пока не продаю
 

zl0

Новичок
Регистрация
21.12.2016
Сообщения
18
Благодарностей
20
Баллы
3

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)