- Регистрация
- 30.03.2012
- Сообщения
- 8 685
- Благодарностей
- 4 642
- Баллы
- 113
Описание
Чуть больше двух лет назад у одного моего клиента возникла необходимость получать нечто с некоего сайта. Но просто проделав все необходимые действия получить это нечто не получалось. Объёмы были ограничены и другие люди успевали всё забрать раньше. Важно было стать самым быстрым, ну или хотя бы достаточно быстрым, чтобы урвать хоть что-то. Разгадка рекапчи занимала львиную долю времени. Было принято решать задачу комплексно: переписать шаблон под запросы + написать шаблон из данной темы, который заранее бы добывал токены и основному шаблону не надо было тратить время на разгадывание.
Ситуации, в которых данный шаблон может пригодиться:
Как работает шаблон
У шаблона есть основной управляющий поток и рабочие. Поэтому проект должен быть настроен на минимум 2 активных потока.
Настройки
Скриншот входных настроек
Результат
Результатом работы шаблона будет постоянно обновляющийся файл актуальных токенов reCaptcha/hCaptcha в формате временная_метка_жизни|токен. При необходимости любой другой шаблон просто берет первую строку из этого файла, отбрасывает метку и использует токен по назначению не теряя время на собственное разгадывание.
Чуть больше двух лет назад у одного моего клиента возникла необходимость получать нечто с некоего сайта. Но просто проделав все необходимые действия получить это нечто не получалось. Объёмы были ограничены и другие люди успевали всё забрать раньше. Важно было стать самым быстрым, ну или хотя бы достаточно быстрым, чтобы урвать хоть что-то. Разгадка рекапчи занимала львиную долю времени. Было принято решать задачу комплексно: переписать шаблон под запросы + написать шаблон из данной темы, который заранее бы добывал токены и основному шаблону не надо было тратить время на разгадывание.
Ситуации, в которых данный шаблон может пригодиться:
- Вышеописанная, когда есть конкуренция и нужно быть быстрее других.
- Когда у сайтов есть свои взгляды на то, как долго можно разгадывать капчу. Встречал эту ситуации лично при регистрации на одном почтовике. Суть такова, что он не пропускал регистрацию, если на капчу тратилось больше 30 секунд.
- Любая массовая деятельность, когда из железа нужно выжать как можно больше, пусть и ценой повышенных затрат на капчу (ведь часть токенов будет просто сгорать).
Как работает шаблон
У шаблона есть основной управляющий поток и рабочие. Поэтому проект должен быть настроен на минимум 2 активных потока.
- Управляющий поток (им становится самый быстрый из потоков). Его задачи: следить за актуальностью токенов (удалять потенциально мертвые) и выдавать задания рабочим на добычу, если в этом есть необходимость.
- Рабочий поток (кто не успел, тот опоздал). Рабочие проверяют, есть ли доступные задания и, если есть, берут его в работу и добывают токены. Готовый токен будет записан в соответствующий список в формате временная_метка_жизни|токен.
Пример лога работыНастройки
Скриншот входных настроек
Общие настройки
- Путь к файлу с токенами - файл, в который шаблон будет писать добытые токены. А также удалять неактуальные. В общем, файл с результатами работы
- Время работы шаблона - время, через которое поток закончит работу. Сделано на случай поломки, хотя ломаться там нечему. Сам шаблон советую ставить на бесконечное число выполнений
Настройки распознавания
- Тип капчи - тут всё просто: reCaptcha или hCaptcha. Из видов reCaptcha в шаблоне на данный момент только V2
- url - полный адрес страницы, на которой разгадывается капча
- sitekey - капча-ключ сайта. Индивидуален для каждого сайта. Этот текст я скопировал со справки ZennoLab по экшену распознавания. Там же вы сможете найти инструкцию как добыть этот параметр
- Капча сервис - сервив, через который будет происходить разгадывание. Например, CapMonsterCloud
Хранение и добыча токенов
- Сколько секунд считать токен живым - время жизни токена, по истечении которого токен считается неактуальным и будет удалён из файла управляющим потоком
- Сколько живых токенов поддерживать в списке - количество токенов, которое управляющий поток будет пытаться держать в файле, добавляя задания для рабочих потоков или наоборот ограничивая их. Не точное значение из-за следующей настройки
- За какое время до смерти токена начать добывать новый - время до смерти токена, в которое активизируется управляющий поток с новым заданием, чтобы успеть возместить будущую потерю
Результат
Результатом работы шаблона будет постоянно обновляющийся файл актуальных токенов reCaptcha/hCaptcha в формате временная_метка_жизни|токен. При необходимости любой другой шаблон просто берет первую строку из этого файла, отбрасывает метку и использует токен по назначению не теряя время на собственное разгадывание.
- Номер конкурса шаблонов
- Одиннадцатый конкурс шаблонов
Вложения
-
22,5 КБ Просмотры: 156
Для запуска проектов требуется программа ZennoPoster или ZennoDroid.
Это основное приложение, предназначенное для выполнения автоматизированных шаблонов действий (ботов).
Подробнее...
Для того чтобы запустить шаблон, откройте нужную программу. Нажмите кнопку «Добавить», и выберите файл проекта, который хотите запустить.
Подробнее о том, где и как выполняется проект.
Последнее редактирование: