Recaptcha 2 vs Zennoposter или "как бот стал человеком"

dimanis

Client
Регистрация
16.04.2016
Сообщения
195
Благодарностей
110
Баллы
43
ух ты, яж не заметил, у вас и аудио решение есть)) Осталось поженить эти 2 шаблона в один super.killer.recapcha.capmonstervunitaz))
 
  • Спасибо
Реакции: AlexGoodWeb

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
ух ты, яж не заметил, у вас и аудио решение есть)) Осталось поженить эти 2 шаблона в один super.killer.recapcha.capmonstervunitaz))
У меня кстати была идея соединить их в 1 шаблон, а местом соединения выбрать экшен, где идет проверка задания: с изменяющимися картинками или нет (can_no_answer). Тем более соединить эти шаблоны не составит труда, так как шаблон для аудио сделан на базе первого моего шаблона.
 
Последнее редактирование:
  • Спасибо
Реакции: AlexGoodWeb

S10n4eg

Client
Регистрация
25.06.2014
Сообщения
268
Благодарностей
41
Баллы
28
Здравствуйте, а как быть если капчасейвер сохраняет не всю картинку, а вот так?
 

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
  • Спасибо
Реакции: S10n4eg

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Нашел место, где может зациклиться проект и перестать работать: после нажатия кнопки "Я не робот" при очень плохих прокси или сложной для загрузки страницы идет вечная загрузка. Это решается добавлением счетчика перед сниппетом паузы на 300 мс. Поставить можно условие, что если счетчик превысит значение 20, то идет смена прокси и обновление страницы.
Обновлю решение позже.
 
  • Спасибо
Реакции: S10n4eg

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Добавлю сюда улучшенные решения для Recaptcha 2. Если все будет нормально, то опубликую в шапке темы.
Вот что исправил:
1) Зацикливание шаблоне в случае, когда кнопка "Я не робот" была нажата, задание не появилось (и не появится) и шаблон не разгадан. В таком случае через 4 сек шаблон переходит в Bad end и нужно обновлять страницу с Recaptcha (желательно также менять прокси, если их используете).
2) Ошибка в использовании изображений для отправки на сервис разгадки при использовании в многопоточном режиме (перед отправкой изображения другой поток мог заменить его своим из-за того, что имя для сохранения совпадает). Внимание!!! Переместите экшен "Случайная строка" в начало вашего основного проекта (не проекта Recaptcha), чтобы каждый поток пересохранял изображение только в 1 файл для каждого потока. Если не переместить, то число изображений будет равно числу разгаданных Recaptcha.
Также выложу сюда шаблон для audio, может кто-то его не видел (исправлен только пункт 1, так как пункт 2 работает правильно).
 

Вложения

Последнее редактирование:
  • Спасибо
Реакции: GHU, gonzo и galslot

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Кстати, вот по первой причине наверное у некоторых и гадало бесконечно.
 
Последнее редактирование:

jslby

Client
Регистрация
02.01.2016
Сообщения
77
Благодарностей
5
Баллы
8
Странный глюк. У меня не выбирает изображения, а просто кликает подтвердить. В связи с этим постоянно просто обновляются картинки.

Еще есть два предложения автору:
1. Вынести всю логику в C#, клики эммитации можно и оставить, а логику лучше в кубик, что бы в свои проекты было проще вставлять.
2. Если не получится, опишите пожалуйста как вставить "Проект в проекте". Подобного опыта не было лично у меня, поэтому для быстрой вставки в проекты было бы идеальным решением
 

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Странный глюк. У меня не выбирает изображения, а просто кликает подтвердить. В связи с этим постоянно просто обновляются картинки.

Еще есть два предложения автору:
1. Вынести всю логику в C#, клики эммитации можно и оставить, а логику лучше в кубик, что бы в свои проекты было проще вставлять.
2. Если не получится, опишите пожалуйста как вставить "Проект в проекте". Подобного опыта не было лично у меня, поэтому для быстрой вставки в проекты было бы идеальным решением
Глюк может быть из-за того, что у вас не отправляется изображение нужное, какое изображение отправляется можно посмотреть в папке img. Также надо установить ключ.
1. Я бы сделал, если владел С#.
2. Экшен "проект в проекте", не забудьте удалить лишние экшены в проекте рекапчи, как переход к странице с рекапчей от гугла. Плюс я выше описывал, как можно вставить без "проекта в проекте".
 

cybercat

Client
Регистрация
12.05.2016
Сообщения
19
Благодарностей
2
Баллы
3
Разобрался как прикрутить шаблон к своему проекту, для понимания пришлось правда создать в готовом проекте своей тестовый, но все работает правда далеко от идеала. Теперь последовательно: в моем случае, в экшене CapchaSaver пришлось перебрать 7 значений совпадений, и только на 7ом он сохраняет изображение в таком виде:


Во всех остальных случаях сохраняются либо элементы сайта либо куски от капчи. Правда надо сказать, что при 3ем значении совпадения сохраняется блок с заданием, но не видно картинок.
Итог: 1)шаблон с 5 запросами. Разгадывание занимает более 1 миуты, в некоторых случаях доходит и до 2х - это не критично, с точки зрения времени, все равно, если мы имеем задание массовой реги, то за сутки можно нарегать очень много аккаунтов, но, минус в том, что при использовании данного проекта цена за 1 зареганный аккаунт возрастает, положительный вариант как правило наступает когда появляются street sign, там и без задания все понятно.
2)шаблон с 1 запросом. Ситуация равносильна с 5ю запросами, но в 10 вариантах время проверки капчи увеличивалось в несколько раз, плюс ко всему разница в цене за 1 аккаунт не сильно разница.
Простой пример: картинка выше. И без задания капча гугла имеет как правило только варианты с реками, номерами улиц, уличными знаками. Картинка выше - задание streen number работники выбирают правильные варианты и это можно пронаблюдать в ходе выполнения проекта, но после того как все варианты выбраны и необходимо нажать кнопку подтвердить работники начинают выбирать другие варианты(например: воду, которая, в свою очередь, появляется на местах правильно выбранных изображений).
Если резюмировать коротко шаблон отрабатывает на ура и с 1 и с 5 пост запросами, проблема в сохраненных изображениях, а именно в том, что или не видно текста задания, или не видно части изображений. Если бы эта проблема была устранена это был бы 100% работоспособный шаблон для рекапчи.
Спасибо за внимание.
 

cybercat

Client
Регистрация
12.05.2016
Сообщения
19
Благодарностей
2
Баллы
3
p.s. шаблон с голосовой капчей в тренинге гугла отрабатывает неплохо, но с прокси не работает. Возможно у меня такие прокси, надо тестить.


P.s. 2 да. Проверка с прокси показала что при наличии более менее годного прокси звуковое разгадывание срабатывает.
Не знаю еще как оно будет отрабатывать в масс регах, надо тестить, но по итогу лично моих проверок работоспособность лучше чем у картиночных. Хотя... если починить картинки для корректного отображения заданий, то результаты могут быть иными.

В любом случае автор не просто молодец, он гений) спасибо ему.
 
Последнее редактирование:
  • Спасибо
Реакции: john45

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Разобрался как прикрутить шаблон к своему проекту, для понимания пришлось правда создать в готовом проекте своей тестовый, но все работает правда далеко от идеала. Теперь последовательно: в моем случае, в экшене CapchaSaver пришлось перебрать 7 значений совпадений, и только на 7ом он сохраняет изображение в таком виде:


Во всех остальных случаях сохраняются либо элементы сайта либо куски от капчи. Правда надо сказать, что при 3ем значении совпадения сохраняется блок с заданием, но не видно картинок.
Итог: 1)шаблон с 5 запросами. Разгадывание занимает более 1 миуты, в некоторых случаях доходит и до 2х - это не критично, с точки зрения времени, все равно, если мы имеем задание массовой реги, то за сутки можно нарегать очень много аккаунтов, но, минус в том, что при использовании данного проекта цена за 1 зареганный аккаунт возрастает, положительный вариант как правило наступает когда появляются street sign, там и без задания все понятно.
2)шаблон с 1 запросом. Ситуация равносильна с 5ю запросами, но в 10 вариантах время проверки капчи увеличивалось в несколько раз, плюс ко всему разница в цене за 1 аккаунт не сильно разница.
Простой пример: картинка выше. И без задания капча гугла имеет как правило только варианты с реками, номерами улиц, уличными знаками. Картинка выше - задание streen number работники выбирают правильные варианты и это можно пронаблюдать в ходе выполнения проекта, но после того как все варианты выбраны и необходимо нажать кнопку подтвердить работники начинают выбирать другие варианты(например: воду, которая, в свою очередь, появляется на местах правильно выбранных изображений).
Если резюмировать коротко шаблон отрабатывает на ура и с 1 и с 5 пост запросами, проблема в сохраненных изображениях, а именно в том, что или не видно текста задания, или не видно части изображений. Если бы эта проблема была устранена это был бы 100% работоспособный шаблон для рекапчи.
Спасибо за внимание.
Насчет сохранения изображений скорее всего у вас это из-за неправильно выбранного номера совпадения (как решить описано выше) или из-за того, что прокси медленные и за установленный таймаут загрузки не успевают загрузиться измененные изображения (экшен с С# в левом нижнем углу изменить с "System.Threading.Thread.Sleep(800);" на "System.Threading.Thread.Sleep(1500);" или можно даже 2000 поставить).
Также если у вас в самом начале изображения загружаются медленно, то можно поставить в С# вместо "System.Threading.Thread.Sleep(1100);" большее значение (1500 или 2000).
Текст задания же отправляется всегда правильно (много раз тестил и на рукапче и в самом шаблоне проверял).
P.S.: на 3 ресурсах с изображениями тестил и везде идеально работало, так что скорее всего проблема в медленных прокси (нужно увеличить таймауты загрузки изображений).
 
Последнее редактирование:

cybercat

Client
Регистрация
12.05.2016
Сообщения
19
Благодарностей
2
Баллы
3
Насчет сохранения изображений скорее всего у вас это из-за неправильно выбранного номера совпадения (как решить описано выше) или из-за того, что прокси медленные и за установленный таймаут загрузки не успевают загрузиться
Я писал выше, что номера совпадений на скрине выше 7, остальные выдают скрины сайта, совпадения 4 и 3 выдают вот такая картинки:



На втором варианте можно понять задание но не видно половина изображений, а на первом текст задания очень слабо видим. Вполне возможно, что это можно считать успшным вариантом но работникик явно не понимают, так-как кол-во удачных ответов очень низко.
Изменение времени тайм-аута не помогло (пробовал все ваши варианты, плюс еще сам покрутил).


Для верности должен признать попадаются варианты где видно и текст задани и варианты, правда отчего-то работники выбирают совершенно не то. например: задание с номерами, а они тыкают по цветам и автомобилям, хотя в тот момент и задание и варианты были четко видны.
 
Последнее редактирование:

AlexGoodWeb

Client
Регистрация
08.04.2015
Сообщения
206
Благодарностей
51
Баллы
28
У меня кстати была идея соединить их в 1 шаблон, а местом соединения выбрать экшен, где идет проверка задания: с изменяющимися картинками или нет (can_no_answer). Тем более соединить эти шаблоны не составит труда, так как шаблон для аудио сделан на базе первого моего шаблона.
Интересная идея соединить в один шаблон и в зависимости от условий разгадывать или картинки или аудио ...
 

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Я писал выше, что номера совпадений на скрине выше 7, остальные выдают скрины сайта, совпадения 4 и 3 выдают вот такая картинки:



На втором варианте можно понять задание но не видно половина изображений, а на первом текст задания очень слабо видим. Вполне возможно, что это можно считать успшным вариантом но работникик явно не понимают, так-как кол-во удачных ответов очень низко.
Изменение времени тайм-аута не помогло (пробовал все ваши варианты, плюс еще сам покрутил).


Для верности должен признать попадаются варианты где видно и текст задани и варианты, правда отчего-то работники выбирают совершенно не то. например: задание с номерами, а они тыкают по цветам и автомобилям, хотя в тот момент и задание и варианты были четко видны.
Так по стандарту вариант номер 0 отсылает все картинки. Задание же он и не должен высылать, так как задание отсылается отдельно в параметре "textinstructions". Если 0 совпадение дает вообще не то изображение, то уже 1 или 2 совпадение срабатывало всегда у меня. Всё зависит от кода страницы и номер совпадения может и 7, и 20 и более. Вот в таком формате все отправляется:
122.jpg
 

AlexGoodWeb

Client
Регистрация
08.04.2015
Сообщения
206
Благодарностей
51
Баллы
28
Если 0 совпадение дает вообще не то изображение, то уже 1 или 2 совпадение срабатывало всегда у меня. Всё зависит от кода страницы и номер совпадения может и 7, и 20 и более.
А этот момент можно как - нибудь автоматизировать и проверять, а исходя из результата проверки уже задавать номер совпадения ?
 

cybercat

Client
Регистрация
12.05.2016
Сообщения
19
Благодарностей
2
Баллы
3
Так по стандарту вариант номер 0 отсылает все картинки. Задание же он и не должен высылать, так как задание отсылается отдельно в параметре "textinstructions".
Посмотреть вложение 13710
В моем случае это вариант за номером 7. Спасибо за инфу, я думал должна и задание отправляться. Значит, выходит, что работники отгадывают не верно в большинстве случаев. Тогда, чтобы более детально разобраться с этим, где можно посмотреть параметр "textinstructions"?. Спасибо.
 

cybercat

Client
Регистрация
12.05.2016
Сообщения
19
Благодарностей
2
Баллы
3
А этот момент можно как - нибудь автоматизировать и проверять, а исходя из результата проверки уже задавать номер совпадения ?
А что там автоматизировать? Под каждый сайт, возможно, просто потребуется проверить совпадение и один раз его отредактировать.
Amyboose подробно расписал как это сделать. Продублирую его ответ в виде скрина.
 

AlexGoodWeb

Client
Регистрация
08.04.2015
Сообщения
206
Благодарностей
51
Баллы
28
А что там автоматизировать? Под каждый сайт, возможно, просто потребуется проверить совпадение и один раз его отредактировать ...
Вопрос вообще - то к автору ... вот как раз момент с проверкой и неплохо было бы автоматизировать, если есть такая возможность ...
 

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Вопрос вообще - то к автору ... вот как раз момент с проверкой и неплохо было бы автоматизировать, если есть такая возможность ...
Да автоматизировать не получится, так как могут быть тысячи вариантов html страниц. Даже если бы я задал поиск по другому элементу, то у других бы эти элементы могли встретиться на странице. Тем более если сложно найти по номеру совпадения, то можно открыть структуру рекапчи и там найти элемент tbody и посмотреть его номер совпадения.
 

spbalexpiter

Client
Регистрация
24.11.2013
Сообщения
405
Благодарностей
93
Баллы
28
Сколько рублесов в средней выходит на разгадку 1000 таких капчей через сервис рукапча?
 

AlexGoodWeb

Client
Регистрация
08.04.2015
Сообщения
206
Благодарностей
51
Баллы
28
Да автоматизировать не получится, так как могут быть тысячи вариантов html страниц.
Кто бы мог представить, что многотонные куски железа смогут летать и плавать ... :-)

Всё что нужно открывать и смотреть в коде или браузере можно автоматизировать нужно лишь найти способ.
 

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Кто бы мог представить, что многотонные куски железа смогут летать и плавать ... :-)

Всё что нужно открывать и смотреть в коде или браузере можно автоматизировать нужно лишь найти способ.
Не понимаю зачем это так сильно нужно? Это делается всего 1 раз и похоже на то, чтобы автоматизировать проесс создания шаблонов вообще без участия человека. Я сам сталкивался с различными кодами и всё равно приходится под каждый вариант оптимизировать свой же шаблон в зависимости от кода страницы, скорости прокси и различных защит от разгадки рекапчи (были одни умельцы, которые обхитрили бы 99% всех ботов). А если уж этот вариант совпадения будет изменяться каждый раз, то тут 2 пути: выбрать другие теги для данного элемента или пойти путем определения координат рекапчи, что я уже 1 раз сделал до конца и всё работало, но экшен скриншота мне не позволил его использовать в моем проекте из-за структуры сайта.
 

Flakelf

Client
Регистрация
25.04.2016
Сообщения
21
Благодарностей
3
Баллы
3
Как я понял, вариант с 5 POST-запросами выходит дороже т.к. запрос 5 раз вместо одного?
 
Последнее редактирование:

cybercat

Client
Регистрация
12.05.2016
Сообщения
19
Благодарностей
2
Баллы
3
-
 
Последнее редактирование:

Flakelf

Client
Регистрация
25.04.2016
Сообщения
21
Благодарностей
3
Баллы
3

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Как я понял, вариант с 5 POST-запросами выходит дороже т.к. запрос 5 раз вместо одного?
Просто дороже, но даже быстрее, так как значительно повышается точность.
 

cybercat

Client
Регистрация
12.05.2016
Сообщения
19
Благодарностей
2
Баллы
3
не всегда вернее. Возможно, что когда я проверял так совпали звезды, но пять запросов не сильно отличались по точности от 1го, но время затрат было чуть дольше, а цена дороже значительней. Грубо говоря генерация одного аккаунта с 5ю гет запросами составляла в диапазоне 0.90 - 1 рубль, что, на мой взгляд дороговато.
 

jurnalik

Client
Регистрация
10.11.2015
Сообщения
25
Благодарностей
2
Баллы
3
Скажите, а возможно ли сделать получение-отправку этой рекапчи на POST/GET запросах? Там много сложных js, и вроде никто подобного решения реализовать еще не смог, по крайней мере я не нашел.
 

amyboose

Client
Регистрация
21.04.2016
Сообщения
2 311
Благодарностей
1 191
Баллы
113
Скажите, а возможно ли сделать получение-отправку этой рекапчи на POST/GET запросах? Там много сложных js, и вроде никто подобного решения реализовать еще не смог, по крайней мере я не нашел.
Никак. В гугле не дураки сидят и все параметры, отправляемые на гугл, хорошо шифруются. Например, для изображений не получить параметр "b" без JS. Используйте либо решения с эмуляцией JS на языках программирования (рекомендую PhantomJS, у меня даже исходники под изображения на Perl+PhantomJS вроде остались, правда я кучу времени потратил чтобы их найти), либо зеннопостер (эмуляция JS непосредственно через браузер).
 

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)