Yandex.Rus - увеличиваем % распознавания

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 311
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

1. В модуле Yandex.Rus есть баг/аномалия.//другие модули не проверял. возможно там тоже есть подобное.
Символ - ц
Есть слова которые распознаны верно, но потом идет на конце символ ц.
False список
http://pastebin.com/4AHbA1Rv

статистика:

Всего строк - 2511
Из них последний символ ц = 749
Предпоследний символ ц = 39
Последние два символа цц = 9

Если будем удалять у всех ответов последний символ ц =749*100/2511= получим +~29% к пробиву

2. Фичу которую стоит прикрутить - Спеллер
Для каптч состоящих из осмысленных слов.
https://tech.yandex.ru/speller/

2.1 Если спеллер предлагает массив вариантов, использовать Алгоритм нечеткого сравнения строк.
http://en.wikibooks.org/wiki/Algorithm_Implementation/Strings/Levenshtein_distance
http://www.codeproject.com/Articles/11157/An-improvement-on-capturing-similarity-between-str

фикс 1 + 2 = +20-30+..% к пробиву на ровном месте.

Подходит для всех типов каптч, где есть осмысленные слова.
 
Последнее редактирование:
  • Спасибо
Реакции: alekwuy

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 645
Благодарностей
2 513
Баллы
113
Прикольно.
Символ ц на конце появляется из-за логотипа яндекса, вроде как в том модуле еще не было фильтра, который его вырезает.
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 311
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

Прикольно.
Символ ц на конце появляется из-за логотипа яндекса, вроде как в том модуле еще не было фильтра, который его вырезает.
спеллер от яндекса фиксит сам символ ц.

цифры в стате выше не последняя инстанция.
не ставил целью вывести точный %, просто на практике получил прирост +~30% пофиксив ц
 

igramnet

Новичок
Регистрация
03.01.2015
Сообщения
19
Благодарностей
0
Баллы
1
а на 30% неплохо бы увеличить распознание, особенно русских капт.
 

Vladimir-AWM

Client
Регистрация
26.08.2014
Сообщения
117
Благодарностей
7
Баллы
18
Интересует сейчас какой процент распознавания Яндекс капч которые при регистрации а на AddURL.
 

Sobesednic

Client
Регистрация
24.12.2012
Сообщения
391
Благодарностей
77
Баллы
28

Vladimir-AWM

Client
Регистрация
26.08.2014
Сообщения
117
Благодарностей
7
Баллы
18
В примере слово. Так же при регистрации акков в Яндексе, обычно слова. Но в AddURL набор символов. Мне нужно точно знать что подойдет под AddURL.
 

Sobesednic

Client
Регистрация
24.12.2012
Сообщения
391
Благодарностей
77
Баллы
28
  • Спасибо
Реакции: Vladimir-AWM

igramnet

Новичок
Регистрация
03.01.2015
Сообщения
19
Благодарностей
0
Баллы
1
Как поднять уровень распознания на яндексе RUS ?
цифра распознания низкая.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113

igramnet

Новичок
Регистрация
03.01.2015
Сообщения
19
Благодарностей
0
Баллы
1
Мало) До 80% бы) Быстро блочит яндекс, т.к. половину распознает.
 

Sobesednic

Client
Регистрация
24.12.2012
Сообщения
391
Благодарностей
77
Баллы
28
за что блочит? нормально вроде работает
 

igramnet

Новичок
Регистрация
03.01.2015
Сообщения
19
Благодарностей
0
Баллы
1
меня блочит за частую ошибку в распознании каптч. Типо пишет в итоге "Ваш ip заблокирован" за частое посещение страниц.
 

Sobesednic

Client
Регистрация
24.12.2012
Сообщения
391
Благодарностей
77
Баллы
28
сутками работает, такой проблемы не встречал
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
может изза проксей?
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)