Цифра 0 и символ О

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

1. Нужна возможность для 2 шага, сбора символов, отключать уже собранные массивы.
Каптча регистро-независмая, и прокатит любой вариант.
Столкнулся с тем что, в коллекции есть оба варианта.
Нужно протестить каждый из вариантов.
Не собирать же по новой проект ради 1 символа.

2. На первом шаге нужна возможность вернуть регистр символов к исходному.
 

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 473
Баллы
113
Нужно при сборе символов всегда ставить, что регистр важен.
А при обучении уже либо устанавливать, либо убирать. Это я говорю про второй шаг.
Галку важности регистра в настройках обучения нужно ставить только если каптча регистрозависимая.
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

если каптча регистронезависимая.
у меня в коллекции обучения/теста 100 шт где 0 и 100 буква О. Ну так на антигейте распознали. Один букву вбил, другой цифру 0.
По факту будет % выше, а в тестере будет занижен.
+это же будет влиять на обучение?

Как следствие в тестере после обучения % будет не верным.
Просто так получилось что в выборке больше либо 0 либо О.
 

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 473
Баллы
113
Все равно не совсем понял, ты-то правильно собрал символы? Там где 0 собирал 0, там, где O - O правильно?
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

при сравнении строк получаем так:
upload_2015-1-23_15-8-35.png

но учитывая регистронезависимость, этот ответ прошел бы как true.
тут даже вопрос не в регистре, а чисто в 0 и О и о
на каптче не понятно как понимать, буква это или цифра, и каптча принимает как true оба варианта.
Но на сервисе распознавания при создании коллекции люди понимали этот как 0 и О.
о чем и речь, добавить функцию замены или выбора только тех каптч где один из символов будет в качестве ответа.
привести коллекции к одному из символов путем замены 0>O или в обратном порядке, без разницы, или как функция, считать 0 за O и в обратном порядке..

тогда для таких моментов тестер будет показывать точный %, сейчас он занижен при наличии 0/О

Пример:
Одна каптча A1B0 - 0(цифра)
На сервисе мне распознали 100 шт что это цифра, и 100 что это буква О.
На практике:
на сайте 0==O true
в тестере 0==O false
итог: 50% будет показывать в тестере.

Не важно как я соберу в таком случае.


+нужно чистить коллекции от служебных ответов , типа sorry.
Если мы будет слать на распознавание через сервисы в студии, у нас нет возможности, кроме как руками визуально удалять их.
 
Последнее редактирование модератором:

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Ну это же не про регистр, а про разные символы. учи 0 цифру как заглавную 0 букву.
Или я чего то не понимаю?
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

1.ну обучил я ее как 0.
в коллекции теста как была буква в ответах..так и осталась.
потом тестер будет сравнивать букуву с цифрой и отдавать false.

2. обучил как букве, аналогично. в коллекции тестирования и обучения есть ответы как буквы и цифры. опять будет false в тестере

3. обучил обоим. будет рандомный false

//
вопрос затрагивает и регистр. если каптча будет регистрозависимой.
генератор размножения..сделает из маленькой буквы о большую О, и обратно, усреднит их до разницы размеров к примеру в 30%.

вопрос в показаниях % тестера.
 
Последнее редактирование:

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 473
Баллы
113
Тут вопрос только в показателях итогового процента. Он будет ниже чем нужно. Если 0 и O встречаются одинаковое количество раз, значит настоящий процент будет больше в 1,7-2 раза примерно.

А какая разница, ведь каптча будет распознаваться.
Короче учи все 0 и O как 0 и все.
Там даже при сохранении символов, которые насобирал можно внести изменение, т.е. собираешь O, а перед отправкой в коллекцию меняшь символ на 0 (он там редактируемый)
Менять программу, добавлять новые фичи под одну кривую каптчу не вижу никакого смысла.
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

ты не понял суть проблемы.
этот момент допустим для всех каптч где есть 0/О

в коллекции тестирования нельзя привести при необходимости только к цифрам или только к буквам.

какому бы символу не обучил, сравнивать в коллекции строки тестер будет то с нулем то с буквой.

суть не в обучении/сбору символов.
без разницы что вернет монстр после распознавания.
на фактический пробив не влияет, в случае когда каптча принимает 0/О за верный ответ .
суть в коллекции тестирования!
просто цифра тестера занижена.
 
Последнее редактирование:

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 473
Баллы
113
Если сервису все равно и он не различает в ответе О и 0:
1) Учи все как 0
2) Прямо в таблице, где идет тест, измени у всех тестовых каптч О на 0
 

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 473
Баллы
113
На первое время так, а в новом билде добавим возможность замены символов.
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

видео в лс кинул.
я так и делаю, на практике с пробивом проблемы нет.
просто если модуль на продажу или под заказ делаешь, получаешь % в тестере ниже фактического.
заказчику потом долго объясняешь почему фактически там % больше.

// я момент этот решил своими средствами..подгрузил нужную коллекцию.
просто через встроенный инструмент отправки на сервисы это не пофиксить потом.

//как и служебные ответы типа sorry нужно фильтровать.
в виде редактируемого списка стоп слов можно.

еще добавлю пару моментов тут уже)
для инструмента отправки на сервис задать опцию фильтрации длины ответа.
для случаев когда каптча константную длину имеет.
скажем всегда 6 символов, и не пропускать в коллекцию ответы больше/меньше этой длины.
 
Последнее редактирование:

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 473
Баллы
113
Если так сильно важно, чтобы какая-то коллекция была распознана очень правильно, можно использовать опцию 100% распознавание на антикапче.
Хотя это, вообще говоря, не нужно для создание модуля.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)