Цифра 0 и символ О

  • Автор темы Автор темы 7make
  • Дата начала Дата начала

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Реакции
1 312
Баллы
113
1. Нужна возможность для 2 шага, сбора символов, отключать уже собранные массивы.
Каптча регистро-независмая, и прокатит любой вариант.
Столкнулся с тем что, в коллекции есть оба варианта.
Нужно протестить каждый из вариантов.
Не собирать же по новой проект ради 1 символа.

2. На первом шаге нужна возможность вернуть регистр символов к исходному.
 
Нужно при сборе символов всегда ставить, что регистр важен.
А при обучении уже либо устанавливать, либо убирать. Это я говорю про второй шаг.
Галку важности регистра в настройках обучения нужно ставить только если каптча регистрозависимая.
 
если каптча регистронезависимая.
у меня в коллекции обучения/теста 100 шт где 0 и 100 буква О. Ну так на антигейте распознали. Один букву вбил, другой цифру 0.
По факту будет % выше, а в тестере будет занижен.
+это же будет влиять на обучение?

Как следствие в тестере после обучения % будет не верным.
Просто так получилось что в выборке больше либо 0 либо О.
 
Все равно не совсем понял, ты-то правильно собрал символы? Там где 0 собирал 0, там, где O - O правильно?
 
при сравнении строк получаем так:
upload_2015-1-23_15-8-35.png

но учитывая регистронезависимость, этот ответ прошел бы как true.
тут даже вопрос не в регистре, а чисто в 0 и О и о
на каптче не понятно как понимать, буква это или цифра, и каптча принимает как true оба варианта.
Но на сервисе распознавания при создании коллекции люди понимали этот как 0 и О.
о чем и речь, добавить функцию замены или выбора только тех каптч где один из символов будет в качестве ответа.
привести коллекции к одному из символов путем замены 0>O или в обратном порядке, без разницы, или как функция, считать 0 за O и в обратном порядке..

тогда для таких моментов тестер будет показывать точный %, сейчас он занижен при наличии 0/О

Пример:
Одна каптча A1B0 - 0(цифра)
На сервисе мне распознали 100 шт что это цифра, и 100 что это буква О.
На практике:
на сайте 0==O true
в тестере 0==O false
итог: 50% будет показывать в тестере.

Не важно как я соберу в таком случае.


+нужно чистить коллекции от служебных ответов , типа sorry.
Если мы будет слать на распознавание через сервисы в студии, у нас нет возможности, кроме как руками визуально удалять их.
 
Последнее редактирование модератором:
Ну это же не про регистр, а про разные символы. учи 0 цифру как заглавную 0 букву.
Или я чего то не понимаю?
 
1.ну обучил я ее как 0.
в коллекции теста как была буква в ответах..так и осталась.
потом тестер будет сравнивать букуву с цифрой и отдавать false.

2. обучил как букве, аналогично. в коллекции тестирования и обучения есть ответы как буквы и цифры. опять будет false в тестере

3. обучил обоим. будет рандомный false

//
вопрос затрагивает и регистр. если каптча будет регистрозависимой.
генератор размножения..сделает из маленькой буквы о большую О, и обратно, усреднит их до разницы размеров к примеру в 30%.

вопрос в показаниях % тестера.
 
Последнее редактирование:
Тут вопрос только в показателях итогового процента. Он будет ниже чем нужно. Если 0 и O встречаются одинаковое количество раз, значит настоящий процент будет больше в 1,7-2 раза примерно.

А какая разница, ведь каптча будет распознаваться.
Короче учи все 0 и O как 0 и все.
Там даже при сохранении символов, которые насобирал можно внести изменение, т.е. собираешь O, а перед отправкой в коллекцию меняшь символ на 0 (он там редактируемый)
Менять программу, добавлять новые фичи под одну кривую каптчу не вижу никакого смысла.
 
ты не понял суть проблемы.
этот момент допустим для всех каптч где есть 0/О

в коллекции тестирования нельзя привести при необходимости только к цифрам или только к буквам.

какому бы символу не обучил, сравнивать в коллекции строки тестер будет то с нулем то с буквой.

суть не в обучении/сбору символов.
без разницы что вернет монстр после распознавания.
на фактический пробив не влияет, в случае когда каптча принимает 0/О за верный ответ .
суть в коллекции тестирования!
просто цифра тестера занижена.
7bc40-clip-7kb.png
 
Последнее редактирование:
Если сервису все равно и он не различает в ответе О и 0:
1) Учи все как 0
2) Прямо в таблице, где идет тест, измени у всех тестовых каптч О на 0
 
На первое время так, а в новом билде добавим возможность замены символов.
 
видео в лс кинул.
я так и делаю, на практике с пробивом проблемы нет.
просто если модуль на продажу или под заказ делаешь, получаешь % в тестере ниже фактического.
заказчику потом долго объясняешь почему фактически там % больше.

// я момент этот решил своими средствами..подгрузил нужную коллекцию.
просто через встроенный инструмент отправки на сервисы это не пофиксить потом.

//как и служебные ответы типа sorry нужно фильтровать.
в виде редактируемого списка стоп слов можно.

еще добавлю пару моментов тут уже)
для инструмента отправки на сервис задать опцию фильтрации длины ответа.
для случаев когда каптча константную длину имеет.
скажем всегда 6 символов, и не пропускать в коллекцию ответы больше/меньше этой длины.
 
Последнее редактирование:
Если так сильно важно, чтобы какая-то коллекция была распознана очень правильно, можно использовать опцию 100% распознавание на антикапче.
Хотя это, вообще говоря, не нужно для создание модуля.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)