Zzom
Client
- Регистрация
- 23.05.2016
- Сообщения
- 238
- Благодарностей
- 66
- Баллы
- 28
Вообще отличная штука, много в каких шаблонах гадает на автомате, причем, если символы ровно, то результат отличный. Шумы можно сниппетами убирать разными, осветление итд.
К сожалению, иногда такое бывает. Просто перезагрузи проект.Ребят, скажите пожалуйста что за дела?
Я компьютер перезагрузил 2 разаК сожалению, иногда такое бывает. Просто перезагрузи проект.
Ты переименовал неправильно, на скрине у тебя в слове "ExternalAssemblies" две буквы "l"Теперь думаю что это из за этого..
Исправил, спасибо! Не хочет гадать такую каптчу. Не подскажешь, что-то нужно еще делать чтобы она такие гадала?Ты переименовал неправильно, на скрине у тебя в слове "ExternalAssemblies" две буквы "l"
Tesseract такие каптчи не возьмёт.Не хочет гадать такую каптчу. Не подскажешь, что-то нужно еще делать чтобы она такие гадала?
Tesseract такие каптчи не возьмёт.
Не зря! Хоть это и не являлось твоей целью, но ты получил знаниястолько времени зря...ёптть. Спасибо!
Подскажи пожалуйста как код переделать чтобы он сработал?
using (var api = OcrApi.Create())
{
api.Init(Languages.English);
api.SetVariable("tessedit_char_whitelist", "0123456789");
string plainText = api.GetTextFromImage(@"C:\cap.png");
return plainText;
}
return "bad";
Подскажи пожалуйста как код переделать чтобы он сработал?
Код:using (var api = OcrApi.Create()) { api.Init(Languages.English); api.SetVariable("tessedit_char_whitelist", "0123456789"); string plainText = api.GetTextFromImage(@"C:\cap.png"); return plainText; } return "bad";
Английский язык убираем, и оставляем только цифры?Тебе по сути все что нужно привести в 2 цвета (ч/б) и https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality#noise-removal
Ограничение символов и желательно кол-во цифр тоже указывать если оно статично
https://github.com/tesseract-ocr/tesseract/wiki/FAQ#how-do-i-recognize-only-digits
using (var api = OcrApi.Create())
{
api.SetVariable("tessedit_char_whitelist", "0123456789"); // если гадать только цифры - раскомментировать строку
var path = project.Variables["picture"].Value;//название переменной в которой путь к файлу
string plainText = api.GetTextFromImage(path);
return plainText; // возвращаем ответ переменой екшена
}
return "bad";
Английский язык убираем, и оставляем только цифры?
Код:using (var api = OcrApi.Create()) { api.SetVariable("tessedit_char_whitelist", "0123456789"); // если гадать только цифры - раскомментировать строку var path = project.Variables["picture"].Value;//название переменной в которой путь к файлу string plainText = api.GetTextFromImage(path); return plainText; // возвращаем ответ переменой екшена } return "bad";
Я ничего не понимаю в этом. Все же, спасибоприложил к первому посту этого диалога trainingdata
https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract-3.03–3.05#data-files-required
и уже второй раз повторяю, remove noise
https://tesseract.patagames.com/help/html/b4effc4b-310d-4f1f-99a0-65bc001cd765.htm
enable_noise_removal 1 Remove and conditionally reassign small outlines when they confuse layout analysis, determining diacritics vs noise
мб еще с другими параметрами шума поиграться прийдется.
Я не юзал .net либу тессеракта, я не подскажу тебе как прикурить ее в конкретно твоем коде. Пробуй, изучай, конфиги скинул наглядно
А он разве обучается? Он только распознает. Это ж не нейросетьБлин, по прежнему не понятно, как обучать тессеракт(( Может кто-то продвинулся уже в этом вопросе? Обучить циферкам нужно, то есть вроде как не сложное должно быть обучение, но не понятно, чего делать...
Ну он не сам обучается - это дело ручное)) но всё же улучшить его алгоритмы можно. Да ты можешь даже загуглить это - увидишь, что всякие статьи есть на эту тему.А он разве обучается? Он только распознает. Это ж не нейросеть
Человек на то и человек что бы самому разбираться. А не ждать когда все расскажу и покажут. Как в мультике Валл-и, будем летать в летучих креслах и только рот открывать что бы туда закладывали пищу). Тут нужно же шумы всяки убирать с картинки. Каждую буку обрезать подравнивать. А данный teaseract распознает только прямые шрифты. Больше гамороя будет. Используй сервисы распознования, кап монстры, ксевилы ... всего полноНу он не сам обучается - это дело ручное)) но всё же улучшить его алгоритмы можно. Да ты можешь даже загуглить это - увидишь, что всякие статьи есть на эту тему.
Вот только применить всё это сложно - все те статьи с пропущенным жирным куском информации, без которого новичкам очень сложно разобраться.
он совсем для простеньких капч. я давно обучал. получилось гдет 15% распознавания. но там сложности были со слипшимися цифрами. это всё надо обрабатывать было. нарезать , прогонять через фильтры.Блин, по прежнему не понятно, как обучать тессеракт(( Может кто-то продвинулся уже в этом вопросе? Обучить циферкам нужно, то есть вроде как не сложное должно быть обучение, но не понятно, чего делать...
На фотостране он хорошо капчу гадал, помниться мне года так 2 назадон совсем для простеньких капч. я давно обучал. получилось гдет 15% распознавания. но там сложности были со слипшимися цифрами. это всё надо обрабатывать было. нарезать , прогонять через фильтры.
вообщем надо создать свой шрифт который используется в капче, прописать каждый символ какую букву обозначает и скормить эту все тессеракту.
Никто и не ждёт, милейший. Что можно, делаю сам. Где не получается - пишу. Это раз. Второе - использование даже самого быстрого решения - икс зла - мне не подходит, так как ему на разгадывание нужно секунд пять, а тесеракт в течении секунды всё делает. А у шаблона всего 15 секунд на разгадывание двух картинок и принятия решения.Человек на то и человек что бы самому разбираться. А не ждать когда все расскажу и покажут. Как в мультике Валл-и, будем летать в летучих креслах и только рот открывать что бы туда закладывали пищу). Тут нужно же шумы всяки убирать с картинки. Каждую буку обрезать подравнивать. А данный teaseract распознает только прямые шрифты. Больше гамороя будет. Используй сервисы распознования, кап монстры, ксевилы ... всего полно
Смотря какая капча, драгоценнейший.Никто и не ждёт, милейший. Что можно, делаю сам. Где не получается - пишу. Это раз. Второе - использование даже самого быстрого решения - икс зла - мне не подходит, так как ему на разгадывание нужно секунд пять, а тесеракт в течении секунды всё делает. А у шаблона всего 15 секунд на разгадывание двух картинок и принятия решения.
Любезнейший, он одну простую циферку разпозновал 5 секунд. То есть это даже не капча былаСмотря какая капча, драгоценнейший.
Ну желаю удачи, прелюбезнейший в обучении тессеракта)Любезнейший, он одну простую циферку разпозновал 5 секунд. То есть это даже не капча была![]()
Ну желаю удачи, прелюбезнейший в обучении тессеракта)