Zzom
Client
- Регистрация
- 23.05.2016
- Сообщения
- 238
- Благодарностей
- 66
- Баллы
- 28
Вообще отличная штука, много в каких шаблонах гадает на автомате, причем, если символы ровно, то результат отличный. Шумы можно сниппетами убирать разными, осветление итд.
К сожалению, иногда такое бывает. Просто перезагрузи проект.Ребят, скажите пожалуйста что за дела?
Я компьютер перезагрузил 2 раза Папка "ExternalAssemblies" создавалась в ручную, но потом пробежался по папкам была еще 1 такая же папка в смысле с таким же именем. Странно не попросил заменить при создании одинаковой папки..я удалил одну папку. оставил ту что создал ручками. Теперь думаю что это из за этого..К сожалению, иногда такое бывает. Просто перезагрузи проект.
Ты переименовал неправильно, на скрине у тебя в слове "ExternalAssemblies" две буквы "l"Теперь думаю что это из за этого..
Исправил, спасибо! Не хочет гадать такую каптчу. Не подскажешь, что-то нужно еще делать чтобы она такие гадала?Ты переименовал неправильно, на скрине у тебя в слове "ExternalAssemblies" две буквы "l"
Tesseract такие каптчи не возьмёт.Не хочет гадать такую каптчу. Не подскажешь, что-то нужно еще делать чтобы она такие гадала?
столько времени зря...ёптть. Спасибо!Tesseract такие каптчи не возьмёт.
Не зря! Хоть это и не являлось твоей целью, но ты получил знаниястолько времени зря...ёптть. Спасибо!
Подскажи пожалуйста как код переделать чтобы он сработал?
using (var api = OcrApi.Create())
{
api.Init(Languages.English);
api.SetVariable("tessedit_char_whitelist", "0123456789");
string plainText = api.GetTextFromImage(@"C:\cap.png");
return plainText;
}
return "bad";
Подскажи пожалуйста как код переделать чтобы он сработал?
Код:using (var api = OcrApi.Create()) { api.Init(Languages.English); api.SetVariable("tessedit_char_whitelist", "0123456789"); string plainText = api.GetTextFromImage(@"C:\cap.png"); return plainText; } return "bad";
Английский язык убираем, и оставляем только цифры?Тебе по сути все что нужно привести в 2 цвета (ч/б) и https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality#noise-removal
Ограничение символов и желательно кол-во цифр тоже указывать если оно статично
https://github.com/tesseract-ocr/tesseract/wiki/FAQ#how-do-i-recognize-only-digits
using (var api = OcrApi.Create())
{
api.SetVariable("tessedit_char_whitelist", "0123456789"); // если гадать только цифры - раскомментировать строку
var path = project.Variables["picture"].Value;//название переменной в которой путь к файлу
string plainText = api.GetTextFromImage(path);
return plainText; // возвращаем ответ переменой екшена
}
return "bad";
Английский язык убираем, и оставляем только цифры?
Код:using (var api = OcrApi.Create()) { api.SetVariable("tessedit_char_whitelist", "0123456789"); // если гадать только цифры - раскомментировать строку var path = project.Variables["picture"].Value;//название переменной в которой путь к файлу string plainText = api.GetTextFromImage(path); return plainText; // возвращаем ответ переменой екшена } return "bad";
Я ничего не понимаю в этом. Все же, спасибоприложил к первому посту этого диалога trainingdata
https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract-3.03–3.05#data-files-required
и уже второй раз повторяю, remove noise
https://tesseract.patagames.com/help/html/b4effc4b-310d-4f1f-99a0-65bc001cd765.htm
enable_noise_removal 1 Remove and conditionally reassign small outlines when they confuse layout analysis, determining diacritics vs noise
мб еще с другими параметрами шума поиграться прийдется.
Я не юзал .net либу тессеракта, я не подскажу тебе как прикурить ее в конкретно твоем коде. Пробуй, изучай, конфиги скинул наглядно
А он разве обучается? Он только распознает. Это ж не нейросетьБлин, по прежнему не понятно, как обучать тессеракт(( Может кто-то продвинулся уже в этом вопросе? Обучить циферкам нужно, то есть вроде как не сложное должно быть обучение, но не понятно, чего делать...
Ну он не сам обучается - это дело ручное)) но всё же улучшить его алгоритмы можно. Да ты можешь даже загуглить это - увидишь, что всякие статьи есть на эту тему.А он разве обучается? Он только распознает. Это ж не нейросеть
Человек на то и человек что бы самому разбираться. А не ждать когда все расскажу и покажут. Как в мультике Валл-и, будем летать в летучих креслах и только рот открывать что бы туда закладывали пищу). Тут нужно же шумы всяки убирать с картинки. Каждую буку обрезать подравнивать. А данный teaseract распознает только прямые шрифты. Больше гамороя будет. Используй сервисы распознования, кап монстры, ксевилы ... всего полноНу он не сам обучается - это дело ручное)) но всё же улучшить его алгоритмы можно. Да ты можешь даже загуглить это - увидишь, что всякие статьи есть на эту тему.
Вот только применить всё это сложно - все те статьи с пропущенным жирным куском информации, без которого новичкам очень сложно разобраться.
он совсем для простеньких капч. я давно обучал. получилось гдет 15% распознавания. но там сложности были со слипшимися цифрами. это всё надо обрабатывать было. нарезать , прогонять через фильтры.Блин, по прежнему не понятно, как обучать тессеракт(( Может кто-то продвинулся уже в этом вопросе? Обучить циферкам нужно, то есть вроде как не сложное должно быть обучение, но не понятно, чего делать...
На фотостране он хорошо капчу гадал, помниться мне года так 2 назадон совсем для простеньких капч. я давно обучал. получилось гдет 15% распознавания. но там сложности были со слипшимися цифрами. это всё надо обрабатывать было. нарезать , прогонять через фильтры.
вообщем надо создать свой шрифт который используется в капче, прописать каждый символ какую букву обозначает и скормить эту все тессеракту.
Никто и не ждёт, милейший. Что можно, делаю сам. Где не получается - пишу. Это раз. Второе - использование даже самого быстрого решения - икс зла - мне не подходит, так как ему на разгадывание нужно секунд пять, а тесеракт в течении секунды всё делает. А у шаблона всего 15 секунд на разгадывание двух картинок и принятия решения.Человек на то и человек что бы самому разбираться. А не ждать когда все расскажу и покажут. Как в мультике Валл-и, будем летать в летучих креслах и только рот открывать что бы туда закладывали пищу). Тут нужно же шумы всяки убирать с картинки. Каждую буку обрезать подравнивать. А данный teaseract распознает только прямые шрифты. Больше гамороя будет. Используй сервисы распознования, кап монстры, ксевилы ... всего полно
Смотря какая капча, драгоценнейший.Никто и не ждёт, милейший. Что можно, делаю сам. Где не получается - пишу. Это раз. Второе - использование даже самого быстрого решения - икс зла - мне не подходит, так как ему на разгадывание нужно секунд пять, а тесеракт в течении секунды всё делает. А у шаблона всего 15 секунд на разгадывание двух картинок и принятия решения.
Любезнейший, он одну простую циферку разпозновал 5 секунд. То есть это даже не капча былаСмотря какая капча, драгоценнейший.
Ну желаю удачи, прелюбезнейший в обучении тессеракта)Любезнейший, он одну простую циферку разпозновал 5 секунд. То есть это даже не капча была
Спасибо!)Ну желаю удачи, прелюбезнейший в обучении тессеракта)