С# ZennoPoster + Tesseract.Net SDK

  • Автор темы Автор темы swiniks
  • Дата начала Дата начала

Полезная ли для вас информация ?


  • Всего проголосовало
    130
в ручную запилил чтобы для пнонимания было понятно что можно и тессерактом распознать
два видео конечно из за того что программа когда захват видео делает не скринит
1.увеливаем картинку
2.очищаем от мусора


символы я нарезал заранее


теперь всю эту красоту связываешь в автоматический режим и в путь
@ssXXXss как ты картинки разрезаешь?
 
тебе определенно нужен кодер для реализации твоих идей, так как ты их чуть ли не каждый день генерируешь
ага особенно такой жадный как ты))) у которого вс начинается с фразы
Можно, но такие решения сходу не пишутся, так что если вам нужна скорость, пишите в пм, там все обсудим.
приведу цитату нашего шутника ))) тут он точно за детектил)))
Зарабатывать конечно необходимо, но и совесть нужно иметь
 
ага особенно такой жадный как ты))) у которого вс начинается с фразы
приведу цитату нашего шутника )))
Так и есть. Я долго искал решение на тот вопрос и нашел только длинное решение, которое вдобавок ещё пришлось и доделывать с трудом. А doc написал короткий вариант в 2 строки, о котором я на тот момент даже и не знал
P.S. мне все равно заняться нечем, прочитал Албахари, теперь читаю Джеффри Рихтера и переписываю его кусочки кода
 
показал бы как кодом резать????
Вариант ведь не один и я не знаю тебе для каких целей, но думаю наверно для шрифтов уникальных )))
1. можно нарезать методом Moadip, а тоесть перерисовать символы на новый битмап сохранив только символ
2. можно просто по вертикали нарезать
3. можно crop применить если знаешь точные координаты
смотря для каких целей, можно перерисовать под один размер для обучения нейронки, поэтому замарачиваться думаю мало кто будет так как не всё можно порезать удачно
 
  • Спасибо
Реакции: rediffusion
Вариант ведь не один и я не знаю тебе для каких целей, но думаю наверно для шрифтов уникальных )))
1. можно нарезать методом Moadip, а тоесть перерисовать символы на новый битмап сохранив только символ
2. можно просто по вертикали нарезать
3. можно crop применить если знаешь точные координаты
смотря для каких целей, можно перерисовать под один размер для обучения нейронки, поэтому замарачиваться думаю мало кто будет так как не всё можно порезать удачно
нужно как у тебя в видосе, скопировал картинку и все символы уже порезаны ))) по отдельности!
а что за прога где ты удалеяешь мусор с картинки?
 
Конкретно эта каптча режется неплохо, пропорционально количеству букв. Взял ещё несколько таких же - расстояния между буквами одинаковые, только немного с краёв добавил. Приложил пример на imagemagik-e: убирает шум, увеличивает, режет.

p7.png p7-rez.jpg

1a.png 1a-rez.jpg

yu.png yu-rez.jpg
 

Вложения

Конкретно эта каптча режется неплохо, пропорционально количеству букв. Взял ещё несколько таких же - расстояния между буквами одинаковые, только немного с краёв добавил. Приложил пример на imagemagik-e: убирает шум, увеличивает, режет.
Спасибо ДРУЖИЩЕ! Это как раз то, что нужно!
Я то думал тут куча кода, а выходит imagemagik сам вырезает буквы и складывает их отдельно?

с командами помоги пожалуйста разобраться?
-resize 1000% - изменяет размер картинки
-threshold 60% - читаю тут но немогу понять что делает? http://www.imagemagick.org/script/command-line-options.php#threshold
-trim - это обрезка, но чтото пока не пойму, перевод тут не очень http://www.imagemagick.org/script/command-line-options.php#trim
-fuzz 20% - что это команда делает?
-bordercolor white - цвет границы. Тут имеется ввиду граница между символом и фоном?
-border 40x0 - что эта команда делает?
-crop 6x1@ - это вырезает символы. Немного с параметрами не понятно! Что задают данные параметры?
+repage - удалить / переустановить виртуальный холст. Тоесть полностью убирает фон и рисует изображение на новый фон?
+adjoin - эта команда записывает вырезанные символы из изображения в отдельные файлы?
-trim
-fuzz 2%
-border 3x3

зачем некоторые команды применяются 2 раза?
 
-threshold 60% удаляет шумы, иожешь поэксперементировать, может подберёшь лучший параметр
-border 40x0 добавляет по бокам по 40 пикселей, подобрал опытным путем, если без него то во время обрезки может захватывать соседние буквы
-crop 6x1@ режет на 6 равных частей. Именно для этой каптчи подойдет так как все буквы на одинаковом расстоянии.
-bordercolor white - да, правильно
-trim -fuzz 20% - делает обрезку по краям белого цвета. Вот так:
0.jpg
всё обрезано со всех сторон по первому черному пикселю. Почему взял 20 - уже не помню, давно эксперементировал, но потом забросил.

команды по 2 раза - в первом случае применяются к самой картинке каптчи, во втором к уже обрезанным. То есть: -border 40x0 -border 3x3 в первом случае добавил 40 пикселей к самой капче, во втором по 3 пикселя с каждой стороны к уже обрезанным буквам (-border 3x3 можно вообще удалить).

Какие то параметры возможно не совсем корректны, может даже что то и лишнее. Надо пробовать подбирать. Но принцып, я думаю понятен.
 
-threshold 60% удаляет шумы, иожешь поэксперементировать, может подберёшь лучший параметр
-border 40x0 добавляет по бокам по 40 пикселей, подобрал опытным путем, если без него то во время обрезки может захватывать соседние буквы
-crop 6x1@ режет на 6 равных частей. Именно для этой каптчи подойдет так как все буквы на одинаковом расстоянии.
-bordercolor white - да, правильно
-trim -fuzz 20% - делает обрезку по краям белого цвета. Вот так:
Посмотреть вложение 16992
всё обрезано со всех сторон по первому черному пикселю. Почему взял 20 - уже не помню, давно эксперементировал, но потом забросил.

команды по 2 раза - в первом случае применяются к самой картинке каптчи, во втором к уже обрезанным. То есть: -border 40x0 -border 3x3 в первом случае добавил 40 пикселей к самой капче, во втором по 3 пикселя с каждой стороны к уже обрезанным буквам (-border 3x3 можно вообще удалить).

Какие то параметры возможно не совсем корректны, может даже что то и лишнее. Надо пробовать подбирать. Но принцып, я думаю понятен.
Спасибо все стало намного понятнее!
 
Минут 20 пробывал, разгадывает эту каптчу, но минимум один символ всегда не определяет!:D
 
Я делал так
Код:
Развернуть Свернуть Копировать
Bitmap bmp = new Bitmap(@"{-Project.Directory-}\index.jpg");
Image img = ToolStripRenderer.CreateDisabledImage(bmp);
img.Save(@"{-Project.Directory-}\resul.jpg");
bmp.Dispose();

А потом result уже распознавал через Tesseract
Привет скажите пожалуйста пробовал ваш пример для капчи seosprint и у меня после обработки картинка имеет серый фон как зделать белый фон и текст черным
 
https://www.kufar.by/pg/0WRES59uY5nM14EdCrbcL7hdzEB+PFxe1KHbY+Uc=.gif
Не могу понять почему эту капчу не распознает

Код:
Развернуть Свернуть Копировать
using (var api = OcrApi.Create())
{
api.Init(Languages.English); // язык распознавания
api.SetVariable("tessedit_char_whitelist", "0123456789");
string plainText = api.GetTextFromImage(project.Variables["put"].Value); // путь к картинке
return plainText; // возвращаем ответ переменой екшена
}
return "bad";

Вот как распознает
1215725 252

Может кто подскажет?
 
Такие капчи можно разгодать? iYYG44E.jpg
 
Попробуй узнаешь :-), на кап2 есть модуль, точно распознает - это типа socpublic bux. А лучше скрипт для кликера качни, там вообще обход этой капчи на socpublic, она выдаётся по времени в конце ссылки, если подставлять левое время можно за ранее знать ответ на неё.
 
  • Спасибо
Реакции: seregaos
Попробуй узнаешь :-), на кап2 есть модуль, точно распознает - это типа socpublic bux. А лучше скрипт для кликера качни, там вообще обход этой капчи на socpublic, она выдаётся по времени в конце ссылки, если подставлять левое время можно за ранее знать ответ на неё.
три дня ищу модуль на сар2 для капчи socpublic bux. Он точно есть или это предположения? Как его найти? заранее спасибо.
 
три дня ищу модуль на сар2 для капчи socpublic bux. Он точно есть или это предположения? Как его найти? заранее спасибо.
Конечно есть! Даже два видел, один сам делал, а второй с форума брал. Пиши в личку помогу чем смогу.
 
  • Спасибо
Реакции: rediffusion
Такую капчу не разгодать?quote.jpg
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)