Правильно понимаю вот про эти моменты?
Т.е ты делал проверку только на этом сайте, так? В боевом режиме не проверял, на любом кране?
И не будет работать. Ты возьми любой кран, у каждого свой набор ключ-значение, меняется это легко.
Под каждый кран(или кран от одного админа) должен собираться свой набор ключ-значение, иначе никак.
Выложи пример как твой шаб отрабатывает на каком то кране, где явно
видно что набор в антиботе другой, не из стандартного набора.
Если админ не идиот, то он напихает сюда своих вариантов(и такое есть на самом деле), чтобы если ты пробиваешь антибота на одном сайте, то не пробьешь на другом.
Т.е алгоритм антибота состоит из двух частей. Первая - распознавание текста в вопросе и ответе. Вторая, сбор ключ-значение, для сопоставление вопроса с ответами. Тут тоже есть хитрожопые варианты. Вопрос один, вариантов несколько.
И если ты сделал заточку именно под стандартный набор, то стоит только поменять набор, и все, твой алгоритм накроется.
Плюс по распознаванию текста. Если ты сделал перебор вариантов слов "в лоб" -
именно слов, а не букв, и именно под этот набор, то это тоже херовый вариант.
Алгоритм должен распознавать именно буквы, иначе это лажа.
Как это сделать, у меня два варианта.
Или как описывал здесь, но более интеллектуально
http://zennolab.com/discussion/threads/raspoznavanie-simvolov-bez-tesseract-cm-i-prochix-servisov.31731/
Или обучать нейросеть. Самому копать, или юзать готовое решение в виде удобной оболочки - CapMonster.
Вот эту либу юзает CM
http://www.aforgenet.com/framework/features/neural_networks.html
У кого хватит мозгов раскурить мануалы и разобраться с api, сможет обойтись и без CM.