- Регистрация
- 07.01.2014
- Сообщения
- 236
- Благодарностей
- 205
- Баллы
- 43
Всем привет.
В наличии: ZennoPoster 5, CapMonster 2, более 1 000 000 ссылок на страницы, содержащие номер телефона в виде изображения.
Задача: сокращение времени распознавания изображения.
Сейчас алгоритм работы таков: заходим на страницу, вытаскиваем картинку, распознаём через CapMonster (создал свой модуль со 100% распознаванием), сохраняем результат в файл, переходим к следующей странице.
Что не устраивает: на один цикл уходит 25 секунд (1 номер телефона = 25 секунд). А это примерно 3500 номеров в сутки. Этого мне мало. Нужно как минимум в 10 раз быстрее.
Мысли: как вариант, можно было бы исключить распознавание каптчи (-10 секунд) в самом цикле. Оставить только сохранение картинок на ПК. Потом взять все картинки и массово их распознать через CapMonster, а потом сохранить результат в файл.
Вопрос: а можно ли так сделать? Если нет, то можете порекомендовать способы увеличения скорости распознавания? Номеров телефонов в виде картинок у меня будет более 1 000 000.
Благодарности: заранее спасибо всем за помощь.
В наличии: ZennoPoster 5, CapMonster 2, более 1 000 000 ссылок на страницы, содержащие номер телефона в виде изображения.
Задача: сокращение времени распознавания изображения.
Сейчас алгоритм работы таков: заходим на страницу, вытаскиваем картинку, распознаём через CapMonster (создал свой модуль со 100% распознаванием), сохраняем результат в файл, переходим к следующей странице.
Что не устраивает: на один цикл уходит 25 секунд (1 номер телефона = 25 секунд). А это примерно 3500 номеров в сутки. Этого мне мало. Нужно как минимум в 10 раз быстрее.
Мысли: как вариант, можно было бы исключить распознавание каптчи (-10 секунд) в самом цикле. Оставить только сохранение картинок на ПК. Потом взять все картинки и массово их распознать через CapMonster, а потом сохранить результат в файл.
Вопрос: а можно ли так сделать? Если нет, то можете порекомендовать способы увеличения скорости распознавания? Номеров телефонов в виде картинок у меня будет более 1 000 000.
Благодарности: заранее спасибо всем за помощь.