WebArchiveMaster - парсер Вебархива

  • Автор темы Автор темы footashes
  • Дата начала Дата начала
Статус
В этой теме нельзя размещать новые ответы.
Для работы Black Widow Spider нужен мощный компьютер, так-как программе нужно обработать десятки тысяч ссылок только одного сайта и, главное, правильные сайты для поиска дропов - сайты нужны старые, с комментариями не менее 3-4 лет, тогда вероятность нахождения очень сильно повышается. Во время тестирования программа за 8 часов нашла около 40 дропов, это много, так-как они одной тематики. Пример одного из них во вложении.
 

Вложения

del
 
Последнее редактирование:
оплатил жду
 
Через пару дней открываю сервер распознавания текстовых капч на базе (другой софт) Ultra (Google Recaptcha2 через несколько недель). Безлимитное распознавание более 4600+ видов капч. Поддерживаемые типы изображений перечислены в данном списке: https://yadi.sk/d/-QKQsZ933MWy9L

Программа практически полностью заменяет такие сервисы, как AntiGate (Anti-Captcha), RuCaptcha, DeCaptcher и другие. При этом, существенно их превосходит по скорости распознавания (в 10 раз и более).

Можно подключать любой сео-софт, где требуется ввод текстовой капчи - кей коллектор, антиплагиат и т.д. Для каждого даю тест на час, чтобы было понятно, устраивает его этот сервис или нужная программа не работает с этим сервером.

Хотелось бы узнать - какая цена в месяц вас бы устроила? Пишите свои предложения на obrnadzorgov@yandex.ru, чтобы не засорять ЛС.

Да, какой бы ни была цена (а она будет небольшой), покупателям WebArchiveMasters скидка 50%.
 
Последнее редактирование:
Через пару дней открываю сервер распознавания текстовых капч на базе (другой софт) Ultra (Google Recaptcha2 через несколько недель). Безлимитное распознавание более 4600+ видов капч. Поддерживаемые типы изображений перечислены в данном списке: https://yadi.sk/d/-QKQsZ933MWy9L

Программа практически полностью заменяет такие сервисы, как AntiGate (Anti-Captcha), RuCaptcha, DeCaptcher и другие. При этом, существенно их превосходит по скорости распознавания (в 10 раз и более).

Можно подключать любой сео-софт, где требуется ввод текстовой капчи - кей коллектор, антиплагиат и т.д. Для каждого даю тест на час, чтобы было понятно, устраивает его этот сервис или нужная программа не работает с этим сервером.

Хотелось бы узнать - какая цена в месяц вас бы устроила? Пишите свои предложения на obrnadzorgov@yandex.ru, чтобы не засорять ЛС.

Да, какой бы ни была цена (а она будет небольшой), покупателям WebArchiveMasters скидка 50%.
не будет второй рекапчи
она будет только для хрумака
 
Небольшой F.A.Q. по данному модулю:

1. Будет ли модуль включён в (другой софт), или только в (другой софт)?

Нами было принято реализовывать данный функционал именно в (другой софт)-е, вопреки изначальным планам:
именно в (другой софт)-е предусмотрены все возможности для приёма капч от стороннего софта,
поэтому такой подход для пользователей будет наиболее удобен.

2. Будет ли поддержка распознавания РеКапчи2 по API сервисов "RuCaptcha"?

Да, именно так данный функционал и реализуется - по тем же причинам, которые изложены в п.1 выше.

3. Для всех, кто не будет принимать участие в пред-заказе, модуль распознавания РеКапча2 будет бесплатен?

Да, все обновления для наших пользователей - бесплатны, включая и это.
Однако общедоступен модуль будет существенно позже старта тестирования (на 3-5 недель или более), поэтому те,
кто получают эксклюзивные права на тестирование, будут в существенном выигрыше - хоть и будут "первопроходцами"
в плане обнаружения и устранения возможных погрешностей в работе программы.
 
Небольшой F.A.Q. по данному модулю:

1. Будет ли модуль включён в (другой софт), или только в (другой софт)?

Нами было принято реализовывать данный функционал именно в (другой софт)-е, вопреки изначальным планам:
именно в (другой софт)-е предусмотрены все возможности для приёма капч от стороннего софта,
поэтому такой подход для пользователей будет наиболее удобен.

2. Будет ли поддержка распознавания РеКапчи2 по API сервисов "RuCaptcha"?

Да, именно так данный функционал и реализуется - по тем же причинам, которые изложены в п.1 выше.

3. Для всех, кто не будет принимать участие в пред-заказе, модуль распознавания РеКапча2 будет бесплатен?

Да, все обновления для наших пользователей - бесплатны, включая и это.
Однако общедоступен модуль будет существенно позже старта тестирования (на 3-5 недель или более), поэтому те,
кто получают эксклюзивные права на тестирование, будут в существенном выигрыше - хоть и будут "первопроходцами"
в плане обнаружения и устранения возможных погрешностей в работе программы.
Это было давно. Мне лично известно что рекапча2 будет все таки только для хрумака.
 
Нет, просто новый продукт должен взять свою долю на рынке и это логично. Им же нужно шагать в ногу со временем.
 
Нет, просто новый продукт должен взять свою долю на рынке и это логично. Им же нужно шагать в ногу со временем.
просто ранее было известно о том что рекапча2 не будет доступна из стороннего софта
 
просто ранее было известно о том что рекапча2 не будет доступна из стороннего софта
Нами было принято реализовывать данный функционал именно в (другой софт)-е, вопреки изначальным планам.
 
Не успеваю следить за всем софтом.
 
то еще вилами по воде. На деле все может выйти совсем иначе. И точно не в срок.
 
Хочу написать насчет Black Widow Spider. Эта программа не предназначена для того, чтобы бросить в неё сотню доменов и поставить на поиск. Нужно знать, где копать. Почти все зависит от сайта-донора. Сайт должен быть старый, со старыми комментариями, тогда нахождение дропов резко увеличивается, так-как многие люди через 2-3 года бросают сайт, как правило, с очень хорошим авторским контентом.

Я работаю с женской тематикой, где в принципе много дропов и сайт выбираю старый, чтобы в нем было около 70-100 страниц. 5-6 сайтов вполне достаточно.

Вы же можете выбрать молодой сайт-донор, в котором тысячи страниц и мало комментариев, и чтобы обработать все эти страницы, потребуется очень много времени, а на выходе может ничего не быть. Ведь в каждой странице под сотню различных ссылок, включая рекламу и ссылки на другие страницы, и всё это нужно обработать, а для этого нужен полный цикл. Очень многое зависит от тематики и самого сайта.

Лучше найти 2-3 старых сайта со множеством комментариев, пусть он будет хоть тысячу страниц, чем 1000 непонятных сайтов, которые придется обрабатывать очень много времени с непонятным результатом, но если у вас есть мощности вычислительного центра, то вы можете забросить хоть сто тысяч доменов, он обязательно найдет дропы; другое дело, сколько на это потребуется времени.

Продублирую видеоролик, посмотрите его более внимательно.
 
  • Спасибо
Реакции: Astraport
Если вы считаете, что пропускается много дропов, вы можете отключить проверку доменов в проджектмейкере, но учтите - будет много заведомо неуникальных текстов:
Вебархив.gif
 
Последнее редактирование:
Оплатил, жду. По поводу (другой софт) на складчике можно поймать подписку на пол года менее чем за 100 руб.
 
Можно глянуть ссылку на такое чудо?
Смотрите в разделе "доступ к платным ресурсам". (Приватные сборища)
По сути делов не много, у меня демо (другой софт) стоит на тест. (оч даже...)
 
Последнее редактирование:
Смотрите в разделе "доступ к платным ресурсам". (Приватные сборища)
По сути делов не много, у меня демо (другой софт) стоит на тест. (оч даже...)
У демо значительно ниже пробиваемость капч. знаю, т.к. имел опыт использования обоих.
 
Смотрите в разделе "доступ к платным ресурсам". (Приватные сборища)
Это не для простых смертных, и я не удивлюсь, если там продают Демо
По сути делов не много, у меня демо (другой софт) стоит на тест. (оч даже...)
Демо только для проверки возможностей, пробиваемость снижена вполовину, вы не понимаете разницу ультра и демо, так-как не можете сравнить - это небо и земля.
 
Стабильная версия Black Widow Spider для сбора тематических дропов. Нужен мощный компьютер, так-как программе нужно обработать десятки тысяч ссылок только одного сайта и правильные сайты для поиска дропов - сайты нужны старые, с комментариями не менее 3-4 лет, тогда вероятность нахождения очень сильно повышается.
  • Программа ускорена в 3-4 раза
  • Изменена логика и убрано лишнее
По ошибке "Нет такого таба page в инстансе. Инстанс 60010:127.0.0.1" - Это вроде как баг некоторых версий Зеннопостер.

Программа будет постоянно дорабатываться.
Всем отправил.
 
По ошибкам Black Widow Spider пишите в личку и на почту, желательно со скриншотами, версией Зеннопостер и id ошибки. У всех разные версии и проявляются они по разному. И посмотрите, чтобы на папке не стояла галка "Только чтение", так-как там много циклов и постоянно идет запись\чтение диска. За один час программе нужно обработать тысячи ссылок, и она может "упасть" от нехватки памяти или загрузки процессора.
 
Всплыла одна известная проблема с ответом сервера - например, сайт _zatporno.net получает ответ "200", но при этом по факту не работает:
Screenshot_1.jpg


Black Widow Spider отлавливает явные дропы, пока не понятно, как отловить неявные, поэтому пока перепроверяйте данные в файле NoDrops.txt через этот сервис: http://backlinks-checker.dimax.biz/tools/proverka_otveta_servera.php.
 
Почему ты так думаешь, что там демо?
Там всё прекрасно работает.
Стоит удивиться )
Не для простых смертных я имею в виду - "доступ к платным ресурсам". (Приватные сборища)
У ксевила мощная защита, поэтому думаю, что демо.
 
Статус
В этой теме нельзя размещать новые ответы.

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)