Пример восстановленного сайта:
Пример парсинга текстов с этого сайта (вчера делал) -
https://zennolab.com/discussion/attachments/mamyprofi-ru-rar.30496/?temp_hash=8dcf93c34afc4bc6ffd2e8b4d1fc8f45
Нашел кучу интересных сайтов, попробую восстановить и почистить. Кто хочет попробовать себя в этом деле - велкам.
WebArchiveMastersV2.3 - парсер Вебархива + Дзен v2.2 + Антиплагиат + Мануал + Content Watch + ParserDomens. Восстановление всего сайта из Вебархива. Полностью готовый сайт, остается только залить на сервер. Пригодится для своих сайтов,
можно сразу получить при оплате -
https://primearea.biz/product/134651/.
Небольшое дополнение -
ParserDomens теперь заменяет устаревший
Black Window Spider. В течении некоторого времени не смогу отвечать оперативно (1-2 недели) в связи с восстановлением диска. Алгоритм Криворучки полностью переписывается и тестируется на мобильных прокси, так-как они показывают наилучшие результаты.
___________________________________________________________________
Добрый день. Прошу помочь. Все работало нормально. Месяц шаблон не использовался. Настройки не менялись. Сейчас выдает ошибки:
Тип Время Сообщение
21:40:21 Количество текстовых ссылок: ~ 147
Тип Время Сообщение
21:40:22 Бесшаблонный парсер подключен неправильно
Тип Время Сообщение
21:43:47 ZennoPoster Не удалось выполнить проект C:\bots\WebArchiveMasters\Краулер.xmlz
Сегодня скачал текста с сайта. ZennoPoster v5.17.2.0 тоже. Если используете v5.17.2.0, ставьте браузер в настройкак Фаерфокс 45, иначе будет много мусора.
21:40:22 Бесшаблонный парсер подключен неправильно - нет подключения к full-text-rss - он должен стоять на сервере или Опен Сервере. Самое главное - добавляйте 200-300 заданий, тогда при потере доступа к скрипту шаблон будет его постоянно запрашивать, и когда он ответит, пойдет дальше. У вас видимо стоит одно задание, поэтому при любом сбое задание заканчивается и программа останавливается.
Подскажите пожалуйста, по ссылке на версию WebArchiveMastersV2.3.rar в архиве находится файл domens.txt и все. Так и должно быть? Если нет, отправьте пожалуйста актуальную ссылку.
Попробуйте использовать новый архиватор - вчера скачал и запустил - всё работает, как и должно, вчерашние текста приложил. Попробуйте почитать WebArchiveMasters.pdf, как правило, этого бывает достаточно.
____________________________________________
хочу уточнить, шаблон парсит тексты из вебархива или восстанавливает полностью сайт?
если восстанавливает, то
а. есть ли возможность восстанавливать на конкретную дату (или до даты),
б. выкачивает ли кроме текста и картинок всякие js скрипты,
в. в каком формате возвращает готовый сайт, хтмл со структурой (ну то есть раскладывает по папочкам) или все в общей куче?
и последний интересный вопрос - этот комбайн работает только с ру или можно бурж совать (поиск контента, поиск дропов и пр)? ))
Восстанавливает полностью - скрипты, стили и т.д. Текст парсит на любом языке.
P.S.
Если кто работает с AMS и нужно быстро импортировать сотни и тысячи релеев, быстренько для себя написал шаблон импорта.
Файл "Емейлы.txt" - сюда ложим емейлы с паролями (через точку с запятой -
[email protected];Ls1c91DIawtfx), файл "Готовые релеи.LST" - сюда будут записываться готовые к импорту релеи), файл "Релеи.txt" - служебный (основной шаблон импорта).