WebArchiveMaster - парсер Вебархива2

Webfrilanser · 04.07.2018

footashes сказал(а):
Отправил, но в базе вы есть. Только что проверил - всё скачивается и распаковывается. Используется новый архиватор, старый распаковать не сможет.

Какой новый Архиватор нужно использовать скажите пожалуйста???? а то я Винраром пытаюсь распаковать и вот что мне пишет http://prntscr.com/k2k7ir

Webfrilanser · 05.07.2018

footashes сказал(а):
https://www.rarlab.com/

Спасибо скачал архив с ParserDomens распаковал нашёл в выдаче под нужную мне тему Рабалка несколько доноров с ТОП 10, закинул их в файл Domens и Запустил - Зенку, добавил задание выбрав файл ParserDomens и пошла проверка доменов, пишет что Нужных данных в Вебархиве НЕТ оставляем типа для ручной проверки и переходим к другому домену потом так с несколькими доменами прошло и только из 6 сайтов 1 нашёлся в Вебархиве и начилась проверка страниц и нашлось 1045 страниц и на этих страницах потихоньку находились дропы, но Дропы в файле Спаршенные домены повторяются и много раз повторяются и так как страниц много я в файле Чистая карта удалил много страниц оставил 145 штук, они проверялись, дропы находились, ну все одинаковые восновном несколько попалось разных, потом как парсинг был завершён и домены закончились в файле Domens, я зашёл в файл Спаршенные домены и там куча одинаковых доменов, ну я поудалял дубли и закинул файл Спаршенные домены в папку 200ОК, там какое то Приложение httpanswer, запустил его и где написано: ЗАДАЙТЕ ИСХОДНЫЙ ФАЙЛ я там выбрал место тоесть папку 200ОК и выбрал файл Спаршенные домены и нажал на кнопку СТАРТ, после чего увидел какие то подсчеты цифры побежали и вообщем когда всё приостановилось и не чего больше не происходило я посмотрел появились какие то файлы в папке 200ОК, файлы имеют названия: 2xx, 3xx, 4xx, 5xx, noanswer, other, что это за папки я так и не понял если честно, но зайдя в каждый из файлов увидел тоже самое почти что и в файле Спаршенные домены, тоесть по несколько раз повторяются одни и теже домены, причём в каждом файле, я кароче вручную УДАЛИЛ ДУБЛИ ДОМЕНОВ и НАЧАЛ ИХ ПРОВЕРЯТЬ И ВСЕ ОНИ ОКАЗАЛИСЬ ДОСТУПНЫ ТОЕСТЬ НА НИХ РАБОЧИЕ САЙТЫ В ИТОГЕ НЕ ОДНОГО ДРОПА Я ТАК И НЕ ДОБЫЛ!!! footashes - Скажите пожалуйста может я что то сделал не правильно???? и что значат эти файлы в папке 200ОК ??? Хочу по рыбалке Дропов найти и не получается!!!

Webfrilanser · 05.07.2018

footashes сказал(а):
Всё, что можно было неправильно сделать, было сделано на 99%. До футбола сделаю видео, перепишу помощь и разошлю. Насчет поисков дропов по рыбалке, попугаям и другим узким тематикам - ParserDomens работает по методике вероятностеАй - чем уже тематика, тем меньше шансов. Если у вас сайт по дрессировке жирафов - какая вероятность, что найдется ещё один такой брошенный сайт.

Это работает так - вы находите сайт по, например, здоровому образу жизни. Очень большая вероятность, что комментарии (со своей ссылкой) оставляют люди с такой же или близкой тематикой (как правило, так и есть). И очень большая вероятность, что многие эти сайты уже брошены. Парсер работает по методике - собирает ссылки и пишет в файл.

а что конкретно я сделал не правильно почему я не говорю про Узкую тематику я назвал тематика Рыбалка а это не узная тематика я не сказал что мне нужны статьи по теме Зимняя рыбалка на Окуня или Зимняя рыбалка на Щуку и так далее что относится к Зимней рыбалке! Просто нету конретного видео по работе ParserDomens чтобы можно было наглядно смотреть и настраивать всё так же а ещё было бы лучше если голосом комментировать думаю всем кто покупал парсер у вас было бы Очень полезное данное видео!

deonisii · 08.07.2018

Добрый день. Оплатил на Яндекс, за комплект WebArchiveMaster

deonisii · 08.07.2018

Что делать если archive.org заблочен провайдером? Пробовал так же покупные прокси (РФ), тоже самое ничего не работает.

Или дело в браузере.
В файрфоксе страница вообще не загружается.
В хроме очень хуёво.
В опере замечательно загружается.

Medvedoc · 09.07.2018

Доброе утро =) написал вам на почту по поводу шаблона под вебархив. А где я могу посмотреть информацию по остальным вашим шаблонам?

dimkinpark · 11.07.2018

Оплатил) Ждемс.

Webfrilanser · 11.07.2018

footashes сказал(а):
Отправляю. Сегодня ночью будет описание принципов работы по всей ветке Вебархива. От Мастера Вебархива до проверки текстов и откровений работы с биржами и сайтами. Ну и много интересного. С примерами парсинга и жизненных примеров, что и как работает. Не пропустите.

Хорошая новость Ждёмс!!! :-)

Webfrilanser · 12.07.2018

footashes сказал(а):
Слишком много информации, форум такие данные распределяет по частям, поэтому, во избежание потери данных, перепишу в pdf.
П.С.
Небольшой срыв по срокам, приехали друзья - лето, жара, шашлыки, пляж - постараюсь сделать сегодня к вечеру в формате форума. Всё уже было подготовлено - видео, как я пришел к Вебархиву - и вот так.

Хорошо Ждёмс!

deonisii · 12.07.2018

Подскажите по Дзен. Проект работал нормально, после перезагрузки пишет "Ошибка свитча".

Vita1980 · 16.07.2018

Здравствуйте. в краулере, веб архив не отдает данные, в чем может быть причина?

Skandar · 16.07.2018

Vita1980 сказал(а):
Здравствуйте. в краулере, веб архив не отдает данные, в чем может быть причина?

Столкнулся с такой же проблемой.

Vita1980 · 17.07.2018

в том то и дело что вручную все ок.
Да, все заработало).

player_kid · 26.07.2018

Добрый день, оплатил на киви

Vadim321 · 26.07.2018

@footashes
Приветствую. Сегодня купил твой парсер по этой ссылке: https://primearea.biz/product/134651/

Что-то я немного не понял, как правильно прописать ссылку (т.е. как должна выглядеть ссылка) в Create full-text feed from feed or webpage URL - Enter URL

Вид самой ссылки какой-должен быть?

Если можно пример

sergey_l · 28.07.2018

@footashes Здравствуй, меня наверное пропустили я не получил обновление.

WebArchiveMaster - парсер Вебархива2

Новичок

Client

Новичок

Client

Новичок

Client

Client

Client

Client

Client

Вложения

Новичок

Client

Новичок

Client

Client

Client

Client

Новичок

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Кто просматривает тему: (Всего: 4, Пользователи: 0, Гости: 4)