WebArchiveMaster - парсер Вебархива2

Bollador · 18.08.2021

footashes написал(а):
Все, кто покупал в магазине - пришлите свою почту на footashes@gmail.com для внесения в базу рассылок. Завтра всем разошлю обновленные шаблоны для регистраций почтовых ящиков и заработка, а также новые фишки. Кто ещё не купил Вебархивмастер - у вас есть один день по сниженной цене и возможность получить шаблоны для регистраций. Вот пример продаж сегодня:

Посмотреть вложение 81435

Я давно у тебя покупал за 500 рублей. Что нового в шаблонах? Извини, я уже забыл.

miir1981 · 20.08.2021

footashes написал(а):
Дополнительная метода, которую все обходят стороной - https://zennolab.com/discussion/threads/analiz-kommentariev-dlja-postinga-v-jandeks-dzen.89980/. Не секрет, что Яндекс сделал упор на нейронку - это один из экспериментальных способов её обойти. Упор на парсинг комментариев, заодно собирает емейлы с каналов и ссылки на соцсети. Но основной упор на комментарии. Принцип работы показан в видео. Шаблон открыт, можете вносить те изменения, которые вам нужны.

Не заработало только у меня? Ошибка ] Поток №1 : Поток завершился с сообщением "Не удалось дождаться элемента >CSS> page-switch >SHADOW> >CSS> main-index >SHADOW> >CSS> index-locations >SHADOW> >CSS

miir1981 · 20.08.2021

Может надо премиум покупать в расширении???

tyssin · 29.08.2021

miir1981 написал(а):
Не заработало только у меня? Ошибка ] Поток №1 : Поток завершился с сообщением "Не удалось дождаться элемента >CSS> page-switch >SHADOW> >CSS> main-index >SHADOW> >CSS> index-locations >SHADOW> >CSS

тоже самое не работает

Lewiy · 29.08.2021

tyssin написал(а):
тоже самое не работает

из 100 3-4 зарегало.

maksimal2 · 07.09.2021

footashes написал(а):
Все, кто покупал в магазине - пришлите свою почту на footashes@gmail.com для внесения в базу рассылок. Завтра всем разошлю обновленные шаблоны для регистраций почтовых ящиков и заработка, а также новые фишки. Кто ещё не купил Вебархивмастер - у вас есть один день по сниженной цене и возможность получить шаблоны для регистраций. Вот пример продаж сегодня:

Посмотреть вложение 81435

Как получить обновления, пишу на почту , ответа нет

Olegator · 16.09.2021

Андрей, привет...насчет проверки через текст.ру. Поскольку етхт сейчас сдох, а я им пользовался больше 10 лет, то решил прогнать текст.ру версия 1.6 и что-то совсем не то,что в ролике в мануале за 2018 год. Летом текст.ру перешел с тупо айпи на кол-знаков, вот стал юзать и за три часа 4 статьи.....господа, это только мне свисток не достался или акула глухая попалась?

Evgenij · 28.11.2021

А как тогда тексты проверять? Если через текст.ру, невозможно.

dima8121 · 28.11.2021

У меня все работает

footashes · 10.12.2021

Обновление WebArchiveMastersV4.13 в связи с изменением верстки Вебархива:

- пофиксена небольшая ошибка, когда было совпадение регулярного выражения с данными, предоставленными Вебархивом,из-за чего парсер считал, что спарсил все ссылки и уходил на фильтрацию данных (это не так - в определенных обстоятельствах данные, которые проверялись, могли совпасть, если в ссылке присутствовало слово сравнения - например,Nexte, и в ссылке было, к примеру,http:\\kulbyar\visinexterin\appetit.htm), программа считала, что данные закончились и уходила на второй этап - фильтрация ссылок (отсеивание таких данных, как: *.jpg, replitcom и т.д). Это проявилось только несколько дней назад, так-как Вебархив изменил и усложнил парсинг.

Также хочу показать, на что способен Зеннопостер - сайт https://pibarum.ru/. Сделан полностью автоматически, обратите внимание на категорию "Тесты на знания", на сервере Зеннопостер парсит, обрабатывает и постит полностью на автомате, данные рассчитаны на 3 месяца, примерно 10 000 тестов. Попробуйте попроходить их, возможны ошибки, т.к. полный автомат, но всё это легко поправить, внести изменения в программу.

По всем вопросам, особенно тем, кто покупал WebArchiveMasters через магазин, пишите на footashes@gmail.com

Также прикрепляю частично проверенный домен (для проверки работоспособности) без чистки для проверки работоспособности:

Обновленный скрипт разошлю сегодня, после дополнительной проверки.

Olegator · 10.12.2021

Андрей, спасибо, что быстро откликнулся и исправил этот баг, а то таких доменов выходило примерно 200 на 1000 и это в день. Ждем обновление.

footashes · 10.12.2021

Постоянно спрашивают - как начать работать, где взять домены для парсинга

Есть проверка по ключевым словам, о которой мало кто знает, потому-что не читает инструкцию. Допустим, вы хотите найти женские сайты - вы можете ввести ключевые слова в выбранных вами доменах. Программа по умолчанию (можно изменить) будет брать 10 рандомных ссылок в выбранных вами доменах, искать совпадения и найденные совпадения записывать в файл "Search.txt" (все это описано в файле WebArchiveMasters.pdf, который никто не читает).
Постоянно спрашивают про Спайдер - парсинг доменов. Принцип работы такой - берется домен определенной тематики, например, гадания. Во время парсинга текста одновременно работает BlackWindowSspider - он давно встроен в WebArchiveMasters и работает одновременно с парсингом текста - это все описано в WebArchiveMasters.pdf. Принцип работы - работа на вероятностях, что комментировать сайт о строительстве будут люди, связанные со строительством, которые оставляют свои комментарии со ссылкой на свой сайт. Сайт кулинаров будут комментировать люди, близкие к кулинарии и т.д. На этом основан парсинг дружественных доменов - на вероятностях, отличных от нуля.

Данные отправил, по вопросам пишите на footashes@gmail.com

footashes · 19.12.2021

Беглый показ принципа работы ВебархивМастер, чистка текста и проверка на уникальность. Так-как zennoproxy.com на профилактике, через Текст.ру я не стал проверять, так-как ему требуются IP6, вместо этого показал через Адвего, принцип одинаков. Это не руководство - для каждого шаблона есть видео и текстовая инструкция. Это показ принципа работы - сначала парсим, затем чистим, затем проверяем на уникальность.

Evgenij · 30.12.2021

В инструкции написано: Как работает программа - берет выборочно домен и проверяет его на ответ 200 (сайт работает). Если сайт работает, домен удаляется и берется следующий. После получения нужного домена, программа подключается к Вебархиву и запрашивает количество файлов за все годы (не по снепшотам). Если файлов нет, возвращается к выбору другого домена. Если файлы есть, программа забирает ссылки и включает фильтрацию (css, png, jpg, reply и т.д.).

А я смогу восстановить действующий, мой сайт, из веб архива ? И много он мусора цепляет ? В веб архиве, копия wordpress , только метки, тэги и коментарии.

footashes · 30.12.2021

Evgenij написал(а):
В инструкции написано: Как работает программа - берет выборочно домен и проверяет его на ответ 200 (сайт работает). Если сайт работает, домен удаляется и берется следующий. После получения нужного домена, программа подключается к Вебархиву и запрашивает количество файлов за все годы (не по снепшотам). Если файлов нет, возвращается к выбору другого домена. Если файлы есть, программа забирает ссылки и включает фильтрацию (css, png, jpg, reply и т.д.).

А я смогу восстановить действующий, мой сайт, из веб архива ? И много он мусора цепляет ? В веб архиве, копия wordpress , только метки, тэги и коментарии.

Там есть скрипт, выкачивающий копию сайта. Но смысл просто забирать текст, проверять его и использовать для себя или на продажу. В любом случае, писать нужно сюда: footashes@gmail.com. Также, кто покупал через магазин, отпишите для внесения вашего емейл в базу рассылок для обновлений.

Evgenij · 08.01.2022

Помогите, не парсит домен.
Текст в логах:
Начинаем проверку домена
Переходим на забор данных для парсинга
Домены в файле закончились
Проект краулер.xmlz уцспешно выполнин.

В чём может быть проблема?

footashes · 08.01.2022

Evgenij написал(а):
Помогите, не парсит домен.
Текст в логах:
Начинаем проверку домена
Переходим на забор данных для парсинга
Домены в файле закончились
Проект краулер.xmlz уцспешно выполнин.

В чём может быть проблема?

Версия WebArchiveMastersV4.13? ZennoPoster RU 5.17.2.0?
Только что проверил, всё работает.

Evgenij · 08.01.2022

Я вам ответ отправил на почту. Версия WebArchiveMastersV4.8 ZennoPoster Pro 7.6.0.0

footashes · 08.01.2022

WebArchiveMastersV4.13 рассчитан на массовый парсинг текста, для последующей продажи - лично я использую для размещения на Ротапост, Гогетлинкс, Миралинкс. Протокол HTTPS игнорируются, так-как практика показала, что любой анализатор уникальности покажет 0%, потому что эти данные ещё не вылетели из индекса, так-как прошло слишком мало времени. Поэтому все ссылки с этим протоколом игнорируются. В парсере несколько защит, чтобы случайно не поймать данные на https. Это сделано изначально, исходя из опыта, толку от этих данных нет.

rewrite008 · 16.01.2022

В проверке адвего вылезло такое сообщение при прогреве профиля.
Выполнение действия HtmlElement Не найден HTML элемент, по условиям поиска

Вопрос решен))

footashes · 17.01.2022

rewrite008 написал(а):
В проверке адвего вылезло такое сообщение при прогреве профиля.
Выполнение действия HtmlElement Не найден HTML элемент, по условиям поиска

Вопрос решен))

Новая версия Advego.v7. Поправлено создание профилей. Использовалась версия ZennoPoster RU 5.17.2.0. Всем разослал, если что, пишите на footashes@gmail.com

Evgenij · 19.01.2022

Перехватил домен. Месяц прошёл, как закончилась регистрация. Восстановил статьи из вебархива. Все статьи уникальные. Может ли предыдущий владелец домена, предъявить претензию, о нарушении авторских прав ?

Astraport · 19.01.2022

Evgenij написал(а):
Может ли предыдущий владелец домена, предъявить претензию, о нарушении авторских прав ?

Легко.

footashes · 19.01.2022

Evgenij написал(а):
Перехватил домен. Месяц прошёл, как закончилась регистрация. Восстановил статьи из вебархива. Все статьи уникальные. Может ли предыдущий владелец домена, предъявить претензию, о нарушении авторских прав ?

Я делал и не заморачивался, ничего не было. Но лучше забрать просто текст.

Olegator · 19.01.2022

Evgenij написал(а):
Перехватил домен. Месяц прошёл, как закончилась регистрация. Восстановил статьи из вебархива. Все статьи уникальные. Может ли предыдущий владелец домена, предъявить претензию, о нарушении авторских прав ?

Нет, для этого каждую статью он должен был заверить нотариально, а это накладно и никто не делает и с учетом, что фичи Оригинальные тексты уже нет.

Olegator · 19.01.2022

Другой вопрос, что месяц, домен свежий и тексты 100% с кэшем, хоть и уникальны, ПСы еще помнят.

footashes · 27.01.2022

Очередная распродажа на всё - 2 дня за 350 рублей, в связи непонятных действий с Украиной - WebArchiveMaster - парсер Вебархива + Антиплагиат + Мануал + Парсинг емейлов с Яндекс.Дзен + Парсинг субтитров с роликов Ютуб+ Нестандартная рассылка через сервис рассылок+ Каталог Дзен-каналов (шаблон и уже спаршенные емейлы (около 9000 почт с дзен-каналов). Восстановление всего сайта из Вебархива. Полностью готовый сайт, остается только залить на сервер. Все купившие WebArchiveMaster получат его бесплатно.

Киви: 9619995137
Яндекс-Деньги: 410011187505134

В примечании введите свой емейл, он будет внесен в базу рассылок.

serhio12345 · 11.02.2022

footashes написал(а):
Очередная распродажа на всё - 2 дня за 350 рублей, в связи непонятных действий с Украиной - WebArchiveMaster - парсер Вебархива + Антиплагиат + Мануал + Парсинг емейлов с Яндекс.Дзен + Парсинг субтитров с роликов Ютуб+ Нестандартная рассылка через сервис рассылок+ Каталог Дзен-каналов (шаблон и уже спаршенные емейлы (около 9000 почт с дзен-каналов). Восстановление всего сайта из Вебархива. Полностью готовый сайт, остается только залить на сервер. Все купившие WebArchiveMaster получат его бесплатно.

Киви: 9619995137
Яндекс-Деньги: 410011187505134

В примечании введите свой емейл, он будет внесен в базу рассылок.

Здравствуйте! Только зарегистрировался, заинтересовал данный софт... Как можно с вами связаться? а то в не пойму, в лс вроде нет функции чтоб вам написать...

footashes · 11.02.2022

serhio12345 написал(а):
Здравствуйте! Только зарегистрировался, заинтересовал данный софт... Как можно с вами связаться? а то в не пойму, в лс вроде нет функции чтоб вам написать...

Цена - 500 рублей
Почта - footashes@gmail.com

Киви: 9619995137
Яндекс-Деньги: 410011187505134

В примечании введите свой емейл, он будет внесен в базу рассылок.

Ruhas · 12.02.2022

footashes написал(а):
Обновление WebArchiveMastersV4.13 в связи с изменением верстки Вебархива:

- пофиксена небольшая ошибка, когда было совпадение регулярного выражения с данными, предоставленными Вебархивом,из-за чего парсер считал, что спарсил все ссылки и уходил на фильтрацию данных (это не так - в определенных обстоятельствах данные, которые проверялись, могли совпасть, если в ссылке присутствовало слово сравнения - например,Nexte, и в ссылке было, к примеру,http:\\kulbyar\visinexterin\appetit.htm), программа считала, что данные закончились и уходила на второй этап - фильтрация ссылок (отсеивание таких данных, как: *.jpg, replitcom и т.д). Это проявилось только несколько дней назад, так-как Вебархив изменил и усложнил парсинг.

Также хочу показать, на что способен Зеннопостер - сайт https://pibarum.ru/. Сделан полностью автоматически, обратите внимание на категорию "Тесты на знания", на сервере Зеннопостер парсит, обрабатывает и постит полностью на автомате, данные рассчитаны на 3 месяца, примерно 10 000 тестов. Попробуйте попроходить их, возможны ошибки, т.к. полный автомат, но всё это легко поправить, внести изменения в программу.

По всем вопросам, особенно тем, кто покупал WebArchiveMasters через магазин, пишите на footashes@gmail.com

Также прикрепляю частично проверенный домен (для проверки работоспособности) без чистки для проверки работоспособности:

Обновленный скрипт разошлю сегодня, после дополнительной проверки.

Друг, сделай шаблон что бы мог вытягивать сайты с веб-архива.

WebArchiveMaster - парсер Вебархива2

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Вложения

Client

Client

Вложения

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Новичок

Client

Вложения

Client

Кто просматривает тему: (Всего: 12, Пользователи: 0, Гости: 12)