WebArchiveMaster - парсер Вебархива2

manka163

Client
Регистрация
28.12.2016
Сообщения
10
Благодарностей
1
Баллы
3
Здравствуйте. У меня перестал работать шаблон text ru. Точнее с шаблоном все в порядке, а вот где проблема не пойму. Подозреваю, что на самом текст ру что-то поменялось. Кто-то сталкивался с проблемами или это только у меня?
 

lexbzk

Client
Регистрация
07.09.2019
Сообщения
2
Благодарностей
1
Баллы
3
Здравствуйте. У меня перестал работать шаблон text ru. Точнее с шаблоном все в порядке, а вот где проблема не пойму. Подозреваю, что на самом текст ру что-то поменялось. Кто-то сталкивался с проблемами или это только у меня?
А какую ошибку пишет?
 

manka163

Client
Регистрация
28.12.2016
Сообщения
10
Благодарностей
1
Баллы
3
Никакой ошибки нет. Просто перебирает прокси из списка, говорит, что не рабочие. Пробовала другие прокси. Результат тот же. Зенка на сервере работает. Попробовала запустить на личном ноутбуке с теми прокси, которые на сервере не принимались в текст ру. Итог - с первой прокси были сделаны 10 проверок, а дальше всё, начался перебор прокси из списка. Вот я думаю, может на текст ру придумали что-то против массовых бесплатных проверок.
 

lexbzk

Client
Регистрация
07.09.2019
Сообщения
2
Благодарностей
1
Баллы
3
Никакой ошибки нет. Просто перебирает прокси из списка, говорит, что не рабочие. Пробовала другие прокси. Результат тот же. Зенка на сервере работает. Попробовала запустить на личном ноутбуке с теми прокси, которые на сервере не принимались в текст ру. Итог - с первой прокси были сделаны 10 проверок, а дальше всё, начался перебор прокси из списка. Вот я думаю, может на текст ру придумали что-то против массовых бесплатных проверок.
Я думаю просто все прокси уже использованные. Попробуй проверить Content-Watch, я им проверяю норм.
 
  • Спасибо
Реакции: manka163

manka163

Client
Регистрация
28.12.2016
Сообщения
10
Благодарностей
1
Баллы
3
Да, пожалуй, попробую
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 051
Благодарностей
440
Баллы
83
Здравствуйте. У меня перестал работать шаблон text ru. Точнее с шаблоном все в порядке, а вот где проблема не пойму. Подозреваю, что на самом текст ру что-то поменялось. Кто-то сталкивался с проблемами или это только у меня?
У вас в рассылке есть методика проверки для прокси, смотрите внимательнее.

Пример парсинга текста на сегодня: скачать. Просто парсинг, без проверок на уникальность и чистки.

Можно купить здесь - catcut.net/y2IB. Темы приходят и уходят, а Вебархив вечен. Берите, пригодится не сейчас, так потом. тем более, шаблон открыт, можете сами добавлять что нужно лично вам. Цена, по-сути, 5-6 пачек сигарет, дешевле только даром.
 

Вложения

Последнее редактирование:

footashes

Client
Регистрация
20.02.2015
Сообщения
1 051
Благодарностей
440
Баллы
83
Через несколько часов презентую новый шаблон "Франкенштейн" для прверки емейл на существование и работоспособность для рассылок.

А пока можете купить парсер Вебархива - туда входит: парсер текстов, парсер готовых сайтов, проверка на уникальность через Текст.ру и КонтентВатч, шаблон продажи текстов через ТекстСейл, правильные копеечные прокси, принцип работы с Яндекс.Дзен - catcut.net/y2IB.
 

goldenbux

Client
Регистрация
06.09.2018
Сообщения
84
Благодарностей
45
Баллы
18

footashes

Client
Регистрация
20.02.2015
Сообщения
1 051
Благодарностей
440
Баллы
83

goldenbux

Client
Регистрация
06.09.2018
Сообщения
84
Благодарностей
45
Баллы
18

Stailzore

Новичок
Регистрация
27.09.2019
Сообщения
3
Благодарностей
1
Баллы
3
А на демке зенки шаблон можно опробовать?
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 051
Благодарностей
440
Баллы
83

wolfz

Client
Регистрация
30.04.2016
Сообщения
70
Благодарностей
2
Баллы
8

Galvit

Client
Регистрация
28.03.2019
Сообщения
17
Благодарностей
5
Баллы
3
Чтото текст ру сегодня нехочет работать. Свежие чистые прокси, пробовал V4 и V6, после запуска сразу когда смотриш инстансы пишет
Sorry, you have been blocked
You are unable to access text.ru
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 051
Благодарностей
440
Баллы
83
У меня на v6 работает нормально. Единственно, что очередь на проверку последние несколько часов очень большая, я пока остановил проверку.

Возможно, что-то тестируют или все начали проверять одновременно.

Лучшн подождать некоторое время и попробовать снова.
 

Galvit

Client
Регистрация
28.03.2019
Сообщения
17
Благодарностей
5
Баллы
3
Все также не работает
Чтото текст ру сегодня нехочет работать. Свежие чистые прокси, пробовал V4 и V6, после запуска сразу когда смотриш инстансы пишет
Sorry, you have been blocked
You are unable to access text.ru
3 дня подряд результат не меняется. Пробовал как покупные новые прокси V4 , V6 так и через проксичикер публичне. У вас как? все работает?
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 051
Благодарностей
440
Баллы
83
Все также не работает


3 дня подряд результат не меняется. Пробовал как покупные новые прокси V4 , V6 так и через проксичикер публичне. У вас как? все работает?
Да, все отлично
работает. Проблема где-то у вас. Попробуйте другой компьютер. Проверьте в браузере, открывает вообще Текст.ру. Попробуйте зайти в обычном браузере через прокси. Посмотрите сайт с прокси в высланом архиве. Надеюсь, не Украина.
 
  • Спасибо
Реакции: Galvit

Galvit

Client
Регистрация
28.03.2019
Сообщения
17
Благодарностей
5
Баллы
3
Украина. :( а что с этим могут быть сейчас проблемы я ж с русских прокси захожу?
Текст.ру открывается без проблем с компа что с яндекс броузера что с хрома.
На другом компе проверить не могу (зенка привязана к этому).
Взял чистый шаблон из присланного архива. Записал в папку с другим названием. Добавил новый шаблон в задания в зенке. Подключил проксичикер установил правило текст.ру. Заработало. Залил свои прокси - работает. Запустил старую версию с теми же проксями - бан. Что-то видать слетело у меня в шаблоне. Ура товарищи.
footashes - спасибо
 

letta

Новичок
Регистрация
16.10.2019
Сообщения
23
Благодарностей
3
Баллы
3
Здравствуйте. Я оплатила 500 руб. Как получить комплект? Спасибо
 

letta

Новичок
Регистрация
16.10.2019
Сообщения
23
Благодарностей
3
Баллы
3
Посмотреть вложение 26391

WebArchiveMaster - программа парсинга контента из ВебАрхива. Программа полностью автоматизирована и позволяет разгрузить своё время на 90%. Программа работает в связке с PHP скриптом, который можно поставить на любой хостинг или использовать Open Server - https://ospanel.io (рекомендуется).

Принцип работы очень прост - нужно только вставить домены в текстовый файл и запустить программу - все остальное она сделает сама. Никаких настроек нет, так-как все настроено на максимальную производительность.

Пример спарсенных текстов - скачать пример
Скачать мануал - WebArchiveMaster.pdf
Цена - 500 рублей. Шаблон полностью открытый и без привязок.

WebArchiveMaster - парсер Вебархива + Black Widow Spider + Антиплагиат + Мануал + Content Watch за 500 рублей. Восстановление всего сайта из Вебархива. Полностью готовый сайт, остается только залить на сервер. Все купившие WebArchiveMaster получат его бесплатно.

Вебмани: R282711380496
Яндекс-Деньги: 410011187505134
В примечании введите свой емейл.

Что идет с WebArchiveMaster :

Доработал проверку текста через text.ru, используя прокси. Примерный алгоритм:
Программа всё делает автоматически, вмешательство не требуется.

  1. Парсинг русских прокси.
  2. Проверка этих прокси на работоспособность (чекинг).
  3. Берем прокси и переходим на проверку текста (берем текст из папки "База статей").
  4. После проверки переносим файл из папки "База статей" в папки "Уникальные" или "Копипаст" (в зависимости от проверки).
  5. Перед каждым файлом пишется процент уникальности - например, Уникальность 0_13% - ваш текст.txt или Уникальность 83_04% - ваш текст.txt
Скорость проверки текста зависит от прокси и загруженности сервиса. В моем случае это составляет примерно 50 текстов в час.
Для кого это? Это пригодится копирайтерам, так-как текст.ру самый вменяемый проверяльщик, по моему мнению - я ориентируюсь в своей работе только на него. Новичкам, которые хотят узнать, как зайти на сайт с помощью прокси и где их взять. Также это пригодится тем, кто хочет использовать прокси в своей работе - шаблон позволяет модернизировать логику и сделать на этой базе что угодно, что требует использования прокси - спамер Мой Мир, регистрация почтовых ящиков и т.д.

Также шаблон пригодится как дополнение к парсеру вебархива, так-как для проверки уникальности не требуется капча, а многие стопорятся именно на проверке уникальности.

Проверка текста через Content-Watch, используя прокси. Примерный алгоритм:
Программа всё делает автоматически, вмешательство не требуется.
  1. Парсинг русских прокси.
  2. Проверка этих прокси на работоспособность (чекинг).
  3. Берем прокси и переходим на проверку текста (берем текст из папки "База статей").
  4. После проверки переносим файл из папки "База статей" в папки "Уникальные" или "Копипаст" (в зависимости от проверки).
  5. Перед каждым файлом пишется процент уникальности - например, Уникальность 0_13% - ваш текст.txt или Уникальность 83_04% - ваш текст.txt
  6. Добавлена возможность использования своих прокси. Для этого в файл My_proxys вставляете свои прокси, шаблон забирает их и работает с этими прокси, а файл очищает. Если прокси не рабочий, он удаляется и берется другой. Когда все прокси будут отработаны, файл проверяется, и если он пустой, запускается автоматический парсинг и чекинг прокси с hidemy. Как правило, собственные прокси работают на несколько порядков быстрее. В шаблон Textru тоже добавлена возможность использования своих прокси.
Для справки: Зеннопостер использует прокси только HTTP формата.

Скорость проверки текста зависит от прокси и загруженности сервиса. В моем случае это составляет примерно 50 текстов в час.
Для кого это? Это пригодится копирайтерам, так-как текст.ру самый вменяемый проверяльщик, по моему мнению - я ориентируюсь в своей работе только на него. Новичкам, которые хотят узнать, как зайти на сайт с помощью прокси и где их взять. Также это пригодится тем, кто хочет использовать прокси в своей работе - шаблон позволяет модернизировать логику и сделать на этой базе что угодно, что требует использования прокси - спамер Мой Мир, регистрация почтовых ящиков и т.д.

Также шаблон пригодится как дополнение к парсеру вебархива, так-как для проверки уникальности не требуется капча, а многие стопорятся именно на проверке уникальности.

Новая версия Black Widow Spider для сбора тематических дропов. Нужен мощный компьютер, так-как программе нужно обработать десятки тысяч ссылок только одного сайта и правильные сайты для поиска дропов - сайты нужны старые, с комментариями не менее 3-4 лет, тогда вероятность нахождения очень сильно повышается.
  1. Программа ускорена в 3-4 раза
  2. Изменена логика и убрано лишнее
  3. Двухсуточное тестирование не выявило падений Зеннопостер
  4. Множественные запросы к base приводили к её разрастанию до 1,5 ГБ, что приводило к замедлению работы и последующему падению Зеннопостер с выеданием всех ресурсов компьютера\сервера. Теперь base использует максимум 150 Мб, с последующей итерацией инстанс автоматически перезагружается и очищает память компьютера.
  5. Каждую копию запускать в одном потоке.
В следующей версии планируется ввести блок для редактирования пользователем, работающим по признакам на пару с главным алгоритмом. Это позволит выцеплять нестандартные домены, которые не может взять никакая программа.

Программа будет постоянно дорабатываться.

Также продаю мануал нахождения "жирных" сайтов в Вебархиве. Мануал разработан мной, я давно работаю именно по нему и частично там задействован Black Widow Spider. Позволяет найти такой текст, который не поддается автоматизации. Работа ручная, но за пару часов можно найти 50-60 дропов, до которых ещё никто не доюрался, и зарядить их в WebArchiveMasters.

Это особенно актуально для тех, кто продает текста или имеет сайты определенной тематики - парсить список дропов, это тыкать пальцем в небо, тут как повезет; моя методика позволяет работать точечно. Буквально за десять минут я нашел больше сотни уникальных статей по теме "Строительство". Выхода на покупателей у меня нет и сайта о стройке тоже, поэтому, что с ними делать, без понятия, кто захочет купить курс, тому и вышлю (первому покупателю). Думаю, вы найдете, куда их пристроить.
Мануал по поиску тематических дропов
За основу был взят скрипт с Гитхаба, из его смысла был создан WebArchiveMasters, так-как восстановление сайтов потеряло актуальность 5-6 лет назад, нужно было забирать только тексты.

Помощь и уроки:
http://zennolab.com/discussion/attachments/full-text-rss-pdf.24190/
http://zennolab.com/discussion/attachments/proverka-unikalnosti-cherez-text-pdf.24188/
http://zennolab.com/discussion/attachments/webarchivemasters-pdf.24191/
http://zennolab.com/discussion/attachments/black-widow-spider-pdf.24189/

Видео по работе и установке:

https://youtu.be/e0VEUnCAsVU
https://youtu.be/z9fsoU4ZRwg

Шаблоны рассчитаны на массовую скачку текстов и проверку на плагиат с последующей продажей текстов или использованием для своих сайтов, желательно на сервере.

Предыдущая тема - http://zennolab.com/discussion/threads/webarchivemaster-parser-vebarxiva.40540/. Можете там почитать и пофлудить.
По всем вопросам прошу писать на [email protected] или в ЛС.
 

letta

Новичок
Регистрация
16.10.2019
Сообщения
23
Благодарностей
3
Баллы
3

footashes

Client
Регистрация
20.02.2015
Сообщения
1 051
Благодарностей
440
Баллы
83
Я оплатила 500 руб. Скриншот: http://prntscr.com/pjyjsn
Как получить комплект?
На почту ничего не пришло.
Вот почта: [email protected]
Отправил. Проще купить здесь - catcut.net/y2IB
Пример продаж текста на бирже за последние часы:
Screenshot_1.jpg

А это рефералы - спарсил емейлы с помощью шаблона Парсинг емейлов с Яндекс.Дзен, отправил несколько часов назад:
Screenshot_2.jpg
Отправлял такой текст:
Screenshot_3.jpg

Продаются текста из Вебархива довольно быстро, просто цену не ломить. Ещё раз - catcut.net/y2IB. Шаблоны открыты, есть видео, разобраться не сложно.
 

letta

Новичок
Регистрация
16.10.2019
Сообщения
23
Благодарностей
3
Баллы
3
Отправил. Проще купить здесь - catcut.net/y2IB
Пример продаж текста на бирже за последние часы:

А это рефералы - спарсил емейлы с помощью шаблона Парсинг емейлов с Яндекс.Дзен, отправил несколько часов назад:
Отправлял такой текст:

Продаются текста из Вебархива довольно быстро, просто цену не ломить. Ещё раз - catcut.net/y2IB. Шаблоны открыты, есть видео, разобраться не сложно.
Купила еще и на каткуте, теперь вижу что одно и то же дважды оплатила. Вы мне вернете хотя бы за один? Мой кошелек ЯД: 410019736480652 Буду признательна. Теперь вот пытаюсь разобраться. Подскажите с чего начинать? Предполагаю залить скрипт на свой домен Спасибо
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 051
Благодарностей
440
Баллы
83
Купила еще и на каткуте, теперь вижу что одно и то же дважды оплатила. Вы мне вернете хотя бы за один? Мой кошелек ЯД: 410019736480652 Буду признательна. Теперь вот пытаюсь разобраться. Подскажите с чего начинать? Предполагаю залить скрипт на свой домен Спасибо
С шершеляфам одни проблемы. Я вам отправил на почту выслать реквизиты. Начните с чтения "WebArchiveMasters.pdf" и просмотром видео на ютуб. Там ничего сложного нет.
 

Вложения

letta

Новичок
Регистрация
16.10.2019
Сообщения
23
Благодарностей
3
Баллы
3
В инструкции написано что в настройках надо прописать путь? в каких настройках? http://feed.cheerfulness.ru это прописывать? Устанавливаю на домен и не получается. Буду признательна за помощь
 

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 419
Благодарностей
5 454
Баллы
113
В инструкции написано что в настройках надо прописать путь? в каких настройках? http://feed.cheerfulness.ru это прописывать? Устанавливаю на домен и не получается. Буду признательна за помощь
Эта тема не для поддержки. Решайте вопросы в личке.
__
@footashes Связывайтесь с клиенткой и обучайте вне данной темы.
 

letta

Новичок
Регистрация
16.10.2019
Сообщения
23
Благодарностей
3
Баллы
3

letta

Новичок
Регистрация
16.10.2019
Сообщения
23
Благодарностей
3
Баллы
3
Опишу для всех немного подробней. Разберем полный цикл парсинга Вебархива, сначала на моём примере - WebArchiveMaster+AntiPlagiarism.NET+(другой софт), потом на примере Зеннопостер Стандарт+WebArchiveMaster+Textru. Полный цикл работы - от парсинга до проверки на уникальность.

Разберем пример - я подготовил видео, где всё показываю, и напишу здесь словами:

Я работаю по своей методике, которую высылал вам - набираю 10 - 20 брошенных доменов, запускаю WebArchiveMaster (всё это на сервере, мне так удобней - пока там все крутится, я занимаюсь своими делами). Итак - запускаем WebArchiveMaster на сервере, закидываем домены и забываем про него на 2-3 дня. После этого заходим на сервер, забираем все тексты, которые вытянул WebArchiveMaster и запускаем AntiPlagiarism.NET для проверки этих текстов на уникальность (WebArchiveMaster в это время работает, просто подкидываем ему новые домены, чтобы работа была без остановки), также запускаем (другой софт) (для капчи).

Полный цикл выглядит так - постоянно работает WebArchiveMaster, постоянно работает проверка на уникальность - выйти на полный цикл занимает примерно 3-4 дня, после чего у нас куча свободного времени и основная задача состоит в том, чтобы подкидывать домены в WebArchiveMaster и забирать уникальный текст. После этого у нас одна работа - размещать текста на своих сайтах или продавать пачкой.

Теперь разберем связку Зеннопостер Стандарт+WebArchiveMaster+Textru.

Всё тоже самое - запускаем Зеннопостер Стандарт на сервере, WebArchiveMaster запускаем, думаю, 2 потоков хватит (каждая папка - на один поток, чтобы не было пересечений!). На остальные 3 потока вешаем проверку на уникальность - Textru (он позволяет проверять без капчи). Он работает через прокси, поэтому можно использовать хоть сто потоков. Забываем на пару дней, потом вся работа - забираем напарсенное и закидываем на проверку. Подкидываем домены и забираем уник. Всё это должно работать без остановки.

После отработки тексты будут выглядеть примерно так - пронумерованы и расположены каждые в своем домене, в каждом файле свой тайтл, также там будет папка, куда будут перемещены категории:

Скачать и посмотреть

Чтобы было более понятно, посмотрите видео (оно короткое, минут 7). В своё время я нехило зарабатывал на продаже уника. Также эти текста можно использовать для рассылок:

Здравствуйте! Приобрела ваши продукты. Мне нужна ваша помощь. Как с вами можно связаться по скайпу? Написала вам на почту вашу. Буду вам очень признательна за ответ и возможность с вами поговорить в скайпе, потому как в ваших видео я ничего не могу понять. Жду. Спасибо
 

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 419
Благодарностей
5 454
Баллы
113
Если бы у меня была такая возможность здесь не найду как написать в личку
В личку новички писать не могут, только клиенты, коим является автор, но что-то он не спешит вам помогать.

Как с вами можно связаться по скайпу? Написала вам на почту вашу. Буду вам очень признательна за ответ и возможность с вами поговорить в скайпе, потому как в ваших видео я ничего не могу понять. Жду. Спасибо
Автор был на форуме и видел ваши сообщения. Скорей всего просто не хочет оказывать поддержку, так что придется вам наедятся и ждать.
Я очередной раз прошу вас не отписывать в теме подобные сообщения.
 
  • Спасибо
Реакции: letta

letta

Новичок
Регистрация
16.10.2019
Сообщения
23
Благодарностей
3
Баллы
3
В личку новички писать не могут, только клиенты, коим является автор, но что-то он не спешит вам помогать.


Автор был на форуме и видел ваши сообщения. Скорей всего просто не хочет оказывать поддержку, так что придется вам наедятся и ждать.
Я очередной раз прошу вас не отписывать в теме подобные сообщения.
Спасибо. Извините пожалуйста
 
  • Спасибо
Реакции: Mikhail B.

Кто просматривает тему: (Всего: 7, Пользователи: 0, Гости: 7)