WebArchiveMaster - парсер Вебархива2

Здравствуйте. У меня перестал работать шаблон text ru. Точнее с шаблоном все в порядке, а вот где проблема не пойму. Подозреваю, что на самом текст ру что-то поменялось. Кто-то сталкивался с проблемами или это только у меня?
 
Здравствуйте. У меня перестал работать шаблон text ru. Точнее с шаблоном все в порядке, а вот где проблема не пойму. Подозреваю, что на самом текст ру что-то поменялось. Кто-то сталкивался с проблемами или это только у меня?
А какую ошибку пишет?
 
Никакой ошибки нет. Просто перебирает прокси из списка, говорит, что не рабочие. Пробовала другие прокси. Результат тот же. Зенка на сервере работает. Попробовала запустить на личном ноутбуке с теми прокси, которые на сервере не принимались в текст ру. Итог - с первой прокси были сделаны 10 проверок, а дальше всё, начался перебор прокси из списка. Вот я думаю, может на текст ру придумали что-то против массовых бесплатных проверок.
 
Никакой ошибки нет. Просто перебирает прокси из списка, говорит, что не рабочие. Пробовала другие прокси. Результат тот же. Зенка на сервере работает. Попробовала запустить на личном ноутбуке с теми прокси, которые на сервере не принимались в текст ру. Итог - с первой прокси были сделаны 10 проверок, а дальше всё, начался перебор прокси из списка. Вот я думаю, может на текст ру придумали что-то против массовых бесплатных проверок.
Я думаю просто все прокси уже использованные. Попробуй проверить Content-Watch, я им проверяю норм.
 
  • Спасибо
Реакции: manka163
Да, пожалуй, попробую
 
Здравствуйте. У меня перестал работать шаблон text ru. Точнее с шаблоном все в порядке, а вот где проблема не пойму. Подозреваю, что на самом текст ру что-то поменялось. Кто-то сталкивался с проблемами или это только у меня?
У вас в рассылке есть методика проверки для прокси, смотрите внимательнее.

Пример парсинга текста на сегодня: скачать. Просто парсинг, без проверок на уникальность и чистки.

Можно купить здесь - catcut.net/y2IB. Темы приходят и уходят, а Вебархив вечен. Берите, пригодится не сейчас, так потом. тем более, шаблон открыт, можете сами добавлять что нужно лично вам. Цена, по-сути, 5-6 пачек сигарет, дешевле только даром.
 

Вложения

Последнее редактирование:
Через несколько часов презентую новый шаблон "Франкенштейн" для прверки емейл на существование и работоспособность для рассылок.

А пока можете купить парсер Вебархива - туда входит: парсер текстов, парсер готовых сайтов, проверка на уникальность через Текст.ру и КонтентВатч, шаблон продажи текстов через ТекстСейл, правильные копеечные прокси, принцип работы с Яндекс.Дзен - catcut.net/y2IB.
 
А на демке зенки шаблон можно опробовать?
 
Чтото текст ру сегодня нехочет работать. Свежие чистые прокси, пробовал V4 и V6, после запуска сразу когда смотриш инстансы пишет
Sorry, you have been blocked
You are unable to access text.ru
 
У меня на v6 работает нормально. Единственно, что очередь на проверку последние несколько часов очень большая, я пока остановил проверку.

Возможно, что-то тестируют или все начали проверять одновременно.

Лучшн подождать некоторое время и попробовать снова.
 
Все также не работает
Чтото текст ру сегодня нехочет работать. Свежие чистые прокси, пробовал V4 и V6, после запуска сразу когда смотриш инстансы пишет
Sorry, you have been blocked
You are unable to access text.ru

3 дня подряд результат не меняется. Пробовал как покупные новые прокси V4 , V6 так и через проксичикер публичне. У вас как? все работает?
 
Все также не работает


3 дня подряд результат не меняется. Пробовал как покупные новые прокси V4 , V6 так и через проксичикер публичне. У вас как? все работает?
Да, все отлично
работает. Проблема где-то у вас. Попробуйте другой компьютер. Проверьте в браузере, открывает вообще Текст.ру. Попробуйте зайти в обычном браузере через прокси. Посмотрите сайт с прокси в высланом архиве. Надеюсь, не Украина.
 
  • Спасибо
Реакции: Galvit
Украина. :( а что с этим могут быть сейчас проблемы я ж с русских прокси захожу?
Текст.ру открывается без проблем с компа что с яндекс броузера что с хрома.
На другом компе проверить не могу (зенка привязана к этому).
Взял чистый шаблон из присланного архива. Записал в папку с другим названием. Добавил новый шаблон в задания в зенке. Подключил проксичикер установил правило текст.ру. Заработало. Залил свои прокси - работает. Запустил старую версию с теми же проксями - бан. Что-то видать слетело у меня в шаблоне. Ура товарищи.
footashes - спасибо
 
Здравствуйте. Я оплатила 500 руб. Как получить комплект? Спасибо
 
Посмотреть вложение 26391

WebArchiveMaster - программа парсинга контента из ВебАрхива. Программа полностью автоматизирована и позволяет разгрузить своё время на 90%. Программа работает в связке с PHP скриптом, который можно поставить на любой хостинг или использовать Open Server - https://ospanel.io (рекомендуется).

Принцип работы очень прост - нужно только вставить домены в текстовый файл и запустить программу - все остальное она сделает сама. Никаких настроек нет, так-как все настроено на максимальную производительность.

Пример спарсенных текстов - скачать пример
Скачать мануал - WebArchiveMaster.pdf
Цена - 500 рублей. Шаблон полностью открытый и без привязок.

WebArchiveMaster - парсер Вебархива + Black Widow Spider + Антиплагиат + Мануал + Content Watch за 500 рублей. Восстановление всего сайта из Вебархива. Полностью готовый сайт, остается только залить на сервер. Все купившие WebArchiveMaster получат его бесплатно.

Вебмани: R282711380496
Яндекс-Деньги: 410011187505134
В примечании введите свой емейл.

Что идет с WebArchiveMaster :

Доработал проверку текста через text.ru, используя прокси. Примерный алгоритм:
Программа всё делает автоматически, вмешательство не требуется.

  1. Парсинг русских прокси.
  2. Проверка этих прокси на работоспособность (чекинг).
  3. Берем прокси и переходим на проверку текста (берем текст из папки "База статей").
  4. После проверки переносим файл из папки "База статей" в папки "Уникальные" или "Копипаст" (в зависимости от проверки).
  5. Перед каждым файлом пишется процент уникальности - например, Уникальность 0_13% - ваш текст.txt или Уникальность 83_04% - ваш текст.txt
Скорость проверки текста зависит от прокси и загруженности сервиса. В моем случае это составляет примерно 50 текстов в час.
Для кого это? Это пригодится копирайтерам, так-как текст.ру самый вменяемый проверяльщик, по моему мнению - я ориентируюсь в своей работе только на него. Новичкам, которые хотят узнать, как зайти на сайт с помощью прокси и где их взять. Также это пригодится тем, кто хочет использовать прокси в своей работе - шаблон позволяет модернизировать логику и сделать на этой базе что угодно, что требует использования прокси - спамер Мой Мир, регистрация почтовых ящиков и т.д.

Также шаблон пригодится как дополнение к парсеру вебархива, так-как для проверки уникальности не требуется капча, а многие стопорятся именно на проверке уникальности.

Проверка текста через Content-Watch, используя прокси. Примерный алгоритм:
Программа всё делает автоматически, вмешательство не требуется.
  1. Парсинг русских прокси.
  2. Проверка этих прокси на работоспособность (чекинг).
  3. Берем прокси и переходим на проверку текста (берем текст из папки "База статей").
  4. После проверки переносим файл из папки "База статей" в папки "Уникальные" или "Копипаст" (в зависимости от проверки).
  5. Перед каждым файлом пишется процент уникальности - например, Уникальность 0_13% - ваш текст.txt или Уникальность 83_04% - ваш текст.txt
  6. Добавлена возможность использования своих прокси. Для этого в файл My_proxys вставляете свои прокси, шаблон забирает их и работает с этими прокси, а файл очищает. Если прокси не рабочий, он удаляется и берется другой. Когда все прокси будут отработаны, файл проверяется, и если он пустой, запускается автоматический парсинг и чекинг прокси с hidemy. Как правило, собственные прокси работают на несколько порядков быстрее. В шаблон Textru тоже добавлена возможность использования своих прокси.
Для справки: Зеннопостер использует прокси только HTTP формата.

Скорость проверки текста зависит от прокси и загруженности сервиса. В моем случае это составляет примерно 50 текстов в час.
Для кого это? Это пригодится копирайтерам, так-как текст.ру самый вменяемый проверяльщик, по моему мнению - я ориентируюсь в своей работе только на него. Новичкам, которые хотят узнать, как зайти на сайт с помощью прокси и где их взять. Также это пригодится тем, кто хочет использовать прокси в своей работе - шаблон позволяет модернизировать логику и сделать на этой базе что угодно, что требует использования прокси - спамер Мой Мир, регистрация почтовых ящиков и т.д.

Также шаблон пригодится как дополнение к парсеру вебархива, так-как для проверки уникальности не требуется капча, а многие стопорятся именно на проверке уникальности.

Новая версия Black Widow Spider для сбора тематических дропов. Нужен мощный компьютер, так-как программе нужно обработать десятки тысяч ссылок только одного сайта и правильные сайты для поиска дропов - сайты нужны старые, с комментариями не менее 3-4 лет, тогда вероятность нахождения очень сильно повышается.
  1. Программа ускорена в 3-4 раза
  2. Изменена логика и убрано лишнее
  3. Двухсуточное тестирование не выявило падений Зеннопостер
  4. Множественные запросы к base приводили к её разрастанию до 1,5 ГБ, что приводило к замедлению работы и последующему падению Зеннопостер с выеданием всех ресурсов компьютера\сервера. Теперь base использует максимум 150 Мб, с последующей итерацией инстанс автоматически перезагружается и очищает память компьютера.
  5. Каждую копию запускать в одном потоке.
В следующей версии планируется ввести блок для редактирования пользователем, работающим по признакам на пару с главным алгоритмом. Это позволит выцеплять нестандартные домены, которые не может взять никакая программа.

Программа будет постоянно дорабатываться.

Также продаю мануал нахождения "жирных" сайтов в Вебархиве. Мануал разработан мной, я давно работаю именно по нему и частично там задействован Black Widow Spider. Позволяет найти такой текст, который не поддается автоматизации. Работа ручная, но за пару часов можно найти 50-60 дропов, до которых ещё никто не доюрался, и зарядить их в WebArchiveMasters.

Это особенно актуально для тех, кто продает текста или имеет сайты определенной тематики - парсить список дропов, это тыкать пальцем в небо, тут как повезет; моя методика позволяет работать точечно. Буквально за десять минут я нашел больше сотни уникальных статей по теме "Строительство". Выхода на покупателей у меня нет и сайта о стройке тоже, поэтому, что с ними делать, без понятия, кто захочет купить курс, тому и вышлю (первому покупателю). Думаю, вы найдете, куда их пристроить.
Мануал по поиску тематических дропов
За основу был взят скрипт с Гитхаба, из его смысла был создан WebArchiveMasters, так-как восстановление сайтов потеряло актуальность 5-6 лет назад, нужно было забирать только тексты.

Помощь и уроки:
http://zennolab.com/discussion/attachments/full-text-rss-pdf.24190/
http://zennolab.com/discussion/attachments/proverka-unikalnosti-cherez-text-pdf.24188/
http://zennolab.com/discussion/attachments/webarchivemasters-pdf.24191/
http://zennolab.com/discussion/attachments/black-widow-spider-pdf.24189/

Видео по работе и установке:

https://youtu.be/e0VEUnCAsVU
https://youtu.be/z9fsoU4ZRwg

Шаблоны рассчитаны на массовую скачку текстов и проверку на плагиат с последующей продажей текстов или использованием для своих сайтов, желательно на сервере.

Предыдущая тема - http://zennolab.com/discussion/threads/webarchivemaster-parser-vebarxiva.40540/. Можете там почитать и пофлудить.
По всем вопросам прошу писать на footashes@gmail.com или в ЛС.
 
Я оплатила 500 руб. Скриншот: http://prntscr.com/pjyjsn
Как получить комплект?
На почту ничего не пришло.
Вот почта: letta.stranichka@gmail.com
Отправил. Проще купить здесь - catcut.net/y2IB
Пример продаж текста на бирже за последние часы:
Screenshot_1.jpg

А это рефералы - спарсил емейлы с помощью шаблона Парсинг емейлов с Яндекс.Дзен, отправил несколько часов назад:
Screenshot_2.jpg
Отправлял такой текст:
Screenshot_3.jpg

Продаются текста из Вебархива довольно быстро, просто цену не ломить. Ещё раз - catcut.net/y2IB. Шаблоны открыты, есть видео, разобраться не сложно.
 
Отправил. Проще купить здесь - catcut.net/y2IB
Пример продаж текста на бирже за последние часы:

А это рефералы - спарсил емейлы с помощью шаблона Парсинг емейлов с Яндекс.Дзен, отправил несколько часов назад:
Отправлял такой текст:

Продаются текста из Вебархива довольно быстро, просто цену не ломить. Ещё раз - catcut.net/y2IB. Шаблоны открыты, есть видео, разобраться не сложно.
Купила еще и на каткуте, теперь вижу что одно и то же дважды оплатила. Вы мне вернете хотя бы за один? Мой кошелек ЯД: 410019736480652 Буду признательна. Теперь вот пытаюсь разобраться. Подскажите с чего начинать? Предполагаю залить скрипт на свой домен Спасибо
 
Купила еще и на каткуте, теперь вижу что одно и то же дважды оплатила. Вы мне вернете хотя бы за один? Мой кошелек ЯД: 410019736480652 Буду признательна. Теперь вот пытаюсь разобраться. Подскажите с чего начинать? Предполагаю залить скрипт на свой домен Спасибо
С шершеляфам одни проблемы. Я вам отправил на почту выслать реквизиты. Начните с чтения "WebArchiveMasters.pdf" и просмотром видео на ютуб. Там ничего сложного нет.
 

Вложения

В инструкции написано что в настройках надо прописать путь? в каких настройках? http://feed.cheerfulness.ru это прописывать? Устанавливаю на домен и не получается. Буду признательна за помощь
 
В инструкции написано что в настройках надо прописать путь? в каких настройках? http://feed.cheerfulness.ru это прописывать? Устанавливаю на домен и не получается. Буду признательна за помощь
Эта тема не для поддержки. Решайте вопросы в личке.
__
@footashes Связывайтесь с клиенткой и обучайте вне данной темы.
 
Эта тема не для поддержки. Решайте вопросы в личке.
__
@footashes Связывайтесь с клиенткой и обучайте вне данной темы.
Если бы у меня была такая возможность здесь не найду как написать в личку
 
Опишу для всех немного подробней. Разберем полный цикл парсинга Вебархива, сначала на моём примере - WebArchiveMaster+AntiPlagiarism.NET+(другой софт), потом на примере Зеннопостер Стандарт+WebArchiveMaster+Textru. Полный цикл работы - от парсинга до проверки на уникальность.

Разберем пример - я подготовил видео, где всё показываю, и напишу здесь словами:

Я работаю по своей методике, которую высылал вам - набираю 10 - 20 брошенных доменов, запускаю WebArchiveMaster (всё это на сервере, мне так удобней - пока там все крутится, я занимаюсь своими делами). Итак - запускаем WebArchiveMaster на сервере, закидываем домены и забываем про него на 2-3 дня. После этого заходим на сервер, забираем все тексты, которые вытянул WebArchiveMaster и запускаем AntiPlagiarism.NET для проверки этих текстов на уникальность (WebArchiveMaster в это время работает, просто подкидываем ему новые домены, чтобы работа была без остановки), также запускаем (другой софт) (для капчи).

Полный цикл выглядит так - постоянно работает WebArchiveMaster, постоянно работает проверка на уникальность - выйти на полный цикл занимает примерно 3-4 дня, после чего у нас куча свободного времени и основная задача состоит в том, чтобы подкидывать домены в WebArchiveMaster и забирать уникальный текст. После этого у нас одна работа - размещать текста на своих сайтах или продавать пачкой.

Теперь разберем связку Зеннопостер Стандарт+WebArchiveMaster+Textru.

Всё тоже самое - запускаем Зеннопостер Стандарт на сервере, WebArchiveMaster запускаем, думаю, 2 потоков хватит (каждая папка - на один поток, чтобы не было пересечений!). На остальные 3 потока вешаем проверку на уникальность - Textru (он позволяет проверять без капчи). Он работает через прокси, поэтому можно использовать хоть сто потоков. Забываем на пару дней, потом вся работа - забираем напарсенное и закидываем на проверку. Подкидываем домены и забираем уник. Всё это должно работать без остановки.

После отработки тексты будут выглядеть примерно так - пронумерованы и расположены каждые в своем домене, в каждом файле свой тайтл, также там будет папка, куда будут перемещены категории:

Скачать и посмотреть

Чтобы было более понятно, посмотрите видео (оно короткое, минут 7). В своё время я нехило зарабатывал на продаже уника. Также эти текста можно использовать для рассылок:

Здравствуйте! Приобрела ваши продукты. Мне нужна ваша помощь. Как с вами можно связаться по скайпу? Написала вам на почту вашу. Буду вам очень признательна за ответ и возможность с вами поговорить в скайпе, потому как в ваших видео я ничего не могу понять. Жду. Спасибо
 
Если бы у меня была такая возможность здесь не найду как написать в личку
В личку новички писать не могут, только клиенты, коим является автор, но что-то он не спешит вам помогать.

Как с вами можно связаться по скайпу? Написала вам на почту вашу. Буду вам очень признательна за ответ и возможность с вами поговорить в скайпе, потому как в ваших видео я ничего не могу понять. Жду. Спасибо
Автор был на форуме и видел ваши сообщения. Скорей всего просто не хочет оказывать поддержку, так что придется вам наедятся и ждать.
Я очередной раз прошу вас не отписывать в теме подобные сообщения.
 
  • Спасибо
Реакции: letta
В личку новички писать не могут, только клиенты, коим является автор, но что-то он не спешит вам помогать.


Автор был на форуме и видел ваши сообщения. Скорей всего просто не хочет оказывать поддержку, так что придется вам наедятся и ждать.
Я очередной раз прошу вас не отписывать в теме подобные сообщения.
Спасибо. Извините пожалуйста
 
  • Спасибо
Реакции: Mikhail B.

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)