WebArchiveMaster - парсер Вебархива2

Шаблон пришел, буду пробовать
 
Помогите кто нибудь настроить Textru.
С шаблоном разобрался, спарсил им 500-600 статей.
Скачал Textru v1.4, добавил в зенку, после нажатия на кнопку старта пишет то, что он подключен, но ничего не происходит. Прокси естественно чекнул и они появились в документе. При нажатии на настройки выбивает - проект не содержит входных настроек.

Кое как вроде бы разобрался и каким то чудом начались попытки использовать прокси и даже заходить в text.ru, но вот что происходит

37577-2cbc175d9dc3906e1af40e711f29ec76.jpg


И так по кругу, прокси собирает - пишет что они не рабочие, потом обнулят их и заново..
 

Вложения

  • 1.png
    1.png
    111 KB · Просмотры: 332
Всё заработало, прокси разогнались, нашелся по крайне мере один рабочий и пошло дело.
 
Поставил на ночь работать проверку текста.
По какой то причине в 2 часа ночи написало "Ваших прокси нет в файле" хотя их там и не было. После чего написало что переходит в прокси лист и все стало.. собрано 500+ прокси - все на их работало, так зачем понадобились какие то "Мои прокси" и почему оно просто выключается, а не ищет альтернативу? что можно сделать в такое ситуации? 6 часов получилось что программа просто висела и не выбила никаких ошибок.

37589-45e1270c39b71b9b1cfcbf6ac94d3c2f.jpg
 

Вложения

  • 2019-04-25 08_36_59-ZennoPoster Lite v5.17.1.0 by ZennoLab.com.png
    2019-04-25 08_36_59-ZennoPoster Lite v5.17.1.0 by ZennoLab.com.png
    35,4 KB · Просмотры: 593
@vsemmoney Эта тема не для поддержки, связывайтесь с продавцом и решайте вопросы в личке. (вы писать в личку не можете, по этому просите продавца самого написать)
 
WebArchiveMastersV4.6. Вебархив немного изменил данные, поэтому внесены правки и немного изменена логика, связанная с обработчиком.
  • Дополнена фильтрация
  • Дополнена чистка
Разошлю вечером, после тестирования.

Тестирование идет нормально. Заодно проверю проверку на уник.
Screenshot_1.jpg

P.S.
Отправил всем.

2.png


После парсинга текст нужно подготовить для проверки на уникальность. WebArchiveMastersV4.6 работает автоматически по заданным данным и может почистить на 70-80%. Для более тонкой чистки поможет шаблон "Clear texts".


Он помогает оценить текст визуально и массово внести изменения, если требуется. Цена исключительно формальная - 100 рублей. Кому нужно, вот реквизиты:

Яндекс-Деньги: 410011187505134
Киви - +7 961 999‑51‑37

Затем напишите на почту - footashes@gmail.com

Также на праздники шаблон WebArchiveMastersV4.6 с ценой 500 рублей.

Шаблон полностью открытый и без привязок + решение по скоростной проверки на уникальность.

Яндекс-Деньги: 410011187505134
Киви - +7 961 999‑51‑37

В примечании укажите свою почту.

Посмотрите видео - там показан принцип работы.
 
Последнее редактирование:
Здравствуйте. Все отлично парсится и проверяется на уникальность, спасибо ).

Сегодня заметила, что не все отработанные домены заносятся в черный список. Два домена таких уже увидела. На скрине для примера inter-cleaning.ru. Несколько дней назад он был обработан. У меня стояла еще версия 4.4.
Сегодня поставила версию 4.6 и загрузила список спаршенных из комментов доменов. Смотрю, опять обрабатывает этот домен, проверяю - нет его в черном списке. Удалила все из чистой карты, краулер закончил его обрабатывать и опять не записал в черный список.

Вопрос по скоростной проверке на уникальность - стоит 200 р?

daef9d39b0f88f41412b32752e25f355.png
 
Здравствуйте. Все отлично парсится и проверяется на уникальность, спасибо ).

Сегодня заметила, что не все отработанные домены заносятся в черный список. Два домена таких уже увидела. На скрине для примера inter-cleaning.ru. Несколько дней назад он был обработан. У меня стояла еще версия 4.4.
Сегодня поставила версию 4.6 и загрузила список спаршенных из комментов доменов. Смотрю, опять обрабатывает этот домен, проверяю - нет его в черном списке. Удалила все из чистой карты, краулер закончил его обрабатывать и опять не записал в черный список.


daef9d39b0f88f41412b32752e25f355.png
Домены, в которых мало текста или его нет, не заносятся в черный список (должно быть не менее 10 текстов). Могут быть причины - сбой интернета, сам вебархив не отдает в это время, но может отдать в другое и т.д. В черный список те заносятся домены, которые прошли все проверки и шаблон убедился, что текст действительно скачан.
Вопрос по скоростной проверке на уникальность - стоит 200 р? Да.
 
  • Спасибо
Реакции: manka163
Привет, отпиши на почту, я в суботу писал.
 
Новая версия TextruV1.5 - пакетная проверка текста. Для бесперебойной работы папка с проверенным текстом перемещается в директорию "ReadyText" и берется следующая на проверку.

Screenshot.png
 
А рассылка TextruV1.5 уже была?
 
да, вчера тоже не понял, у меня только V1.4
 
  • Спасибо
Реакции: Yolbert_Shantry
  • Спасибо
Реакции: Webfrilanser
А проверка уникальности только на https://text.ru? этот сайт вроде как не всегда корректно показывает уникальность текста
 
А проверка уникальности только на https://text.ru? этот сайт вроде как не всегда корректно показывает уникальность текста
Полностью поддерживаю! Не выдерживают у них серваки нагрузок..
content-watch давно работает 50 на 50.
text.ru - В последнее время тоже сильно глючит, очень часто при повторной проверке оказывается что там не 100% уникальности, а 0)) Самое фиговое что даже если изначально в пики нагрузок проверять повторно то так же может показывать норм уникальность, а потом когда проверяешь через сутки-две, покажет 0%) После того как начали банить каналы в яндекс дзен просек фишку что оказывается уникальный контент вовсе может быть и не совсем уникальным)) И % такого брака в текстру с каждым днем все растет и растет...
 
Написала вам на почту, ответьте пожалуйста!!!
 
Поддерживаю вы куда пропали??? я вам написал ещё дней 5 назад не ответа не привета !!! Жду от вас ответа на почте!!!
Еще раз напишите, может, просмотрел. Куча спама валится, приходится зачищать.
 
Полностью поддерживаю! Не выдерживают у них серваки нагрузок..
content-watch давно работает 50 на 50.
text.ru - В последнее время тоже сильно глючит, очень часто при повторной проверке оказывается что там не 100% уникальности, а 0)) Самое фиговое что даже если изначально в пики нагрузок проверять повторно то так же может показывать норм уникальность, а потом когда проверяешь через сутки-две, покажет 0%) После того как начали банить каналы в яндекс дзен просек фишку что оказывается уникальный контент вовсе может быть и не совсем уникальным)) И % такого брака в текстру с каждым днем все растет и растет...
Можно сделать контрольные проверки проверенных текстов по Текст.ру через https://advego.com/antiplagiat, но он медленный и с квотой по символам. Протестирую на днях. Либо использовать для дополнительной проверки Адвего Плагиатус, он поддерживает пакетность.
1.png

2.png
 
Сегодня одиннадцатый канал на Вебархиве выходит на монету. Предлагаю посмотреть, выйдет или нет в реальном времени:
этап жизни.png

Многие, кто работает с Дзеном, получали такие письма. На данный момент дело обстоит так:
Дзен статистика канала.png
Два дня назад после прихода письма о новом этапе жизни зарубили канал, в котором я описывал о своей жизни с формулировкой о заимствовании контента. Просто обрубили показы на 8000. Такое уже не в первый раз. Посмотрим, как будет с Вебархивом.
Ждите 3-4 часа или больше. В любом случае предоставлю пруфы (скриншот ответа техподдержки Яндекс).

Ну а вот и ответ:
яндекс.png


анкета.png


Посмотрите Дзен.Понедельник, увидете много интересного. Читайте между строк, Трибуна не слушайте. Авторские каналы банят на подлете к 5000, Вебархив пропускают. На канале 14 статей - всегда вывозит одна-две.
 
Последнее редактирование:
  • Спасибо
Реакции: specialist и Zennovods
Вебархив пропускают
Да и так давно понятно было что у них тупо ресурсов нет таких что бы как то выявлять вебархив и уникальные статьи)
Единственное что у них хватает ресурсов что бы 100% выявлять не уникальные статьи - а у нас не всегда 100% гарантия самой уникальности) Так как на всех сервисах проверок нагрузки большие, брака много, когда стал перепроверять повторно по несколько раз, все стало на свои места.

Не массовый характер, но рано или поздно попадаются такие статьи которые загубят канал.

P.S Сколько выходит по деньгам с 11 каналов?
 
Крч провел я ради интереса свой эксперимент по проверке на уникальность. По несколько раз прогонял одни и те же статьи. Процент брака в text.ru 10-20%. Так же ради эксперимента пытался параллельно работать и с другими сервисами. Ситуация странная. То текст ру покажет 100%(даже при повторной проверке), другой сервис словит 0%, и на оборот, в таком случае % брака еще больше. Но в таком ключе работать, по несколько проверок + в разных сервисах прогонять, это ппц по трудозатратам и ресурсам)) Но кому нужен результат ближе к 100%, кто использует текст для сервисов типа дзен и своих сайтов, советую чекать по нескольким источникам и по несколько раз) Что бы хоть как то уменьшить вероятность брака.

Screenshot_2.png
 
Глобальное обновление (примерно через неделю). Также лучше иметь десяток своих сайтов, на которых стоит реклама, чтобы иметь свою копеечку - сайты всегда пригодятся. Вот ещё один сайт, который приносит деньги на пассиве - РСЯ платит немного, но пачка сайтов без наполнения будет приносить доходы не один год. Это не доры или адалт, с которыми нужно возиться.
Наполнил или восстановил сайт - повешал РСЯ и забыл про него. Делаешь новый. Вот новый принятый сайт с РСЯ:

Screenshot_1.jpg


Трафик небольшой, но в наше время с миллиардами сайтов и дзенканалов это неплохие деньги. Главное - меньше мороки с рассылкой, дорвеями и адалтом, а на длинной дистанции выходят те же деньги.

Цена - 500 рублей.
Почта - footashes@gmail.com
Яндекс-Деньги: 410011187505134
Киви - +7 961 999‑51‑37
 
Крч провел я ради интереса свой эксперимент по проверке на уникальность. По несколько раз прогонял одни и те же статьи. Процент брака в text.ru 10-20%. Так же ради эксперимента пытался параллельно работать и с другими сервисами. Ситуация странная. То текст ру покажет 100%(даже при повторной проверке), другой сервис словит 0%, и на оборот, в таком случае % брака еще больше. Но в таком ключе работать, по несколько проверок + в разных сервисах прогонять, это ппц по трудозатратам и ресурсам)) Но кому нужен результат ближе к 100%, кто использует текст для сервисов типа дзен и своих сайтов, советую чекать по нескольким источникам и по несколько раз) Что бы хоть как то уменьшить вероятность брака.

Посмотреть вложение 39571
Сколько времени прошло с проверкой? Возможно, уже успели растащить, если разница в месяцы..
 
Сколько времени прошло с проверкой? Возможно, уже успели растащить, если разница в месяцы..
Сразу же, после первой проверки, запустил вторую по оставшимся уникальным.
 
Сразу же, после первой проверки, запустил вторую по оставшимся уникальным.
Несколько недель назад Текст.ру улучшал алгоритм, о чем они писали в новостях, чтобы не проверяли в это время, а я писал здесь (поищите в топике), чтобы не проверяли, попробуйте перепроверить сейчас на совпадения.
 
Глобальное обновление (примерно через неделю). Также лучше иметь десяток своих сайтов, на которых стоит реклама, чтобы иметь свою копеечку - сайты всегда пригодятся. Вот ещё один сайт, который приносит деньги на пассиве - РСЯ платит немного, но пачка сайтов без наполнения будет приносить доходы не один год. Это не доры или адалт, с которыми нужно возиться.
Наполнил или восстановил сайт - повешал РСЯ и забыл про него. Делаешь новый. Вот новый принятый сайт с РСЯ:

Посмотреть вложение 39704

Трафик небольшой, но в наше время с миллиардами сайтов и дзенканалов это неплохие деньги. Главное - меньше мороки с рассылкой, дорвеями и адалтом, а на длинной дистанции выходят те же деньги.

Цена - 500 рублей.
Почта - footashes@gmail.com
Яндекс-Деньги: 410011187505134
Киви - +7 961 999‑51‑37
Здравствуйте, это новый шаблорн вы написали по востановлению сайтов с вебархива с Трафиком или что это? за что 500р?
 
Купил шаблон с месяц назад. Только в эти выходные дошли до него руки. Парсер вебархива сработал чётко и им я насобирал много текстов. А вот проверка на Text.ru... У меня не получилось насобирать бесплатных проксей. Через них Text.ru или не открывается совсем или с вот таким окном:

One-more-step.png


То что шаблон сам находит через hidemyass вообще не грузится. За весь вечер смогло проверить один текст. Нужны хорошие прокси, которые стоят денег. Отобью я их с этими текстами? А фиг знает. Короче очередная декоративная херня.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)