Парсер статей Яндекс Дзен

  • Автор темы Автор темы cherus09
  • Дата начала Дата начала

cherus09

Client
Регистрация
10.10.2016
Сообщения
172
Реакции
14
Баллы
18
51b6017bffe9.png


Парсер статей Яндекс Дзен
Данный шаблон парсит статьи и их статистику, внося данные в сформированный на лету Excel файл, создавая в нем листы с именем ключевого слова или канала для более удобного восприятия собранной информации. Шаблон парсит статьи быстро, на гет запросах!

Для каких целей будет полезен данный инструмент:

Собранные статьи вы можете использовать для постов в соц. сетях, создания дорвеев, для лонгридов ВК, ОД, Telegram и т.д.

По собранной статистики определить какие статьи пользуются большей популярностью, и на основании этой информации отбирать только интересный контент для постов. Также с помощью статистики можно отслеживать свой канал в Яндекс Дзен и вовремя реагировать на снижение вовлеченности читателей вашего канала.



70317


При парсинге формируется такая информация как:
— Дата парсинга статьи
— Заголовок статьи
— Дата выхода статьи
— Количество просмотров
— Количество дочитывания статьи
— Количество комментариев
— Количество лайков
— Среднее время чтения статьи
— Ссылка на статью
— Текст статьи
— Ссылка на изображения из статьи


Входные настройки шаблона:
70318


На Главной вкладке , которая есть только у PRO-версии шаблона указывается лицензионный ключ для активации.
У демо-версии шаблона данной вкладки нет.
При первом запуске демо-версии активируется пробный период на трое суток. По истечению пробного периода шаблон перестанет работать!
Для дальнейшей работы вам нужно приобрести лицензионный ключ с PRO-версией шаблона!


102352


На этой вкладке выбираете режим парсинга.

1) Если поставить галочку «Парсить новые статьи» - то ранее собранные статьи не будут браться. Ссылки, на ранее собранные статьи, храняться в файле used_links_to_articles.txt, который находиться в папке Temp.

2) Есть два режима парсинга статей:

— По ключевым словам

— По списку каналов


При выборе режима «По ключевым словам» - шаблон будет брать их из файла keywords_search.txt, не забудьте перед запуском шаблона внести в этот список нужные ключевые слова! Каждое слово или словосочетание указывайте с новой строки!

При выборе режима «По списку каналов» - данные будут браться из файла chennels.txt в который вы заблаговременно внесете ссылки на каналы.

3) Удалять хэштеги в заголовке и тексте - при включенной функции будут удалены хэштеги в заголовке и тексте.

4) Поставив галочку напротив «Сохранять статьи в TXT файл» - текст статей будет сохранен в txt файлы, имя файлов будет состоять из заголовка статьи. При отсутствии галочки, текст будет записан в Exsel таблицу.

5) При включенной функции «Спарсить только краткое описание» - будет собрано: Заголовок, короткое описание статьи, URL изображения, URL на полную статью, URL канала, название канала. Данные будут сохранены в таблицу result_kor_opis.xlsx.
Если поставить галочку напротив «Сохранять статьи в TXT файл», заголовок и короткое описание статьи будет сохранен в txt файл и в таблицу.

6) Парсинг изображений статьи:

Не парсить изображения – При выборе этого режима, изображения статьи не будут собраны
Записать URL всех изображений в txt файл – При этом включенном режиме, будут собраны URL всех изображений статьи с последующим сохранением их в txt файл в директории проекта в папке название которой будет соответствовать заголовку статьи
Скачать только первое – Будет скачано первое изображение и сохранено в директорию проекта в папке название которой будет соответствовать заголовку статьи
Скачать все – Будут скачены все изображения статьи и сохранены в директорию проекта в папке название которой будет соответствовать заголовку статьи

7) Сколько парсить статей - думаю и так все понятно.

8 ) Разделитель для столбцов - При сборе, данные для записи в файл Excel формируются в одну строку и для разнесения по столбцам используется разделитель, иногда этот разделитель может появиться в тексте статьи, что сбивает правильное разнесение данных в Excel. Если вдруг возникнут проблемы при записи данных в таблицу, нужно будет подобрать нужный символ и указать в этом поле.


70320


Во вкладке Proxy указываете использовать прокси при работе или нет.

Файлы находящиеся в директории проекта:

102351


В папке Temp находятся два файла:

Logs.txt - в который записывается информация по ошибкам, возникшим при работе шаблона для более быстрого их выявления и устранения.
used_links_to_articles.txt - в этом файле хранятся ссылки на ранее собранные статьи

В файл chennels.txt записываете ссылки на каналы с которых нужно спарсить статьи. Пример какого должны быть ссылки есть внутри этого файла.

В файл keywords_search.txt записываете ключевые слова по которым нужно произвести сбор статей.

В файле proxy.txt указываете прокси если понадобиться. Если вы с России то они вам не пригодятся.

Так же в здесь есть два файла демо-версии шаблона Yandex_Dzen_parser_DEMO_v1.5.zp и Yandex_Dzen_parser_DEMO_v1.5_7.4.0.0.zp

Файл Yandex_Dzen_parser_DEMO_v1.5.zp или в случае приобретении PRO-версии Yandex_Dzen_parser_PRO_v1.5.zp должен запуститься на версии ZennoPoster с 7.2.0.0 (5.47.0.0) до 7.7.3.0

Для нормальной работы потребуется скопировать Библиотеки из одноимённой папки в директорию Зеннопостер в папку «ExternalAssemblies» которая находиться примерно по такому пути «C:\Program Files\ZennoLab\RU\ZennoPoster Pro V7\7.7.3.0\Progs\ExternalAssemblies». У вас возможно путь до папки будет отличаться!

Если у вас версия ZennoPoster 7.7.3.0 и выше, ничего делать не нужно. Просто используйте для работы файл Yandex_Dzen_parser_DEMO_v1.5_vz7.7.3.0 или если вы приобрели PRO-версию, используйте Yandex_Dzen_parser_PRO_v1.5_vz7.7.3.0.zp


Так выглядит лог ZennoPoster при выполнении шаблона


102350


При отсутствии программы ZennoPoster можно воспользоваться ZennoBox, это обойдется +10$ к стоимости шаблона (единоразово).

Шаблон корректно работает только в один поток, при запуске нескольких потоков автоматически будут остановлены все потоки кроме одного для избежания ошибок!

Стоимость шаблона 2490р. для приобретения пишите здесь или в Telegram

Скачать DEMO-версию шаблона и опробовать в течение трех суток можно здесь
 

Вложения

  • 2021-01-03_13-19-33.png
    2021-01-03_13-19-33.png
    11,8 KB · Просмотры: 476
  • 2021-01-03_13-48-11.png
    2021-01-03_13-48-11.png
    33,4 KB · Просмотры: 2 700
  • 2021-01-17_11-07-25.png
    2021-01-17_11-07-25.png
    15,7 KB · Просмотры: 395
  • 2021-01-17_11-16-54.png
    2021-01-17_11-16-54.png
    13,6 KB · Просмотры: 393
  • 2021-01-28_15-34-37.png
    2021-01-28_15-34-37.png
    12,2 KB · Просмотры: 1 293
  • 2021-11-01_21-41-15.png
    2021-11-01_21-41-15.png
    10,9 KB · Просмотры: 1 361
  • 2021-11-01_20-12-00.png
    2021-11-01_20-12-00.png
    17,6 KB · Просмотры: 396
  • 2021-11-23_16-07-12.png
    2021-11-23_16-07-12.png
    18,5 KB · Просмотры: 1 266
Последнее редактирование:
АКЦИЯ!
До конца января стоимость шаблона 1490руб.
Успейте сэкономить, приобретайте доступ к этому полезному инструменту сейчас!

Автоматизируйте рутинную работу по поиску контента для наполнения ваших соцсетей, а также сбора статистики по статьям для определения правильного направления создания своего канала в Яндекс дзен.

 
А смыслпарсить неуникальные статьи? Или я чего то не понимаю?
 
А смыслпарсить неуникальные статьи? Или я чего то не понимаю?
Собираешь статьи с Яндекс Дзен смотришь по статистики какие лучше заходят народу, береш их и наполняешь свои группы в соцсетях или каналы в Телеграм и т.д.. Для сайтов скорей всего не пойдет собранный контент, а вот для соцсетей самое то. Не нужно самому придумывать контент.
 
  • Спасибо
Реакции: Saf
Обновление
Добавлена функция сохранения изображений статьи в трех режимах.

70826

Выбираете нужный режим парсинга изображений из статьи. Изображения будут сохраняться в директории проекта в папке название которой будет соответствовать заголовку статьи.
Также снижена минимальная версия Zennoposter для работы с шаблоном до 7.2.0.0
 
Последнее редактирование:
ОБНОВЛЕНИЕ ШАБЛОНА!
Актуальная версия 1.1
Добавлена функция сохранение статей в txt файлы. Также статьи можно, как и раньше сохранять в Exsel таблицу. Обновил главный топик.
71381

Скачивайте, пробуйте! Архив с шаблоном прикрепляю.
 

Вложения

Ошибка компиляции проекта. Точно работает?
 
Обновил шаблон, устранил ошибки парсинга связанные с изменением верстки страниц Яндекс Дзен. Прикрепляю актуальную версию.
 

Вложения

ac48ff53a409.png




Привет всем! Подъехало очередное обновление шаблона "Парсер статей Яндекс Дзен"

Устранил очередные ошибки парсинга связанные с изменением верстки страниц Яндекс Дзен.

Скачать актуальную версию можно здесь.​
 
  • Спасибо
Реакции: Mavrikman
ac48ff53a409.png




Привет всем! Подъехало очередное обновление шаблона "Парсер статей Яндекс Дзен"

Устранил очередные ошибки парсинга связанные с изменением верстки страниц Яндекс Дзен.

Скачать актуальную версию можно здесь.​

что то не отрывает ссылку
 
Только что проверил, ссылка рабочая
 
ХОРОШАЯ НОВОСТЬ
Время тест-драйва "Парсера статей Яндекс Дзен" увеличено с 10 мин. до 24-х часов
‼

Качайте, тестируйте
f09f9189f09f8fbb.png


83495
 
Последнее редактирование:
Прикреплю сюда архив с шаблоном
 

Вложения

Шаблон отличный, на последней зенке все завелось в 1 клик, парсит быстро и без глюков, автор всегда на связи и готов развивать шаблон. Рекомендую к покупке
 
Добавил функцию - парсинга и записи URL первого изображения статьи в таблицу Excel


84840
 

Вложения

Очередное обновление парсера Яндекс Дзен!

Добавлена функция для сбора ссылок на все изображения статьи с последующим сохранением их в TXT файл. Файл со ссылками сохраняется в директорию проекта в папке название которой будет соответствовать заголовку статьи.

Также исправлены некоторые проблемы с парсингом статей по ключевым словам.

84930


СКАЧАТЬ ОБНОВЛЕННЫЙ ШАБЛОН МОЖНО ПО ЭТОЙ
ССЫЛКЕ
 
Очередное обновление "Парсера статей Яндекс Дзен"

Исправлена работа шаблона с использованием прокси без авторизации.
Скачать актуальную версию можно по этой ссылке
 
Автор сразу вышел на связь и проблема решена! Шаблон работает и выполняет свои задачи на УРА!!! Рекомендую!
 
Очередное обновление "Парсера статей Яндекс Дзен"

85810


Список изменений:

1) Добавлена функция для сбора короткого описания статьи.

При включенной функции «Спарсить только краткое описание» - будет собрано: Заголовок, короткое описание статьи, URL изображения, URL на полную статью, URL канала, название канала. Данные будут сохранены в таблицу result_kor_opis.xlsx.

Если поставить галочку напротив «Сохранять статьи в TXT файл», заголовок и короткое описание статьи будет сохранен в txt файл и в таблицу.

2) Исправлена ошибка создания листа в xcel таблице если названия канала или ключевого слова слишком длинное, теперь название листа обрезается до 30 символов для обхода этого ограничения.

3) Улучшена стабильность парсинга.

СКАЧАТЬ ОБНОВЛЕННЫЙ ШАБЛОН МОЖНО ПО ЭТОЙ ССЫЛКЕ
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)