- Регистрация
- 10.10.2016
- Сообщения
- 172
- Благодарностей
- 14
- Баллы
- 18
Парсер статей Яндекс Дзен
Данный шаблон парсит статьи и их статистику, внося данные в сформированный на лету Excel файл, создавая в нем листы с именем ключевого слова или канала для более удобного восприятия собранной информации. Шаблон парсит статьи быстро, на гет запросах!
Для каких целей будет полезен данный инструмент:
Собранные статьи вы можете использовать для постов в соц. сетях, создания дорвеев, для лонгридов ВК, ОД, Telegram и т.д.
По собранной статистики определить какие статьи пользуются большей популярностью, и на основании этой информации отбирать только интересный контент для постов. Также с помощью статистики можно отслеживать свой канал в Яндекс Дзен и вовремя реагировать на снижение вовлеченности читателей вашего канала.
При парсинге формируется такая информация как:
— Дата парсинга статьи
— Заголовок статьи
— Дата выхода статьи
— Количество просмотров
— Количество дочитывания статьи
— Количество комментариев
— Количество лайков
— Среднее время чтения статьи
— Ссылка на статью
— Текст статьи
— Ссылка на изображения из статьи
Входные настройки шаблона:
На Главной вкладке , которая есть только у PRO-версии шаблона указывается лицензионный ключ для активации.
У демо-версии шаблона данной вкладки нет.
При первом запуске демо-версии активируется пробный период на трое суток. По истечению пробного периода шаблон перестанет работать!
Для дальнейшей работы вам нужно приобрести лицензионный ключ с PRO-версией шаблона!
На этой вкладке выбираете режим парсинга.
1) Если поставить галочку «Парсить новые статьи» - то ранее собранные статьи не будут браться. Ссылки, на ранее собранные статьи, храняться в файле used_links_to_articles.txt, который находиться в папке Temp.
2) Есть два режима парсинга статей:
— По ключевым словам
— По списку каналов
При выборе режима «По ключевым словам» - шаблон будет брать их из файла keywords_search.txt, не забудьте перед запуском шаблона внести в этот список нужные ключевые слова! Каждое слово или словосочетание указывайте с новой строки!
При выборе режима «По списку каналов» - данные будут браться из файла chennels.txt в который вы заблаговременно внесете ссылки на каналы.
3) Удалять хэштеги в заголовке и тексте - при включенной функции будут удалены хэштеги в заголовке и тексте.
4) Поставив галочку напротив «Сохранять статьи в TXT файл» - текст статей будет сохранен в txt файлы, имя файлов будет состоять из заголовка статьи. При отсутствии галочки, текст будет записан в Exsel таблицу.
5) При включенной функции «Спарсить только краткое описание» - будет собрано: Заголовок, короткое описание статьи, URL изображения, URL на полную статью, URL канала, название канала. Данные будут сохранены в таблицу result_kor_opis.xlsx.
Если поставить галочку напротив «Сохранять статьи в TXT файл», заголовок и короткое описание статьи будет сохранен в txt файл и в таблицу.
6) Парсинг изображений статьи:
Не парсить изображения – При выборе этого режима, изображения статьи не будут собраны
Записать URL всех изображений в txt файл – При этом включенном режиме, будут собраны URL всех изображений статьи с последующим сохранением их в txt файл в директории проекта в папке название которой будет соответствовать заголовку статьи
Скачать только первое – Будет скачано первое изображение и сохранено в директорию проекта в папке название которой будет соответствовать заголовку статьи
Скачать все – Будут скачены все изображения статьи и сохранены в директорию проекта в папке название которой будет соответствовать заголовку статьи
7) Сколько парсить статей - думаю и так все понятно.
8 ) Разделитель для столбцов - При сборе, данные для записи в файл Excel формируются в одну строку и для разнесения по столбцам используется разделитель, иногда этот разделитель может появиться в тексте статьи, что сбивает правильное разнесение данных в Excel. Если вдруг возникнут проблемы при записи данных в таблицу, нужно будет подобрать нужный символ и указать в этом поле.
Во вкладке Proxy указываете использовать прокси при работе или нет.
Файлы находящиеся в директории проекта:
В папке Temp находятся два файла:
— Logs.txt - в который записывается информация по ошибкам, возникшим при работе шаблона для более быстрого их выявления и устранения.
— used_links_to_articles.txt - в этом файле хранятся ссылки на ранее собранные статьи
В файл chennels.txt записываете ссылки на каналы с которых нужно спарсить статьи. Пример какого должны быть ссылки есть внутри этого файла.
В файл keywords_search.txt записываете ключевые слова по которым нужно произвести сбор статей.
В файле proxy.txt указываете прокси если понадобиться. Если вы с России то они вам не пригодятся.
Так же в здесь есть два файла демо-версии шаблона Yandex_Dzen_parser_DEMO_v1.5.zp и Yandex_Dzen_parser_DEMO_v1.5_7.4.0.0.zp
Файл Yandex_Dzen_parser_DEMO_v1.5.zp или в случае приобретении PRO-версии Yandex_Dzen_parser_PRO_v1.5.zp должен запуститься на версии ZennoPoster с 7.2.0.0 (5.47.0.0) до 7.7.3.0
Для нормальной работы потребуется скопировать Библиотеки из одноимённой папки в директорию Зеннопостер в папку «ExternalAssemblies» которая находиться примерно по такому пути «C:\Program Files\ZennoLab\RU\ZennoPoster Pro V7\7.7.3.0\Progs\ExternalAssemblies». У вас возможно путь до папки будет отличаться!
Если у вас версия ZennoPoster 7.7.3.0 и выше, ничего делать не нужно. Просто используйте для работы файл Yandex_Dzen_parser_DEMO_v1.5_vz7.7.3.0 или если вы приобрели PRO-версию, используйте Yandex_Dzen_parser_PRO_v1.5_vz7.7.3.0.zp
Так выглядит лог ZennoPoster при выполнении шаблона
При отсутствии программы ZennoPoster можно воспользоваться ZennoBox, это обойдется +10$ к стоимости шаблона (единоразово).
Шаблон корректно работает только в один поток, при запуске нескольких потоков автоматически будут остановлены все потоки кроме одного для избежания ошибок!
Стоимость шаблона 2490р. для приобретения пишите здесь или в Telegram
Скачать DEMO-версию шаблона и опробовать в течение трех суток можно здесь
Вложения
-
11,8 КБ Просмотры: 366
-
33,4 КБ Просмотры: 2 588
-
15,7 КБ Просмотры: 306
-
13,6 КБ Просмотры: 303
-
12,2 КБ Просмотры: 1 199
-
10,9 КБ Просмотры: 1 263
-
17,6 КБ Просмотры: 301
-
18,5 КБ Просмотры: 1 156
Последнее редактирование: