Парсер хештегов на запросах

  • Автор темы Автор темы traffman
  • Дата начала Дата начала

traffman

Client
Регистрация
30.11.2018
Сообщения
91
Реакции
102
Баллы
33
Доброго времени суток.

Вашему вниманию представлен шаблон для сбора хештегов на запросах с сайта hashtagify.me. Шаблон достаточно прост для понимания и новичкам будет полезен для написания простых шаблонов. И в тоже время несмотря на его простоту, он выполняет свою задачу, а именно собирает хештеги с выводом информации о них в виде частотности их использования (в данном случае это твиттер).

Данный сайт hashtagify.me имеет платную подписку и уверен отдаёт больше статистики, но для того чтобы собрать для теста или объемов хештеги (причем адалтных) он отлично подойдёт и в бесплатном варианте)).

Работа шаблона проста. Во входных настройках указываем текстовый файл с хештегами, которые будем распаршивать (можно как с # так и без). Каждый хештег должен быть с новой строки. Запускаем и на выходе получаем ексель файл с результатами. Визуально информацию о каждом распаршеном хештеге можно увидеть непосредственно в самом файле. Кубики с задержками в шаблоне возможно можно уменьшить, но так как шаблон не тестировался на скорость, поэтому заданы такие.
97530


Последовательность работы шаблона и описание блоков в нём представлено в самом шаблоне.
 

Вложения

traffman
Почему-то получается куча дублей с разными значениями частотности. В чем может быть проблема?
111.jpg
 
Тоесть чисто по логике понятно что для ключа #sex частотность > ляма это нормально, но вот верное ли оно? И полно дублей НЧ ключей... правильно ли брать максимальное значение частотности? Как вообще такую таблицу обрабатывать? у меня этих адалтных ключей просто немеряно)
 
Тоесть чисто по логике понятно что для ключа #sex частотность > ляма это нормально, но вот верное ли оно? И полно дублей НЧ ключей... правильно ли брать максимальное значение частотности? Как вообще такую таблицу обрабатывать? у меня этих адалтных ключей просто немеряно)
Покопавшись на сайте откуда мы парсим хештеги, мы можем получать два вида хештегов (всё согласно мнению создателей сайта)
Первый вид хештегов, это схожие хештеги и он их кореллирует с нашим запросом, а эти цифры в екселе, не совсем их частотность. (скорее частотность о который вы спросили в платной версии). Судя по результату, чем больше цифра, тем они считают данный хештег подходит к тому которым мы парсим. Второй вид хештегов - это как им видятся популярные хештеги. Там сам то запрос отдаёт гораздо больше информации и у кого есть желание, может получить гораздо больше.
 

Вложения

  • 11.png
    11.png
    133,3 KB · Просмотры: 234
Доброго времени суток.
@traffman
Добрый день!
Скажите, пож-та, а переделать Ваш шаблон под парсинг частотности хештегов Инстаграм с этого же сайта - это очень сложно? Вы бы взялись за эту задачу и если да, то на каких условиях?
Спасибо.
 
@traffman
Добрый день!
Скажите, пож-та, а переделать Ваш шаблон под парсинг частотности хештегов Инстаграм с этого же сайта - это очень сложно? Вы бы взялись за эту задачу и если да, то на каких условиях?
Спасибо.
А там он выдаёт её? Я уже честно не знаю что там есть, есть ведь другие сайты, более заточенные под сбор хештегов и конкретно Инстаграм. Да и там частотность какая то сомнительная, насколько я помню.
 
  • Спасибо
Реакции: Dev00

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)