Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация

DrunkDeath

Client
Регистрация
24.12.2014
Сообщения
616
Реакции
442
Баллы
63
Лого.png


Доброго времени суток, дамы и господа. Хочу поделиться с вами весьма полезным шаблоном для парсинга групп Вконтакте с сайта https://allsocial.ru/ с последующей фильтрацией этих групп и занесением результата в таблицу. Шаблон парсит по ссылке группы и получает данные о группах (Название, ID, тип сообщества, доступ, возможность постинга в комментарии или на стену группы, возможность загружать документы, фото и видео, можно ли создавать обсуждения и писать в сообщения группы). Результат записывается в таблицу.


Таблица.jpg




Входные.jpg

Лог.jpg


Как пользоваться шаблоном:


Переходим на сайт https://allsocial.ru/ и выставляем критерии поиска групп.
Копируем ссылку из адресной строки и вставляем во входные настройки шаблона.
Выбираем пункт "Парсить AllSocial" и выполняем 1 раз.
В корневой папке шаблона появится список с ID групп.
Добавляем полученный список во входные настройки.
Выбираем пункт "Фильтровать Группы".
Пишем логин и пароль вк.
По желанию добавляем прокси в формате: логин:пароль@ip:port.
Запускаем 1 выполнение.
Отфильтрованные группы появятся в таблице "Результат".



Можно фильровать и свои группы из списка. В списке должны быть только ID сообществ. Шаблон записывает все полученные данные в одну таблицу "Результат".

Всем спасибо за внимание. Надеюсь этот шаблон вам пригодится.
 
Номер конкурса шаблонов
  1. Пятый конкурс шаблонов
Уровень сложности
Средний
Категория
  1. Парсинг
  2. SMM

Вложения

Вот бы кто такое для телеграмма придумал)
 
Вот бы кто такое для телеграмма придумал)
А что тут думать, выбирается вкладка Telegram на сайте и в кубике dom (в парсере) вписывается эта регулярка (?<=domain=).*. И всё, шаблон парсит группы телеграма по вашим критериям из allsocial
 
  • Спасибо
Реакции: Gomer
А что тут думать, выбирается вкладка Telegram на сайте и в кубике dom (в парсере) вписывается эта регулярка (?<=domain=).*. И всё, шаблон парсит группы телеграма по вашим критериям из allsocial
Отлично, вот и шаблон на шестой конкурс шаблонов приехал)
 
А что тут думать, выбирается вкладка Telegram на сайте и в кубике dom (в парсере) вписывается эта регулярка (?<=domain=).*. И всё, шаблон парсит группы телеграма по вашим критериям из allsocial
Лишний раз убеждаюсь, все гениальное просто)) Спасибо. А можешь добавить в шаб эту функцию по телеге, чтобы еще в отчет ссылку на телеграм канал выгружал?
 
Лишний раз убеждаюсь, все гениальное просто)) Спасибо. А можешь добавить в шаб эту функцию по телеге, чтобы еще в отчет ссылку на телеграм канал выгружал?
Не, этот шаб под вк. Как и писал выше, адаптировать под телегу можно заменив 1 кубик. Это не сложно.
 
  • Спасибо
Реакции: Gomer
Не, этот шаб под вк. Как и писал выше, адаптировать под телегу можно заменив 1 кубик. Это не сложно.

Шаб нужный пригодиться в работе. Помню был такой раньше, но где то затерялся. Долго парсил с помощью софта, но вроде тот уже не парсит. Кстати, чем можно потом группы отвалидировать по дате последнего поста?
 
  • Спасибо
Реакции: DrunkDeath
Шаб нужный пригодиться в работе. Помню был такой раньше, но где то затерялся. Долго парсил с помощью софта, но вроде тот уже не парсит. Кстати, чем можно потом группы отвалидировать по дате последнего поста?
Да можно по json взять дату поста
 
Шаблон работает, но при парсинге почему-то выдает какие-то предупреждения и в папке создает два файла: в одном собранные id в указанном количестве (что в логе показывает), а в другом тоже id, но уже более 2000. Хотя по ссылке там и в помине нет этих 2000. Что это за второй список и откуда он берется?

17-03-2020 12-06-33.png
 
Шаблон работает, но при парсинге почему-то выдает какие-то предупреждения и в папке создает два файла: в одном собранные id в указанном количестве (что в логе показывает), а в другом тоже id, но уже более 2000. Хотя по ссылке там и в помине нет этих 2000. Что это за второй список и откуда он берется?

Посмотреть вложение 52056
Предупреждения выскакивают только когда пустая страница, видимо не подгрузились группы. А вт на счёт нового файла я даже незнаю, он создаёт только 1 файл когда парсит с датой в имени
 
зацикливается шаблон, и парсит первые 20 групп. Можете подправить?
 

Вложения

  • Спасибо
Реакции: Kitagen и sambukanuka
Только приобрёл данный продукт и решил попробовать Ваш шаблон. Настроил прокси чекер и когда запускаю ничего не происходит. Что не так делаю? Юзера никакого не указывал.
54571
 
Только приобрёл данный продукт и решил попробовать Ваш шаблон. Настроил прокси чекер и когда запускаю ничего не происходит. Что не так делаю? Юзера никакого не указывал.
Посмотреть вложение 54571
А в логе что пишет при запуске? И надо добавить выполнения шаблону, а то всё по нулям
 
А в логе что пишет при запуске? И надо добавить выполнения шаблону, а то всё по нулям
Тип Время Сообщение
13:15:06 Начинаю парсинг...
13:15:07 Начинаю парсинг...
13:15:08 Начинаю парсинг...
13:15:12 Начинаю парсинг...
13:15:12 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:12 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:12 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:12 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:12 Выполнение действия List Ошибка при обработке списка
13:15:12 Выполнение действия List Ошибка при обработке списка
13:15:12 ZennoPoster Не удалось выполнить проект E:\ZennoPoster\Шаблоны\Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация.zp
13:15:12 ZennoPoster Не удалось выполнить проект E:\ZennoPoster\Шаблоны\Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация.zp
13:15:13 Начинаю парсинг...
13:15:21 Начинаю парсинг...
13:15:21 Начинаю парсинг...
13:15:37 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:37 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:37 Выполнение действия List Ошибка при обработке списка
13:15:37 ZennoPoster Не удалось выполнить проект E:\ZennoPoster\Шаблоны\Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация.zp
13:15:45 Начинаю парсинг...
13:15:49 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:49 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:49 Выполнение действия List Ошибка при обработке списка
13:15:49 ZennoPoster Не удалось выполнить проект E:\ZennoPoster\Шаблоны\Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация.zp
13:15:58 Начинаю парсинг...
 

Вложения

  • 1587981610373.png
    1587981610373.png
    95,6 KB · Просмотры: 463
  • 1587981770686.png
    1587981770686.png
    170,9 KB · Просмотры: 506
  • 1587981825478.png
    1587981825478.png
    11,3 KB · Просмотры: 462
Последнее редактирование:
Тип Время Сообщение
13:15:06 Начинаю парсинг...
13:15:07 Начинаю парсинг...
13:15:08 Начинаю парсинг...
13:15:12 Начинаю парсинг...
13:15:12 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:12 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:12 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:12 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:12 Выполнение действия List Ошибка при обработке списка
13:15:12 Выполнение действия List Ошибка при обработке списка
13:15:12 ZennoPoster Не удалось выполнить проект E:\ZennoPoster\Шаблоны\Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация.zp
13:15:12 ZennoPoster Не удалось выполнить проект E:\ZennoPoster\Шаблоны\Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация.zp
13:15:13 Начинаю парсинг...
13:15:21 Начинаю парсинг...
13:15:21 Начинаю парсинг...
13:15:37 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:37 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:37 Выполнение действия List Ошибка при обработке списка
13:15:37 ZennoPoster Не удалось выполнить проект E:\ZennoPoster\Шаблоны\Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация.zp
13:15:45 Начинаю парсинг...
13:15:49 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:49 Парсинг текста регулярным выражением Результат: ничего не найдено
13:15:49 Выполнение действия List Ошибка при обработке списка
13:15:49 ZennoPoster Не удалось выполнить проект E:\ZennoPoster\Шаблоны\Парсер групп Вконтакте с сайта AllSocial + последующая фильтрация.zp
13:15:58 Начинаю парсинг...
Прокси нужно 1 поставить и если что в личку мне пишите)
 
  • Спасибо
Реакции: Acme
Спасибо за отличный шаблон!
Обнаружил 2 ошибки:
1. Вылет с такой ошибкой
C#:
Развернуть Свернуть Копировать
15:30:41    Выполнение действия Parse Json/Xml Unexpected character encountered while parsing value: <. Path '', line 0, position 0.
55647

2. В результате получается очень много дублей
55648


Для работы не критично - шаб можно перезапускать и дубли чистить. .
 
  • Спасибо
Реакции: DrunkDeath
Спасибо за отличный шаблон!
Обнаружил 2 ошибки:
1. Вылет с такой ошибкой
C#:
Развернуть Свернуть Копировать
15:30:41    Выполнение действия Parse Json/Xml Unexpected character encountered while parsing value: <. Path '', line 0, position 0.
Посмотреть вложение 55647
2. В результате получается очень много дублей
Посмотреть вложение 55648

Для работы не критично - шаб можно перезапускать и дубли чистить. .
Видимо вк пустой ответ отдаёт и Json не обрабатывается. Паузу между запросами небольшую поставить надо.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)