- Регистрация
- 30.09.2016
- Сообщения
- 43
- Реакции
- 27
- Баллы
- 18
Работает он по следующему принципу:
1. Парсит название, описание, торрент файл, магнет ссылку
2. Укладывает все это в таблицу для последующего постинга, на ваш сайт
3. Работает с прокси (по умолчанию использует tor browser в качестве прокси, именно этот способ рекомендую использовать)
4. Контроль раздач (одно и то же не скачаете)
5. Может работать как единоразово так и на постоянной основе, качая только новые раздачи.
Подробнее о том как работать с входными настройками будет ссылка на видео в конце поста.
Ниже скрин как выглядит проект в ProjectMaker
Работа парсера постороена на get запросах, что дало хорошую скорость работы. За ходом выполнения парсинга можно следить в логах, колличество спарсеных страниц так же выводится в лог для мониторинга.
После того как будет собрана база, вы можете постить ее к себе на сайт по средствам zennoposter. Думаю с этим у вас поблем не возникнет, ктому же в видео я показал как получается строка из готовой таблицы и раскладывается по переменным.
От себя хочу посоветовать не парсить все подряд, выберите для начала музыку или видео, наполните сайт и дождитесь индексации поисковиками, дальше будет видно, может быть вы остановитесь на том что у вас будет музыкальный трекер или трекер с фильмами. Такие сайты легче продвигать чем те где все подряд
Откройте парсер в ProjectMaker и обратите внимание на комментарии в коде, так будет легче разобраться что к чему.
Детальный разбор парсера видео
PS: Данный парсер, можно использовать как для обычных - так и для самонаполняемых сайтов. Принцип такой: поднимается сайт на том же wordpress, парсится контент на +- 10к страниц, далее пишете бота под вашу cms (думаю с этим проблем не будет там пару строк кода) и из готовой таблицы постите результаты к себе на сайт. Все это можно сделать на локалке или на хостинге если он уже проплачен. После на сайт вешаете рекламу и получаете профит. Идея не нова, но главное рабочая.
Да и вот еще, в файле парсера Pars category.txt будьте внимательны, там не должно быть пустых строк, в обычном блокноте этого не видно, рекомндую использовать notepad++

- Номер конкурса шаблонов
- Второй конкурс шаблонов
- Уровень сложности
- Средний
- Категория
- Парсинг
Вложения
Последнее редактирование:






