- Регистрация
- 03.10.2018
- Сообщения
- 1 136
- Благодарностей
- 196
- Баллы
- 63
Всем привет
Можете подсказать, в каком направлении думать по следующему вопросу:
я нашел регулярку, которая чисто парсит тексты, без мусора с любого сайта. У меня один вопрос только остался - как искать именно информационные статьи на этих сайтах? Пока мысль такая - выделить теги, в которые завернуты статьи и по ним искать..
Еще вопрос - есть ли возможность взять дом модель всего сайта, а не только ту страницу, на которую зашел?
Можете подсказать, в каком направлении думать по следующему вопросу:
я нашел регулярку, которая чисто парсит тексты, без мусора с любого сайта. У меня один вопрос только остался - как искать именно информационные статьи на этих сайтах? Пока мысль такая - выделить теги, в которые завернуты статьи и по ним искать..
Еще вопрос - есть ли возможность взять дом модель всего сайта, а не только ту страницу, на которую зашел?