Article Extraction ?

nomarketing

Client
Регистрация
01.11.2013
Сообщения
911
Благодарностей
178
Баллы
43
Ну название говорит само за себя на как он определяет статью и есть ли какие то настроийки и с чем его применять ?
Затестил на одном сайте, после спарсил один заголовок и все..
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
Это не точный инструмент. То есть не следует ожидать что у вас спарсится статья с любого сайта без мусора и корректно.
Инструмент для определения релевантности страницы
https://wiki.zennolab.com/doku.php?id=ru:context-recognizer
 
  • Спасибо
Реакции: nomarketing

nomarketing

Client
Регистрация
01.11.2013
Сообщения
911
Благодарностей
178
Баллы
43
А... т.е нужно его использовать с context-recognizer понял, а я то думал.. :D
Почитал о context-recognizer очень даже интересная вещь :-)
 

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
901
Баллы
113
до( только русский не понимает... ну или не понимало
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)