[SOLVED] Баг ZP или неправильность рег. выражения

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
164
Баллы
43
Пытаюсь спарсить заголовки вакансий на rabota.yandex.ru
в конструкторе рег.выражение собираю так:



Если я правильно понимаю - конструктор должен взять текст "Инженер - программист", но берет всю страницу.
ZP - 5.7.0.0
Кто виноват: - я прописав не правильно рег. выражение или ZP ?
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113
попробуй поставить галочку, самое короткое совпадение
 

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
164
Баллы
43
Выставлял разные параметры - все одно, парсит целую страницу
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113
Выставлял разные параметры - все одно, парсит целую страницу
ну такая регулярка я думаю точно не подойдёт, так как "> может встретить до твоего значения 10 раз
 

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
164
Баллы
43
ну такая регулярка я думаю точно не подойдёт, так как "> может встретить до твоего значения 10 раз
В том то и дело, что конструктор находит только одно значение после парсинга, по идеи должен быть множественный результат.

ssXXXss, если не сложно, можете подсказать правильное рег. выражение в данном случае?
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
Попробуйте так:
Перед искомым текстом всегда есть .html">
+ самое короткое совпадение
А лучше приложите полный код или нужную часть страницы.
 

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
164
Баллы
43
.html"> - не всегда есть
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113
выложи нам хоть что то, мы переписывать ведь не будем)))
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
164
Баллы
43

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
164
Баллы
43

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
Код:
(?<=(html|;)">).*?(?=<)
Надеюсь должно быть 11?
 

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
164
Баллы
43

botovod

Client
Регистрация
04.04.2014
Сообщения
170
Благодарностей
126
Баллы
43
(?<=">)[^<>]*?(?=</a></h3>)
 
  • Спасибо
Реакции: inotoxic

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
164
Баллы
43

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)