- Регистрация
- 20.04.2015
- Сообщения
- 354
- Благодарностей
- 164
- Баллы
- 43
Подскажите что не правильно делаю...
Нужно спарсить страницы на сайте по тегу h1.
использую регулярку - вида
(?<=<h1\ class="entry-title">\ <\ href=").*?(?=")
и ничего не находит.
Хотя на этом сайте
регулярка - вида
(?<=<h3\ class="title">\ <a\ href=").*?(?=") - парсит результат
Подскажите, где ошибка в первой регулярке?
Спасибо!
Нужно спарсить страницы на сайте по тегу h1.
Код:
<header class="entry-header">
<h1 class="entry-title">
<a title="Риск, вход, стоп-лосс и цель" href="http://foreks-tim.ru/risk-vxod-stop-loss-i-cel/">Риск, вход, стоп-лосс и цель</a>
</h1>
</header>
(?<=<h1\ class="entry-title">\ <\ href=").*?(?=")
и ничего не находит.
Хотя на этом сайте
Код:
<div class="description">
<h3 class="title">
<a title="Недвижимость (Черногория) в Москве" href="/moskva/nedvizhimost_za_rubezhom/nedvizhimost_chernogoriya_123683741"> Недвижимость (Черногория)</a>
</h3>
(?<=<h3\ class="title">\ <a\ href=").*?(?=") - парсит результат
Подскажите, где ошибка в первой регулярке?
Спасибо!