Регулярка, помогите объединить выражения

olga.armalita

Client
Регистрация
05.04.2014
Сообщения
194
Благодарностей
42
Баллы
28
Приветствую, в целях ускорения шаблона пытаюсь объединить несколько регулярок для парсинга вместе.
Но нифига у меня не получается:-) Помогите пожалуйста кто в этом разбирается.
На странице появляется одна из ниже перечисленных строк, нужно спарсить TEXT2.
Код:
TEXT1</em> TEXT2&nbsp;
TEXT1</em>:TEXT2&nbsp;
TEXT1</em>, TEXT2-
TEXT1</em> TEXT2-
TEXT1</em>:TEXT2-
TEXT1</em>:TEXT2.
TEXT1</em> TEXT2.
TEXT1</em>, TEXT2-
TEXT1</em>, TEXT2.
TEXT1</em>:TEXT2,
TEXT1</em> TEXT2-
Я попытался сделать так
Код:
(?<=TEXT1</em>.).*?(?=\.|\,|\-|\&nbsp;)
В результате обрабатывая текст в тестере регулярных выражений я получаю "TEXT2" или "пробелTEXT2", вроде бы все ок.
Но когда я попытался парсить из страницы, по получил "TEXT2 идальшевесьтекстстраницы"
 

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 450
Благодарностей
1 885
Баллы
113
А что во втором тексте? Если там одно слово без пробелов, то можно так сделать
Код:
(?<=TEXT1</em>[\.,:\s]+)\S+?(?=\.|\,|\-|\&nbsp;)
 
  • Спасибо
Реакции: olga.armalita

olga.armalita

Client
Регистрация
05.04.2014
Сообщения
194
Благодарностей
42
Баллы
28
Да одно слово, спасибо большое за помощь.
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
Код:
(?<=TEXT1</em>\W+)\w+
 
  • Спасибо
Реакции: olga.armalita

ksander

Client
Регистрация
17.06.2016
Сообщения
272
Благодарностей
34
Баллы
28
Вот лови тут точно найдешь что надо
 
  • Спасибо
Реакции: olga.armalita

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)