Составить три простые регулярки

djamv

Client
Регистрация
21.12.2015
Сообщения
22
Благодарностей
0
Баллы
1
В странице идет строка которая начинается с <td >, уже легче. Остальные <td> без пробела.
<td >Пупкин Василий Иванович
Василий регуляркой взять могу (?<=<td\ >).*?(?=\ )

Как взять отдельно Василий и отдельно Иванович?
 
Последнее редактирование:

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 630
Благодарностей
8 768
Баллы
113
Василий Иванович можно вот так взять:

upload_2016-4-28_1-16-0.png


дальше уже проще разделить..
 

djamv

Client
Регистрация
21.12.2015
Сообщения
22
Благодарностей
0
Баллы
1

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 630
Благодарностей
8 768
Баллы
113
У меня тоже получилось взять Василий Иванович. А как разделить?
первое слово: .*(?=\ )
второе: (?<=\ ).*

или загнать в список с разделителем в виде пробела и взять первую и вторую строку, или первую два раза, но с удалением..
 

Mikhail B.

Moderator
Регистрация
23.12.2014
Сообщения
14 344
Благодарностей
5 433
Баллы
113
Пупкин будет меняться?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 630
Благодарностей
8 768
Баллы
113

doc

Client
Регистрация
30.03.2012
Сообщения
8 621
Благодарностей
4 607
Баллы
113
(?<=<td\ >\w+\s+)\w+
(?<=<td\ >(\w+\s+){2,2})\w+
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 621
Благодарностей
4 607
Баллы
113

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)