Помогите с регуляркой

Alexander

Client
Регистрация
01.10.2014
Сообщения
77
Благодарностей
6
Баллы
8
Есть список доменов видана, пример
site1.com/ssilka
site2.com/cat1/ssilka
site1.com/cat1/cat2/ssilka
мне нужно найти строки только у которых есть категория, т.е. ссылки вида
site2.com/cat1/ssilka
site1.com/cat1/cat2/ssilka
либо удалить ссылки из списка у которых нет категорий и каталогов
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113

Alexander

Client
Регистрация
01.10.2014
Сообщения
77
Благодарностей
6
Баллы
8
пробую по данной регулярки удалять строки из списка, не удаляются
 

sergboss

Client
Регистрация
19.09.2016
Сообщения
52
Благодарностей
3
Баллы
8
Подскажите и мне с регулярной не получается составить.
есть html код
HTML:
<div class="cloud clr br5">
                    текст с html кодом который нужно парсить
                                                <div class="clr">
                                                        <a class="raport tdnone cb90404 fright block small userBlock" href="#blockUser">
                                <span class="icon inlblk userban vtop margintop1">&nbsp;</span> <span class="hvline">Заблокировать</span>
                            </a>
                                                    </div>
                                            </div>
сколько вариантов не пробовал ничего не выходит ((
 

Alexander

Client
Регистрация
01.10.2014
Сообщения
77
Благодарностей
6
Баллы
8
(?<=<div\ class="cloud\ clr\ br5">)[\w\W]*?(?=<div\ class="clr">)
 

sergboss

Client
Регистрация
19.09.2016
Сообщения
52
Благодарностей
3
Баллы
8
(?<=<div\ class="cloud\ clr\ br5">)[\w\W]*?(?=<div\ class="clr">)
не работает
Прикол в том что когда я первый раз составлял у меня формула была точно такая же и в конструкторе рег. выражений всё работал.
Но после запуска отладки перестала извлекать данные. При повторной проверки выражение не работало (((
 

sergboss

Client
Регистрация
19.09.2016
Сообщения
52
Благодарностей
3
Баллы
8
точнее у меня было (?<=<div\ class="cloud\ clr\ br5">)[\w\W]*?(?=</div>)
Хочу понять почему не работает в чем проблема ?? и как правильно.
извлечь нужно сообщение которые приходят на olx.ua
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113
Подскажите и мне с регулярной не получается составить.
есть html код
HTML:
<div class="cloud clr br5">
                    текст с html кодом который нужно парсить
                                                <div class="clr">
                                                        <a class="raport tdnone cb90404 fright block small userBlock" href="#blockUser">
                                <span class="icon inlblk userban vtop margintop1">&nbsp;</span> <span class="hvline">Заблокировать</span>
                            </a>
                                                    </div>
                                            </div>
сколько вариантов не пробовал ничего не выходит ((
откуда получен этот код? dom, sorce, через конструктор или вообще левы браузер?
 

sergboss

Client
Регистрация
19.09.2016
Сообщения
52
Благодарностей
3
Баллы
8

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 714
Баллы
113
Сесли работает при записи, а потом при прогоне не работает значит что то меняется в коде. Нужно сравнивать
 

sergboss

Client
Регистрация
19.09.2016
Сообщения
52
Благодарностей
3
Баллы
8
Сесли работает при записи, а потом при прогоне не работает значит что то меняется в коде. Нужно сравнивать
Сейчас никак не работает на этой стр. и именно с этим участком кодом.
 

sergboss

Client
Регистрация
19.09.2016
Сообщения
52
Благодарностей
3
Баллы
8
Прошу прощение за частые посты.
проблема в том что
HTML:
<div class="cloud clr br5">
встречается 3 раза а нужно только одно значение парсить

в котром после кода идёт сразу текст а в других вариантах идёт другой html код
пробовал составлять регулярку в таком виде :
(?<=<div\ class="cloud\ clr\ br5">\(\[\\n\\t]\+\)\?<p>)[\w\W]*(?=</p>)

Добавлял \n с новой строки и \t табуляцию есть или нет
тоесть хотел захватить только код
HTML:
<div class="cloud clr br5">тут есть табуляции и с новой строки или нет как где<p>текст</p>
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)