Взять определенные атрибуты в DOM

Регистрация
09.11.2015
Сообщения
264
Благодарностей
10
Баллы
18
Скажите пожалуйста, возможно ли в зенке взять с дома например все теги а?
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Регистрация
09.11.2015
Сообщения
264
Благодарностей
10
Баллы
18
Отлично. А как? Мне это в дереве сделать можно?
 

Вложения

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Регистрация
09.11.2015
Сообщения
264
Благодарностей
10
Баллы
18
Мне нужно с разных сайтов собирать все ссылки, они находятся в теге "а", регуляркой собирается куча мусора.
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Мне нужно с разных сайтов собирать все ссылки, они находятся в теге "а", регуляркой собирается куча мусора.
значит, скорей всего, регулярка плохо составлена.. я сейчас занимаюсь похожей задачей(тоже паршу базу сайтов)... так, что бы составить норм регулярку(сам не умею).. я тут народу пару дней мозг выносил)))
кстати... ваши сайты на одном движке?? или разные?
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
и еще.. помоему, что б выпарсить все ссылки с любого сайта .. достаточно этого: (?<=href=").*?(?=") хотя, может я и ошибаюсь
 
Регистрация
09.11.2015
Сообщения
264
Благодарностей
10
Баллы
18
Нет сайты все разные, точно не на одном движке. Регулярка все равно много мусора собирает. За регулярку спасибо тебе.
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 415
Благодарностей
5 454
Баллы
113
И как много сайтов? делайте под каждый регулярку.
 
Регистрация
09.11.2015
Сообщения
264
Благодарностей
10
Баллы
18
Рекламные сайты в ютубе, под все сделать не получится.
Вот например //yastatic.net/promo-tr-test/0.0.360/desktop.bundles/raw/_raw.css
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Рекламные сайты в ютубе, под все сделать не получится.
Вот например //yastatic.net/promo-tr-test/0.0.360/desktop.bundles/raw/_raw.css
это пример мусора? по моему это ссылка из тега <a именно это вам и нужно, судя по первому посту
 
  • Спасибо
Реакции: Mikhail B.
Регистрация
09.11.2015
Сообщения
264
Благодарностей
10
Баллы
18
Да, точно. Извини, туплю))
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Регистрация
09.11.2015
Сообщения
264
Благодарностей
10
Баллы
18
А есть регулярка которая будет охватывать домен в ссылке?
 

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 415
Благодарностей
5 454
Баллы
113

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
А есть регулярка которая будет охватывать домен в ссылке?
я это делаю не регуляркой .. а старым макросом от зенно 3 разделение строки: {-String.Split-|-строка-|-символ по которому делим-|-номер подстроки-}
в экшн обработка текста прописываешь данный макрос, в поле "строка" переменную с полной ссылкой, откуда нужно выдрать домен, символ по которому делим "/" номер подстроки 2 сохраняй в переменную ... вот тебе и домен...
пы сы да простят меня злые админы за рекламу старых макросов ... ))))))
 
  • Спасибо
Реакции: Mikhail B.

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)