Спарсить все урлы на странице

tatarin

Client
Регистрация
28.10.2012
Сообщения
805
Благодарностей
137
Баллы
43
Не подскажете как спарсить все урлы, которые под кнопкой "Visit" 1.jpg
 

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
901
Баллы
113
буду сегодня злым и недобрым)
Используйте конструктор регулярных выражений
все после href=" и перед ">Visit самое короткое совпадание - и есть искомая регулярка. А если вопрос был в том как вообще это все парсить -
Операции с браузером - взять DOM - парсить результат и при помощи получившейся регулярки нужные ссылки упадут в список
 

tatarin

Client
Регистрация
28.10.2012
Сообщения
805
Благодарностей
137
Баллы
43
Да спасибо большое, как раз нужно было как спарсить. Только проблема с регуляркой, она первый и последний урл спарсивает нормально, а между ними код еще берет.
 

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
901
Баллы
113
надо поставить галочку - самое короткое сопадение)) и где то там заменится .* на .*?
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)