Спарсить все урлы на странице

  • Автор темы Автор темы tatarin
  • Дата начала Дата начала

tatarin

Client
Регистрация
28.10.2012
Сообщения
945
Реакции
164
Баллы
43
Не подскажете как спарсить все урлы, которые под кнопкой "Visit" 1.jpg
 
буду сегодня злым и недобрым)
Используйте конструктор регулярных выражений
все после href=" и перед ">Visit самое короткое совпадание - и есть искомая регулярка. А если вопрос был в том как вообще это все парсить -
Операции с браузером - взять DOM - парсить результат и при помощи получившейся регулярки нужные ссылки упадут в список
 
Да спасибо большое, как раз нужно было как спарсить. Только проблема с регуляркой, она первый и последний урл спарсивает нормально, а между ними код еще берет.
 
надо поставить галочку - самое короткое сопадение)) и где то там заменится .* на .*?
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)