Подскажите как реализовать чекер

wekze

Client
Регистрация
14.12.2015
Сообщения
25
Благодарностей
1
Баллы
3
Сделал зенкой много страничек, сохранил все урлы этих страниц в формате для спама хрумером:

Но проблема в том, что не все странички создались правильно, а другие вообще удалили или убрали ссылки.
Как мне прочекать весь список этих ссылок?
Для начала надо как то выдрать урл из всей строки, ну это наверняка регуляркой, потом проверить страницу согласно моим критериям, а как потом удачные страницы в текстовичёк good сохранить (тоесть, найденные странички, которые сделанные правильно и не удалены) именно всю эту строку? вот не соображу никак. Подскажите пожалуйста
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
В цикле брать построчно. Сначала парсить URL, делать к нему GET запрос, регуляркой в ответе на запрос искать подтверждение наличия валидных данных, если найдены, записывать в новый список строку.
Что именно не получилось и на каком этапе?
 
  • Спасибо
Реакции: wekze

wekze

Client
Регистрация
14.12.2015
Сообщения
25
Благодарностей
1
Баллы
3
В цикле брать построчно. Сначала парсить URL, делать к нему GET запрос, регуляркой в ответе на запрос искать подтверждение наличия валидных данных, если найдены, записывать в новый список строку.
Что именно не получилось и на каком этапе?
Так вот, как из строки
Код:
[url=http://site.com/title]title[/url]
, спарсить http://site.com/title ?
 

ibred

Client
Регистрация
04.04.2015
Сообщения
3 835
Благодарностей
3 545
Баллы
113
  • Спасибо
Реакции: wekze

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)