Как проверить список URL адресов на валидность?

sof

Client
Регистрация
15.04.2013
Сообщения
831
Благодарностей
185
Баллы
43
Вообщем задача такая. Имеется список Url адресов мне нужно реализовать такую задачу. Нужно чтобы ZennoPoster брал из списка по порядку нужный урл и проверял доступность адреса. В случае если сайт оказывается не работоспособным или временно не доступным то данный урл чтобы записывался в файл.

Если не тяжело расскажите все на пальчиках или пример шаба киньте. Просто немного в замешательстве и не знаю с чего начинать нужно.
 
Регистрация
31.07.2012
Сообщения
99
Благодарностей
14
Баллы
8
после перехода на данный урл можно парсить какой-нибудь уникальный текст на странице, уникальный для случая рабочего урл (или нерабочего урл). Соответственно, если текст найден - урл рабочий (или нерабочий). После сохраняете урл в нужный файл.
найти текст.png
 
  • Спасибо
Реакции: sof

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 340
Благодарностей
9 088
Баллы
113
я такую проверку делаю с помощью get-запроса и проверки какой ответ от сервера..
если ответ 200, то заносим в список валидных, если ответ отличный от 200, то в другой список..
(сортировки по ответу 200 - мне хватает, при необходимости можно проверять по другим ответам)
 
  • Спасибо
Реакции: Maria Arbuzova

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 340
Благодарностей
9 088
Баллы
113
вот шаблон, как иллюстрация:
(вместо сообщений вставите нужные вам действия)
 

Вложения

  • Спасибо
Реакции: sof

sof

Client
Регистрация
15.04.2013
Сообщения
831
Благодарностей
185
Баллы
43
Maria Arbuzova - пробовал я по вашему методу создавать но у меня что то возникают проблемы когда я в regex прописываю не одно слово для парсинга а 2-3 или более по примеру: вход\ регистрация\ статистика\ то при отладке программа пишет что таких слов не найдено. Хотя если вписывать 1 все находится. Возможно глюк программы не знаю. Но все равно спасибо за подсказку.

sergodjan66 - спасибо тебе многое узнал для себя нового. Действительно ценная информация
 

mdsurfer

Client
Регистрация
31.01.2012
Сообщения
52
Благодарностей
1
Баллы
8
Maria Arbuzova - пробовал я по вашему методу создавать но у меня что то возникают проблемы когда я в regex прописываю не одно слово для парсинга а 2-3 или более по примеру: вход\ регистрация\ статистика\ то при отладке программа пишет что таких слов не найдено. Хотя если вписывать 1 все находится. Возможно глюк программы не знаю. Но все равно спасибо за подсказку.

sergodjan66 - спасибо тебе многое узнал для себя нового. Действительно ценная информация
для парсинга одного из нескольких слов в regex нужно использовать немного другое условие (вход|регистрация|статистика|что-то там еще), таким образом он будет искать настранице наличие одного из любыъ этих слов
 

mdsurfer

Client
Регистрация
31.01.2012
Сообщения
52
Благодарностей
1
Баллы
8
Maria Arbuzova - пробовал я по вашему методу создавать но у меня что то возникают проблемы когда я в regex прописываю не одно слово для парсинга а 2-3 или более по примеру: вход\ регистрация\ статистика\ то при отладке программа пишет что таких слов не найдено. Хотя если вписывать 1 все находится. Возможно глюк программы не знаю. Но все равно спасибо за подсказку.

sergodjan66 - спасибо тебе многое узнал для себя нового. Действительно ценная информация
для парсинга одного из нескольких слов в regex нужно использовать немного другое условие (вход|регистрация|статистика|что-то там еще), таким образом он будет искать настранице наличие одного из любыъ этих слов
 
Регистрация
31.07.2012
Сообщения
99
Благодарностей
14
Баллы
8
sof, надо вход| регистрация| статистика
не слэш, а вертикальная черта, что и было показано на картинке)
 
  • Спасибо
Реакции: sof

frion-seo

Client
Регистрация
27.02.2011
Сообщения
538
Благодарностей
471
Баллы
63
а как забирать коды ошибок ? сортирую если не 200 то идем дальше и тут вопрос как проверить на значение от 300 до 399 ?? создавать массивы ? или еще как ??
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 714
Баллы
113
Соберите все заголовки которые вас устроят, объедините в регулярку а-ля (200|302|...), парсите первую строку ответа.
Если что нашли, идете дальше.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)