Сбор ссылок с сайта на ASP.NET

Регистрация
23.03.2015
Сообщения
1 170
Благодарностей
691
Баллы
113
Привет мужики, выручайте

Есть задача собрать данные с сайта https://www.globalair.com/
Как оказалось он на asp.net. Инфу дёргать получается, а вот собрать ссылки, дл этого, нет
Файла sitemap.xml нет, в поиске нужных страниц нет.

Подскажите решение. Пожалуйста.
 

Buch

Client
Регистрация
15.02.2016
Сообщения
260
Благодарностей
75
Баллы
28
Привет! Если ссылок не особо много можно расширение для хрома попробовать. linkgopher. Иногда пользуюсь.
 
  • Спасибо
Реакции: KolkaPetkinSyn
Регистрация
23.03.2015
Сообщения
1 170
Благодарностей
691
Баллы
113

Buch

Client
Регистрация
15.02.2016
Сообщения
260
Благодарностей
75
Баллы
28
  • Спасибо
Реакции: KolkaPetkinSyn
Регистрация
23.03.2015
Сообщения
1 170
Благодарностей
691
Баллы
113

arhip1985

Client
Регистрация
31.10.2011
Сообщения
2 989
Благодарностей
786
Баллы
113
как вариант - кликать на каждый див самолёта переходить на страницу брать урл - и закрывать её и так далее, в однопоточном режиме будет работать.
тут дело не в том, что асп, а в том что переход на самолёт жс направляет, а не ссылка в штмл
 
  • Спасибо
Реакции: KolkaPetkinSyn

Buch

Client
Регистрация
15.02.2016
Сообщения
260
Благодарностей
75
Баллы
28
  • Спасибо
Реакции: KolkaPetkinSyn

ibred

Client
Регистрация
04.04.2015
Сообщения
3 835
Благодарностей
3 550
Баллы
113
Нет.
Допустим от сюда https://www.globalair.com/aircraft-for-sale/Citation-Bravo
нужны ссылки на все самолёты. Идеи есть, но много ручного труда
Как бы сделал я, исходя из контексте этой задачи:

Ссылка на каталог выглядит так: https://www.globalair.com/aircraft-for-sale/Citation-Bravo
Ссылка на самолёт: https://www.globalair.com/aircraft-for-sale/ListingDetail/Citation-Bravo?AdId=XXXXX

Подробная ссылка нам недоступна из исходного кода, но мы можем сформировать её самостоятельно.
Для этого с помощью регулярных выражений и замены добавляем /ListingDetail/ перед названием модели самолёта.

Далее нам нужен его ID, который можно найти здесь:


Парсим данный элемент, забирая только цифры.
Формируем ссылку:
Код:
https://www.globalair.com/aircraft-for-sale/ListingDetail/Citation-Bravo?AdId={-Variable.ID-}
 
  • Спасибо
Реакции: grin-du и KolkaPetkinSyn
Регистрация
23.03.2015
Сообщения
1 170
Благодарностей
691
Баллы
113
Там формирование ссылок идёт с помощью добавление в урл категории слова ListingDetail и ?AdId=83666 где 83666 номер страниц объявления и эти номер есть в коде категории. Сейчас осталось придумать как листать страницы категории где их несколько
 
Регистрация
23.03.2015
Сообщения
1 170
Благодарностей
691
Баллы
113
ну прям с языка сняли:-)
Всем большое спасибо
 

ibred

Client
Регистрация
04.04.2015
Сообщения
3 835
Благодарностей
3 550
Баллы
113
Там формирование ссылок идёт с помощью добавление в урл категории слова ListingDetail и ?AdId=83666 где 83666 номер страниц объявления и эти номер есть в коде категории. Сейчас осталось придумать как листать страницы категории где их несколько
Там ничего придумывать не нужно, перелистывание реализовано "табами".
Все элементы доступны на первой странице, в чём можете убедиться самостоятельно.
Перейдите на страницу категории и кликните на вторую страницу:
https://www.globalair.com/aircraft-for-sale/Citation-Bravo

И возьмите AdId последнего самолёта (82884).
Далее откройте исходный код категории и увидите, что этот ID есть в исходном коде.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)