Взять список адресов из таблицы

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Здравствуйте.

Надоело вручную ковырять мегаиндекс https://www.megaindex.ru/, решил сделать шаблон - парсер профилей и сразу столкнулся с проблемой. Не получается взять урлы из столбца "страница", чтобы потом положить его в список и парсить нужные данные по значению адреса.

Кто подскажет как сделать?

Шаблон прикрепил, скрин тоже))
 

Вложения

backoff

Client
Регистрация
20.04.2015
Сообщения
6 054
Благодарностей
6 482
Баллы
113
пример скрина, хорошо, но еще бы приимер html кода надо... регистрироваться нет желания.

а так можно регулярками выпашивать
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
пример скрина, хорошо, но еще бы приимер html кода надо... регистрироваться нет желания.

а так можно регулярками выпашивать
В шаблоне стоят данные аккаунта, можно открыть шаблон и он выполнит все действия до таблицы
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 054
Благодарностей
6 482
Баллы
113

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
упс))

Не сохранил
 

Вложения

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Блин
 

Вложения

backoff

Client
Регистрация
20.04.2015
Сообщения
6 054
Благодарностей
6 482
Баллы
113


Код:
(?<=<td\ style="text-align:\ left;">.*?<a\ href=").*(?="\ target="_blank")
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Благодарствую, буду дальше колупать шаблон:bi:
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Можно кубиком прислать решение?
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 054
Благодарностей
6 482
Баллы
113
неправильную регулярку дал, исправил, вот новая + проект
Код:
(?<=<td\ style="text-align:\ left;">.*?<a\ href=").*?(?=")
 

Вложения

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Грациа мерси!
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
неправильную регулярку дал, исправил, вот новая + проект
Код:
(?<=<td\ style="text-align:\ left;">.*?<a\ href=").*?(?=")
создаю регулярку (?<=users).*(?=/) чтобы брала только адреса профилей, что то идет не так, берет только часть адреса, а мне надо весь))
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Например в списке есть профиль http://heavymusic.ru/users/6701/, его находит по запросу users и взять весь адрес
 

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 418
Благодарностей
5 454
Баллы
113
@lesssss81 Писать сообщения подряд запрещено правилами.
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 054
Благодарностей
6 482
Баллы
113

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 418
Благодарностей
5 454
Баллы
113

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Мне не в лом. тебе же не в лом ему помогать.
Я не настаиваю на помощи. Есть у меня примерно решение, спарсить участки адреса до "users" и после, потом объединить все в кубике "переход на страницу"
Может есть проще решение?
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 054
Благодарностей
6 482
Баллы
113
решение заключается в том, чтобы не писать загадками, так как тут нет экстрасенсов ...
хочешь помощи, напиши нормально по пунктам что да как с примерами
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
решение заключается в том, чтобы не писать загадками, так как тут нет экстрасенсов ...
хочешь помощи, напиши нормально по пунктам что да как с примерами
)))
Спарсить список ссылок получилось, теперь из списка требуется взять адреса с значением "users" и положить в список.

Например в адресе http://heavymusic.ru/users/6701/ я спарсил до "users" и после, отправил в список, теперь бы сделать логическое "если", потому что в текстовом документе получается большие отступы.
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Как сделать, чтобы если не находит нужное значение "users" то начинал сначала?
 

Вложения

  • 25,1 КБ Просмотры: 449

backoff

Client
Регистрация
20.04.2015
Сообщения
6 054
Благодарностей
6 482
Баллы
113
используй конструктор регулярок F3
там все просто
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Сделал пример, на чем споткнулся, так то все парсит, только в итоге получается в текстовом документе большие отступы, потому что работает добавление в список даже если ничего нет
 

Вложения

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 433
Благодарностей
9 128
Баллы
113
Сделал пример, на чем споткнулся, так то все парсит, только в итоге получается в текстовом документе большие отступы, потому что работает добавление в список даже если ничего нет
После парсинга можно применить действие:

upload_2018-4-22_14-57-48.png
 

lesssss81

Client
Регистрация
10.03.2017
Сообщения
685
Благодарностей
32
Баллы
28
Отлично!
Спасибо большое)))
 
  • Спасибо
Реакции: Mikhail B. и Sergodjan

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)