Вопрос! Новичок создает элементарный парсер.

gentleq

Новичок
Регистрация
28.10.2014
Сообщения
28
Благодарностей
1
Баллы
3
Со страницы нужно собрать все необходимые строки с адресами сайтов и положить их в файл.

Определил все необходимые строки через конструктор действий. Но даже при указании в столбце (№ совпадения), значения "all", в переменную все равно кладется лишь один адрес сайта.

Как и что нужно сделать, что бы в переменную поместились сразу все результаты поиска, а не только один?

P.S. Прощу объяснить доступным языком, или пошагово)) Пересмотрел и перечитал все что можно, но так и не понял. Вроде нужно увеличивать счетчик переменной или... Помогите пожалуйста)
 

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 314
Благодарностей
5 869
Баллы
113

gentleq

Новичок
Регистрация
28.10.2014
Сообщения
28
Благодарностей
1
Баллы
3
Не хотел лезть в регулярки, но если вы говорите что так лучше...
А у Вас, совершенно случайно, нет простого парсера регулярками?)

То есть в данном случае, не нужно использовать конструктор действий, верно? Сразу обработка текста - regex? И что результат положиться в переменную как-то иначе?

Пример шаблона Bing парсера на форуме, уже устарел и выдает ошибку.
 

Ribas

Client
Регистрация
31.05.2014
Сообщения
1 401
Благодарностей
484
Баллы
83
Табы - данные - парсить результат. Регексом парсите нужные значения со страницы, в опциях что брать - указываете всё, кладёте в список и с ним уже работаете - можно как со списком построчно, можно объединить весь список в переменную, если требуется
 
  • Спасибо
Реакции: gentleq

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 314
Благодарностей
5 869
Баллы
113
Для парсинга с помощью регулярок используйте экшн Табы>Данные>Взять DOM - парсить результат. Там нужно прописать регулярку, которая и будет парсить нужные вам ссылки. Результат можно сложить в список.
Вы парсите с Bing я так понимаю?
 
  • Спасибо
Реакции: gentleq

gentleq

Новичок
Регистрация
28.10.2014
Сообщения
28
Благодарностей
1
Баллы
3
Вы парсите с Bing я так понимаю?
Bing взял как для примера, что бы в случае чего, можно было поделиться шаблоном для редактирования.
Вообще нужно собрать все внешние ссылки своих сайтов, из статистики Яндекс.


Нашел регулярку от "Rostonix"
Код:
(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?
Работает, но собирает все ссылки. А мне нужно собрать только активные ссылки из списка(подчеркнуто синим). Можно ли как-то точнее отсортировать?

Вообще что бы составлять такие "дикие" строки для регулярок, нужно изучить регулярные выражения? или есть готовые?))



И последний вопрос. В большинстве случаев, лучше парсить через (Табы>Данные>Взять DOM - парсить результат)??? Если нужно, допустим, собрать статьи, заголовки, или активные ссылки.?
 

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 314
Благодарностей
5 869
Баллы
113
Конечно нужно изучать регулярные выражения, готовые на все случаи жизни вам никто не составит. Но в них ничего сложного нет. Уже прочитав справку можно составлять простейщие выражения - https://wiki.zennolab.com/doku.php?id=ru:creating-a-regular-expressions . А с конструктором регулярок в Zenno это вообще просто - нужно указать с чего начинается строка и чем заканчивается, софт сам составит выражение за вас.
По каким критериям вы определяете, что ссылка именно на ваш сайт? в слепую по картинке я вам ничего не смогу подсказать. Нужен кусок кода, образец ссылки и по каким критериям отбирается.
 
  • Спасибо
Реакции: gentleq

gentleq

Новичок
Регистрация
28.10.2014
Сообщения
28
Благодарностей
1
Баллы
3
Огромное Вам спасибо!!!) Уже разобрался.
Тестер рег. выражений, реально облегчает все до предела)

Для тех кто не разобрался.
Ищем в DOM-коде теги, которые обрамляют интересующие Вас ссылки или текст. После копируем и вставляем их в тестер рег. выражений, в соответствующие поля. Тестируем и получаем долгожданную регулярку.

Еще раз спасибо!):ax:
 

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 314
Благодарностей
5 869
Баллы
113
Рад. что разобрались.
 

vrnsalesite

Client
Регистрация
17.05.2015
Сообщения
81
Благодарностей
13
Баллы
8

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)