Как спарсить все варианты совпадений?

ParfeniyAnton

Client
Регистрация
24.08.2014
Сообщения
301
Благодарностей
49
Баллы
28
Друзья, прошу помощи! Я хочу сделать парсер гостей в Одноклассниках, делаю это через конструктор действий. Выделяю нужные хтмл элементы их бывает по 4000 совпадений, чтобы спарсить все, в графе "№ совпадения" ложу переменную, которой с помощью счётчика увеличиваю значение. И получается чтобы спарсить несколько тысяч нужных мне записей уходит не мало так времени.

Собственно вопрос: Возможно ли каким-то образом собрать сразу же все возможные варианты совпадений по поиску элемента?
 

Radzhab

Client
Регистрация
23.05.2014
Сообщения
1 500
Благодарностей
1 268
Баллы
113
Можно регулярками запихнуть все это дело в Список
 
  • Спасибо
Реакции: ParfeniyAnton

ParfeniyAnton

Client
Регистрация
24.08.2014
Сообщения
301
Благодарностей
49
Баллы
28
Да, это именно и нужно, не понял каким образом применить регулярное выражение к этому вопросу( Поможете?
 

black_pariah

Client
Регистрация
08.09.2014
Сообщения
294
Благодарностей
91
Баллы
28
QIP Shot - Screen 020.png
 
  • Спасибо
Реакции: ParfeniyAnton

ParfeniyAnton

Client
Регистрация
24.08.2014
Сообщения
301
Благодарностей
49
Баллы
28
Спасибо за быстрые ответы, правда я не понял как это использовать. регулярные выражения ведь нельзя использовать (в отличии от переменных) в качестве номера совподения в конструкторе действий, к сожалению.
Регулярные выражение они ведь текст обрабатывают? вариант типа - спарсить весь код страницы, потом обработать его и вытащить ссылки нужном формате http://odnoklassniki.ru/profile/8888888 ? проблема в том, что если спарсить весь код со страницы, будет много левых ссылок, не нужных. ссылки которые мне нужны хорошо идентифицируются через конструктор действий по атрибуту class.
Вобщем, я пока не пришёл к решению!) жду помощи!)
 

black_pariah

Client
Регистрация
08.09.2014
Сообщения
294
Благодарностей
91
Баллы
28
напишите урл страницы на которой нужно спарсить и что нужно с неё выдрать?
 
Последнее редактирование:

Dailes

Client
Регистрация
27.05.2013
Сообщения
193
Благодарностей
76
Баллы
28
Не нужен конструктор действий.
Нужен Обработка текста - Regex. Указываем список куда парсим, в графе что парсим ставим {-Page.Dom-} или {-Page.Source-}. После чего пишем регулярку и указываем её в графу Regex. Для того чтобы её правильно написать открываем окошко Содержимое страницы. Оттуда копируем в конструктор регулярных выражений и подбираем нужное нам выражение. Если вы с этим не справитесь то человек выше моего сообщения, как я понял, готов вам помочь. Если не правильно понял - можете отписать мне в личку, поможем.
 

ParfeniyAnton

Client
Регистрация
24.08.2014
Сообщения
301
Благодарностей
49
Баллы
28
http://www.odnoklassniki.ru/guests - на этой странице отображаются люди, посещающие твою страницу од. у меня гостей ежедневно порядка 500, так как анкеты девушек. нужны ссылки на их профили в формате http://www.odnoklassniki.ru/profile/124141414124

Ребята, я правильно понял, что {-Page.Dom-} или {-Page.Source-} указывает на то что парсить нужно данные с активной вкладки?
Через тестер рег выражений составил простейшее выражение http://www.odnoklassniki.ru/profile/[0-9]*
в тестере вроде работает и дёргает корректно, ну и точные совпадения в коде страницы есть.

Я тут нашёл функцию - взять DOM и взять Source. Вобщем парсил эти данные со страницы нужной, но оказалось что именно нужную мне инфу он не спарсил.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
Друзья, прошу помощи! Я хочу сделать парсер гостей в Одноклассниках, делаю это через конструктор действий. Выделяю нужные хтмл элементы их бывает по 4000 совпадений, чтобы спарсить все, в графе "№ совпадения" ложу переменную, которой с помощью счётчика увеличиваю значение. И получается чтобы спарсить несколько тысяч нужных мне записей уходит не мало так времени.

Собственно вопрос: Возможно ли каким-то образом собрать сразу же все возможные варианты совпадений по поиску элемента?
Это только в PM там медленно потому что там отрисовка прохода шаблона. В ЯЗ все будет быстро, попробуйте
 

ParfeniyAnton

Client
Регистрация
24.08.2014
Сообщения
301
Благодарностей
49
Баллы
28
Простите, ЯЗ это что? обычный зеннопостер?)
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
пунтосвитчер исправил)
Да, ZP = ZennoPoster
 

ParfeniyAnton

Client
Регистрация
24.08.2014
Сообщения
301
Благодарностей
49
Баллы
28
Спасибо! А правильно ли я понял, что не получится спарсить все номера совпадений разом?
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
если подобрать правильную регулярку, можно спарсить все что угодно разом из Dom текста
 
  • Спасибо
Реакции: money4honey

money4honey

Client
Регистрация
19.06.2014
Сообщения
144
Благодарностей
46
Баллы
28
по регуляркам есть классная инфа, вот тут (линк, кстати в zenno wiki нашёл, слава админам :-))
если не влом, можно почитать. без регулярок всё равно никуда, но для начала можно юзать встроенный в zenno конструктор
 
  • Спасибо
Реакции: allnair

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)