парсинг

  • Автор темы Автор темы wpblog
  • Дата начала Дата начала

wpblog

Новичок
Регистрация
25.01.2011
Сообщения
46
Реакции
2
Баллы
0
Вот нигде не нашел темы про парсинг, может кто подскажет - мне нужно спарсить 1 строчку из текста что нужно сделать?:)
 
Для парсинга нужно составлять регулярное выражение. В Project Maker есть специальная закладка для составления выражений.
На форуме есть раздел регулярные выражения, где добрые люди помогают составить сложные регулярные выражения для парсинга. Но раздел доступен только для клиентов.
 
Для парсинга нужно составлять регулярное выражение. В Project Maker есть специальная закладка для составления выражений.
На форуме есть раздел регулярные выражения, где добрые люди помогают составить сложные регулярные выражения для парсинга. Но раздел доступен только для клиентов.
да рег выражение я смогу составить, я только не пойму как сам парсинг начать. вот допустим я зашел на страничку site.ru в Project Maker(для записи проекта) и мне нужно спарсить опред текст. какие мои действия что я сначала должен сделать? мне бы только основы парсинга узнать...
 
новая ветка шага: Get-WebBrowser-Получить исх. текст - В параметры вставляете регулярку
 
  • Спасибо
Реакции: Johny23
вопрос по теме, сделал регулярку, вставил ее в макрос:
новая ветка шага: Get-WebBrowser-Получить исх. текст - В параметры вставляете регулярку

при отладке пишет "Ничего не найдено при парсинге регулярным выражением step_id: ●9●5●2●8●9●1●; branch_id: ≡7≡9≡8≡7≡3≡6≡8≡0≡0≡", в конструкторе регулярка работает, с чем может быть связана ошибка?
 
вопрос по теме, сделал регулярку, вставил ее в макрос:


при отладке пишет "Ничего не найдено при парсинге регулярным выражением step_id: ●9●5●2●8●9●1●; branch_id: ≡7≡9≡8≡7≡3≡6≡8≡0≡0≡", в конструкторе регулярка работает, с чем может быть связана ошибка?

Возможно, в конструкторе регулярных выражений вы парсите из DOM-HTML или SOURCE HTML, а в шаблоне из TEXT. Проверьте чтобы тип исходного текста совпадал.
Если проблема не в этом, попробуйте в шаблоне создать ветку, берущую исходный текст страницы (без регулярного выражения). Затем в режиме отладки дойдите до этой ветки (которая берет исходный текст страницы) и в правой части программы скопируйте результат выполнения этой ветки, т.е. весь исходный текст. Вот этот текст и попробуйте парсить в конструкторе регулярных выражений.
 
  • Спасибо
Реакции: detanatar
Ребят, нужен совет. В конструкторе регулярных выражений, в окне "Результаты обработки" показываются все возможные совпадения (в моём случае это - около 20 на страницу). Но поле того, как вставляю полученное регулярное выражение в шаблон, то и в режиме отладки, и в режиме работы - отлавливается только самое первое совпадение, а не все, как это мне необходимо. В чём может быть дело?
 
(регулярка)-|-all
 
  • Спасибо
Реакции: kopsmika
Огромное спасибо!! Это то, что было нужно.
 
добавь -|-all

860ff506c1b2bc1d8f613f7d8bca15eb.png
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)