парсинг

wpblog

Новичок
Регистрация
25.01.2011
Сообщения
46
Благодарностей
2
Баллы
0
Вот нигде не нашел темы про парсинг, может кто подскажет - мне нужно спарсить 1 строчку из текста что нужно сделать?:-)
 

koster

Client
Регистрация
30.09.2010
Сообщения
137
Благодарностей
3
Баллы
18
Для парсинга нужно составлять регулярное выражение. В Project Maker есть специальная закладка для составления выражений.
На форуме есть раздел регулярные выражения, где добрые люди помогают составить сложные регулярные выражения для парсинга. Но раздел доступен только для клиентов.
 

wpblog

Новичок
Регистрация
25.01.2011
Сообщения
46
Благодарностей
2
Баллы
0
Для парсинга нужно составлять регулярное выражение. В Project Maker есть специальная закладка для составления выражений.
На форуме есть раздел регулярные выражения, где добрые люди помогают составить сложные регулярные выражения для парсинга. Но раздел доступен только для клиентов.
да рег выражение я смогу составить, я только не пойму как сам парсинг начать. вот допустим я зашел на страничку site.ru в Project Maker(для записи проекта) и мне нужно спарсить опред текст. какие мои действия что я сначала должен сделать? мне бы только основы парсинга узнать...
 

LightWood

Moderator
Регистрация
04.11.2010
Сообщения
2 382
Благодарностей
916
Баллы
113
новая ветка шага: Get-WebBrowser-Получить исх. текст - В параметры вставляете регулярку
 
  • Спасибо
Реакции: Johny23

wpblog

Новичок
Регистрация
25.01.2011
Сообщения
46
Благодарностей
2
Баллы
0

Nirvana

Client
Регистрация
15.01.2011
Сообщения
48
Благодарностей
1
Баллы
0
вопрос по теме, сделал регулярку, вставил ее в макрос:
новая ветка шага: Get-WebBrowser-Получить исх. текст - В параметры вставляете регулярку
при отладке пишет "Ничего не найдено при парсинге регулярным выражением step_id: ●9●5●2●8●9●1●; branch_id: ≡7≡9≡8≡7≡3≡6≡8≡0≡0≡", в конструкторе регулярка работает, с чем может быть связана ошибка?
 

LightWood

Moderator
Регистрация
04.11.2010
Сообщения
2 382
Благодарностей
916
Баллы
113

step85

Client
Регистрация
19.02.2010
Сообщения
1 839
Благодарностей
287
Баллы
83
вопрос по теме, сделал регулярку, вставил ее в макрос:


при отладке пишет "Ничего не найдено при парсинге регулярным выражением step_id: ●9●5●2●8●9●1●; branch_id: ≡7≡9≡8≡7≡3≡6≡8≡0≡0≡", в конструкторе регулярка работает, с чем может быть связана ошибка?
Возможно, в конструкторе регулярных выражений вы парсите из DOM-HTML или SOURCE HTML, а в шаблоне из TEXT. Проверьте чтобы тип исходного текста совпадал.
Если проблема не в этом, попробуйте в шаблоне создать ветку, берущую исходный текст страницы (без регулярного выражения). Затем в режиме отладки дойдите до этой ветки (которая берет исходный текст страницы) и в правой части программы скопируйте результат выполнения этой ветки, т.е. весь исходный текст. Вот этот текст и попробуйте парсить в конструкторе регулярных выражений.
 
  • Спасибо
Реакции: detanatar

kopsmika

Новичок
Регистрация
14.02.2011
Сообщения
5
Благодарностей
0
Баллы
0
Ребят, нужен совет. В конструкторе регулярных выражений, в окне "Результаты обработки" показываются все возможные совпадения (в моём случае это - около 20 на страницу). Но поле того, как вставляю полученное регулярное выражение в шаблон, то и в режиме отладки, и в режиме работы - отлавливается только самое первое совпадение, а не все, как это мне необходимо. В чём может быть дело?
 

tonic

Client
Регистрация
07.08.2011
Сообщения
103
Благодарностей
50
Баллы
28
(регулярка)-|-all
 
  • Спасибо
Реакции: kopsmika

kopsmika

Новичок
Регистрация
14.02.2011
Сообщения
5
Благодарностей
0
Баллы
0
Огромное спасибо!! Это то, что было нужно.
 

mux76

Client
Регистрация
13.12.2010
Сообщения
259
Благодарностей
119
Баллы
43
добавь -|-all

860ff506c1b2bc1d8f613f7d8bca15eb.png
 

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)