Парсинг определенных строк

  • Автор темы Автор темы Ivanыч
  • Дата начала Дата начала

Ivanыч

Новичок
Регистрация
31.10.2011
Сообщения
6
Реакции
0
Баллы
0
Приветствую!

Есть примерно такой исходный код:

Код:
Развернуть Свернуть Копировать
<tr style="bla bla"><td>*</td><td>1</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td></td><td>2</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td></td><td>3</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td>*</td><td>4</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td>*</td><td>5</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td></td><td>6</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td></td><td>7</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>

прим. на 1, 4, 5 строке есть звездочки

Задача составить список из "еще бла бла бла", где есть звездочка. Как выбрать эти строки и сохранить в файл?
 
получить исходный текст страницы > параметры \<tr.*\*.*tr\>
 
Сделал это двумя регвырами. Первый выделяет все строки со звездочкой, а второй дергает из них "еще бла бла"
Приложил шаблон
Посмотреть вложение couple_regexps.xml
 
  • Спасибо
Реакции: Ivanыч
shinigami, огромнейшее спасибо! буду изучать)


Эм.. извиняюсь, я не указал, что около звездочки могут быть (а могут и не быть) разные значения:

Код:
Развернуть Свернуть Копировать
<tr style="bla bla"><td>363*</td><td>1</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td></td><td>2</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td></td><td>3</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td>87*</td><td>4</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td>*</td><td>5</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td></td><td>6</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>
<tr style="bla bla"><td></td><td>7</td><td>бла бла бла</td><td>еще бла бла бла</td></tr>

Т.е. интересует именно само наличие этой звездочки в строке, а не повторяющийся код...
 
shinigami, эм.. а где он, подправленный шаблон? :) что-то не вижу...
 
Спасибо!

Теперь мне нужно это все спарсить с сайта и сохранить в файл.

Я делаю так:
1 ветвь: Переход на страницу
2 ветвь: Получение исходного кода результата ветви 1
3 ветвь: Парсинг с помощью "Макрос, парсящий входную строку регулярными выражениями" результата ветви 2
4 ветвь: Сохранение в файл результат ветви 3, с помощью макроса "Записать строку в файл"

Все правильно?
 
увы, ни с исходным кодом, ни DOMом не работает.

на 3м шаге результата нет (хотя регулярное выражение работает, тестировал через конструктор)
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)