Выбрать строки из <table> построчно

play13

Client
Регистрация
12.07.2011
Сообщения
43
Благодарностей
3
Баллы
8
Доброго времени суток, подскажите пожалуйста, вот есть к примеру таблица состоящая из трех столбцов и трех строк (столбцы неизменны, а вот кол-во строк может меняться), подскажите как построчно спарсить данные из таблицы, вторые сутки ломаю голову(

примерно код таблицы выглядит вот так

Код:
<table>
    <thead>
      <tr>
        <th>1</th>
        <th>2</th>
        <th>3</th>
      </tr>
    </thead>
    <tbody>
        <tr>
            <th>
                    <a href="Link0">
                         Link0-Name
                        <span>Link0-Text</span>
                    </a>
            </th>
                <td>
                
                    <a href="Link0_1">
                        Link0_1-Text
                    </a>
                
                
             </td>
            <td>
               <div><a href="">Ne-Nu*no</a> </div>
            </td>
        </tr>
       

        <tr>
            <th>
                    <a href="Link1">
                         Link1-Name
                        <span>Link1-Text</span>
                    </a>
            </th>
                <td>
                
                    <a href="Link1_1">
                        Link1_1-Text
                    </a>
                
                
             </td>
            <td>
               <div><a href="">Ne-Nu*no</a> </div>
            </td>
        </tr>
    </tbody>
    <tfoot>
      <tr>
        <th>
          TheEnd
        </th>
        <td>
            TheEnd-Text
        </td>
        <td>&nbsp;</td>
      </tr>
      </tfoot>
    </table>
Итого на выходе нужно получить
Link0-Name + Link0-Text + Link0_1-Text
Link1-Name + Link1-Text + Link1_1-Text
LinkN-Name + LinkN-Text + LinkN_1-Text
И в конце TheEnd + TheEnd-Text

P/S/ Надеюсь понятно написал)
Заранее благодарен.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 714
Баллы
113
многоэтапный парсинг.
Сначала парсите все блоки лежащие в тегах <tr> и складываете в список
потом в цикле берете кажду строку и распарсиваете данные оттуда нужные регулярками + сохраняете в новую таблицу.
 
Последнее редактирование:

play13

Client
Регистрация
12.07.2011
Сообщения
43
Благодарностей
3
Баллы
8
многоэтапный парсинг.
Сначала парсите все блоки лежащие в тегах <th> и складываете в список
потом в цикле берете кажду строку и распарсиваете данные оттуда нужные регулярками + сохраняете в новую таблицу.
я так и понял, что легкого пути не будет(
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 714
Баллы
113
это не сложный путь.
Три регулярки написать. пробуйте. если что не получается, давайте разбираться что, но вместе. без готового решения. как пробуете, какую регулярку составляете, что не получается, что хотели получить и что получили.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)