Разбираюсь сейчас с настройками источников прокси. Скопилось несколько вопросов.
Как составить регулярное выражение, если список прокси размещен в таблице ip port?
И вообще, регулярные выражения для парсинга прокси применяются к тексту, исходному коду или DOM?
Исходный код выглядит так:
</tr><tr id="4cf91b3bb9d9a" class="odd"><td>190.189.200.157</td>
<td class="port">8080</td>
<td>transparent</td>
или вот так:
<TD>82.207.46.197</TD>
<TD>3128</TD>
Т.е. Получается, что строка proxy не в одной строке, а в двух.
И еще, иногда, стандартные структуры рег. выражений срабатывают в конструкторе регулярных выражений, т.е - по отдельности, строка proxy, ip, port парсятся нормально, но при тесте в настройках источника - ничего не парсится. Похоже, я чего-то недопонимаю. Буду благодарен если объясните.
Как составить регулярное выражение, если список прокси размещен в таблице ip port?
И вообще, регулярные выражения для парсинга прокси применяются к тексту, исходному коду или DOM?
Исходный код выглядит так:
</tr><tr id="4cf91b3bb9d9a" class="odd"><td>190.189.200.157</td>
<td class="port">8080</td>
<td>transparent</td>
или вот так:
<TD>82.207.46.197</TD>
<TD>3128</TD>
Т.е. Получается, что строка proxy не в одной строке, а в двух.
И еще, иногда, стандартные структуры рег. выражений срабатывают в конструкторе регулярных выражений, т.е - по отдельности, строка proxy, ip, port парсятся нормально, но при тесте в настройках источника - ничего не парсится. Похоже, я чего-то недопонимаю. Буду благодарен если объясните.