Взять ИКС штук предложений в теге h3. (Парсинг)

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 251
Благодарностей
219
Баллы
63
Дoбрый день. Всегo неделю пoльзуюсь зеннoпoстерoм a, шaблoны уже с прoстыню длиннoй)
Тaкoй вoпрoс. Есть стaтья. Я спaрсил ее текст,нaзвaние.
В ней рaсстaвлены зaгoлoвки h1,h2,h3.
h2 зaгoлoвкoв мaлo,пoэтoму я их вручную прoписaл сoбирaть,нo сейчaс зaхoтел еще h3.
a их oт 5 дo 20 и бoльше бывaет.
Для кaждoгo переменную тoже делaть не хoчу.
Мoя глaвнaя зaдaчa- пoлучить нa выхoде текст стaтьи, в кoтoрoм выделены все зaгoлoвки, кaк в oригинaльнoй стaтье.
Пoкa кaждый тег через свoй экшен и переменную сoбирaется, a пoтoм зaменoй выделяется в итoгoвoм вaриaнте спaршеннoй стaтьи.

Кaк мoжнo пoпрoще реaлизoвaть выделение кaждoгo h3 в plainText стaтьи в aвтoмaтическoм режиме?

Беру я их из статьи вот так



Вот они(теги h2) тут


Если все еще не понятно,что я делаю, то вот как я работаю с заголовками h2. (Аналогичное для h3 делать-это около 15 экшенов*2)




Кто разбирается, помогите пожалуйста.
 

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
901
Баллы
113
А вы парсите сразу весь текст между нужными тегами, и просто удаляйте потом оттуда все ненужные теги
 
  • Спасибо
Реакции: Dexio

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 251
Благодарностей
219
Баллы
63
А вы парсите сразу весь текст между нужными тегами, и просто удаляйте потом оттуда все ненужные теги
Я вообще не понял,что вы имели в виду).
Мне не только то,что в тегах нужно. Мне нужна статья вся, целиком+ выделить в ней все теги как положено. Основная проблема в том,что кол-во тегов h3 всегда разное и я именно не знаю как автоматизировать автовыделение всех h3.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 178
Баллы
113
Lexicon и я имеем ввиду, что нужно попробовать парсить всю статью целиком, а потом убирать все теги, кроме H..
тогда статья будет с заголовками, как исходная..
 
  • Спасибо
Реакции: Dexio

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 251
Благодарностей
219
Баллы
63
Lexicon и я имеем ввиду, что нужно попробовать парсить всю статью целиком, а потом убирать все теги, кроме H..
тогда статья будет с заголовками, как исходная..
"Парсить всю целиком". Я пробовал из html кода пробовать вырвать часть,где только статья и теги, но регуляркой не выходит.
Может я не туда смотрю и есть другие варианты вырвать чисто статью с тегами?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 178
Баллы
113
без самого пациента сложно что то подсказать заведомо рабочее..
по идее должен пристутствовать контейнер в виде таблицы или дива, в котором вся статья лежит целиком..
вот это контенйнер и надо выпарсить и потом очищать его от тегов, оставляя аш-теги..
 
  • Спасибо
Реакции: Dexio

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 251
Благодарностей
219
Баллы
63
без самого пациента сложно что то подсказать заведомо рабочее..
по идее должен пристутствовать контейнер в виде таблицы или дива, в котором вся статья лежит целиком..
вот это контенйнер и надо выпарсить и потом очищать его от тегов, оставляя аш-теги..
Я даже описать не могу в каком я восторге. Отличный совет, хоть я его и не сразу понял). Сейчас реализовал, в итоге теперь все берется как в контейнере оригинала, и ни о чем думать не надо. Это наредкость взаимовыручающий форум.
Спасибо за совет!
 
  • Спасибо
Реакции: Sergodjan

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 178
Баллы
113
Я даже описать не могу в каком я восторге. Отличный совет, хоть я его и не сразу понял). Сейчас реализовал, в итоге теперь все берется как в контейнере оригинала, и ни о чем думать не надо. Это наредкость взаимовыручающий форум.
Спасибо за совет!
обращайтесь.. :-)
 

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
901
Баллы
113
Волшебная сила котиков... ага...:dm:
 
  • Спасибо
Реакции: Sergodjan

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 178
Баллы
113

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)