Помогите с регулярными выражения

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18
Необходимо спарсить сначала title из поисковой выдачи Яндекса, а затем весть текст, для title прописал <b\ class="needsclick">.*?(?=</a>) но парсится лишний текст, при сохранении имеет такой вид <b class="needsclick">футбол</b> а нужно что только заголовки сохранял.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 416
Благодарностей
9 120
Баллы
113
Необходимо спарсить сначала title из поисковой выдачи Яндекса, а затем весть текст, для title прописал <b\ class="needsclick">.*?(?=</a>) но парсится лишний текст, при сохранении имеет такой вид <b class="needsclick">футбол</b> а нужно что только заголовки сохранял.
с помощью экшена Обработка текста -> Замена замените в режиме Regex <[^>]*> на пустоту..
останется только текст..
 
  • Спасибо
Реакции: asgard

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18
с помощью экшена Обработка текста -> Замена замените в режиме Regex <[^>]*> на пустоту..
останется только текст..
Спс, а чтобы еще удалить такие символы (» ") из текста что нужно прописать.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 416
Благодарностей
9 120
Баллы
113
  • Спасибо
Реакции: asgard

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18
как вариант тоже через экшен замены, в режиме regex [\(\)"»] заменить на пустоту..
отлично, лишние удаляет)

еще вопрос есть, если захочу удалить еще символы после парсинга « () можно будет так дописать регулярку [\(\)"«»()]
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 416
Благодарностей
9 120
Баллы
113
отлично, лишние удаляет)

еще вопрос есть, если захочу удалить еще символы после парсинга « () можно будет так дописать регулярку [\(\)"«»()]
[\(\)"»] - эта регулярка уже содержит скобки, вот такую надо [\(\)"«»]
 

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18
Теперь возник вопрос создания регулярного выражения для парсинга результаты поисковой выдачи в Яндексе, что бы можно было сохранить название заголовков и описание, без ссылок.

 

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18
С предыдущей задачей разобрался, теперь нужно с помощью Замены удалить все анг. слова из текста попробовал прописать [(A-Z)] но удаляет только первые буквы в словах.
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113
С предыдущей задачей разобрался, теперь нужно с помощью Замены удалить все анг. слова из текста попробовал прописать [(A-Z)] но удаляет только первые буквы в словах.
[A-Za-z]
 
  • Спасибо
Реакции: asgard

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18
Еще есть, вопрос как прописать удаление множества разных символов с помощью замены, нужно удалить такие символы: › ... _ _ · -. . - - ←→ .. , сам пробовал так прописать все [› ... _ _ · -. . - - ←→ .. ,] но что то не удаляет.
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113
[\S] попробуйте так, любой символ кроме пробела
 

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18
Нашел регулярку как удалить все символы [\W] можно ли к не прописать, что бы . и , она не удаляла
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113
[^a-zA-Z\sа-яА-Я,.] незнаю что нахимичил но удаляет все символы кроме бкув и , .
 
Последнее редактирование:
  • Спасибо
Реакции: asgard

asgard

Client
Регистрация
09.09.2014
Сообщения
116
Благодарностей
5
Баллы
18

Кто просматривает тему: (Всего: 9, Пользователи: 0, Гости: 9)