Подскажите регулярку дял поиска предложения

one

Client
Регистрация
22.09.2015
Сообщения
6 805
Благодарностей
1 266
Баллы
113
Подскажите регулярку для поиска предложения состоящего из 1-2 слов. Сам что то не могу сочинить.
 

backoff

Client
Регистрация
20.04.2015
Сообщения
5 936
Благодарностей
6 403
Баллы
113
пример текста кинь, и пример того что надо вытащить, так просто не телепаты.
пока так

\S+ \S+
 

one

Client
Регистрация
22.09.2015
Сообщения
6 805
Благодарностей
1 266
Баллы
113
Негистронезависимо вдернуть предложения состоящие из 1-2слов.

Пример:
Слово слово, слово слово слово. Слово. Слово слово слово. слово. Слово слово - слово слово, слово слово слово. Слово слово. Слово слово слово.
 

backoff

Client
Регистрация
20.04.2015
Сообщения
5 936
Благодарностей
6 403
Баллы
113
регулярка: ((?<=\.\ )\S+(?=\.)|(?<=\.\ )\S+ \S+(?=\.))

 
  • Спасибо
Реакции: one

one

Client
Регистрация
22.09.2015
Сообщения
6 805
Благодарностей
1 266
Баллы
113
Спасибо огромное! Но тут я видимо не до думал. Не получилось задуманное. Надо все найденные слова заменить на прописные символы и удалить точку в конце слова.
 

one

Client
Регистрация
22.09.2015
Сообщения
6 805
Благодарностей
1 266
Баллы
113
А нет, так усложняется задача. Проще удалить эти предложения вобще из текста. Была мысль сохранить обьем текста исправив предложения.
 

backoff

Client
Регистрация
20.04.2015
Сообщения
5 936
Благодарностей
6 403
Баллы
113
ну если правильно понял, то вот.
и точки вроде ж удаляются.

Напиши, пример без исправлений (никогда не делай этого)
Пришли оригинальный текст, и что с ним надо сделать, на какие символы заменить

 
  • Спасибо
Реакции: one

one

Client
Регистрация
22.09.2015
Сообщения
6 805
Благодарностей
1 266
Баллы
113
Нет, не цепляет ничего. Опечатку со скобкой принял во внимание. Смотри.

Исходный текст:
- Слово слово, слово слово слово. Слово. Слово слово слово. слово. Слово слово - слово слово, слово слово слово. Слово слово. Слово слово слово.

Идеальный результат (слить слова найденных предложений с соседними предложениями):
- Слово слово, слово слово слово слово. Слово слово слово слово. Слово слово - слово слово, слово слово слово слово слово. Слово слово слово.

Не идеальный но приемлемый результат (удалить найденные предложения):
- Слово слово, слово слово слово. Слово слово слово. Слово слово - слово слово, слово слово слово. Слово слово слово.

Исходный текст не постоянен, он разный, но в нем периодически встречаются такие короткие предложения. Задача избавиться от коротких предложений в исходном тексте сохранив обьем текста или же плюнуть на обьем что не совсем желательно и просто удалить такие предложения. Текст хранится в переменной.
 

backoff

Client
Регистрация
20.04.2015
Сообщения
5 936
Благодарностей
6 403
Баллы
113
я понял.
если удалить, то вот в скрине выше пример приведен, в разделе "на что заменить" ничего не указываешь, и все.

а со слияниями сложнее, я тут наверно уже не помогу
 

one

Client
Регистрация
22.09.2015
Сообщения
6 805
Благодарностей
1 266
Баллы
113

backoff

Client
Регистрация
20.04.2015
Сообщения
5 936
Благодарностей
6 403
Баллы
113
для замены вот: ((?<=\.\ )\S+?\.|(?<=\.\ )\S+ \S+?\.)



 
  • Спасибо
Реакции: one

one

Client
Регистрация
22.09.2015
Сообщения
6 805
Благодарностей
1 266
Баллы
113
Спасибо! Правда один пробел лишний. Там надо наверное цеплять правый пробел тоже. Завтра уже порегулирую, устал, глаза слипаются.
 

backoff

Client
Регистрация
20.04.2015
Сообщения
5 936
Благодарностей
6 403
Баллы
113
да, немного недосмотрел, вот правильная регулярка: ((?<=\.)\ \S+?\.|(?<=\.)\ \S+ \S+?\.)
 
  • Спасибо
Реакции: one

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)