- Регистрация
- 19.06.2013
- Сообщения
- 36
- Благодарностей
- 4
- Баллы
- 8
Прошу помочь. Всю голову сломал.
Требуется регуляное выражение для выдергивания правильных предложений из текста. Т.е. предложение должно начинаться с большой буквы, заканчиваться знаком пунктации [.!?]. Сейчас такая регулярка у меня:
[A-Z0-9].*?[.!?]{1,3}\s
Проблема в том, что она захватывает предложения, где между последним символом и знаком препинания могут быть пробелы. Нужно чтобы брало только предложения, где перед "точкой" в конце не стоит "пробел" и всякий мусор типа запятых. В тексте много поломаных предложений, обрывающихся после союзов и т.п.
Всем спасибо за помощь!
Требуется регуляное выражение для выдергивания правильных предложений из текста. Т.е. предложение должно начинаться с большой буквы, заканчиваться знаком пунктации [.!?]. Сейчас такая регулярка у меня:
[A-Z0-9].*?[.!?]{1,3}\s
Проблема в том, что она захватывает предложения, где между последним символом и знаком препинания могут быть пробелы. Нужно чтобы брало только предложения, где перед "точкой" в конце не стоит "пробел" и всякий мусор типа запятых. В тексте много поломаных предложений, обрывающихся после союзов и т.п.
Всем спасибо за помощь!