Есть ли способы реализации пунктуации в тексте

Deadman

Client
Регистрация
24.09.2011
Сообщения
75
Благодарностей
3
Баллы
8
Здравствуйте, вопрос к знатокам, есть ли способы реализовать пунктуацию в тексте, ну или хотя бы как-то определить начало и конец предложения, если исходник просто массив текста, без каких-либо знаков препинания? Вопрос актуален как под текст на русском, так и на английском.
Может сервисы есть какие хитрые?
 

gevolushn

Известная личность
Регистрация
25.03.2019
Сообщения
518
Благодарностей
269
Баллы
63
Последнее редактирование:

Deadman

Client
Регистрация
24.09.2011
Сообщения
75
Благодарностей
3
Баллы
8
да чёт вопрос регулярки не решают, тут надо какой-то хитрый код, с кучей баз, чтобы предложение более-мене смысловое делало
пробовал делить по 8-10 слов на предложение, но чёт всё кривое по смыслу выходит.
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 375
Благодарностей
2 040
Баллы
113
обратись да купи в чём проблема ?
 

Deadman

Client
Регистрация
24.09.2011
Сообщения
75
Благодарностей
3
Баллы
8

Meteorburn

Client
Регистрация
23.05.2016
Сообщения
1 472
Благодарностей
575
Баллы
113

Deadman

Client
Регистрация
24.09.2011
Сообщения
75
Благодарностей
3
Баллы
8

arhip1985

Client
Регистрация
31.10.2011
Сообщения
2 994
Благодарностей
787
Баллы
113
регулярка предложения от начала до конца - (?<=(^|\n|(\. |! |\? )))[A-ZА-Я].*?([\.]|[!]|[?])(?=( |$|\n))
 

arhip1985

Client
Регистрация
31.10.2011
Сообщения
2 994
Благодарностей
787
Баллы
113
надо бы добавить сюда ещё многоточие и другие варианты конца предложения, если они есть. типа ?! и прочего, не помню все
когда разбили уже по предложением, то в каждом предложении можно разделить регуляркой на части
 
Последнее редактирование:

Deadman

Client
Регистрация
24.09.2011
Сообщения
75
Благодарностей
3
Баллы
8
надо бы добавить сюда ещё многоточие и другие варианты конца предложения, если они есть. типа ?! и прочего, не помню все
когда разбили уже по предложением, то в каждом предложении можно разделить регуляркой на части
тут фишка в том, что знаков препинания в исходнике вообще нету, в этом и проблема. Пока единственное решение, это нанять исполнителя, который вручную будет расставлять.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)