- Регистрация
- 01.05.2015
- Сообщения
- 5 008
- Благодарностей
- 4 482
- Баллы
- 113
Есть фраза и есть список стоп-слов (не обязательно одно).
Нужно найти вхождения стоп-слов в фразу.
Вроде просто, можно либо фразу разбить пробелами и знаками препинаний в массив и в цикле проверить stop_words.Contains(word) для каждого слова фразы, но как быть если стоп слово состоит из двух слов? Не сработает.
Можно наоборот циклом phrase.Contains( stop_words), но тут тоже проблема. Например стоп-слово to может быть в сотне "хороших" слов типа tomorrow. Добавить пробелы не решает задачи, т. к. слово может быть вначале или конце фразы и обрамляться знаками препинаний.
Нужно найти вхождения стоп-слов в фразу.
Вроде просто, можно либо фразу разбить пробелами и знаками препинаний в массив и в цикле проверить stop_words.Contains(word) для каждого слова фразы, но как быть если стоп слово состоит из двух слов? Не сработает.
Можно наоборот циклом phrase.Contains( stop_words), но тут тоже проблема. Например стоп-слово to может быть в сотне "хороших" слов типа tomorrow. Добавить пробелы не решает задачи, т. к. слово может быть вначале или конце фразы и обрамляться знаками препинаний.