Поиск по части слова

RuslanAliev

Client
Регистрация
24.03.2015
Сообщения
45
Благодарностей
5
Баллы
8
Уважаемые участники форума!
Есть список с ключевыми словами (Москва, Санкт-Петербург и т.д.). При поиске на вхождение ключевого слова в заголовке (например) "Ситуация в Москве" - пропускает его из-за несоответствия, т.к. ключевое слово "Москва". Как можно сделать, чтобы поиск шел по корню слова или игнорировал окончания?
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 685
Благодарностей
4 640
Баллы
113
Уважаемые участники форума!
Есть список с ключевыми словами (Москва, Санкт-Петербург и т.д.). При поиске на вхождение ключевого слова в заголовке (например) "Ситуация в Москве" - пропускает его из-за несоответствия, т.к. ключевое слово "Москва". Как можно сделать, чтобы поиск шел по корню слова или игнорировал окончания?
оставить в своём списке корни слов
 

RuslanAliev

Client
Регистрация
24.03.2015
Сообщения
45
Благодарностей
5
Баллы
8
оставить в своём списке корни слов

Не работает - логика при создании проекта проекта была следующая: оставил в списке корни слов (Москв, Санкт-Петербург и т.д.) => В заголовке: добавил через обработку текста замену пробела на "|" (для того чтобы при совпадении со словами из списка ключ. слов брался заголовок) => через regax сравнение на вхождение слов в заголовке со списком ключевых слов.
 

Вложения

RuslanAliev

Client
Регистрация
24.03.2015
Сообщения
45
Благодарностей
5
Баллы
8
Итак, решил выше описаннную проблему - может кому-то пригодиться:

1. Создаем текстовой документ с ключевыми словами, без окончаний.
2. Парсим текст
3. Привязываем список "ключевые слова" к одноименному документу.
4. Объединяем элементы списка "ключевые слова"
5. Получаем строку из списка "ключевые слова"
6. Через обработку текста=>regex=>сравниваем {-Variable.Вашспрасенный текст-} с (?i){-Variable.spisok_klychevii_slova-}[\w\W]*?

+такого решения - найдет только то, что входит в корни ключевых слов.
-если ключевых слов много, тогда занимает относительно много времени.

Было и другое решение, но если попадались частицы (но, и, с и т.д.) или просто аббревиатуры марок (БС, М), то тогда их тоже забирал как подходящие по запросу и приходилось костыль делать из стоп-слов частиц, а их много получалось и все не отследишь.
 

Вложения

  • Спасибо
Реакции: Sergodjan

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)