- Регистрация
- 04.02.2013
- Сообщения
- 945
- Благодарностей
- 257
- Баллы
- 63
Парни есть самый простой алгоритм лично накаляканный, который требует критики и доработки, и возможно перенести на сишарп.
1. Получаем количество слов в обоих текстах.
2. Берём самый короткий текст и разбиваем его по словам в список 1.
3. Разбивает второй текст по словам в список 2.
4. Берем строку с удалением из списка 1 ищем её в списке 2.
5. С каждым успешном поиске пишем любой символ в список 3.
6. Когда список 1 закончится, берём количество строк из списка 3 и сравниваем с количеством слов самого короткого текста.
Вопрос. Как определить процент схожести? Какие минусы в моем способе?
Может у вас есть другой алгоритм на кубиках или сишарпе? Поиском кроме статьи на хабре ни чего не нагуглил.
1. Получаем количество слов в обоих текстах.
2. Берём самый короткий текст и разбиваем его по словам в список 1.
3. Разбивает второй текст по словам в список 2.
4. Берем строку с удалением из списка 1 ищем её в списке 2.
5. С каждым успешном поиске пишем любой символ в список 3.
6. Когда список 1 закончится, берём количество строк из списка 3 и сравниваем с количеством слов самого короткого текста.
Вопрос. Как определить процент схожести? Какие минусы в моем способе?
Может у вас есть другой алгоритм на кубиках или сишарпе? Поиском кроме статьи на хабре ни чего не нагуглил.