- Регистрация
- 19.06.2013
- Сообщения
- 793
- Благодарностей
- 278
- Баллы
- 63
Всем привет.
Не могу придумать способ определять "похожесть".
есть списки 10000 штук в каждом списке по 100 значений id(пример 270358475, 280300221, 260302911 и.т.д.)
других привязок нет.
где-то список может отличатся на 1id где-то на 50id где то на 99id
начало списка, может быть прям один в один похоже, 10-15-20 значений к концу списка может сильно начать различаться.
Хочу как-то эти списки разделить на группы. по похожести.
Может кто-то делал уже такое. Заранее благодарю на наводку или решение.
Не могу придумать способ определять "похожесть".
есть списки 10000 штук в каждом списке по 100 значений id(пример 270358475, 280300221, 260302911 и.т.д.)
других привязок нет.
где-то список может отличатся на 1id где-то на 50id где то на 99id
начало списка, может быть прям один в один похоже, 10-15-20 значений к концу списка может сильно начать различаться.
Хочу как-то эти списки разделить на группы. по похожести.
Может кто-то делал уже такое. Заранее благодарю на наводку или решение.