- Регистрация
- 19.06.2013
- Сообщения
- 793
- Благодарностей
- 278
- Баллы
- 63
господа. есть список (10-100к значений) отсортированный (можно не сортировать). Формат можно тоже сделать любой.
всё дело в цифрах. весь форум усыпан как удалить дубли, а у меня задача на оборот. даже не так 2 задачи. первая задача — это найти точные дубли (555), вторая задача близкие значения (555,554 не более 1% разницы, а может и 0.1%, надо смотреть в маштабе)
в дальнейшем я буду формировать что-то для себя красивого отчёта. наверное в экселе, пока не решил. но пока что то второй день изучаю форум. не попадается решение. каждую строку сверять со всем списком. 100к не долго ли будет процесс? с памятью тоже непонятно, хватит ли ?
Список прилагаю.
928347|мама
918271|мыла
873|раму
743|папа
743|строгал
555|елка
555|авто
555|кран
554|опера
321|дом
23|ключ
15|ручка
1|буй
и.т.д.
всё дело в цифрах. весь форум усыпан как удалить дубли, а у меня задача на оборот. даже не так 2 задачи. первая задача — это найти точные дубли (555), вторая задача близкие значения (555,554 не более 1% разницы, а может и 0.1%, надо смотреть в маштабе)
в дальнейшем я буду формировать что-то для себя красивого отчёта. наверное в экселе, пока не решил. но пока что то второй день изучаю форум. не попадается решение. каждую строку сверять со всем списком. 100к не долго ли будет процесс? с памятью тоже непонятно, хватит ли ?
Список прилагаю.
928347|мама
918271|мыла
873|раму
743|папа
743|строгал
555|елка
555|авто
555|кран
554|опера
321|дом
23|ключ
15|ручка
1|буй
и.т.д.