Плюсую вопрос. Очень нужен такой софт-шаблон.
А в идеале еще сравнивать файлы на "похожесть" - разбиваем файл на строки, получаем MD5 каждой строки если в файлах, допустим, 75% строк-хешей совпадают - считаем дублями и удаляем меньший по обьему.
Последнее сам пытался реализовать, но это на...