Удалятор дублей не видит разницу

timoxa949

Client
Регистрация
16.11.2018
Сообщения
158
Благодарностей
27
Баллы
28
Есть ли разница в этих словах?:

weapons
weapons

Удаление дублей не помогает.

Прикрепляю файл
 

Вложения

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 407
Благодарностей
9 115
Баллы
113
Есть ли разница в этих словах?:

weapons
weapons

Удаление дублей не помогает.

Прикрепляю файл
Проверил сейчас, они идентичны и у меня дубль удаляется.
Напишите, можно со скринами, каким образом вы удаляете дубль.
 

Ilshakin

Client
Регистрация
14.02.2017
Сообщения
639
Благодарностей
581
Баллы
93
Попробуйте по хешу удалить дубль:
C#:
    HashSet<string> hs = new HashSet<string>(project.Lists["list"]);
    project.Lists["list"].Clear();
    project.Lists["list"].AddRange(hs);
 
  • Спасибо
Реакции: timoxa949

timoxa949

Client
Регистрация
16.11.2018
Сообщения
158
Благодарностей
27
Баллы
28
Проверил сейчас, они идентичны и у меня дубль удаляется.
Напишите, можно со скринами, каким образом вы удаляете дубль.
Пробую удалить кубиком Операции над списком Удаление дублей.
 

timoxa949

Client
Регистрация
16.11.2018
Сообщения
158
Благодарностей
27
Баллы
28

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 407
Благодарностей
9 115
Баллы
113
Пробую удалить кубиком Операции над списком Удаление дублей.
Именно так проверял - из вашего текстовика копировал в список и удалял дубли, все было отлично.
Попробуйте перезагрузить программу и снова проверить.
 
  • Спасибо
Реакции: timoxa949

timoxa949

Client
Регистрация
16.11.2018
Сообщения
158
Благодарностей
27
Баллы
28
Именно так проверял - из вашего текстовика копировал в список и удалял дубли, все было отлично.
Попробуйте перезагрузить программу и снова проверить.
Интересно, в проекте не удаляет, копировал вставил в новый проект все работает. Да, наверное надо перезагрузиться. Спасибо.
 
  • Спасибо
Реакции: Sergodjan

BAZAg

Client
Регистрация
08.11.2015
Сообщения
1 787
Благодарностей
2 453
Баллы
113
Интересно, в проекте не удаляет, копировал вставил в новый проект все работает.
Магия может происходит тогда, когда данные берутся с файла, который сохранён в кодировке с BOM.
В этом случае впереди файла размещается метка - из-за чего получается, что мы видим слово, а в реальности компьютер видит там ещё дополнительные байты.
Если есть вероятность появления такой метки (данные берутся с какого-то списка, таблицы CSV), то прежде чем что-то с ними делать - есть смысл удалить метку.
C#:
string get = "text......"; // допустим этот текст получен с файла
get = get.TrimStart('\uFEFF'); // Пример удаления BOM метки
Пример удаления метки BOM в списке
C#:
List<string> list = new List<string>(); 
//
// допустим здесь мы заполнили список данными с файла
//
list = list.AsParallel().Select(y => y.TrimStart('\uFEFF')).ToList(); // Удаляем метку BOM, если такая есть
Я не знаю, это конкретно Ваш случай или нет, но мне данная проблема где-то неделю выносила мозг, и я не мог понять почему шаблон не всегда отрабатывает корректно - а оказывается, получал данные с сайта GET запросом - и результат включал эти байты перед ответом.
 
  • Спасибо
Реакции: Santorini и timoxa949

timoxa949

Client
Регистрация
16.11.2018
Сообщения
158
Благодарностей
27
Баллы
28
Магия может происходит тогда, когда данные берутся с файла, который сохранён в кодировке с BOM.
В этом случае впереди файла размещается метка - из-за чего получается, что мы видим слово, а в реальности компьютер видит там ещё дополнительные байты.
Если есть вероятность появления такой метки (данные берутся с какого-то списка, таблицы CSV), то прежде чем что-то с ними делать - есть смысл удалить метку.
C#:
string get = "text......"; // допустим этот текст получен с файла
get = get.TrimStart('\uFEFF'); // Пример удаления BOM метки
Пример удаления метки BOM в списке
C#:
List<string> list = new List<string>();
//
// допустим здесь мы заполнили список данными с файла
//
list = list.AsParallel().Select(y => y.TrimStart('\uFEFF')).ToList(); // Удаляем метку BOM, если такая есть
Я не знаю, это конкретно Ваш случай или нет, но мне данная проблема где-то неделю выносила мозг, и я не мог понять почему шаблон не всегда отрабатывает корректно - а оказывается, получал данные с сайта GET запросом - и результат включал эти байты перед ответом.
Возможно даже это мой случай, так как данные также беру GET запросом, далее чищу регулярками и потом пытаюсь чистить от дублей. И в итоге в списке с 15 дублями, остаются 2 дубля. Спасибо за помощь буду пробовать.
 

Platon

Client
Регистрация
26.09.2015
Сообщения
260
Благодарностей
122
Баллы
43
а оказывается, получал данные с сайта GET запросом - и результат включал эти байты перед ответом.
Так значит проблема в результатах парсинга, либо регулярка отрабатывает неправильно
Либо что-то еще
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)