Как в Regex очистить текст от ненужных символов?

stranger07

Client
Регистрация
29.03.2021
Сообщения
14
Реакции
2
Баллы
3
Как с помощью Regex или С# очищать текст от всех символов, оставляя только буквы, цифры, пробелы и дефис?
 
Как с помощью Regex или С# очищать текст от всех символов, оставляя только буквы, цифры, пробелы и дефис?
Можно еще так: (?i)[^a-zа-я\ -]

80593
 
  • Спасибо
Реакции: stranger07 и doc
Спасибо, получилось сделать, то что нужно. Только я немного изменил, чтобы оставались еще и цифры:
(?i)[^a-zа-я0-9\ -]
Да, прошу прощения, про цифры я забыл совсем.
регулярка от @doc еще хороша тут.
 
  • Спасибо
Реакции: stranger07
  • Спасибо
Реакции: Sergodjan
Разницы в способах нету?
 
заменить [^\w -] на пустоту по регулярке. Правда останется еще и подчеркивание
Попробовал регулярку, смайлы оставляет, есть решение, чтобы вырезать левые символы ввиде смайлов) пример: ツ

Строка которую пытался обработать
Navvvi ツ festive ebony midget
 
Попробовал регулярку, смайлы оставляет, есть решение, чтобы вырезать левые символы ввиде смайлов) пример: ツ

Строка которую пытался обработать
Вот тут есть регулярка, работает:
 
  • Спасибо
Реакции: udder
Попробовал регулярку, смайлы оставляет, есть решение, чтобы вырезать левые символы ввиде смайлов) пример: ツ

Строка которую пытался обработать

Попробуй ответ chatgpt:
C#:
Развернуть Свернуть Копировать
[^a-zA-Zа-яА-Я0-9\s\.,;:!?—()«»“”‘’"-_/&]+

104907
 
  • Спасибо
Реакции: udder
добрый день! подскажите пожалуйста как Cookies Netscape выпарсить все сайты ?
 

Вложения

  • Спасибо
Реакции: санчил
Доброго подскажите. Есть в переменной слово "Категория_1", это слово динамическое, т.е оно может поменяться, и есть в переменной, такое же слово, только выглядит вот так 1 Категория_1, и это тоже слово динамическое. Мне нужно, что бы после обработки текста, в другую переменную, упало только первое "1" т.е мне нужна сама цифра, без названия "Категория_1"
 
Доброго подскажите. Есть в переменной слово "Категория_1", это слово динамическое, т.е оно может поменяться, и есть в переменной, такое же слово, только выглядит вот так 1 Категория_1, и это тоже слово динамическое. Мне нужно, что бы после обработки текста, в другую переменную, упало только первое "1" т.е мне нужна сама цифра, без названия "Категория_1"
Возможно это подойдет: ^\d

113426
 
Спасибо. А если к примеру:
1 Категория_1
2 Категория_1
3 Категория_1
4 Категория_1 ?

Возможно, я не совсем понял задачу.
Спарсить все ID из списка категорий, можно например так:

113427


113428
 
Нашел решение спасибо. Если кому-то будет нужен такой вариант, то все делаем через списки.
113429
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)