Как почистить текст от кракозябр вроде таких - яще

Регистрация
27.12.2012
Сообщения
70
Благодарностей
8
Баллы
8
При сохранении 1251 доков иногда попадаются доки в utf-8 и соотвественно вылетает подобное:

Черногория тносится к числу амых лодых арств а.
Как такое можно почистить? Я просто даже регулярку представить не могу...
 

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
901
Баллы
113
попробуйте подуалять строки с символами Ђ
ну и тогда регулярка будет .*Ђ.*
 
  • Спасибо
Реакции: Jorge_Rodrigez и Sergodjan

Maikl1

Новичок
Регистрация
14.01.2014
Сообщения
3
Благодарностей
1
Баллы
0

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 281
Благодарностей
9 059
Баллы
113
кстати да, надо взять самый распространенный символ и искать регуляркой строки его содержащие..т
тоже озабочен такого рода проблемой..
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 281
Благодарностей
9 059
Баллы
113

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 450
Благодарностей
1 885
Баллы
113
а Trim он ищет внутри строк или только в начале и конце?
Написано же "Где обрезать: Начало и конец"
Читайте внимательно надписи в экшенах.

В регулярке можно прописать вот так

.*[§µЂЂЏ].*

и указать в скобках все нестандартные символы, которые не встречаются в русском\английском языках.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 281
Благодарностей
9 059
Баллы
113
Написано же "Где обрезать: Начало и конец"
Читайте внимательно надписи в экшенах.
дык я и прочитал, и в свете того что человек посоветовал Trim - засоменвался и решил переспросить..
(не неврничать!) :-):az:
 
Регистрация
27.12.2012
Сообщения
70
Благодарностей
8
Баллы
8
Дело в том, что бывает и такое ведь:

РРСРРРСРёСРСРРР
Все буквы кириллица. Решил просто удалять все, что подходит под это - Р.+РР.+
А перед ней регулярка которая удаляет все эти беспонтовые символы. :-)
 
Последнее редактирование:

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)