При парсинге встречаются символы CR LF

hago73

Client
Регистрация
07.09.2012
Сообщения
59
Благодарностей
21
Баллы
8
Здравствуйте. Пытаюсь спарсить сайт гет запросами. У сайта кодировка win-1251
При парсинге встречаются символы переноса строк CR LF

Попробовал код из другой темы по перекодировке в utf-8, но есть проблема: тогда весь текст кракозабрами.

C#:
string input = project.Variables["input"].Value;
byte[] bytes = Encoding.Default.GetBytes(input);
input = Encoding.UTF8.GetString(bytes);
return input;
Нашел такую замену в другой теме, но не знаю как ее сделать. Пробовал разделить на части до | и после на что искать и на что заменять. Не помогает
C#:
^(zcrm_.*?)$|===$1***
^(.*?)$|####$1%%%
####===|===
***%%%|***
\r\n[^\*=]|
Прошу совета
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 052
Благодарностей
6 481
Баллы
113

hago73

Client
Регистрация
07.09.2012
Сообщения
59
Благодарностей
21
Баллы
8

backoff

Client
Регистрация
20.04.2015
Сообщения
6 052
Благодарностей
6 481
Баллы
113
Последнее редактирование:

hago73

Client
Регистрация
07.09.2012
Сообщения
59
Благодарностей
21
Баллы
8
Я знаю что такое замена. Вот только CR LF это спец символы кодировки, а не простые символы текста.
В общем работает через замену \s+ на нужное значение.
 
Последнее редактирование:

bizzon

Client
Регистрация
08.09.2015
Сообщения
1 103
Благодарностей
132
Баллы
63
У меня, наверное, похожий вариант.
Взятый текст записывает в файл txt.
В обычном блокноте получается без переносов.
Notepad++ нормально, посмотрел там только LF.
Куда копать?
 

Azakim

Client
Регистрация
25.07.2021
Сообщения
165
Благодарностей
31
Баллы
28
Предположу раз символы переноса ,то это конец строки, а если конец строки ,то мож. попробуете
C#:
string.TrimEnd(new []{'CR','LF'});
Cам недавно так чистил текст после парсинга.
 

bizzon

Client
Регистрация
08.09.2015
Сообщения
1 103
Благодарностей
132
Баллы
63
Предположу раз символы переноса ,то это конец строки, а если конец строки ,то мож. попробуете
C#:
string.TrimEnd(new []{'CR','LF'});
Cам недавно так чистил текст после парсинга.
Я так понимаю, что этот код удаляет конец строки {'CR','LF'}.
А мне, скорее всего, нужно перед LF добавить CR, чтобы было CRLF.
 
  • Спасибо
Реакции: Azakim

Azakim

Client
Регистрация
25.07.2021
Сообщения
165
Благодарностей
31
Баллы
28

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)