Конструктор регулярных выражений f3

prostors

Client
Регистрация
16.12.2020
Сообщения
1 153
Благодарностей
41
Баллы
48
131017 добавьте вот сюда чекбокс - Показывать спецсимволы
 

prostors

Client
Регистрация
16.12.2020
Сообщения
1 153
Благодарностей
41
Баллы
48
к сожалению \r игнорируется и добавляется в результат
 

Alex91

Активный пользователь
Регистрация
15.08.2024
Сообщения
730
Благодарностей
207
Баллы
43
Ты как всегда в своем репертуаре...;-)
Ну ведь забыл приложить пример воспроизводящий сей проблемный момент , который доставляет абсолютно всем пользователям , колоссальные неудобства... Ну как так ?
В общем ждем...
 

prostors

Client
Регистрация
16.12.2020
Сообщения
1 153
Благодарностей
41
Баллы
48
131019 файл txt, в файле есть переносы строк
содержимое файла:
131020

после regex получаем email с \r вконце, которая игнорируется выражением \w\W
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 781
Благодарностей
1 170
Баллы
113

Alex91

Активный пользователь
Регистрация
15.08.2024
Сообщения
730
Благодарностей
207
Баллы
43
Посмотреть вложение 131019 файл txt, в файле есть переносы строк
содержимое файла:
Посмотреть вложение 131020

после regex получаем email с \r вконце, которая игнорируется выражением \w\W
Не обижайся ... Но ты выставляешь свой непрофессионализм на показ... Я бы даже сказал по другому, но боюсь реакции админов ;-)

Все эти символы чистятся операцией трим. Это раз.
Во вторых это убирается правильной регуляркой, если трим делать лень.

Зачем ты вообще пингуешь разработчиков с таким .... Эээммм фигней что ли ...., если можно тупо задать вопрос на форуме по составлению регулярки, если уж сам не можешь и решить вопрос в течении пары дней, а не десятилетий... Не так. Вечности....

Короче... Возьми за правило задавать вопросы ИИ , прежде чем выставлять все это на всеобщее обозрение....
Глянь какой ИИ умный...

Утверждение говорит о том, что после применения регулярного выражения (regex) для извлечения email-адреса, в конце строки появляется символ \r (возврат каретки), который игнорируется выражением \w\W. Это может привести к проблемам при дальнейшей обработке email-адреса, так как \r является нежелательным символом в email.

Замечания и советы по устранению проблемы:
Проверка источника данных:

Убедитесь, что источник данных (например, файл или строка) не содержит лишних символов, таких как \r или \n. Это может быть связано с тем, что данные были получены из файла, созданного в Windows, где строки разделяются последовательностью \r\n.

Очистка строки перед обработкой:

Перед применением регулярного выражения удалите все нежелательные символы, такие как \r и \n, из строки. Это можно сделать с помощью метода strip() или replace() в Python:

python
Copy
email = email.strip('\r\n')
Уточнение регулярного выражения:

Убедитесь, что ваше регулярное выражение корректно обрабатывает email-адреса и не пропускает лишние символы. Например, можно использовать более строгое выражение для email:

regex
Copy
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
Если вы хотите исключить символы \r и \n из результата, добавьте их в отрицательную группу:

regex
Copy
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}(?<!\r|\n)
Постобработка результата:

После применения регулярного выражения выполните дополнительную очистку результата, чтобы удалить любые оставшиеся нежелательные символы:

python
Copy
import re
email = re.findall(r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}', text)[0]
email = email.strip('\r\n')
Использование флага re.MULTILINE:

Если вы работаете с многострочным текстом, убедитесь, что вы используете флаг re.MULTILINE для корректной обработки строк.
 
  • Спасибо
Реакции: prostors

prostors

Client
Регистрация
16.12.2020
Сообщения
1 153
Благодарностей
41
Баллы
48

prostors

Client
Регистрация
16.12.2020
Сообщения
1 153
Благодарностей
41
Баллы
48
что бы аки сохранять в таком формате
это пример, я раньше тоже указывал на эту проблему
также эта проблема есть в теме SEO, которую мне замодерировали
там была проблема в том, что в переменной \r нету, а после сохранения в файл и взятия в переменную из файла - есть \r
 

usawa0

Client
Регистрация
29.11.2019
Сообщения
74
Благодарностей
22
Баллы
8
Константин, мое почтение. Просто нет слов
 

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)