Вопрос по регулярке, не пойму почему так получается.. Нид хелп

backoff

Client
Регистрация
20.04.2015
Сообщения
5 995
Благодарностей
6 444
Баллы
113
ку, имеем

C#:
<a href="https://t.me/test" target="_blank" class="link link--external" rel="nofollow ugc noopener">https://t.me/test</a>) и их сайт игры в авиатор <a href="https://test-check-site.com/" target="_blank" class="link link--external" rel="nofollow ugc noopener">https://test-check-site.com/</a>
использую регулярку чтобы выцепить самый короткий ответ с ссылкой
C#:
<a.*?test-check-site.com.*?</a>
то есть ответ должен быть таким
C#:
<a href="https://test-check-site.com/" target="_blank" class="link link--external" rel="nofollow ugc noopener">https://test-check-site.com/</a>
почему он такой?
C#:
<a href="https://t.me/test" target="_blank" class="link link--external" rel="nofollow ugc noopener">https://t.me/test</a>) и их сайт игры в авиатор <a href="https://test-check-site.com/" target="_blank" class="link link--external" rel="nofollow ugc noopener">https://test-check-site.com/</a>
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 080
Благодарностей
8 964
Баллы
113

backoff

Client
Регистрация
20.04.2015
Сообщения
5 995
Благодарностей
6 444
Баллы
113
да, но по идее это значение .*? берет самое короткое совпадение.
и это короткое совпадение и должно быть ссылкой
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 080
Благодарностей
8 964
Баллы
113
да, но по идее это значение .*? берет самое короткое совпадение.
и это короткое совпадение и должно быть ссылкой
Оно спотыкается на первое же совпадение - идет поиск слева направо, а не из середины или еще как.
 

backoff

Client
Регистрация
20.04.2015
Сообщения
5 995
Благодарностей
6 444
Баллы
113
идет поиск слева направо, а не из середины или еще как.
ааа, понятно, думал вычленяет как-то ...
Просто между <a href
тогда в свете новых данных, надо предугадать, что возможно где-то между этими символами <a href= может что-то быть типа <a class="style" href= и тогда уже схема биться не будет
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 685
Благодарностей
4 640
Баллы
113
<a[^<>]+>[^<>]*test-check-site.com[^<>]*</a>
 
  • Спасибо
Реакции: backoff

backoff

Client
Регистрация
20.04.2015
Сообщения
5 995
Благодарностей
6 444
Баллы
113

doc

Client
Регистрация
30.03.2012
Сообщения
8 685
Благодарностей
4 640
Баллы
113
[^<>]*
все символы, кроме < и >
Таким образом можно быть уверенным, что внутри искомой строки не будет других html тегов
 

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)