Помогите плиз с регуляркой!
Задача: собрать все теги img со страницы, исключив те теги, которые в ссылке содержат слова logo и avatar.
Вот примеры ссылок:
<img src="http://cdn1.img22.domen.ru/i/company_logo.png" alt="">
<img width="16" height="16" src="http://cdn1.img22.domen.ru/i/default-avatar-20x20.jpg" class="avatar">
Пишу что-то вроде этого:
<img\ .*?domen\.ru.*?(?!logo|avatar).*?>
<img\ .*?domen\.ru.*?((?!logo|avatar).)*?>
но эти конструкции все-равно парсят все теги со стоп-словами
Как сделать правильно?
P.S. Ссылки абсолютно разные везде, их объединяет только корневой домен и + могут быть еще другие стоп слова.