Как можно почистить список по стоп словам?

Tonny

Client
Регистрация
20.07.2013
Сообщения
142
Благодарностей
5
Баллы
18
Есть 1 список из 10 ссылок, к примеру:
Код:
http://yandex.ru/
http://yandex.ru/
http://yandex.ru/
http://yandex.ru/
http://google.ru/
http://yandex.ru/
http://bing.com/
http://yandex.ru/
http://mail.ru/
.....
И есть большой список стоп доменов штук 200, вот в таком виде:
Код:
google.ru
mail.ru
bing.com
rambler.ru
hbhbh.ru
.....
Как можно максимально быстро почитить первый список по этим стопам? Т.е. удалить совпадения: http://google.ru/ = google.ru
Перебором через if не вариант! Как лучше подскажите?
 
Последнее редактирование:

Budda

Client
Регистрация
13.07.2015
Сообщения
247
Благодарностей
41
Баллы
28
Обычный вариант не подходит?
Операции над списком - удалить строки.

Делаем ссылки стоп доменов более удобными. То есть вместо, к примеру, "https://google.com/", оставляем просто "google".
Код:
(?<=htt(ps|p)://).*?(?=\.(ru|com|org|ua)/)
Добавите еще доменов если нужно для фильтра.

Далее берем каждую строку из стоп списка и удаляем элементы, содержащие текст: ...(тут переменная со стоп словом)
 
  • Спасибо
Реакции: Tonny

Tonny

Client
Регистрация
20.07.2013
Сообщения
142
Благодарностей
5
Баллы
18
Там ссылки на страницы совершенно разных сайтов с выдачи будут, это я так пример просто дал https://google.com/
Нужно чтото другое, может вариант на с# кто-то подскажет, или утилиты может какие можно юзать?
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 130
Баллы
113
Если список стоп слов всегда одинаковый, то можно так: Операции над списком > Удалить строки > Удалить элементы удовлетворяющие рег. выражению
и пропишите все стоп домены через вертикальную черту, таким образом:
Код:
google.ru|mail.ru|bing.com|rambler.ru|hbhbh.ru
Удаляться ВСЕ строки, в которых содержаться такие слова, а не только конкретные строки google.ru, mail.ru и т.д.
Чтоб быстро из большого списка сделать такую конструкцию: Замена > Regex > заменить "\r\n" на "|" (без кавычек).

Если хотите на C#, то посмотрите эту тему :http://zennolab.com/discussion/threads/poisk-po-spiskam-i-tablicam-cherez-c-makros.10734/
Да и воспользуйтесь поиском по форуму, не раз такое обсуждалось.
 
Последнее редактирование:
  • Спасибо
Реакции: Tonny и Budda

Tonny

Client
Регистрация
20.07.2013
Сообщения
142
Благодарностей
5
Баллы
18
Супер! Это то что мне нужно, через кубик все отлично работает! Спасибо!
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)