1) Нет, непонятно как у вас в поле адреса что-то не относящееся к сайту может быть
2) Только в цикле проверять каждую строку. Брать строку, парсить ей весь объединенный список, считать количество совпадений, добавлять данные в новй список, если совпадений больше 1