Помогите с блеклистом!

leva001

Client
Регистрация
26.07.2015
Сообщения
282
Благодарностей
48
Баллы
28
Вообщем есть у меня файл с отработанными ссылками blacklist_urls.txt и файл со свежими ссылками temp_urls.txt

Оба файла привязаны к спискам. Шаблон в ходе работы берет с удалением строку с temp_urls.txt, проверяет наличие ее в blacklist_urls.txt и если она там есть - берет следующую с temp_urls.txt и так по кругу, если такой строки нету в blacklist_urls.txt, то идет с ней работать дальше.

Схема вроде проста и хороша, но на больших объемах (100к ссылок в файле) даже при многопотоке процесс отсеивания использованных ссылок идет очень медленно.

Вопрос: как можно за один раз сделать выборку таких строк в temp_urls.txt, которых нету в blacklist_urls.txt? Может есть кубик какой-то с C#?)
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 685
Благодарностей
4 642
Баллы
113
на c# возможностей побольше. И тут было масса тем, поискал бы. А если в обход кода, то ты объединяешь список блэклиста в переменную, и экшеном обработки текста ищешь в переменной свою ссылку
 

leva001

Client
Регистрация
26.07.2015
Сообщения
282
Благодарностей
48
Баллы
28
на c# возможностей побольше. И тут было масса тем, поискал бы. А если в обход кода, то ты объединяешь список блэклиста в переменную, и экшеном обработки текста ищешь в переменной свою ссылку
Сейчас так и работает в обход кода, но это на больших объемах долго очень, т.к. берется каждая ссылка и сравнивается. Если есть где-то на форуме код C# - ткните пальцем, буду благодарен.
 

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 452
Благодарностей
1 886
Баллы
113
  • Спасибо
Реакции: leva001

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
901
Баллы
113
  • Спасибо
Реакции: kagorec и leva001

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)