Как правильно парсить в многопотоке?

nvmds

Client
Регистрация
04.05.2016
Сообщения
91
Благодарностей
7
Баллы
8
У меня большой список ссылок (1гб), написал небольшой парсер гет запросами. Если в зенке добавляю проект в несколько потоков, то моментально забивается оперативка (6гб). Соответсвенно походу каждый поток грузит список ссылок, как этого избежать?
 

Moadip

Client
Регистрация
26.09.2015
Сообщения
509
Благодарностей
823
Баллы
93
Сколько потоков и как подгружается список с ссылками?
Через привязку или нет?
 

nvmds

Client
Регистрация
04.05.2016
Сообщения
91
Благодарностей
7
Баллы
8
Через привязку к файлу подгружается. Потоков конечно чем больше, тем лучше. Но хватает на несколько только оперативы
 

Moadip

Client
Регистрация
26.09.2015
Сообщения
509
Благодарностей
823
Баллы
93


Если здесь не стоит галка, то каждый поток будет работать со своим экземпляром в памяти, что при гиговом файле сожрет оперативу моментально.
Плюс надо смотреть что конкретно вы делаете с этим списком, возможно что в каждом отдельном потоке идет работа с этим файлом и слишком много инфы хранится в оперативке.
Также что конкретно делается при вытаскивании инфы запросами, тут тоже может отжираться память.
Ну и еще одни вариант, браузер отключен в настройках?

 
  • Спасибо
Реакции: nvmds

nvmds

Client
Регистрация
04.05.2016
Сообщения
91
Благодарностей
7
Баллы
8
Спасибо, отпишу как попробую. Сейчас другим парсером уже выполнил задачу
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Вообще странная затея таскать в оперативу один гигабайт списка. Лучше реализовывать парсинг в разные файлы
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)