виснет парсер

ogogo

Пользователь
Регистрация
25.06.2011
Сообщения
43
Благодарностей
1
Баллы
8
привет. написал простой парсер. имеем текстовик со ссылками, записанными построчно. парсер берет строку-ссылку с удалением, загружает ее в браузере, выдерает через regexp нужный текст из DOM'а и кладет в файл. все происходит в цикле (кол-во повторений зависит от кол-ва строк-урлов). проблема состоит в том, что зенно на определенном шаге тупо виснет и ниче не парсит. подскажите причины и возможное решение проблемы.
P.S. давным-давно когда была 3ья версия зенно, был такой же парсер и парсил без проблем. более 1000 урлов-страниц грузил поочереди и не зависал.
 

qzen4i

Client
Регистрация
01.05.2014
Сообщения
1 408
Благодарностей
314
Баллы
83
привет. написал простой парсер. имеем текстовик со ссылками, записанными построчно. парсер берет строку-ссылку с удалением, загружает ее в браузере, выдерает через regexp нужный текст из DOM'а и кладет в файл. все происходит в цикле (кол-во повторений зависит от кол-ва строк-урлов). проблема состоит в том, что зенно на определенном шаге тупо виснет и ниче не парсит. подскажите причины и возможное решение проблемы.
P.S. давным-давно когда была 3ья версия зенно, был такой же парсер и парсил без проблем. более 1000 урлов-страниц грузил поочереди и не зависал.
Попробуйте сделать перезагрузку инстанса через некоторое количество парса, если не ошибаюсь, то про зависание инстанса и т.д много раз обсуждалась в форуме.
 

ogogo

Пользователь
Регистрация
25.06.2011
Сообщения
43
Благодарностей
1
Баллы
8
ставил перезагрузку инстанса через каждое действие цикла - все мимо
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
Что мимо?
 

ogogo

Пользователь
Регистрация
25.06.2011
Сообщения
43
Благодарностей
1
Баллы
8
виснет все равно
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
Сайт не в подгрузкой контента со скроллом? Просто обычная страница как эта страница форума?
 

Solus

Client
Регистрация
14.04.2014
Сообщения
378
Благодарностей
120
Баллы
43
Может стоит без цикла обойтись? 1 запуск - взял ссылку, перешел, спарсил, записал, закончил. так не лучше будет? Думаю "вис" шаблона точно пропадет.
 

Juniorcpa

Client
Регистрация
27.05.2014
Сообщения
2 031
Благодарностей
1 286
Баллы
113
Было бы проще, если бы ТС выложил проект с готовыми входными настройками уже. Каждый бы глянул и оценил проблему, может быть решил бы её.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)