- Регистрация
- 04.03.2018
- Сообщения
- 358
- Благодарностей
- 40
- Баллы
- 28
Ребят, сталкиваюсь с проблемой и никак не пойму принцип работы многопотока, возможно кто подскажет статейку про многопоточность и зацикливание и работа со списками. Видео от ростоникса смотрел, вроде все понятно а в работе неясности.
Написал 2 шаблона. Первый в Однопотоке бегает по страницам доски объявлений и собирает ссылки на объявы и записывает их в текстовик.
Строк бывает 10к-50к.
Второй шаблон парсит уже данные с каждой ссылки, я сделал зацикливание, то есть шаблон взял из текстовика ссылку, собрал данные, удалил строку из текстовика, взял следующую - собрал - удалил строку. То есть в самом шаблоне зацикливание до тех пор пока строки не кончатся. Теперь вопрос по многопотоку. (ПС: шаблон на гетах без браузера, потоков много тянет)
При запуске шаблона в Зенке, ставлю количество потоков 300, количество выполнений 300, в настройках стоит "количество потоков в одном процессе 5" и вот тут не понятно что от чего зависит.
В результате некоторые задания отрабатываются нормально с обработкой всех ссылок, но бывает так что во время работы отваливается скажем 30 потоков и работают всего 270 - а по окончанию работы шаблона в текстовике остается к примеру из 50к ссылок - 4к. То есть Проект закончился а еще 4к ссылок осталось. Приходится шаблон перезапускать с такими же настройками и он уже дорабатывает до конца нормально.
Расскажите пожалуйста про настройки многопоточности в самой зенке, может быть мне нужно НЕ закцикливать шаблон? Тогда сколько раз нужно выполнять проект что бы обработать скажем 50к ссылок?
Оперативы 16гб пока что, проц intel xeon v4 e5 2630 10 ядер (скоро будет докуплено еще оперативы и еще такой же процессор)
В голове уже каша с этими многопотоками, количеством выполнений, реализацией самого шаблона и про количество потоков в одном процессе.
Заранее спасибо
Написал 2 шаблона. Первый в Однопотоке бегает по страницам доски объявлений и собирает ссылки на объявы и записывает их в текстовик.
Строк бывает 10к-50к.
Второй шаблон парсит уже данные с каждой ссылки, я сделал зацикливание, то есть шаблон взял из текстовика ссылку, собрал данные, удалил строку из текстовика, взял следующую - собрал - удалил строку. То есть в самом шаблоне зацикливание до тех пор пока строки не кончатся. Теперь вопрос по многопотоку. (ПС: шаблон на гетах без браузера, потоков много тянет)
При запуске шаблона в Зенке, ставлю количество потоков 300, количество выполнений 300, в настройках стоит "количество потоков в одном процессе 5" и вот тут не понятно что от чего зависит.
В результате некоторые задания отрабатываются нормально с обработкой всех ссылок, но бывает так что во время работы отваливается скажем 30 потоков и работают всего 270 - а по окончанию работы шаблона в текстовике остается к примеру из 50к ссылок - 4к. То есть Проект закончился а еще 4к ссылок осталось. Приходится шаблон перезапускать с такими же настройками и он уже дорабатывает до конца нормально.
Расскажите пожалуйста про настройки многопоточности в самой зенке, может быть мне нужно НЕ закцикливать шаблон? Тогда сколько раз нужно выполнять проект что бы обработать скажем 50к ссылок?
Оперативы 16гб пока что, проц intel xeon v4 e5 2630 10 ядер (скоро будет докуплено еще оперативы и еще такой же процессор)
В голове уже каша с этими многопотоками, количеством выполнений, реализацией самого шаблона и про количество потоков в одном процессе.
Заранее спасибо