- Регистрация
- 10.12.2016
- Сообщения
- 129
- Благодарностей
- 27
- Баллы
- 28
Всем здравствуйте!
Постараюсь описать подробно проблему.
Есть сайт. В нём 1.000.000 строк кода.
Мне нужно с него получать в многопотоке всё, что начинается от начала заголовков и заканчивая закрывающимся тегом </head>
Логично сделать через конструктор регулярных выражений и просто парсить, как я и сделал. Но, это очень сильно нагружает процессор сервера (VPS 8 ядер 2.4Ггц) даже при 10 потоках: http://prntscr.com/ltqqax
Шаблон прикрепил в аттаче.
Я, если честно, не знаю как работают регулярные выражения, но как мне кажется, что ищут они по всему тексту. Можно ли как-то ограничить их поиск, чтобы когда нашёлся текст - больше не искалось.
Ну или может есть какое-то более здравое решение чтобы это всё ускорить?
Постараюсь описать подробно проблему.
Есть сайт. В нём 1.000.000 строк кода.
Мне нужно с него получать в многопотоке всё, что начинается от начала заголовков и заканчивая закрывающимся тегом </head>
Логично сделать через конструктор регулярных выражений и просто парсить, как я и сделал. Но, это очень сильно нагружает процессор сервера (VPS 8 ядер 2.4Ггц) даже при 10 потоках: http://prntscr.com/ltqqax
Шаблон прикрепил в аттаче.
Я, если честно, не знаю как работают регулярные выражения, но как мне кажется, что ищут они по всему тексту. Можно ли как-то ограничить их поиск, чтобы когда нашёлся текст - больше не искалось.
Ну или может есть какое-то более здравое решение чтобы это всё ускорить?
Вложения
-
18,1 КБ Просмотры: 141