Кол-во потоков к проксям

Dp76

Client
Регистрация
24.01.2019
Сообщения
104
Благодарностей
16
Баллы
18
Некоторые провайдеры proxy (awmproxy, proxylist4you) ограничивают кол-во потоков, которые могут быть использованы одновременно.

В текущей реализации я не нашел возможности программно ограничить ОБЩЕЕ кол-во потоков, у меня лично сработало только ограничение в настройках самого браузера, редактированием строк в файле

C:\Program Files\ZennoLab\RU\ZennoPoster Pro\5.27.1.0\Progs\XulRunner52x64\greprefs.js

pref("network.http.max-connections", 4);
pref("network.http.max-connections-per-server", 4);
pref("network.http.max-persistent-connections-per-proxy", 4);
pref("network.http.max-persistent-connections-per-server", 4);

Но это так сказать, полумеры - потому что вот сейчас в 100 потоков работает постер, и разумно предположить что загрузка проксей будет в пределах 400, но нет - паузы, парсинг, сетевые задержки, и получается что загрузка на стороне проксей показывает около 180 потоков.

Внимание, вопрос: возможно ли ограничить на выходе с постера кол-во одновременных потоков к проксям?
 

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 387
Благодарностей
5 446
Баллы
113
Вобще такие прокси покупать не надо, не для зенки они.
 

Dp76

Client
Регистрация
24.01.2019
Сообщения
104
Благодарностей
16
Баллы
18
Я уже несколько раз спрашивал "какие посоветуете", если у меня задача - парсинг страниц сайта, который сидит за Cloudflare
 

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 387
Благодарностей
5 446
Баллы
113
Я уже несколько раз спрашивал "какие посоветуете", если у меня задача - парсинг страниц сайта, который сидит за Cloudflare
Может быть пакетные подошли бы, они стоят не дорого.
 

Dp76

Client
Регистрация
24.01.2019
Сообщения
104
Благодарностей
16
Баллы
18

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 387
Благодарностей
5 446
Баллы
113
А что значит пакетные? Можно разжевать новичку? Заранее спасибо :-)
ну это когда вы покупаете не 1 проксю за 50р, условно говоря. А 1000 шт, за 2000р, условно говоря. гуглите пакетные прокси)
 
  • Спасибо
Реакции: Dp76

Bas

Client
Регистрация
15.12.2013
Сообщения
632
Благодарностей
260
Баллы
63
ну это когда вы покупаете не 1 проксю за 50р, условно говоря. А 1000 шт, за 2000р, условно говоря. гуглите пакетные прокси)
и есть пакетный оператор, они не продают поштучно ip.

По сабжу - Cloudflare давно на запросах обходится. У меня правда нашелся индивид (сайт) который ни в какую не обходится, что-то видимо докрутили/нахимичили, но на 99% сайтов обходится без проблем. Здесь на форуме тема есть, поищите. И будет Вам 300 потоков ЗП = ~150-200 потоков на стороне прокси провайдера, в зависимости от скорости обработки данных.
 
  • Спасибо
Реакции: Dp76

Dp76

Client
Регистрация
24.01.2019
Сообщения
104
Благодарностей
16
Баллы
18

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 387
Благодарностей
5 446
Баллы
113
и есть пакетный оператор, они не продают поштучно ip.
я про них и не говорил ничего)) суть в том, что ограничения по потокам для зенки зло, а деньги просят запредельные за большое кол-во потоков.
 

Dp76

Client
Регистрация
24.01.2019
Сообщения
104
Благодарностей
16
Баллы
18
я про них и не говорил ничего)) суть в том, что ограничения по потокам для зенки зло, а деньги просят запредельные за большое кол-во потоков.
Именно зло, но если бы было бы меньшее зло - я бы пользовался им, а так - альтернатив не вижу, пока если честно
 

Bas

Client
Регистрация
15.12.2013
Сообщения
632
Благодарностей
260
Баллы
63

Dp76

Client
Регистрация
24.01.2019
Сообщения
104
Благодарностей
16
Баллы
18
Обход защиты CloudFlare это вообщем-то важная тема для меня.

Если подключен браузер, то первый этап он решает сам (или я что-то не понимаю), вот в тех постах что предоставил Bas (за что ему огромное спасибо) как раз пытаются получить куки для решения вот этой проблемы (если я правильно понял)

https://imgur.com/a/GMTBmcm (не смог вставить картинку в пост)

А собственно, если есть браузер, то таких проблем не возникает в принципе. В 30-70% случаев после этого отдается обычная страница сайта, с которой уже и работаю дальше. Почему такой разброс в процентах, а Бог его знает, что там себе CF думает. На этих выходных вообще 99% был отлуп на второй шаг.


Второй шаг, который любезно предоставляет нам CF это капча,

https://imgur.com/a/RgCZhen, она бывает разная, видимо версия 2 или 3, подвязывать CapMonster наверное можно, но, признаться, у меня он разгадывает капчи плохо, а если говорить про 100 потоков,
то вообще сервер дохнет, доступа к нему нет (а сервер мощный, 32 ядра, 128 оперативки, SSD), это у меня так или у всех так?

Поэтому приходится прокси, которая получила капчу списывать утиль.

Есть третий вариант развития событий это Error 1009:
https://imgur.com/A1WANXO, и прокси тоже списываю в утиль. :(

Вот такая вот картина на данный момент, если кто понимает что мне делать и поможет дельным советом - то... спасибо мало, буду благодарен финансово
 

Bas

Client
Регистрация
15.12.2013
Сообщения
632
Благодарностей
260
Баллы
63
Обход защиты CloudFlare это вообщем-то важная тема для меня.

Если подключен браузер, то первый этап он решает сам (или я что-то не понимаю), вот в тех постах что предоставил Bas (за что ему огромное спасибо) как раз пытаются получить куки для решения вот этой проблемы (если я правильно понял)

https://imgur.com/a/GMTBmcm (не смог вставить картинку в пост)

А собственно, если есть браузер, то таких проблем не возникает в принципе. В 30-70% случаев после этого отдается обычная страница сайта, с которой уже и работаю дальше. Почему такой разброс в процентах, а Бог его знает, что там себе CF думает. На этих выходных вообще 99% был отлуп на второй шаг.


Второй шаг, который любезно предоставляет нам CF это капча,

https://imgur.com/a/RgCZhen, она бывает разная, видимо версия 2 или 3, подвязывать CapMonster наверное можно, но, признаться, у меня он разгадывает капчи плохо, а если говорить про 100 потоков,
то вообще сервер дохнет, доступа к нему нет (а сервер мощный, 32 ядра, 128 оперативки, SSD), это у меня так или у всех так?

Поэтому приходится прокси, которая получила капчу списывать утиль.

Есть третий вариант развития событий это Error 1009:
https://imgur.com/A1WANXO, и прокси тоже списываю в утиль. :(

Вот такая вот картина на данный момент, если кто понимает что мне делать и поможет дельным советом - то... спасибо мало, буду благодарен финансово
Там не пытаются, там готовый шаблон приложен. На запросах получаете куки, подставляете ответ на рекаптчу, если требуется и в путь.
 

Dp76

Client
Регистрация
24.01.2019
Сообщения
104
Благодарностей
16
Баллы
18
Рекапча на 100 потоках убивает мой тазик
 

Bas

Client
Регистрация
15.12.2013
Сообщения
632
Благодарностей
260
Баллы
63
Рекапча на 100 потоках убивает мой тазик
А тебе и не надо 100 потоков. Ты же парсишь сейчас, говоришь не всегда рекаптча лезет. Ну так а зачем ее гадать всегда? Гадай по мере появления, а лучше гадай отдельным шабом в столько потоков, сколько не напрягают излишне систему, а в своем шабе парсинга бери готовый ответ из того шаба по мере необходимости. В общем я бы логику твоего шаблона совсем иначе строил.
 
  • Спасибо
Реакции: Dp76

Dp76

Client
Регистрация
24.01.2019
Сообщения
104
Благодарностей
16
Баллы
18
А тебе и не надо 100 потоков. Ты же парсишь сейчас, говоришь не всегда рекаптча лезет. Ну так а зачем ее гадать всегда? Гадай по мере появления, а лучше гадай отдельным шабом в столько потоков, сколько не напрягают излишне систему, а в своем шабе парсинга бери готовый ответ из того шаба по мере необходимости. В общем я бы логику твоего шаблона совсем иначе строил.
А связаться с Вами как-то можно? Я не вижу такого функционала для меня, это ограничения форума?
 

Dima_External

Пользователь
Регистрация
23.10.2017
Сообщения
75
Благодарностей
4
Баллы
8
и есть пакетный оператор, они не продают поштучно ip.

По сабжу - Cloudflare давно на запросах обходится. У меня правда нашелся индивид (сайт) который ни в какую не обходится, что-то видимо докрутили/нахимичили, но на 99% сайтов обходится без проблем. Здесь на форуме тема есть, поищите. И будет Вам 300 потоков ЗП = ~150-200 потоков на стороне прокси провайдера, в зависимости от скорости обработки данных.
Привет, можешь отписать пожалуйста в личку? Вопрос по клаудфлейру
 

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)