Как быстро парсить ?

Svyat

Client
Регистрация
10.04.2012
Сообщения
97
Благодарностей
8
Баллы
8
Есть у меня 220000 страниц для парсинга.

Настроил я все, чтоб все поля сохранялись. Протестил все вроде гуд.

Теперь проблема, ставлю 20 потоков, но больше 5-10 не поднимается.

Как сделать чтоб подгужать только код html, может как нибуть get запросом, или еще как-то.
А то я повыключал уже и javascript и картинки, но все равно медлено страницу грузит, наврено css грузит, да и компилирует html код для браузера.

Одним словом, можно ли грузить html код страницы каким-то другим макросом, не использую макрос (переходы на страницу, потом взять Dom) может через C# есть готовые скрипты.

Короче нужно сделать паука, а не полноценного серфера.
 

myweb101

Client
Регистрация
29.04.2013
Сообщения
175
Благодарностей
30
Баллы
28
Только GET запросами.
Берешь страницу и регулярными выражениями берешь нужные ссылки ссылки и переходишь на них.
 

bedl0

Client
Регистрация
07.12.2012
Сообщения
244
Благодарностей
56
Баллы
28
Все верно, толь ко GET запросами или использовать специализированный софт для парсинга.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)