Вопрос по парсингу semrush

potolokwiki

Новичок
Регистрация
18.01.2016
Сообщения
11
Благодарностей
1
Баллы
3
Всем привет. Подскажите по поводу оптимизации проекта.

Написал парсер сервиса semrush.

Сейчас логика работы такая:

- логинимся в сервисе
- берем ключ из списка
- вставляем в поле поиска
- ищем
- скачиваем результат
- конец

Чтобы спарсить следующий ключ, нужно опять залогиниться и выполнить цикл.

Как можно сделать так, что бы софт один раз залогинился, и уже внутри сервиса происходил цикл парсинга ?
 

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
186
Баллы
43
если проект на визуальных кубиках - то просто - организуйте цикл: от взять ключ из списка до скачиваем результат.
 
  • Спасибо
Реакции: potolokwiki

potolokwiki

Новичок
Регистрация
18.01.2016
Сообщения
11
Благодарностей
1
Баллы
3
если проект на визуальных кубиках - то просто - организуйте цикл: от взять ключ из списка до скачиваем результат.
Гдето читал, что лучше не зацикливать проекты внутри. Но попробую и так. Может есть еще решения ?
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 042
Благодарностей
6 474
Баллы
113
если на гетах, то просто сохраняешь куки и делаешь так же в цикл.

я так понимаю шаб на вебе, сделай просто сохранение в профиль после логина, а перед логином сделай проверку на загрузку профиля, если профиль загрузился, то идем парсить, если нет, то логинимся
 
  • Спасибо
Реакции: TIIGR, Gulid и potolokwiki

backoff

Client
Регистрация
20.04.2015
Сообщения
6 042
Благодарностей
6 474
Баллы
113
  • Спасибо
Реакции: TIIGR и Gulid

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
186
Баллы
43
Гдето читал, что лучше не зацикливать проекты внутри. Но попробую и так. Может есть еще решения ?
зацикливания разные бывают, но если нужно перебрать все строки из списка, то по другому более быстрого решения нет.
 

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
186
Баллы
43
не забывай строки из списка брать с удалением, чтобы цикл имел шанс когда-нибудь завершиться.
 

potolokwiki

Новичок
Регистрация
18.01.2016
Сообщения
11
Благодарностей
1
Баллы
3
Проект на кубиках, пока по другому не умею )) Спасибо за подсказки, буду пробовать реализовать.
 
  • Спасибо
Реакции: kapelan28

LiMe

Client
Регистрация
10.12.2015
Сообщения
618
Благодарностей
339
Баллы
63
Проект на кубиках, пока по другому не умею )) Спасибо за подсказки, буду пробовать реализовать.
Зацыкливать без счетчика не надо, иначе по итогу скорость работы снизится, так как ресурсы забьются, сделайте на один логин, и к нему к примеру 10 проверок, и выходим, и так в цикл, и все будет в шоколаде :-)
 

Risk

Client
Регистрация
26.08.2016
Сообщения
75
Благодарностей
26
Баллы
18

potolokwiki

Новичок
Регистрация
18.01.2016
Сообщения
11
Благодарностей
1
Баллы
3

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 332
Благодарностей
9 086
Баллы
113
Всем привет. Подскажите по поводу оптимизации проекта.

Написал парсер сервиса semrush.

Сейчас логика работы такая:

- логинимся в сервисе
- берем ключ из списка
- вставляем в поле поиска
- ищем
- скачиваем результат
- конец

Чтобы спарсить следующий ключ, нужно опять залогиниться и выполнить цикл.

Как можно сделать так, что бы софт один раз залогинился, и уже внутри сервиса происходил цикл парсинга ?
организовать цикл парсинга, как уже советовали выше + перезагрузку инстанса время от времени (по возобновляемому счетчику)..
 

jun_dev

Пользователь
Регистрация
04.08.2017
Сообщения
121
Благодарностей
7
Баллы
18
Цикл внутри проекта, самый лучший на ранней стадии. У самого 4 скрипта работают внутри одного аккаунта, и никаких проблем. Сделай по больше проверок и пауз между выполнениями цикла, ибо Семраш очень хитрый сайт. Если делать одни и те же действия в одном акке, то палево сильное.
Уже не 1 акк улетал в бан, а они денег стоят.
 

potolokwiki

Новичок
Регистрация
18.01.2016
Сообщения
11
Благодарностей
1
Баллы
3
Сделай по больше проверок и пауз между выполнениями цикла
Паузы сделал, шаблон стал стабильнее. А вот по поводу проверок - на что проверять ? Как это реализовать ?
 

jun_dev

Пользователь
Регистрация
04.08.2017
Сообщения
121
Благодарностей
7
Баллы
18
Паузы сделал, шаблон стал стабильнее. А вот по поводу проверок - на что проверять ? Как это реализовать ?
ну когда допустим нет информации по ключам, или закончился аккаунт, или тебя выкинуло из системы.
 

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)