Добрый день. Нужен парсер данных (. ID В.К., почт адресов и аккаунтов инстаграмм) с сайта айтао - https://ru.itao.com. У меня уже есть парсер постов, соответственно парсер данных должен:
1 - находить автора поста
2 - заходить на страничку и парсить данные в открытом доступе
Для облегчения пункта 1, парсер может идти по постам, которые собрал парсер постов (это будут начальные данные с которых стартует парсер).
Сразу скажу, данные не статичны, но всегда начинаются с определенных символов, например VK = vk.com/***, instagramm = Instagram: *** (. Или др аббревиатура), всего таких аббревиатур не много и в каждой есть значение ( например почты @Mail, @inbox и т.д.), которое можно оформить как критерий для парсера (если есть = берем значение, если нет = не берем). Скрины посмотрите http://prntscr.com/e8obtq и http://prntscr.com/e8oeaz, для наглядности вот пример страниц, и которых с надо будет в итоге парсить Данные https://ru.itao.com/u/927598994 еще и https://ru.itao.com/u/941587582.
Само собой нужны блэк листы для исключения дублей.
Можно СДЕЛАТЬ 2 парсера (как вам удобно), под каждый пункт (1 и 2).
Предлагайте цену и сроки.
1 - находить автора поста
2 - заходить на страничку и парсить данные в открытом доступе
Для облегчения пункта 1, парсер может идти по постам, которые собрал парсер постов (это будут начальные данные с которых стартует парсер).
Сразу скажу, данные не статичны, но всегда начинаются с определенных символов, например VK = vk.com/***, instagramm = Instagram: *** (. Или др аббревиатура), всего таких аббревиатур не много и в каждой есть значение ( например почты @Mail, @inbox и т.д.), которое можно оформить как критерий для парсера (если есть = берем значение, если нет = не берем). Скрины посмотрите http://prntscr.com/e8obtq и http://prntscr.com/e8oeaz, для наглядности вот пример страниц, и которых с надо будет в итоге парсить Данные https://ru.itao.com/u/927598994 еще и https://ru.itao.com/u/941587582.
Само собой нужны блэк листы для исключения дублей.
Можно СДЕЛАТЬ 2 парсера (как вам удобно), под каждый пункт (1 и 2).
Предлагайте цену и сроки.