Шаблон для сбора контактов с сайтов.

Регистрация
24.12.2015
Сообщения
20
Реакции
6
Баллы
3
Задача,по списку сайтов собрать контакты:
мыла
телефоны
вайбер
скайп и так далее..

Какие будут предложения?
цена вопроса..

Сменить фото
ася 633130891 или в личку..
 
Перемещаю и апаю)
 
Спасибо что переместили,вопрос актуальный,хоть и нашел софт,но он собрал только мыла с 25% сайтов,а телефоны и скайпы нет..
 
спарсить везде мыло не сложно. А вот телефоны и остальное...
Вопрос стоит не сложно-не сложно,можно нельзя,а нужны конкретные предложения,результат 25 % мыл со всех сайтов и ноль процентов всего остального,меня не устраиват.
 
Вопрос стоит не сложно-не сложно,можно нельзя,а нужны конкретные предложения,результат 25 % мыл со всех сайтов и ноль процентов всего остального,меня не устраиват.
Можно, конечно! Только, скорее всего, под каждый сайт нужно будет составлять свои регулярки для парсинга.
 
Приветствую

На разных сайтах по разным адресам находится страничка контактов, + в разных форматах почта, телефоны, скайпы...
Автоматизировать полностью сложно.
Мой совет.
Делайте в 2 етапа.
Сначала находите странички контактов... Рекомендую через гугл
https://www.google.com.ua/search?num=100&newwindow=1&safe=off&q=Contacts site:http://zennolab.com&oq=Contacts site:http://zennolab.com&gs_l=serp.12...5523.26068.0.27569.22.15.7.0.0.0.148.1495.11j4.15.0....0...1c.1.64.serp..0.17.1263.yDgkphd7NYY

Самый оптимальный способ.

Дальше извлекать. Тут сначала сохранять скриншо странички + html код. А дальше в ручную добавлять регулярки. Для поиска скайпов емейлов асек .... Тоесть постоянно до обучать свой шаблон под разни,е форматы. Со временем пробив будет больше чем 25 проц.
Или если нужно не в мега промишленных маштабах в ручную сохранять в табиличке с сохраненных на 1 етапе страничек.
 
  • Спасибо
Реакции: CSS
мыльники есть мыльники. Там и одной регулярки хватит. Можно парсить все ссылки с главной страницы, а по ним уже искать почту. Будет затратно по времени - но пробив должен быть очень высок
 
у меня 12к сайтов,на каждый свой софт??
не нужно свой софт на каждый сайт..
как уже говорили выше - нужно по одной регулярке на каждый вид контакта и максимально эффективно собирать урлы страниц сайтов..
 
  • Спасибо
Реакции: Dimionix
у меня 12к сайтов,на каждый свой софт??
Среди которых соцсети, Авито и т.п.:-)

Для мыльников и телефонов еще можно подобрать общие регулярки, и то при условии, что они будут лежать в одном теге. Насчет остальных контактов нужно смотреть сайты. Так что нужны примеры. Без них, вряд ли вы какие-то предложения услышите.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)