Шаблон для сбора контактов с сайтов.

Регистрация
24.12.2015
Сообщения
20
Благодарностей
6
Баллы
3
Задача,по списку сайтов собрать контакты:
мыла
телефоны
вайбер
скайп и так далее..

Какие будут предложения?
цена вопроса..

Сменить фото
ася 633130891 или в личку..
 

Astraport

Client
Регистрация
01.05.2015
Сообщения
4 983
Благодарностей
4 434
Баллы
113

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
Перемещаю и апаю)
 
Регистрация
24.12.2015
Сообщения
20
Благодарностей
6
Баллы
3
Спасибо что переместили,вопрос актуальный,хоть и нашел софт,но он собрал только мыла с 25% сайтов,а телефоны и скайпы нет..
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113
спарсить везде мыло не сложно. А вот телефоны и остальное...
 
Регистрация
24.12.2015
Сообщения
20
Благодарностей
6
Баллы
3
спарсить везде мыло не сложно. А вот телефоны и остальное...
Вопрос стоит не сложно-не сложно,можно нельзя,а нужны конкретные предложения,результат 25 % мыл со всех сайтов и ноль процентов всего остального,меня не устраиват.
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
Вопрос стоит не сложно-не сложно,можно нельзя,а нужны конкретные предложения,результат 25 % мыл со всех сайтов и ноль процентов всего остального,меня не устраиват.
Можно, конечно! Только, скорее всего, под каждый сайт нужно будет составлять свои регулярки для парсинга.
 

svaminar

Client
Регистрация
21.08.2013
Сообщения
834
Благодарностей
379
Баллы
63
Приветствую

На разных сайтах по разным адресам находится страничка контактов, + в разных форматах почта, телефоны, скайпы...
Автоматизировать полностью сложно.
Мой совет.
Делайте в 2 етапа.
Сначала находите странички контактов... Рекомендую через гугл
https://www.google.com.ua/search?num=100&newwindow=1&safe=off&q=Contacts site:http://zennolab.com&oq=Contacts site:http://zennolab.com&gs_l=serp.12...5523.26068.0.27569.22.15.7.0.0.0.148.1495.11j4.15.0....0...1c.1.64.serp..0.17.1263.yDgkphd7NYY

Самый оптимальный способ.

Дальше извлекать. Тут сначала сохранять скриншо странички + html код. А дальше в ручную добавлять регулярки. Для поиска скайпов емейлов асек .... Тоесть постоянно до обучать свой шаблон под разни,е форматы. Со временем пробив будет больше чем 25 проц.
Или если нужно не в мега промишленных маштабах в ручную сохранять в табиличке с сохраненных на 1 етапе страничек.
 
  • Спасибо
Реакции: CSS

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113
мыльники есть мыльники. Там и одной регулярки хватит. Можно парсить все ссылки с главной страницы, а по ним уже искать почту. Будет затратно по времени - но пробив должен быть очень высок
 

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 451
Благодарностей
1 885
Баллы
113
Регистрация
24.12.2015
Сообщения
20
Благодарностей
6
Баллы
3

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 407
Благодарностей
9 117
Баллы
113
у меня 12к сайтов,на каждый свой софт??
не нужно свой софт на каждый сайт..
как уже говорили выше - нужно по одной регулярке на каждый вид контакта и максимально эффективно собирать урлы страниц сайтов..
 
  • Спасибо
Реакции: Dimionix

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
у меня 12к сайтов,на каждый свой софт??
Среди которых соцсети, Авито и т.п.:-)

Для мыльников и телефонов еще можно подобрать общие регулярки, и то при условии, что они будут лежать в одном теге. Насчет остальных контактов нужно смотреть сайты. Так что нужны примеры. Без них, вряд ли вы какие-то предложения услышите.
 

Кто просматривает тему: (Всего: 4, Пользователи: 0, Гости: 4)