Находим уязвимости сайтов или как я спарсил 6 млн. почт с Яндекса

guloc

Client
Регистрация
12.09.2016
Сообщения
153
Благодарностей
150
Баллы
43
Всем привет, решил поучаствовать в данном конкурсе это моя первая статья, так что не кидайтесь камнями)

С зенкой работаю же давно и заметил такую особенность ума у себя да и у многих разработчиков, что когда заходишь на любой сайт, смотришь уже не так как прежде, а выявляешь те моменты которые обычный пользователь сети не видит. А именно приходят идеи а как получить трафик с того или иного ресурса? Как автоматизировать и как получить профит? И так далее..

Таким образом ум находит лазейки и слабые места сайта уже на автомате и превращает это в выгоду. (иногда это приносит реальные деньги:bf:)

Под уязвимостью ниже будет пониматься - визуальные уязвимости (слабые места айта) с помощью которых мы можем собрать информацию, или массово сделать рассылку (спам)
Для того чтобы найти слабые места сайтов, не обязательно быть хакером или профессионально разбираться в коде. На самом деле большинство уязвимостей сайта можно определить визуально:

1. Адрес урл
2. Название Никнеймов
3. Наличие средств общения на сайте.

С помощью https://www.similarweb.com/ мы можем найти площадки на которых находятся много народу (большая посещаемость), обычно на таких сайтах есть всё для общения, так как такие площадки и собирают большую аудиторию благодаря постингу интересного контента и факту самого общения между друг другом, по средством внутренних инструментов самого сайта.

Для примера возьмём сервис Яндекса "Яндекс районы" заходим и выбираем любого пользователя. Думаю первые 300 лучше не брать это скорей всего разработчики и тестовые аккаунты, команды Яндекс.

Смотрим адрес Урл страницы

24-512.png

Как мы видим в ссылке есть цифра, это номер id юзера, чем меньше цифра тем старше возраст аккаунта (обычно так).
Возможно случится так что данная цифра, не является номером id, для того чтобы узнать наверняка, мы можем заменить последнюю цифру на любую другую и если мы перейдём на анкету другого юзера то, это то что нам нужно.
Далее смотрим сюда:

2.png

Раньше никнеймы были в виде ссылки и через код мы могли вытащить почту подставить к данному нику @yandex.ru, сейчас Яндекс убрал ссылку на данное значение.
Но мы также можем взять ник который видим визуально на странице обычно этот ник и есть начало почты и вывести это значение в виде [email protected] и получим валидную почту)

Также в сервисе есть и ники в виде русских имён (раньше вытаскивал и с русских имён), такие почты не получить, но мой шаб обходит данные ники и не собирает их. Другими словами он не берёт те ники которые используют кириллицу.

Таким способом я собрал более 6 млн почт) данный способ ещё работает, но половину почт уже не получить, так как была убрана ссылка из никнейма и в некоторых аккаунта прописаны русские имена.

Давайте разберём ещё один пример. К примеру мы нашли сайт, зарегистрировались и если в урл уже есть такая же схема как и в Яндексе нам не нужно парсить пользователей, а спамить в личку уже с помощью перебора цифр, прибавляя к каждому значению +1, в итоге мы будем заходить в личку каждому и писать в лс. Но это только в том случае если мы спамим под какую то общую тематику, которая бы подходила и мужчинам и женщинам, просто на многих сайтах нет выбора пола в поиске.

Так как я специализируюсь на разработке проектов под Яндекс, в Яндексе это не один такой сервис где можно собрать информацию с юзеров.

Есть куча других сайтов в которых через урл можно получить данные пользователей. Поэтому обязательно смотрите строку адреса урл, она может дать многое для автоматизации.

Прилагаю шаблон:

Шаблон парсит как через веб так и через get, через get нужно много проксей, через веб безопасней.

Яндекс прости)
 
Тема статьи
Парсинг
Номер конкурса статей
Одиннадцатый конкурс статей

Вложения

Для запуска проектов требуется программа ZennoPoster или ZennoDroid.
Это основное приложение, предназначенное для выполнения автоматизированных шаблонов действий (ботов).
Подробнее...

Для того чтобы запустить шаблон, откройте нужную программу. Нажмите кнопку «Добавить», и выберите файл проекта, который хотите запустить.
Подробнее о том, где и как выполняется проект.

Последнее редактирование модератором:

fri-lancer

Client
Регистрация
01.10.2013
Сообщения
418
Благодарностей
156
Баллы
43
когда заходишь на любой сайт, смотришь уже не так как прежде, а выявляешь те моменты которые обычный пользователь сети не видит.
Это точно подмечено! :-)
 
  • Спасибо
Реакции: guloc

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 407
Благодарностей
9 116
Баллы
113
  • Спасибо
Реакции: samsonnn

arhip1985

Client
Регистрация
31.10.2011
Сообщения
2 994
Благодарностей
787
Баллы
113
бывает даже - что нет цифр - а название фирмы в урле. но когда сам делаешь регистрацию, то до того как дал название фирмы - там цифры - дефис - и стандартная приписка. и дальше уже зная это - подставляешь цифры с припиской
 

inilim

Client
Регистрация
16.09.2017
Сообщения
446
Благодарностей
170
Баллы
43
По чем такая база будет стоить? Чисто любопытство.
 

Supergrok

Client
Регистрация
05.03.2019
Сообщения
171
Благодарностей
156
Баллы
43
Это точно подмечено! :-)
я на второй день покупки зенки себя тоже начал так вести, причем успешно, к тому же я иногда смотрю рекламные ссылки на почтовиках, и там тоже попадаются болванчики админы очень интересных сайтов для формата зенки
 

samsonnn

Client
Регистрация
02.06.2015
Сообщения
1 778
Благодарностей
1 448
Баллы
113

Bollador

Client
Регистрация
24.11.2017
Сообщения
348
Благодарностей
68
Баллы
28

guloc

Client
Регистрация
12.09.2016
Сообщения
153
Благодарностей
150
Баллы
43

guloc

Client
Регистрация
12.09.2016
Сообщения
153
Благодарностей
150
Баллы
43

guloc

Client
Регистрация
12.09.2016
Сообщения
153
Благодарностей
150
Баллы
43
По чем такая база будет стоить? Чисто любопытство.
Базу продал за 10 к. не знаю много или мало) Но там ситуация такая что все аки практически живые, плохие аки (без привязки телефона зареганые на паблик прокси, и с наложеными фильтрами но рабочие) яндекс туда не пускает. Там только качественные аки.
 

Sanekk

Client
Регистрация
24.06.2016
Сообщения
999
Благодарностей
390
Баллы
63
знакомая схема))) тоже люблю так повытаскивать акки
 

ezotonal

Client
Регистрация
13.01.2014
Сообщения
819
Благодарностей
231
Баллы
43

bumer

Client
Регистрация
15.03.2015
Сообщения
225
Благодарностей
81
Баллы
28
Годная статья, возможно получишь второе место в конкурсе --- вангую, а точней бумергую)))) может спалишь еще тут что то в комментариях. ты же понимаешь что чем полезней твой материал тем больше последователей в голосование. Если щас какой то школьник выкатит опять шаблон что на буксе вырвал 1 миллард рубасов - то он выиграет конкурс. дай нам больше конкретики.
 

gevolushn

Известная личность
Регистрация
25.03.2019
Сообщения
518
Благодарностей
269
Баллы
63
Годная статья, возможно получишь второе место в конкурсе --- вангую, а точней бумергую)))) может спалишь еще тут что то в комментариях. ты же понимаешь что чем полезней твой материал тем больше последователей в голосование. Если щас какой то школьник выкатит опять шаблон что на буксе вырвал 1 миллард рубасов - то он выиграет конкурс. дай нам больше конкретики.
Вечно вы всем недовольны. Хоть бы сами написали что-то годное.
Человек показал рабочую идею, которая новичкам будет в самый раз, и не только новичкам.

Хорошая статья!
 
Последнее редактирование:
  • Спасибо
Реакции: guloc

burhanov88

Client
Регистрация
08.04.2015
Сообщения
70
Благодарностей
23
Баллы
8
Отличная статья. Показывает что надо мыслить куда шире и в разных плоскостях)
 
  • Спасибо
Реакции: guloc

Holy LSB

Client
Регистрация
04.07.2016
Сообщения
27
Благодарностей
12
Баллы
3
Хорошая статья) раньше на некоторых проектах мейлру можно было тоже почты выдирать, но базы тематические получались (например, мамочки или автомобилисты)
 
  • Спасибо
Реакции: guloc

Agent

Client
Регистрация
25.12.2018
Сообщения
156
Благодарностей
48
Баллы
28
Во сколько потоков парсил? Что-то очень медленно идет и дублей по 5 штук в среднем.
 

guloc

Client
Регистрация
12.09.2016
Сообщения
153
Благодарностей
150
Баллы
43
Во сколько потоков парсил? Что-то очень медленно идет и дублей по 5 штук в среднем.
Я уже не помню, зависило от работы других шаблонов не менее 5 потоков
 

Zheka84

Client
Регистрация
13.10.2018
Сообщения
163
Благодарностей
24
Баллы
18
Здравствуйте, спасибо за статью, а сколько нужно прокси для нормальной работы?
 

guloc

Client
Регистрация
12.09.2016
Сообщения
153
Благодарностей
150
Баллы
43
Здравствуйте, спасибо за статью, а сколько нужно прокси для нормальной работы?
Чем больше тем лучше, можно взять на proxi6 в аренду на 3 дня прокси ipv6 по 3 р. за штуку. Либо паблик использовать.
 

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)