Находим уязвимости сайтов или как я спарсил 6 млн. почт с Яндекса

guloc

Client
Регистрация
12.09.2016
Сообщения
153
Реакции
151
Баллы
43
Всем привет, решил поучаствовать в данном конкурсе это моя первая статья, так что не кидайтесь камнями)

С зенкой работаю же давно и заметил такую особенность ума у себя да и у многих разработчиков, что когда заходишь на любой сайт, смотришь уже не так как прежде, а выявляешь те моменты которые обычный пользователь сети не видит. А именно приходят идеи а как получить трафик с того или иного ресурса? Как автоматизировать и как получить профит? И так далее..

Таким образом ум находит лазейки и слабые места сайта уже на автомате и превращает это в выгоду. (иногда это приносит реальные деньги:bf:)

Под уязвимостью ниже будет пониматься - визуальные уязвимости (слабые места айта) с помощью которых мы можем собрать информацию, или массово сделать рассылку (спам)
Для того чтобы найти слабые места сайтов, не обязательно быть хакером или профессионально разбираться в коде. На самом деле большинство уязвимостей сайта можно определить визуально:

1. Адрес урл
2. Название Никнеймов
3. Наличие средств общения на сайте.

С помощью https://www.similarweb.com/ мы можем найти площадки на которых находятся много народу (большая посещаемость), обычно на таких сайтах есть всё для общения, так как такие площадки и собирают большую аудиторию благодаря постингу интересного контента и факту самого общения между друг другом, по средством внутренних инструментов самого сайта.

Для примера возьмём сервис Яндекса "Яндекс районы" заходим и выбираем любого пользователя. Думаю первые 300 лучше не брать это скорей всего разработчики и тестовые аккаунты, команды Яндекс.

Смотрим адрес Урл страницы

24-512.png

Как мы видим в ссылке есть цифра, это номер id юзера, чем меньше цифра тем старше возраст аккаунта (обычно так).
Возможно случится так что данная цифра, не является номером id, для того чтобы узнать наверняка, мы можем заменить последнюю цифру на любую другую и если мы перейдём на анкету другого юзера то, это то что нам нужно.
Далее смотрим сюда:

2.png

Раньше никнеймы были в виде ссылки и через код мы могли вытащить почту подставить к данному нику @yandex.ru, сейчас Яндекс убрал ссылку на данное значение.
Но мы также можем взять ник который видим визуально на странице обычно этот ник и есть начало почты и вывести это значение в виде mitlin.vs@yandex.ru и получим валидную почту)

Также в сервисе есть и ники в виде русских имён (раньше вытаскивал и с русских имён), такие почты не получить, но мой шаб обходит данные ники и не собирает их. Другими словами он не берёт те ники которые используют кириллицу.

Таким способом я собрал более 6 млн почт) данный способ ещё работает, но половину почт уже не получить, так как была убрана ссылка из никнейма и в некоторых аккаунта прописаны русские имена.

Давайте разберём ещё один пример. К примеру мы нашли сайт, зарегистрировались и если в урл уже есть такая же схема как и в Яндексе нам не нужно парсить пользователей, а спамить в личку уже с помощью перебора цифр, прибавляя к каждому значению +1, в итоге мы будем заходить в личку каждому и писать в лс. Но это только в том случае если мы спамим под какую то общую тематику, которая бы подходила и мужчинам и женщинам, просто на многих сайтах нет выбора пола в поиске.

Так как я специализируюсь на разработке проектов под Яндекс, в Яндексе это не один такой сервис где можно собрать информацию с юзеров.

Есть куча других сайтов в которых через урл можно получить данные пользователей. Поэтому обязательно смотрите строку адреса урл, она может дать многое для автоматизации.

Прилагаю шаблон:

Шаблон парсит как через веб так и через get, через get нужно много проксей, через веб безопасней.

Яндекс прости)
 
Номер конкурса статей
  1. Одиннадцатый конкурс статей
Тема статьи
  1. Парсинг

Вложения

Последнее редактирование модератором:
  • Спасибо
Реакции: samsonnn
бывает даже - что нет цифр - а название фирмы в урле. но когда сам делаешь регистрацию, то до того как дал название фирмы - там цифры - дефис - и стандартная приписка. и дальше уже зная это - подставляешь цифры с припиской
 
По чем такая база будет стоить? Чисто любопытство.
 
Это точно подмечено! :-)
я на второй день покупки зенки себя тоже начал так вести, причем успешно, к тому же я иногда смотрю рекламные ссылки на почтовиках, и там тоже попадаются болванчики админы очень интересных сайтов для формата зенки
 
По чем такая база будет стоить? Чисто любопытство.
Базу продал за 10 к. не знаю много или мало) Но там ситуация такая что все аки практически живые, плохие аки (без привязки телефона зареганые на паблик прокси, и с наложеными фильтрами но рабочие) яндекс туда не пускает. Там только качественные аки.
 
знакомая схема))) тоже люблю так повытаскивать акки
 
Годная статья, возможно получишь второе место в конкурсе --- вангую, а точней бумергую)))) может спалишь еще тут что то в комментариях. ты же понимаешь что чем полезней твой материал тем больше последователей в голосование. Если щас какой то школьник выкатит опять шаблон что на буксе вырвал 1 миллард рубасов - то он выиграет конкурс. дай нам больше конкретики.
 
Годная статья, возможно получишь второе место в конкурсе --- вангую, а точней бумергую)))) может спалишь еще тут что то в комментариях. ты же понимаешь что чем полезней твой материал тем больше последователей в голосование. Если щас какой то школьник выкатит опять шаблон что на буксе вырвал 1 миллард рубасов - то он выиграет конкурс. дай нам больше конкретики.
Вечно вы всем недовольны. Хоть бы сами написали что-то годное.
Человек показал рабочую идею, которая новичкам будет в самый раз, и не только новичкам.

Хорошая статья!
 
Последнее редактирование:
  • Спасибо
Реакции: guloc
Отличная статья. Показывает что надо мыслить куда шире и в разных плоскостях)
 
  • Спасибо
Реакции: guloc
Хорошая статья) раньше на некоторых проектах мейлру можно было тоже почты выдирать, но базы тематические получались (например, мамочки или автомобилисты)
 
  • Спасибо
Реакции: guloc
Во сколько потоков парсил? Что-то очень медленно идет и дублей по 5 штук в среднем.
 
Во сколько потоков парсил? Что-то очень медленно идет и дублей по 5 штук в среднем.
Я уже не помню, зависило от работы других шаблонов не менее 5 потоков
 
Здравствуйте, спасибо за статью, а сколько нужно прокси для нормальной работы?
 
Здравствуйте, спасибо за статью, а сколько нужно прокси для нормальной работы?
Чем больше тем лучше, можно взять на proxi6 в аренду на 3 дня прокси ipv6 по 3 р. за штуку. Либо паблик использовать.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)