пишу цену сразу что бы "крутые" разрабы не тратили своё драгоценное время
для тех кому нужны деньги и у кого есть время и знания - более детальное тз:
даю ключ
бот переходит в гугл выдачу
далее проходит по каждому сайту - можно сразу даже не кликая по выдаче переходить на
сайт/robots.txt
сайт/sitemap.xml
задача - найти сайтмап. обычно он указывается в роботс. если нет - идем по прямому урлу sitemap.xml если нигде не нашли ну болт значит, не повезло.
в выдаче проходим первых 10 страниц, то есть проходим 100 сайтов.
ну собственно самое сложное - все. теперь переходим на сайтмап и считаем в нем количество урлов.
далее надо создать список следующего формата в ткст файле:
урл сайта | количество страниц в сайтмапе
то есть просто подсчитать количество страниц на сайте через сайтмап. усё.
ВНИМАНИЕ - бывает много сайтмапов - их все надо обойти. ну вот пример такого beforeyoubet.org/sitemap_index.xml (это конечно особый случай, уж очень много страниц, но бывает, встречается)
капча/прокси.
оплата СБП или на карту ру.
телега: indaxis
для тех кому нужны деньги и у кого есть время и знания - более детальное тз:
даю ключ
бот переходит в гугл выдачу
далее проходит по каждому сайту - можно сразу даже не кликая по выдаче переходить на
сайт/robots.txt
сайт/sitemap.xml
задача - найти сайтмап. обычно он указывается в роботс. если нет - идем по прямому урлу sitemap.xml если нигде не нашли ну болт значит, не повезло.
в выдаче проходим первых 10 страниц, то есть проходим 100 сайтов.
ну собственно самое сложное - все. теперь переходим на сайтмап и считаем в нем количество урлов.
далее надо создать список следующего формата в ткст файле:
урл сайта | количество страниц в сайтмапе
то есть просто подсчитать количество страниц на сайте через сайтмап. усё.
ВНИМАНИЕ - бывает много сайтмапов - их все надо обойти. ну вот пример такого beforeyoubet.org/sitemap_index.xml (это конечно особый случай, уж очень много страниц, но бывает, встречается)
капча/прокси.
оплата СБП или на карту ру.
телега: indaxis