такой вариант парсит и просто домены , а не именно ссылки на новости, по этому не совсем удачный вариант ...UPD: А потом можно удалить строки, где встречается слово yandex
Какие ссылки на новости?такой вариант парсит и просто домены , а не именно ссылки на новости, по этому не совсем удачный вариант ...
То есть нужно получить конкретно выдачу 10 ссылок на страницы. Приведенный вариант дает еще мусор яндекса и чистые доменыКакие ссылки на новости?
Тебе остается только удалить строки яндекса и дубли. И все.То есть нужно получить конкретно выдачу 10 ссылок на страницы. Приведенный вариант дает еще мусор яндекса и чистые домены
этого мало , ведь он парсит ненужные ссылки помимо яндексаТы не знаешь как удалить строки яндекса из списка?
Нет спасибо, я на форум пришел за советом, а не за покупкой)Сложная задача, думал сделаю быстро но нет, требует времени. Хочешь могу за 1000 р решить данную задачу.
Хорошо. Я попробовал сделать и думал получилось, но когда я зашел опять на страницу яндекса он, что-то поменял. т.е. надо проверять код и подгонять регулярку, это очень муторно, надо копаться с кодом. Вот что получилось, может как-то поможет.Нет спасибо, я на форум пришел за советом, а не за покупкой)
(?<=link\ organic__url\ link_cropped_no\ i-bem)[\w\W]*?(?="\ rel)
(?<=href=").*
Только руки дошли протестирость, да все работает на ура! СпасибоЛайкнул бы хоть ради приличия.