Прошу помощи с правильным подбором Xpath для парсинга картинок с сайтов с установленным плагином "ленивой загрузки" - lazyloaded. Перебрал все варианты, но при парсинге и автоматической публикации в Вордпресс картинок или нет, или
Ссылку пришлитеПрошу помощи с правильным подбором Xpath для парсинга картинок с сайтов с установленным плагином "ленивой загрузки" - lazyloaded. Перебрал все варианты, но при парсинге и автоматической публикации в Вордпресс картинок или нет, или Посмотреть вложение 100378
Ссылку пришлите
Если с этой страницы то вотBeautyTester - Capelli, Trucco, Unghie, Moda e Recensioni
Scopri il mondo della bellezza su BeautyTester.it: recensioni, consigli e tendenze su cosmetici, unghie, moda, capelli e tatuaggi: sempre aggiornato!www.beautytester.it
//*[@id='primary']//li//img
Привет. Вот полное решение парсинга ссылок с картинками.BeautyTester - Capelli, Trucco, Unghie, Moda e Recensioni
Scopri il mondo della bellezza su BeautyTester.it: recensioni, consigli e tendenze su cosmetici, unghie, moda, capelli e tatuaggi: sempre aggiornato!www.beautytester.it
/* xPath:
* .//a[normalize-space()='Load More'] - кнопка к след. странице
*
* .//div[contains(@class,'frame-inner')]/child::img[contains(@srcset,'http')] - получить список всех картинок
* нужно получить srcset, там все размеры картинок
*/
string link = "https://www.beautytester.it";
Tab tab = instance.ActiveTab;
tab.Navigate(link); // зайти на страницу
tab.WaitDownloading(); // ждать загрузки
int check = 0; // счетчик
do
{
HtmlElement button = tab.FindElementByXPath(".//a[normalize-space()='Load More']", 0); // найти кнопку
button.ScrollIntoView();
button.Click();
tab.WaitDownloading();
} while (!tab.FindElementByXPath(".//a[normalize-space()='Load More']", 0).IsNull && ++check < 15); // 15 страниц
HtmlElementCollection collection = tab.FindElementsByXPath(".//div[contains(@class,'frame-inner')]/child::img[contains(@srcset,'http')]");
List<string> resLinks = collection.Select(el => el.GetAttribute("srcset")).ToList();
project.Lists["listZM"].Clear(); // очистить список
project.Lists["listZM"].AddRange(resLinks); // добавить результат в список
foreach (string s in resLinks) project.SendInfoToLog(s); // вывод в лог
Извините, со страницы статьи - https://www.beautytester.it/recensioni/garnier-siero-anti-imperfezioni-ahabha-con-carbone-e-niacinamide-recensione/Если с этой страницы то вотC#://*[@id='primary']//li//img
Все так же как и выше вам показал. Прокрутите в самый низ и потом собираешь картинки.
//div[contains(@class,'wp-block-image')]//child::img[contains(@srcset,'http')]
нужно получить атрибут: srcset
Все так же как и выше вам показал. Прокрутите в самый низ и потом собираешь картинки.
xPath на все картинки://div[contains(@class,'wp-block-image')]//child::img[contains(@srcset,'http')]
нужно получить атрибут:srcset
//*[@class= 'wp-block-image']//figure//img
Да, ваш тоже верный, я не спорю.))C#://*[@class= 'wp-block-image']//figure//img
srcset
.