и это читаю.
а можно еще вопрос. вот эта страница
https://www.brickeconomy.com/sets/theme/hidden-side сбивается опять из-за товара промо. оба пути не ищут данного товара и цены с товарами опять не совпадают((.
проверил, вроде одинакого ищут. они не могут сбиться относительно друг друга, так как используется одна база в пути
//td[starts-with(@class,'ctlsets-right')]/div[2]/small[not (@class="label label-default")]//parent::div
и для второго пути используется относительное смещение /following-sibling::div[1]
другое дело как работает кубик парсинга. а он пропускает пустые значения. и получается что по первому xpath имеем 21 элемент , а по 2-му 30.
это не в xpath проблема, а в логике парсинга.
можно посоветовать парсить один верхний элемент по этому пути //td[starts-with(@class,'ctlsets-right')]/div[2]/small[not (@class="label label-default")]//ancestor::td
и получать его innerHtml
и уже потом с каждой записи парсить 1-е и 2-е значение либо через xpath в том же кубике парсинга , либо регуляркой , как удобнее в общем.
вот примерно такой кусок кода вырезается для дальнейшей обработки.
<div class="visible-xs"><a href="/set/70437-1/lego-hidden-side-mystery-castle"><img src="/resources/images/sets/lego-70437-1_medium.jpg" alt="70437 LEGO Hidden Side Mystery Castle" class="ctlsets-setimage" height="91" wdith="118"></a></div>
<div><small class="text-muted mr-5">Retail</small> 99,99 €</div>
<div><small class="label label-default">Available at retail</small></div>
<div id="ContentPlaceHolder1_ctlSets_GridViewSets_PanelUserWantOwn_0" class="ctlsets-wantown text-left hidden-xs">
<div class="ctlsets-wantown-inner">
<div id="ContentPlaceHolder1_ctlSets_GridViewSets_PanelUserSetsNotOwned_0" setid="16571">
<div class="set-ownwanted set-ownwanted-notowned">
<label><span setid="16571" data-toggle="modal" data-target="#LoginModal"><input id="ContentPlaceHolder1_ctlSets_GridViewSets_ckUserSetsNotOwned_0" type="checkbox" name="ctl00$ContentPlaceHolder1$ctlSets$GridViewSets$ctl02$ckUserSetsNotOwned" onclick="$(this).prop('checked', false);"></span> I own this set<span class="set-ownwanted-check"></span></label>
</div>
</div>
<div>
<div id="ContentPlaceHolder1_ctlSets_GridViewSets_PanelUserSetsNotWanted_0" setid="16571">
<div class="set-ownwanted set-ownwanted-notwanted">
<label><span setid="16571" data-toggle="modal" data-target="#LoginModal"><input id="ContentPlaceHolder1_ctlSets_GridViewSets_ckUserSetsNotWanted_0" type="checkbox" name="ctl00$ContentPlaceHolder1$ctlSets$GridViewSets$ctl02$ckUserSetsNotWanted" onclick="$(this).prop('checked', false);"></span> I want this set<span class="set-ownwanted-check"></span></label>
</div>
</div>
</div>
</div>
</div>