Найти одноимённые картинки в html коде

Парс

Новичок
Регистрация
30.11.2020
Сообщения
2
Благодарностей
0
Баллы
1
Всё перепробовал, ничего не помогает, уповаю на ясные головы знающих.
Что есть:
1. HTML страница, в которой находятся несколько повторяющихся jpg элементов.
2. Имена элементов (картинок) повторяются.
3. Имена элементов (картинок) неизвестны. (известно только, что их несколько)
Что нужно:
1. Найти эти элементы (картинки) любым возможным образом. (регулярными выражениями, через паука, через ещё что-либо, без разницы)
2. Было бы здорово если бы существовал способ после нахождения дубликатов ещё и подсветить их на теле страницы, через код. Может существует программа какая для просмотра кода элемента с последующим поиском дубликатов.

Пожалуйста ^!^
 
Последнее редактирование:

Gunjubasik

Client
Регистрация
30.05.2019
Сообщения
3 525
Благодарностей
1 322
Баллы
113
Всё перепробовал, ничего не помогает, уповаю на ясные головы знающих.
Что есть:
1. HTML страница, в которой находятся несколько повторяющихся jpg элементов.
2. Имена элементов (картинок) повторяются.
3. Имена элементов (картинок) неизвестны. (известно только, что их несколько)
Что нужно:
1. Найти эти элементы (картинки) любым возможным образом. (регулярными выражениями, через паука, через ещё что-либо, без разницы)
2. Было бы здорово если бы существовал способ после нахождения дубликатов ещё и подсветить их на теле страницы, через код. Может существует программа какая для просмотра кода элемента с последующим поиском дубликатов.

Пожалуйста ^!^
1. Что бы посмотреть код, используйте в зенке браузер хром и в окне над браузером есть иконка листика, которая откроет DevTool с кодом сайта.
2. Для парсинга используйте Xpath метод.
3. Если хотите удалить дубли, можно сверить либо имена и удалять, либо сверять вес картинок и удалять однотипные.
4. Если хотите что бы вам помогли, дайте пример сайта или код страницы и укажите что вам нужно спарсить.
 

Парс

Новичок
Регистрация
30.11.2020
Сообщения
2
Благодарностей
0
Баллы
1
1. Что бы посмотреть код, используйте в зенке браузер хром и в окне над браузером есть иконка листика, которая откроет DevTool с кодом сайта.
2. Для парсинга используйте Xpath метод.
3. Если хотите удалить дубли, можно сверить либо имена и удалять, либо сверять вес картинок и удалять однотипные.
4. Если хотите что бы вам помогли, дайте пример сайта или код страницы и укажите что вам нужно спарсить.
Что-то вроде того, но с большими массивами работать неудобно. Я нашёл решение в виде UI Vision RPA но не знаю, как заставить её найти похожий текст (код картинки) в других параграфах. Там сразу можно рядами помечать, было бы здорово научить её искать совпадения.
Или может это получится с другими расширениями для Хром/ Firefox вроде Portia , ParseHub , Scrapy ?
 

Gunjubasik

Client
Регистрация
30.05.2019
Сообщения
3 525
Благодарностей
1 322
Баллы
113
Что-то вроде того, но с большими массивами работать неудобно. Я нашёл решение в виде UI Vision RPA но не знаю, как заставить её найти похожий текст (код картинки) в других параграфах. Там сразу можно рядами помечать, было бы здорово научить её искать совпадения.
Или может это получится с другими расширениями для Хром/ Firefox вроде Portia , ParseHub , Scrapy ?
Вы ошиблись форумом, здесь мы zennoposter обсуждаем, а не другой софт.
 

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)