Парсинг данных

twisterrr

Client
Регистрация
25.12.2011
Сообщения
284
Благодарностей
23
Баллы
18

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 438
Благодарностей
9 136
Баллы
113
html код:
<div class="fimg" style="background: url('https://img-cdn.domen.co/wp-content/uploads/2019/06/opossum-vombat-kvokka-kto-milee-0-400x204.jpg') no-repeat;background-size:cover;"></div>

подскажите css селектор, как вытащить картинку?
Можно парсить с помощью регулярки:
Код:
(?<=<div\ class="fimg"\ style="background:\ url\(')[\w\W]*(?='\))
Затем переменную, со спарсенным урлом до картинки,
поместить в кубик Get-запроса, настроить его на загрузку файла,
перед Get-запросом добавить кубик выбора директории, куда должна упасть картинка.

upload_2019-7-3_14-47-46.png
 
Последнее редактирование:
  • Спасибо
Реакции: twisterrr

twisterrr

Client
Регистрация
25.12.2011
Сообщения
284
Благодарностей
23
Баллы
18
Можно парсить с помощью регулярки:
Код:
(?<=<div\ class="fimg"\ style="background:\ url\(')[\w\W]*(?='\))
Затем переменную, со спарсенным урлом до картинки,
поместить в кубик Get-запроса, настроить его на загрузку файла,
перед Get-запросом добавить кубик выбора директории, куда должна упасть картинка.
спасибо я понял, как это применить к странице сайта? нужно сначала спарсить все содержимое сайта и положить в переменную которую в свою очередь нужно вставить в кубик "обработка текста" ? а как спарсить весь html код страницы сайта?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 438
Благодарностей
9 136
Баллы
113
спасибо я понял, как это применить к странице сайта? нужно сначала спарсить все содержимое сайта и положить в переменную которую в свою очередь нужно вставить в кубик "обработка текста" ? а как спарсить весь html код страницы сайта?
upload_2019-7-3_16-31-31.png


Если не нужен Dom, то подставить макрос {-Page.Source-}
Тогда парсинг будет происходить именно по исх. коду страницы.
Если нужно спарсить все ссылки, то в пункте "Что брать" установите "Все" и укажите список, куда спарсить.

Потом в цикле берете строку из списка (урл картинки) с помощью экшена "Операции над списком" и производите цикличное скачивание всех картинок.

upload_2019-7-3_16-39-49.png
 
Последнее редактирование:
  • Спасибо
Реакции: twisterrr

twisterrr

Client
Регистрация
25.12.2011
Сообщения
284
Благодарностей
23
Баллы
18
Посмотреть вложение 40057

Если не нужен Dom, то подставить макрос {-Page.Source-}
Тогда парсинг будет происходить именно по исх. коду страницы.
Если нужно спарсить все ссылки, то в пункте "Что брать" установите "Все" и укажите список, куда спарсить.

Потом в цикле берете строку из списка (урл картинки) с помощью экшена "Операции над списком" и производите цикличное скачивание всех картинок.
все получилось спасибо.
з.ы. просто интересно, с помощью css селектора можно вытащить картинку, из этой строки?
<div class="fimg" style="background: url('https://img-cdn.domen.co/wp-content/uploads/2019/06/opossum-vombat-kvokka-kto-milee-0-400x204.jpg') no-repeat;background-size:cover;"></div>
 
Последнее редактирование:

twisterrr

Client
Регистрация
25.12.2011
Сообщения
284
Благодарностей
23
Баллы
18

Mikhail B.

Client
Регистрация
23.12.2014
Сообщения
14 417
Благодарностей
5 454
Баллы
113
Последнее редактирование:
  • Спасибо
Реакции: twisterrr

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 438
Благодарностей
9 136
Баллы
113
чем отличается макрос {-Page.Source-} от {-Page.Dom-} в практическом плане?
{-Page.Source-} - это исходный код страницы
{-Page.Dom-} - это исх. код страницы с результатом выполнения скриптов.

Если напрмиер требуется спарсить часть страницы, которая генерится скриптом, то нужно использовать {-Page.Dom-},
если этого не требуется, то можно использовать {-Page.Source-}
 
  • Спасибо
Реакции: twisterrr

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)