Создание статичной копии сайта

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
236
Благодарностей
9
Баллы
18
Раньше, это легко делалось через wget, сейчас куча защит, которые обходить тяжело, но Зенно с этим справляется прекрасно, собссно поэтому и возникла задача спарсить весь сайт через зенно, но как это сделать, чтобы локальная копия имела внутреннюю перелинковку, дабы я мог развернуть рабочую копию?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
21 491
Благодарностей
9 548
Баллы
113
Раньше, это легко делалось через wget, сейчас куча защит, которые обходить тяжело, но Зенно с этим справляется прекрасно, собссно поэтому и возникла задача спарсить весь сайт через зенно, но как это сделать, чтобы локальная копия имела внутреннюю перелинковку, дабы я мог развернуть рабочую копию?
На днях поднимался этот вопрос, попробуйте поискать по форуму в недавних темах.
Но вопрос был про сторонние приложения. Навскидку одно из таких приложений - ScrapeBox.
 

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
236
Благодарностей
9
Баллы
18
Хотелось бы с зенно этот вопрос решить, а не искать другой софт...
 

code

Administrator
Регистрация
04.06.2025
Сообщения
49
Благодарностей
10
Баллы
8
На днях поднимался этот вопрос, попробуйте поискать по форуму в недавних темах.
Но вопрос был про сторонние приложения. Навскидку одно из таких приложений - ScrapeBox.
Ссылка на тему:

Хотелось бы с зенно этот вопрос решить, а не искать другой софт...
Вероятно, в ZP достаточно долго это реализовывать, из-за чего все выбирают готовые решения.
 
  • Спасибо
Реакции: Sergodjan

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
236
Благодарностей
9
Баллы
18
Ссылка на тему:


Вероятно, в ZP достаточно долго это реализовывать, из-за чего все выбирают готовые решения.

Подобные решения только для обычных сайтов, а для динамических + защищенных всякими cloudflare и бот протектами - это не подойдёт, почему я и думал через зенно это сделать
 
  • Спасибо
Реакции: code

SenSS

Client
Регистрация
26.06.2020
Сообщения
51
Благодарностей
18
Баллы
8
Раньше, это легко делалось через wget, сейчас куча защит, которые обходить тяжело, но Зенно с этим справляется прекрасно, собссно поэтому и возникла задача спарсить весь сайт через зенно, но как это сделать, чтобы локальная копия имела внутреннюю перелинковку, дабы я мог развернуть рабочую копию?
Спарсить и заменить абсолютные пути внутренних ссылок на относительные. Можно зенкой во время парсинга, можно, после парсинга, в notepad++ пакетно изменить все файлы в папке.
Или вопрос не в этом?
 
Последнее редактирование:

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
236
Благодарностей
9
Баллы
18
Спарсить и заменить абсолютные пути внутренних ссылок на относительные. Можно зенкой во время парсинга, можно, после парсинга, в notepad++ пакетно изменить все файлы в папке.
Или вопрос не в этом?
В принципе можно и так, но как в зенке создавать статичные копии страниц?
 

heks

Client
Регистрация
01.10.2013
Сообщения
1 409
Благодарностей
402
Баллы
83
Раньше классный инструмент был черный дракон назывался прикольно было им сайты клонировать и ссылки на сапу и миралинкс скидывать. А при некоторых условиях даже тиц переклеивать))
 

SenSS

Client
Регистрация
26.06.2020
Сообщения
51
Благодарностей
18
Баллы
8
В принципе можно и так, но как в зенке создавать статичные копии страниц?
Как вариант: получить исходный код страницы -> сохранить в файл, имя взять из оригинального урла. Получить ссылки на картинки, скачать их и сохранить в отдельную директорию с заменой путей при парсинге.
Там работы, отсилы, на пару часов, если не нужно заморачиваться с специфическими настройками вывода контента
 

izubr

Client
Регистрация
11.05.2011
Сообщения
606
Благодарностей
276
Баллы
63
Как вариант: получить исходный код страницы -> сохранить в файл, имя взять из оригинального урла. Получить ссылки на картинки, скачать их и сохранить в отдельную директорию с заменой путей при парсинге.
Там работы, отсилы, на пару часов, если не нужно заморачиваться с специфическими настройками вывода контента
а как же .js .css в которых также напичкано и бывают закодированы(js) ?
Взаимодействие PHP и JavaScript, базы даных ? Копии не получится, или нерабочий сайт, а иммитация.
 
Последнее редактирование:

SenSS

Client
Регистрация
26.06.2020
Сообщения
51
Благодарностей
18
Баллы
8
а как же .js .css в которых также напичкано и бывают закодированы(js) ?
Взаимодействие PHP и JavaScript, базы даных ? Копии не получится, или нерабочий сайт, а иммитация.
Вы определитесь - вам шаблон нарисовать или подсказать общий алгоритм?
* Где в стартпосте было сказано про кодированный JS/etc? Да и про PHP спрашивать в данном контексте - людей смешить. Ну а, если, скачивание CSS файлов вызывает затруднение, то учите матчасть
 
Последнее редактирование:

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
236
Благодарностей
9
Баллы
18
Как вариант: получить исходный код страницы -> сохранить в файл, имя взять из оригинального урла. Получить ссылки на картинки, скачать их и сохранить в отдельную директорию с заменой путей при парсинге.
Там работы, отсилы, на пару часов, если не нужно заморачиваться с специфическими настройками вывода контента
Честно я никогда такого в зенно не делал и даже не знаю с чего начать... Надо же не тупо хтмл страницы сохранить, а еще и все элементы скачать и правильные урл всему расставить.
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 819
Благодарностей
1 417
Баллы
113
Ну так в чем вопрос тогда, не совсем понятно. Из коробки зенка этого не сделает. Но при этом зенкой это сделать можно. Просто надо потратить какое-то время, продумать логику и схему замены всех путей во всех файлах.
Есть уже готовые решения, но ими по какой-то причине пользоваться не хочется. Если нужны именно шашечки, то изучать, углубляться (причем, даже не в зенку) и тратить время... Помочь тут вряд ли кто прямо готов будет, поскольку здесь больше про логику, а не конкретный код или кубики (основной кубик, имхо, будет "Обработка текста - Замена" ). Если важно именно на Зенке, но самому лень углубляться, тогда писать ТЗ (но это, опять же, про логику) и искать исполнителя.
 
  • Спасибо
Реакции: SenSS

Nersd

Client
Регистрация
14.02.2019
Сообщения
102
Благодарностей
8
Баллы
18
а что вы с копией делать будете?
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)