Создание статичной копии сайта

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
238
Благодарностей
9
Баллы
18
Раньше, это легко делалось через wget, сейчас куча защит, которые обходить тяжело, но Зенно с этим справляется прекрасно, собссно поэтому и возникла задача спарсить весь сайт через зенно, но как это сделать, чтобы локальная копия имела внутреннюю перелинковку, дабы я мог развернуть рабочую копию?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
21 493
Благодарностей
9 550
Баллы
113
Раньше, это легко делалось через wget, сейчас куча защит, которые обходить тяжело, но Зенно с этим справляется прекрасно, собссно поэтому и возникла задача спарсить весь сайт через зенно, но как это сделать, чтобы локальная копия имела внутреннюю перелинковку, дабы я мог развернуть рабочую копию?
На днях поднимался этот вопрос, попробуйте поискать по форуму в недавних темах.
Но вопрос был про сторонние приложения. Навскидку одно из таких приложений - ScrapeBox.
 

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
238
Благодарностей
9
Баллы
18
Хотелось бы с зенно этот вопрос решить, а не искать другой софт...
 

code

Administrator
Регистрация
04.06.2025
Сообщения
49
Благодарностей
10
Баллы
8
На днях поднимался этот вопрос, попробуйте поискать по форуму в недавних темах.
Но вопрос был про сторонние приложения. Навскидку одно из таких приложений - ScrapeBox.
Ссылка на тему:

Хотелось бы с зенно этот вопрос решить, а не искать другой софт...
Вероятно, в ZP достаточно долго это реализовывать, из-за чего все выбирают готовые решения.
 
  • Спасибо
Реакции: Sergodjan

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
238
Благодарностей
9
Баллы
18
Ссылка на тему:


Вероятно, в ZP достаточно долго это реализовывать, из-за чего все выбирают готовые решения.

Подобные решения только для обычных сайтов, а для динамических + защищенных всякими cloudflare и бот протектами - это не подойдёт, почему я и думал через зенно это сделать
 
  • Спасибо
Реакции: code

SenSS

Client
Регистрация
26.06.2020
Сообщения
51
Благодарностей
18
Баллы
8
Раньше, это легко делалось через wget, сейчас куча защит, которые обходить тяжело, но Зенно с этим справляется прекрасно, собссно поэтому и возникла задача спарсить весь сайт через зенно, но как это сделать, чтобы локальная копия имела внутреннюю перелинковку, дабы я мог развернуть рабочую копию?
Спарсить и заменить абсолютные пути внутренних ссылок на относительные. Можно зенкой во время парсинга, можно, после парсинга, в notepad++ пакетно изменить все файлы в папке.
Или вопрос не в этом?
 
Последнее редактирование:

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
238
Благодарностей
9
Баллы
18
Спарсить и заменить абсолютные пути внутренних ссылок на относительные. Можно зенкой во время парсинга, можно, после парсинга, в notepad++ пакетно изменить все файлы в папке.
Или вопрос не в этом?
В принципе можно и так, но как в зенке создавать статичные копии страниц?
 

heks

Client
Регистрация
01.10.2013
Сообщения
1 410
Благодарностей
402
Баллы
83
Раньше классный инструмент был черный дракон назывался прикольно было им сайты клонировать и ссылки на сапу и миралинкс скидывать. А при некоторых условиях даже тиц переклеивать))
 

SenSS

Client
Регистрация
26.06.2020
Сообщения
51
Благодарностей
18
Баллы
8
В принципе можно и так, но как в зенке создавать статичные копии страниц?
Как вариант: получить исходный код страницы -> сохранить в файл, имя взять из оригинального урла. Получить ссылки на картинки, скачать их и сохранить в отдельную директорию с заменой путей при парсинге.
Там работы, отсилы, на пару часов, если не нужно заморачиваться с специфическими настройками вывода контента
 

izubr

Client
Регистрация
11.05.2011
Сообщения
606
Благодарностей
276
Баллы
63
Как вариант: получить исходный код страницы -> сохранить в файл, имя взять из оригинального урла. Получить ссылки на картинки, скачать их и сохранить в отдельную директорию с заменой путей при парсинге.
Там работы, отсилы, на пару часов, если не нужно заморачиваться с специфическими настройками вывода контента
а как же .js .css в которых также напичкано и бывают закодированы(js) ?
Взаимодействие PHP и JavaScript, базы даных ? Копии не получится, или нерабочий сайт, а иммитация.
 
Последнее редактирование:

SenSS

Client
Регистрация
26.06.2020
Сообщения
51
Благодарностей
18
Баллы
8
а как же .js .css в которых также напичкано и бывают закодированы(js) ?
Взаимодействие PHP и JavaScript, базы даных ? Копии не получится, или нерабочий сайт, а иммитация.
Вы определитесь - вам шаблон нарисовать или подсказать общий алгоритм?
* Где в стартпосте было сказано про кодированный JS/etc? Да и про PHP спрашивать в данном контексте - людей смешить. Ну а, если, скачивание CSS файлов вызывает затруднение, то учите матчасть
 
Последнее редактирование:

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
238
Благодарностей
9
Баллы
18
Как вариант: получить исходный код страницы -> сохранить в файл, имя взять из оригинального урла. Получить ссылки на картинки, скачать их и сохранить в отдельную директорию с заменой путей при парсинге.
Там работы, отсилы, на пару часов, если не нужно заморачиваться с специфическими настройками вывода контента
Честно я никогда такого в зенно не делал и даже не знаю с чего начать... Надо же не тупо хтмл страницы сохранить, а еще и все элементы скачать и правильные урл всему расставить.
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 820
Благодарностей
1 417
Баллы
113
Ну так в чем вопрос тогда, не совсем понятно. Из коробки зенка этого не сделает. Но при этом зенкой это сделать можно. Просто надо потратить какое-то время, продумать логику и схему замены всех путей во всех файлах.
Есть уже готовые решения, но ими по какой-то причине пользоваться не хочется. Если нужны именно шашечки, то изучать, углубляться (причем, даже не в зенку) и тратить время... Помочь тут вряд ли кто прямо готов будет, поскольку здесь больше про логику, а не конкретный код или кубики (основной кубик, имхо, будет "Обработка текста - Замена" ). Если важно именно на Зенке, но самому лень углубляться, тогда писать ТЗ (но это, опять же, про логику) и искать исполнителя.
 
  • Спасибо
Реакции: SenSS

Nersd

Client
Регистрация
14.02.2019
Сообщения
102
Благодарностей
8
Баллы
18
а что вы с копией делать будете?
 

igoreff

Client
Регистрация
24.02.2011
Сообщения
213
Благодарностей
31
Баллы
28
Тут как раз главный вопрос для чего это делается, если тупо массово копии на свой домен то там много мусора вылезет, типа разной рекламы, скрипты итд и не всё так просто отловить и заменить своими ссылками, да и смысла в этом нет уже. Если цель что то менять и заливать на свои домены, там уже другой подход будет, ну и так далее
 

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
238
Благодарностей
9
Баллы
18
Ну так в чем вопрос тогда, не совсем понятно. Из коробки зенка этого не сделает. Но при этом зенкой это сделать можно. Просто надо потратить какое-то время, продумать логику и схему замены всех путей во всех файлах.
Есть уже готовые решения, но ими по какой-то причине пользоваться не хочется. Если нужны именно шашечки, то изучать, углубляться (причем, даже не в зенку) и тратить время... Помочь тут вряд ли кто прямо готов будет, поскольку здесь больше про логику, а не конкретный код или кубики (основной кубик, имхо, будет "Обработка текста - Замена" ). Если важно именно на Зенке, но самому лень углубляться, тогда писать ТЗ (но это, опять же, про логику) и искать исполнителя.
Изначальный вопрос был, как раз в том, что в зенке есть готовые кубики или скрипты для этой задачи (казалось бы задачка древняя и её 100 раз уже должны были решать). Если ничего нет, то значит придётся писать всё с 0...
Ну, касательно ТЗ... у меня будет список УРЛ (скажем тыщ 10), по ним надо пройтись и скопировать все страницы статично + изменить УРЛы, чтобы они функционировали в минимальном виде (сохранился внешний вид и все элементы СЕО, а так же адреса страниц и внутренняя перелинковка (домен будет иной) ).
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 820
Благодарностей
1 417
Баллы
113
А какие тут могут быть кубики? "Сделать копию сайта"? Ну, у тебя же есть Зенка, открой, посмотри, там нет такого кубика )) Зенка в целом про возможность сделать то, что тебе нужно самому, а не про то, что она это сделает за тебя.
А так задача, в целом, линейная. Сохранить все страницы. Сохранить все элементы с этих страниц (фото, стили, шрифты, скрипты какие-то простые, если не планируешь постоянно подгружать из с донора и т.д.). Поправить во всех страницах пути к этим элементам. Поправить все ссылки (тут менее линейное, зависит от структуры донора, плюс, возможно, я бы сводил все через какую-то промежуточную базу/таблицу, в которую все варианты замен прописывать).
Но, мне кажется, это все про шашечки, если есть уже готовые решения, которые сделают это быстро и правильно. Но если интересно поразбираться и потренироваться, то это все реализуемо. Ну убьешь времени раз в сто больше, чем взяв готовое, но если цель не в "сэкономить время", то и бог с ним.
 

GoogleMo

Client
Регистрация
13.04.2014
Сообщения
238
Благодарностей
9
Баллы
18
А какие тут могут быть кубики? "Сделать копию сайта"? Ну, у тебя же есть Зенка, открой, посмотри, там нет такого кубика )) Зенка в целом про возможность сделать то, что тебе нужно самому, а не про то, что она это сделает за тебя.
А так задача, в целом, линейная. Сохранить все страницы. Сохранить все элементы с этих страниц (фото, стили, шрифты, скрипты какие-то простые, если не планируешь постоянно подгружать из с донора и т.д.). Поправить во всех страницах пути к этим элементам. Поправить все ссылки (тут менее линейное, зависит от структуры донора, плюс, возможно, я бы сводил все через какую-то промежуточную базу/таблицу, в которую все варианты замен прописывать).
Но, мне кажется, это все про шашечки, если есть уже готовые решения, которые сделают это быстро и правильно. Но если интересно поразбираться и потренироваться, то это все реализуемо. Ну убьешь времени раз в сто больше, чем взяв готовое, но если цель не в "сэкономить время", то и бог с ним.
Я обычно такое делал через wget, но современные сайты имеют кучу защит, которые тяжело через такие старые инструменты обходить. Собссно можете накидать хотя бы простых кубиков для сохранения страницы\скачки файлов с этой страницы? мне бы хотя бы один пример создания статичной страницы через зенно, как это делает любой браузер при нажатии "сохранить как".
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)