- Регистрация
- 20.02.2015
- Сообщения
- 1 051
- Благодарностей
- 440
- Баллы
- 83
В рассылке есть скрипт на Руби для загрузки всего веб-сайт из интернет-архива со структурой. Я сделал видео по установке Руби и показал, как скачивать сайт. Это идет как бонус. Сам принцип WebArchiveMastersV4.13 совсем другой - забирать только тексты и проверять на уникальность. Парсинг всего сайта в 2022 давно не имеет смысла. Также там могут быть картинки из личного архива, с этими картинками уже были прецеденты, поэтому я забираю только текст.
Только что спарсил на Руби, прикладываю, запустить на Опен Сервере, возможно, поправить css. В принципе, готовый сайт.
Только что спарсил на Руби, прикладываю, запустить на Опен Сервере, возможно, поправить css. В принципе, готовый сайт.
Вложения
-
10,7 МБ Просмотры: 154