Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save InstaRobot/c71ca0bffb733cab7da169b0b2882c13 to your computer and use it in GitHub Desktop.
Save InstaRobot/c71ca0bffb733cab7da169b0b2882c13 to your computer and use it in GitHub Desktop.
// Первый вариант
wget -r -l0 -k http://apple.com/
// Второй вариант - более подробный
wget -r -k -l 100 -p -E -nc http://clean-vk.instarobot.net
А теперь немного подробнее о параметрах wget.
-r – данный параметр указывает на то, что нужно рекурсивно переходить по ссылкам на скачиваемом сайте.
-k – данный параметр используется для того, чтобы wget преобразовал все ссылки в загруженных файлах для последующего просмотра в автономном режиме.
-l – данный параметр задает максимальную глубину вложенности страниц, которые wget должен скачать. В своем примере я указал 1 (единица), в результате загрузилась только главная страница. Рекомендуется устанавливать данный параметр на значении 5-8. Если установить большее значение, то wget может “зарыться” так глубоко, что скачивание будет идти бесконечно.
-p – данный параметр нужен для того, чтобы загрузить все файлы, которые нужны для корректного отображения страниц (изображения, css, java и т.д.).
-E – данный параметр добавляет к загруженным файлам (страничкам) расширение .html.
-nc – данный параметр исключает перезапись существующих файлов. Это может быть полезно, если сайт не загрузился за раз, либо загрузка была прервана по каким-либо причинам.
// Скачать утилиту wget: http://konstantin.in/dc/aHR0cDovL2tvbnN0YW50aW4uaW4vdXBsb2Fkcy8yMDE1LzAxL2dudS13Z2V0LWtvbnN0YW50aW4uaW5fLnppcA==
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment