Wie man eine Website mit wget herunterlädt und spiegelt

In einer zunehmend vernetzten digitalen Welt ist es eine erhebliche Erleichterung, auf Webinhalte zuzugreifen, auch wenn man offline ist. Eine der nützlichsten Techniken, um eine komplette Website herunterzuladen und zu spiegeln, ist die Verwendung des Tools wget. Mit diesem leistungsstarken und vielseitigen Befehl können Sie eine vollständige Kopie einer Website einschließlich ihrer Seiten, Bilder, CSS-Dateien und JavaScript herunterladen, sodass Sie die Seite offline durchsuchen oder eine Sicherungskopie erstellen können.

Was ist wget?

wget (World Wide Web Get) ist ein Kommandozeilenwerkzeug, mit dem Sie Inhalte aus dem Internet herunterladen können. Es wird auf Unix-, Linux- und macOS-Systemen weit verbreitet verwendet, kann aber auch unter Windows installiert werden. wget ist besonders nützlich, um ganze Websites oder einzelne Dateien automatisiert herunterzuladen und dabei die ursprüngliche Struktur der Links zwischen den Seiten beizubehalten.

Wie man mit wget eine Website spiegelt

Wenn Sie eine Website spiegeln müssen, also sie vollständig herunterladen möchten, um sie offline zu durchsuchen oder eine Sicherungskopie zu erstellen, können Sie den wget-Befehl mit einigen spezifischen Optionen verwenden.

Grundlegender Befehl

Der Befehl, um eine vollständige Website mit wget herunterzuladen, lautet wie folgt:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent -P /pfad/zum/speichern https://www.ihre-website.com

Erklärung der Optionen:

  • --mirror: Aktiviert die vollständige Spiegelung, bei der alle Seiten, Bilder und benötigten Dateien heruntergeladen werden.
  • --convert-links: Konvertiert alle Links in den heruntergeladenen Seiten, sodass sie offline navigierbar sind.
  • --adjust-extension: Fügt den heruntergeladenen Dateien die entsprechende Erweiterung hinzu (z. B. .html, .jpg usw.).
  • --page-requisites: Lädt alle erforderlichen Ressourcen herunter, die zum korrekten Anzeigen der Seiten benötigt werden (z. B. CSS, Bilder, Skripte).
  • --no-parent: Verhindert das Herunterladen von Dateien, die sich außerhalb des angegebenen Verzeichnisses der Website befinden.
  • -P /pfad/zum/speichern: Gibt das Verzeichnis an, in dem die Website gespeichert werden soll.

Praktisches Beispiel

Angenommen, Sie möchten die Website https://www.ihre-website.com in den Ordner /Users/vincenzo/Downloads/website herunterladen. Der Befehl lautet dann:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent -P /Users/vincenzo/Downloads/website https://www.ihre-website.com

Dieser Befehl erstellt eine vollständige Kopie der Website im angegebenen Ordner, mit allen notwendigen Dateien für das Offline-Browsing.

Warum sollte man wget zum Spiegeln einer Website verwenden?

  • Offline-Browsing: Sie können die Website ohne Internetverbindung aufrufen, was besonders praktisch ist, wenn Sie reisen oder an Orten mit eingeschränkter Konnektivität sind.
  • Website-Backups: Sie können eine Sicherung der Website erstellen, was nützlich ist, wenn Sie eine statische Version davon archivieren möchten.
  • Geschwindigkeit und Automatisierung: wget ist schnell und kann problemlos automatisiert werden, um große Websites herunterzuladen.

Wichtige Überlegungen

  • Urheberrecht: Stellen Sie sicher, dass Sie die Erlaubnis haben, den Inhalt einer Website herunterzuladen und zu nutzen. Einige Websites verbieten den Download über ihre robots.txt.
  • Festplattenspeicher: Eine vollständige Website, insbesondere eine mit vielen Bildern und Multimedia-Dateien, kann viel Speicherplatz beanspruchen. Stellen Sie sicher, dass Sie genügend Speicherplatz auf Ihrer Festplatte haben.
  • Download-Zeit: Je nach Größe der Website und Ihrer Internetverbindung kann der Spiegelungsprozess einige Zeit in Anspruch nehmen.

Fazit

Die Verwendung von wget zum Herunterladen einer vollständigen Website ist eine leistungsstarke und flexible Technik. Wenn Sie eine Website offline durchsuchen oder eine Sicherung erstellen möchten, ist wget eines der besten Tools, die Ihnen zur Verfügung stehen. Mit den richtigen Optionen können Sie den Befehl leicht an Ihre Bedürfnisse anpassen.