Webseiten archivieren

Es gibt viele Situationen, in denen es praktisch ist, Webseiten auf dem eigenen Rechner zu archivieren. Sei es, um Lesefutter für Bahnfarten zu haben, um sich den Zugriff auf einen interessanten Spiegel Online-Artikel zu sichern, bevor er im Bezahlarchiv verschwindet, oder aus Angst, eine bestimmte Webseite könnte in absehbarer Zukunft aus dem Internet verschwinden.
In diesem Artikel stelle ich drei unterschiedliche Lösungen vor, mit denen man den Inhalt von Webseiten archivieren kann:

  • Die einfachste Möglichkeit besteht darin, einzelne Seiten einfach per Datei  -> Seite speichern auf die Festplatte des eigenen Rechners zu sichern. Dieses Verfahren funktioniert immer, allerdings verlangt es eine gewisse Disziplin, auf diese Weise eine große Zahl archivierter Webseiten übersichtlich zu organisieren.
  • Der kostenlose Dienst toread bietet eine einfache Möglichkeit, den Inhalt einzelner Webseiten zu archivieren. Nachdem man sich mit der eigenen Email-Adresse bei toread angemeldet hat, bekommt man Zugang auf zwei Bookmarklets, durch die man toread bedient. Drückt man das erste Bookmarklet, so wird die gerade angezeigte Webseite direkt an die eigene Email-Adresse gesendet. Die Mail hat einen Titel der Form
    [toread] Seitentitel.

    Drückt man das zweite Bookmarklet, kann man dem Titel der Mail zusätzliche Informationen (Tags, Metainformationen) hinzufügen. In Kombination mit einem Gmail-Account lassen sich die archivierten Webseiten sehr bequem kategorisieren und durchsuchen.

    Anzumerken ist, dass die Mails lediglich den (HTML-)Quellcode der archivierten Seiten enthalten. Sämtliche Verweise auf Stylesheets, Bilder, externe Dateien und Links werden nicht verändert. Das heißt, man bekommt in den meisten Email-Programmen standardmäßig eine schrecklich formatierte Version der Seite ohne Bilder angezeigt. Man kann zwar alle Emailprogramme dazu bewegen, auch externe Bilder und Dateien zu laden, allerdings sollte man darauf aufgrund der Sicherheitsrisiken verzichten.

  • Eine bessere Lösung zum Archivieren von Webseiten bietet die Firefox-Erweiterung ScrapBook. Mit ScrapBook kann man komplette Webseiten, oder auch nur markierte Ausschnitte, auf dem lokalen Rechner speichern. Die archivierten Webseiten kann man direkt in Firefox in einer hierarchischen Baumansicht organisieren und per Suchfeld durchsuchen. ScrapBook archiviert nicht nur den HTML-Quelltext, wie das oben vorgestellte toread, sondern die gesamte Seite, inklusive Bildern und Stylesheets, so dass die archivierte Seite genauso aussieht, wie das Original.
Ähnliche Artikel:

3 Antworten to “Webseiten archivieren”

  1. Noch eine elegante Möglichkeit: Website als PDF in eine Datei drucken. Setzt natürlich Adobe Acrobat voraus.

  2. Ich nutze für alles HTTrack… Ist zwar nicht ganz so flexibel wie Scrapbook dafür ist alles in einem Ordner kopierbar und fertig. HTTrack ist auch im Gegensatz zu Scrapbook dafür ausgelegt komplette Webseiten zu spiegeln. Scrapbook kann das zwar leidlich auch aber… es fehlen immer wieder Dinge, mich überrascht immer wieder wie HTTrack auch Graphiken aus JavaScript Code liest usw!

  3. Also mir taugt toread sehr. Der Vorteil ist, dass man es von mehreren Rechnern benutzen kann. Wenn ich Seiten permanent speichern wollte, würde ich ein Online-Bookmark-System bevorzugen.

Mitreden