Online Marketing Wiki

Wayback Machine

« zurück zur Wiki-Übersicht

Die sogenannte Wayback Machine ist ein digitales Webarchiv, das zum Portfolio der Non-Profit-Organisation Internet Archive gehört. Das Archiv speichert seit 1996 Inhalte von Websites in mehr oder minder regelmäßigen Abständen. Seit 2007 ist das Archiv zudem eine offiziell anerkannte Bibliothek im US-Bundesstaat Kalifornien. Ziel der Wayback Machine ist die Langzeitarchivierung großer Teile des World Wide Webs sowie die öffentliche und möglichst barrierefreie Zugänglichkeit der gesammelten Daten.

Bis Juli 2016 wurden etwa 15 Petabyte Daten und mit Stand Juli 2017 bereits √ľber 298 Milliarden Websites abgespeichert. Die Wayback Machine durchsucht dabei selbstst√§ndig das Web und nimmt automatisch neue Internetseiten sowie bestehende Website-Versionen in ihren Index auf.

Kritik an der Wayback Machine

Die Archivierung durch Internet Archive blieb infolge der zunehmenden Diskussionen um den Datenschutz sowie den Schutz von Urheberrechten im Internet ebenfalls nicht ohne Kritik. Werden beispielsweise Inhalte einer Website aus rechtlichen Gr√ľnden entfernt, so kann es sein, dass diese weiterhin √ľber die Wayback Machine abrufbar bleiben. Zudem kritisieren Nutzer des Webarchives, dass die Indexierung nur unregelm√§√üig erfolgt und teils unvollst√§ndig durchgef√ľhrt wird. So k√∂nnen beispielsweise fehlende Multi-Mediadateien dazu f√ľhren, dass die entsprechende Seite √ľberhaupt nicht aufgerufen werden kann.

Ein weiteres Problem sind √Ąnderungen bei der URL, insbesondere von Unterseiten. Wer sich √§ltere Versionen einer Unterseite mit ge√§nderter URL ansehen m√∂chte, der muss wissen, welche genaue URL die Seite zuvor hatte.

Um Ihre Dokumente und Webseiten aus der Wayback Machine zu entfernen oder das Archivieren Ihrer Seite zu verhindern, f√ľgen Sie folgende Zeilen in Ihre Robots.txt.

User-agent: ia_archiver
Disallow: /

Diese Ma√ünahme k√∂nnen Sie √ľbrigens auch nachtr√§glich durchf√ľhren. Laut Internet Archive werden dann alle alten Versionen einer Seite ebenfalls entfernt. Bedenken Sie aber, dass die Wayback Machine auch nur eines der Ged√§chtnisse des Internets ist.

Nutzen der Wayback Machine

F√ľr die Suchmaschinenoptimierung kann das Webarchiv n√ľtzlich sein, wenn Sie auf die Suche nach Fehlern gehen wollen ‚Äď also zur SEO-Diagnose. So k√∂nnten Sie beispielsweise einen neueren Code mit √§lteren Versionen nach einem Absturz in den SERPs vergleichen. Au√üerdem lassen sich verlorene Links, beispielsweise nach einem Relaunch, sowie tote Links ausfindig machen.

Rechtliche Vorz√ľge

Bez√ľglich eines Streites um Duplicate Content beziehungsweise Copyrights, bei dem zum Beispiel eine andere Website Ihre Inhalte widerrechtlich kopiert hat, k√∂nnen sie gegebenenfalls per Wayback Machine nachweisen, dass Sie diesen Content als Erster publiziert haben. Hier kann das Archiv also beim Erfolg sogar zum Schutz des Urheberrechts beitragen. Problematisch k√∂nnten wiederum √§ltere Rechtsverst√∂√üe der eigenen Website sein, die ebenfalls archiviert wurden.

Umfang des Internet Archive

Wie bereits erw√§hnt, die Wayback Machine ist nur ein Teil der digitalen Bibliothek der Non-Profit-Organisation. Internet Archive stellt zudem auch andere ‚Äěurheberrechtsfreie‚Äú Daten der breiten √Ėffentlichkeit zur Verf√ľgung. Hierzu geh√∂ren unter anderem:

  • B√ľcher
  • Videos
  • Musik
  • TV-Angebote
  • Software
  • Bilder
  • Audios

Verweise:

Weitere Artikel