|
Das Internet leidet an Gedächtnisschwund. Laufend geben Websites ihren Geist auf. Allerdings, auf anderen Seiten existieren meist noch Verbindungshinweise (Hyperlinks) auf die Verblichenen. Beim Anklicken läuft der Nutzer jedoch ins Leere und erhält Meldungen wie Error 404. File not found oder auch nur ein neckisches Oooops. Im Durchschnitt ist eine Internet-Seite 75 Tage erreichbar. Dann wird sie von einer Nachfolgerin abgelöst oder entschwindet auf Nimmerwiedersehen. Forscher von der University of Nebraska in Lincoln, USA, fanden heraus, dass die Maschenstruktur des Netzes eine Halbwertszeit von nur 55 Monaten hat. Innerhalb dieser Frist wird die Hälfte der Hyperlinks unbrauchbar. Zum Glück gibt es Menschen, die versuchen, dieses schnelllebige Medium für die Nachwelt zu konservieren.
Seit 1996 sammelt der Amerikaner Brewster Kahle Websites mit dem Ziel, ein Langzeitgedächtnis des Netzes zu schaffen. Zusammen mit einigen Unternehmern gründete er das Internet Archive. "Das Archiv gibt einen Einblick in die Ursprünge und Entwicklung des Internet", sagt Kahle. "Ein Spiegelbild unserer Gesellschaft am Ende eines Jahrtausends." Jetzt steht das Museum unter dem Titel WaybackMachine auch privaten Nutzern offen.
Für seine Archivierungen wertet das Team um den kalifornischen Informatiker die Datensammlungen der von ihm entwickelten Suchmaschine Alexa aus. Dieses Programm beschränkt sich nicht darauf, schier endlose Fundlisten zu präsentieren, sondern belohnt häufig besuchte Seiten mit hohen Plätzen in der Trefferliste. Dem virtuellen Sammeltrieb sind allerdings Grenzen gesetzt, etwa durch passwortgeschützte Seiten. Selbst Metasuchmaschinen, die mehrere Suchdienste gleichzeitig auswerten, erfassen noch nicht einmal die Hälfte des weltweiten Netzes.
Die Internet-Archivare machen etwa alle zwei Monate eine Momentaufnahme vom aktuellen Alexa-Bestand. Gelagert werden diese Schnappschüsse in mehreren Großrechnern, die auf ihren Festplatten jeweils über 300 Gigabyte Daten fassen. "Heute besitzt das Internet Archive über 10 Milliarden Websites, die sonst verloren gegangen wären", begeistert sich Brewster Kahle. Gesamtvolumen des digitalen Großgedächtnisses: über 100 Terabyte, das entspricht einem Stapel von ungefähr 1,5 Millionen CD-ROMs. Nach jedem Schnappschuss wächst die Sammlung um weitere zwölf Terabyte.
Damit ist das Internet Archive derzeit die umfangreichste Datenbank der Welt. Zu herausragenden Ereignissen legt das gemeinnützige Projekt aus San Francisco außerdem Sondersammlungen an. Allein zu den Terroranschlägen vom 11. September trug das Museum 500 Millionen Websites zusammen. Die US-Wahl 2000 hielt es in 200 Millionen Homepages fest, darunter auch die digitalen Selbstanpreisungen der Bewerber um den Präsidentenjob. Bereits 1998 schenkte Kahle der amerikanischen Kongressbibliothek einen Schnappschuss des Jahresanfangs 1997. "Eine der bedeutendsten Sammlungen von Gedanken und Ausdrucksformen, die aus einem neuen Medium hervorgegangen sind", kommentierte die Bibliothek den Zuwachs an digitalem Kulturgut.
Spurensuche im Weltgedächtnis
Die Zahl der Konzerne und Institute, die ihre Websites und deren Änderungen vom Internet Archive gezielt dokumentieren lassen, wächst ständig. Inzwischen können auch private Anwender ihre Seiten archivieren lassen, falls sie nicht schon erfasst sind. Der Link Archive Your Site auf dem WaybackMachine-Portal macht aus der privaten Spielerei einen historischen Beleg im virtuellen Weltgedächtnis.
Die Suche in der digitalen Vergangenheit ist simpel. Nach dem Aufruf erscheint eine Suchmaske, in die einfach der Domain-Name eingegeben wird. Wird das Archiv fündig, präsentiert es eine zeitlich geordnete Liste der Museumskopien. Manchmal fehlen den aufgerufenen Seiten allerdings Grafiken oder Banner, manchmal stimmt auch die zeitliche Zuordnung nicht so ganz. Ärgerlich für Web-Archäologen ist aber, dass - wie gehabt - hinter manchen Links die Antwort Not in Archive lauert. Die Gründe dafür sind allerdings nicht unbedingt den Betreibern anzulasten. Denn jeder Eigner einer Homepage kann verlangen, dass seine Seiten wieder aus dem Archiv entfernt werden.
Trotz dieser Mängel besitzt das Internet Archive eine historische Qualität. Schließlich handelt es sich um den ersten umfassenden Versuch, professionelle und populäre Online-Publikationen unabhängig von ihrer Bedeutung dauerhaft für die Nachwelt zu konservieren. Brewster Kahles Vorbild ist die große Bibliothek von Alexandria. In deren weitläufigen Hallen soll einst alles Wissen der antiken Welt verwahrt worden sein. Allerdings ging der gesamte Bestand von rund 700 000 Papyrusrollen im Jahr 47 vor Christus in Flammen auf und wurde restlos vernichtet. Auch digitale Datenträger sind nicht für die Ewigkeit geschaffen. Doch zurzeit ist die Haltbarkeit das kleinste Problem der Cyber-Archivare. Kopfzerbrechen bereitet ihnen das rasante Wachstum der Datenmengen. "Wenn die Leute immer mehr Videos ins Netz stellen", befürchtet Brewster Kahle, "haben wir keine Chance mehr."
SUCHE![]() | |
![]() ![]() |
1.Wort
markieren 2.Button anklicken 3.Erklärung erscheint! |
| ZEIT.DE | POLITIK | DOSSIER | WIRTSCHAFT | WISSEN | FEUILLETON | | LITERATUR | LEBEN | REISEN | CHANCEN | MEDIA | E-VOTE | KULTURKALENDER | | STELLENMARKT | ABO-SHOP | ZEIT-SHOP | ZEIT-VERLAG | PARTNERSUCHE | | IMPRESSUM | MEDIADATEN | DIENSTE | KONTAKT | HILFE | |