Internet Archive
Das Internet Archive (englisch für Internet-Archiv) in San Francisco ist ein gemeinnütziges Projekt, das 1996 von Brewster Kahle gegründet wurde. Es hat sich die Langzeitarchivierung digitaler Daten in frei zugänglicher Form zur Aufgabe gemacht.
Es speichert Momentaufnahmen von Webseiten, Usenetbeiträgen, Filmen, Tonaufnahmen (hauptsächlich von Live-Konzerten), Büchern und Software. Eine Sicherungskopie der Daten von San Francisco befindet sich in der Bibliothek von Alexandria.
Zum Archiv gehört auch die Wayback Machine (?Zeitmaschine?), mit der man die gespeicherten Webseiten in verschiedenen Versionen abrufen kann. Die Auswahl der zu speichernden Seiten erfolgt über den Dienst Alexa Internet. Alle dort hinterlegten URLs werden regelmäßig aufgerufen und archiviert. Der Gesamtumfang beträgt etwa 85 Milliarden Seiten (Stand: März 2007). Die Seiten werden erst ca. 6 Monate nach dem Indexieren öffentlich verfügbar gemacht.
Problematisch an der Wayback Machine ist, dass auch Inhalte erhalten bleiben, die die Autoren nicht mehr vertreten. So könnten irgendwann einmal geäußerte Meinungen heute zum Einstellungshindernis werden.
Auch rechtswidrige Inhalte, etwa üble Nachreden, werden über Jahre der Öffentlichkeit zugänglich gemacht.
In dem so genannten Million Book Project werden durch das Internet Archive Bücher, die durch das Ablaufen des Copyrights oder aus anderen Gründen gemeinfrei geworden sind, digitalisiert und in den Dateiformaten DjVu, TIFF und PDF zum Download zur Verfügung gestellt.
Die Library of Congress hat im Dezember 2006 sechs Ausnahmen des umstrittenen US-Copyright-Gesetzes Digital Millennium Copyright Act gewährt [http://www.theregister.co.uk/2006/12/01/internet_archive_copyright_reprieve/ Internet Archive wins copyright reprieve], The Register, 1. Dezember 2006. Das Internet Archive darf somit Computer-Software oder -Spiele mit der Absicht der Erhaltung speichern, wenn die Originalhardware, -formate oder -technologie veraltet sind.
Das Archiv hat eine geschätzte Größe von drei Petabyte und wächst um ca. 20 Terabyte pro Monat. Das Archiv ist vom Bundesstaat Kalifornien seit Anfang Mai 2007 offiziell als Bibliothek anerkannt. [http://www.archive.org/iathreads/post-view.php?id=121377 Internet Archive officially a library]
Quellen
Siehe auch
Webarchiv
Internet
Weblinks
• Offizielle Website (englisch)
• Million Book Project (englisch)
• Internetarchiv Alexandria (offizielle Spiegelung)
Technology Review: [http://www.heise.de/tr/artikel/54303 Online in die Vergangenheit (Artikel bei Heise.de)]
• Beispiel für die Wayback Machine (benötigt Javascript)
• Video-Interview mit Internet-Archiv-Gründer Brewster Kahle

