Das Projekt e-Helvetica der Schweizerischen Landesbibliothek
Zwei Teilprojekte: «Organisation» und «Archivierung»
Elektronische Information: Langzeitarchivierung
Konfrontierte man Gesprächspartner vor einigen Jahren mit der Idee, Archivbibliotheken müssten Teile der im Internet publizierten Information langfristig aufbewahren, erntete man oft ein ungläubiges Kopfschütteln oder ein mitleidiges Lächeln.
Die Argumente waren fast immer dieselben. Ein solches Vorhaben sei nicht realisierbar und auch für die zukünftigen Generationen überhaupt nicht interessant oder relevant. Der Charme des Internets bestehe ja gerade in seiner Flüchtigkeit. Im Weiteren sei ein solches Vorhaben technisch unmöglich.
Trotz aller Skepsis beschäftigen sich seit ein paar Jahren namhafte Institutionen in Projekten und aus den daraus realisierten Applikationen mit der Aufbewahrung elektronischer Information aus dem Internet.
Die Anliegen im Bibliotheksumfeld im Bezug auf elektronische Information sind in drei Kategorien einteilbar:
1. Verfügbarkeit: Der Zugriff auf elektronische Information soll zu möglichst kostengünstigen Konditionen für die Ziel- und Anspruchsgruppen der jeweiligen Institution gewährleistet sein.
2. Archivierung: Die Verfügbarkeit soll auch dann noch gewährleistet sein, wenn die Information nicht mehr gegen Bezahlung oder frei im Internet zur Verfügung steht.
3. Digitalisierung: Auf analogen Trägern vorhandene Information soll mit möglichst attraktiven Suchmöglichkeiten ausgestattet auf dem Internet breit zugänglich gemacht werden.
Der Idee der Aufbewahrung von Teilen der im Internet publizierten Information wird heute zwar immer noch mit einiger Skepsis begegnet. Durch die eindrucksvolle Verbreitung des Gebrauchs des Internets und durch die verbesserte Sensibilisierung der Wichtigkeit der Aufbewahrung von sogenannten «Gedächtnis-Objekten» wird grundsätzlich die Sinnhaftigkeit, Internetpublikationen zu archivieren, nicht mehr angezweifelt. Die Zweifel liegen heute eher, und nicht ganz unbegründet, bei der Frage der Machbarkeit.
Die Aktivitäten der Schweizerischen Landesbibliothek
Die Schweizerische Landesbibliothek ist weltweit die wichtigste schriftliche Quelle zum Verständnis der Schweiz und der schweizerischen Bevölkerung.
Sie hat den Auftrag, «gedruckte oder auf anderen Informationsträgern gespeicherte Informationen, die einen Bezug zur Schweiz haben, zu sammeln, zu erschliessen, zu erhalten und zu vermitteln»Bundesgesetz über die Schweizerische Landesbibliothek vom 18. Dezember 1992..
Bereits zum Zeitpunkt der Entstehung des Gesetzes zeichnete sich eine Änderung im Informationsmarkt ab. Im Gesetz von 1992 ist nicht mehr der Träger wichtig, sondern der Bezug der Information zur Schweiz. Nach dem breiten Aufkommen des Internets ab 1993 beschäftigte sich die Schweizerische Landesbibliothek zuerst in diversen Vorprojekten und ab 2001 im Projekt e-Helvetica mit der Frage, ob und wie elektronische Publikationen zukünftig langfristig gesichert und für die spätere Konsultation aufbewahrt werden können.
Das Projekt e-Helvetica1, 2hat das Ziel, die Grundlagen für das Sammeln, Erschliessen, Archivieren und Vermitteln von elektronischen Off- und Online-Helvetica zu schaffen.
Offline-Helvetica sind Trägermedien, zum Beispiel Disketten, CD-ROM oder DVD.
Online-Helvetica sind Internet-Publikationen. Im Projekthandbuch sind die grundsätzlichen Ziele und Termine und die Projektstruktur definiert. Ebenso wird der Finanzbedarf für das Projekt und den späteren Betrieb geplant.
Die Schweizerische Landesbibliothek befolgt als Institution der Eidgenossenschaft deren Regeln. So bezieht sie die IT-Dienstleistungen beispielsweise von einem bundesinternen Leistungserbringer. Mögliche Synergiepotenziale mit anderen Bundesinstitutionen werden im Rahmen einer effektiven Zusammenarbeit ausgeschöpft.
Als öffentliche Institution hat sie bei der Beschaffung von Gütern und Dienstleistungen die Regeln für das öffentliche Beschaffungswesen zu befolgen.
Als schweizerische Bibliothek bemüht sich die Schweizerische Landesbibliothek im Rahmen des Projekts e-Helvetica besonders um die Zusammenarbeit mit anderen schweizerischen Bibliotheken auf kantonaler oder universitärer Ebene.
Als Nationalbibliothek hat sie etablierte Kontakte zum schweizerischen Buch- und Informationsmarkt.
International arbeitet sie vor allem mit anderen Nationalbibliotheken zusammen, die einen vergleichbaren Auftrag haben.
Das Projekt e-Helvetica ist unterteilt in zwei Teilprojekte:
Das Teilprojekt «Organisation» ist für die bibliothekarischen Aspekte der e-Helvetica-Sammlung zuständig. Es geht darum, den Sammlungsinhalt festzulegen, die Erschliessung zu bestimmen und die Vermittlung zu konzipieren.
Das Teilprojekt «Archivierung» ist für die IT-Aspekte der e-Helvetica-Sammlung zuständig. Hier werden die technischen Grundlagen und die IT-Applikation für die Sammlungsbearbeitung und -speicherung aufgebaut. Im Projekt arbeiten sowohl bibliothekarische Fachpersonen wie auch IT-Spezialisten mit. Im Projekt teilen sich sieben Mitarbeitende 310 Stellenprozente.
Gemäss Projektplan und aktuellem Projektstand wird e-Helvetica als Projekt Ende 2008 abgeschlossen und in den Betrieb überführt. Ab diesem Zeitpunkt wird die Sammeltätigkeit ausgebaut.
Die Inhalte: Pilotprojekte
Das Teilprojekt «Organisation» ist für die bibliothekarischen Arbeiten zuständig. Die Schweizerische Landesbibliothek hat sich dafür entschieden, eine selektive Sammlung elektronischer Publikationen aufzubauen. Offline-Medien wie Disketten, CD-ROM oder DVD werden vollumfänglich gesammelt. Internet-Publikationen (Online-Medien) werden in möglichst repräsentativer Auswahl selektiv gesammelt.
Bis heute hat sich betreffend der Sammlung von elektronischem Kulturgut in den Nationalbibliotheken kein einheitlicher Usus durchgesetzt.
Einige Nationalbibliotheken sammeln mittels Webharvesting einen möglichst grossen Teil der in ihrem Land publizierten Websites. Andere Nationalbibliotheken bauen eine selektive Sammlung auf.
Die Schweizerische Landesbibliothek hat sich aus rechtlichen Gründen (Urheberrechte), aus Kostengründen (Kosten für die Sammlungsäufnung und Speicherung) und aus Ressourcengründen (Planung und Durchführung der Langzeiterhaltung) für den Aufbau einer selektiven Sammlung entschieden.
Im Rahmen des selektiven Sammlungsaufbaus wird die Sammlung breit angelegt. Als Grundlage für den Sammlungsaufbau und die damit verbundenen Arbeitsschritte werden Publikationen von verschiedenen ausgewählten Herausgebertypen gesammelt. Die Arbeitsabläufe werden in drei und ab 2007 in vier Pilotprojekten konzipiert und mit den bibliothekarischen Arbeiten für die IT-Prozesse verbunden.
Im Pilotprojekt «POP» (Pilotprojekt Übernahme und Archivierung von Online-Verlagspublikationen) werden kommerzielle Publikationen der schweizerischen Traditionsverlage Karger (Basel)3www.karger.com2und Stämpfli (Bern)4gesammelt. Die Schweizerische Landesbibliothek führt dabei die seit den 1920er-Jahren ständig geäufnete gedruckte Sammlung weiter. Die Sammlung besteht grösstenteils aus Online-Periodika-Titeln, die in einem bestimmten Format hergestellt sind. Der Sammlungsaufbau erfolgt in enger Zusammenarbeit und Absprache mit den Verlagen.
Im Pilotprojekt «e-Diss.ch» werden die elektronischen Dissertationen und Habilitationsschriften der schweizerischen Universitäten gesammelt. Der Sammlungsaufbau wird zwischen der Schweizerischen Landesbibliothek und den Universitätsbibliotheken koordiniert. Die Zusammenarbeit wird von der «Konferenz der Universitätsbibliotheken der Schweiz (KUB)» unterstützt. Die Formate entsprechen in der Regel bekannten Standards. Die Urheber sind als Mitglieder der universitären Hochschulen bekannt.
Im Pilotprojekt «Webarchiv Schweiz» werden landeskundliche, nicht kommerzielle Internetsites gesammelt. Der Sammlungsaufbau erfolgt in enger Zusammenarbeit mit den schweizerischen Kantonsbibliotheken, die für die Auswahl der zu sammelnden Publikationen verantwortlich sind.
Im Gegensatz zu den Pilotprojekten «POP» und «e-Diss.ch» sind im Pilotprojekt «Webarchiv Schweiz» die Website-Produzenten und die Formate heterogen.
Ab 2007 wird ein neues Pilotprojekt zur Sammlung von amtlichen elektronischen Publikationen der Eidgenossenschaft gestartet.
Alle von der Schweizerischen Landesbibliothek gesammelten elektronischen Online-Helvetica werden im Online-Katalog Helveticat rudimentär erschlossen. Durch die Speicherung und Archivierung werden sie definitiv in die Sammlung aufgenommen.
In allen Pilotprojekten ist die Zusammenarbeit mit anderen Institutionen wichtig. Die Partner sind Verlage und Informationsherstellende, Universitätsbibliotheken, Kantonsbibliotheken und Verwaltungen.
Technisches: IT-Projekte
Das Archivierungssystem wird gemäss den Vorgaben des generischen Modells «Open Archival Information System (OAIS)»5aufgebaut. Das als ISO 14721 verabschiedete Referenzmodell beschreibt ein Archiv als Organisation, in dem Menschen und Systeme mit der Aufgabenstellung zusammenwirken, Informationen zu erhalten und einer definierten Nutzerschaft verfügbar zu machen. Das Modell beschreibt im Detail, wie die von einem Produzenten hergestellte elektronische Information in ein Archivsystem gelangen soll, welche Bearbeitungsschritte für die langfristige Archivierung vorgenommen werden müssen und wie auf die im Archiv gespeicherte Information zugegriffen werden kann.
Das Modell regelt im Wesentlichen, wie ein von einem Produzenten (Producer) hergestelltes Objekt (SIP = Submission Information Package) in das Archivierungssystem integriert wird (Ingest). Es wird nach dessen Integration in ein Archivierungsobjekt (AIP = Archival Information Package) umgewandelt und im Speichersystem (Archival Storage) abgelegt. Die Verwaltung des Objekts erfolgt im Verwaltungsmodul (Data Management). Das archivierte Objekt (AIP = Archival Information Package) wird via Benutzungsmodul (Access) an den Benutzer unter Einhaltung sämtlicher rechtlicher Einschränkungen als Benutzungsobjekt (DIP = Dissemination Information Package) ausgeliefert.
Die Langzeitarchivierung in Form von Migration und Emulation der Objekte wird im Konservierungsmodul geplant (Preservation Planning). Die Verwaltung des gesamten Archivierungssystems erfolgt im Administrationsmodul (Administration).
Die Arbeitsabläufe sind im Wesentlichen vergleichbar mit den klassischen Arbeitsabläufen einer Bibliothek mit gedruckten Beständen. Die Schwierigkeit beim Aufbauen und Erhalten einer elektronischen Sammlung liegt in den zu archivierenden Objekten. Sie bestehen aus mehreren direkt voneinander abhängigen Komponenten, die für deren Lesbarkeit vorhanden sein müssen (Hardware, Betriebssystem, Programm, Publikation).
Die Schweizerische Landesbibliothek baut ihr Archivierungssystem für elektronische Helvetica nach den Vorgaben des OAIS-Modells auf. Für das Modul «Archival Storage» arbeitet sie im Rahmen der Synergieausschöpfung innerhalb der Bundesverwaltung eng mit dem Schweizerischen Bundesarchiv zusammen. Andere Module wie die Module «Ingest» oder «Access» müssen nach den Bedürfnissen und aufgrund der bibliothekarischen Sammlungsobjekte und Zugriffsmöglichkeiten konzipiert werden.
Soeben wurde das Modul «Ingest» in Betrieb genommen. Die elektronischen Publikationen werden – je nach Produzent – auf verschiedenen Wegen im «Archival Storage» abgelegt. 2007 und 2008 wird das «Access»-Modul für die Sicherstellung des Zugriffs geplant.
Das Metadatenformat der Schweizerischen Landesbibliothek basiert auf dem von der Library of Congress entwickelten Standard METS (Metadata Encoding & Transmission Standard, Version 1.3)6. Für die bibliografischen Metadaten wird MARCxml verwendet. Für die technischen Metadaten werden die Preservation Metadata der National Library of New Zealand (Version Juli 2003) gebraucht.
Eine URN (Uniform Resource Name) ist ein persistenter Identifikator, das heisst eine stabile Adressierung. Persistente Identifikatoren können die URLs (Uniform Resource Locator = «Link» im Internet) im Katalog oder anderen Nachweissystemen ersetzen oder als stabile Referenzen in den Dokumenten selbst angewendet werden. Dadurch werden Links stabil.
Der Pflegeaufwand für die Aktualisierung der Verweise reduziert sich, da URLs nur an einer einzigen Stelle automatisiert gepflegt werden. Die Links können in mehrere Nachweisdienste integriert werden. Digitale Publikationen haben einen weltweit eindeutigen Identifikator und sind damit zuverlässig zitierbar7.
Mit einer URN wird der dauerhafte Zugriff auf ein Objekt sichergestellt. Der dauerhafte Zugriff wird durch Langzeitarchivierung oder Archivierung der Objekte sowie durch die technische Hochverfügbarkeit des URN- Dienstes gewährleistet.
Eine URN verweist auf mindestens eine URL, über welche ein Objekt adressiert wird. Eine URN kann auch mehrere Kopien desselben Objekts, also URLs, verwalten sowie unterschiedliche Präsentationsformate der Objekte.
Die IT-Projekte werden ebenfalls in Zusammenarbeit mit anderen Institutionen realisiert. Das Modul «Archival Storage» wird in Zusammenarbeit mit dem Schweizerischen Bundesarchiv realisiert und auch gemeinsam verwendet. Die übrigen Module werden mit externen Firmen aufgebaut.
Besonders weit entwickelt ist die gemeinsame Verwendung von Standards. So hat die Deutsche Nationalbibliothek beispielsweise ihren URN-Resolving-Dienst für die Schweizerische Landesbibliothek und deren Partnerinstitutionen zur Verfügung gestellt.
Besonders wichtig ist auch der Informationsaustausch mit Institutionen, die in gleichen oder ähnlichen Arbeitsgebieten tätig sind. Damit kann die Entwicklung von verschiedenen Formaten oder Standards vermieden werden.
Was bringt die Zukunft?
Noch befinden sich die Projekte und Anwendungen zur Langzeitarchivierung der wichtigsten digitalen Quellen im Aufbau. Durch unterschiedliche Herangehensweisen und inhaltlich diversifizierte Sammlungen ist es wahrscheinlich, dass wenigstens ein Teil relevanter Informationen aufbewahrt und für zukünftige Generationen zugänglich gemacht wird.
Wie im Bereich der gedruckten Sammlungen entstehen bezüglich Langzeitverfügbarkeit Kosten, die zur Zeit erst in Form von Modellrechnungen evaluiert werden können. Gedächtnisinstitutionen wie National- oder andere Archivbibliotheken müssen sich neben dem Sammlungsaufbau auch mit der Kostenfrage beschäftigen.
Ähnlich wie bei der Erhaltung von Papier werden im Verlauf der Zeit verschiedene Tendenzen bezüglich Konservierung der digitalen Daten entstehen. Es ist deshalb wichtig, die Originalobjekte soweit immer möglich aufzubewahren, damit je nach Technologiefortschritt die adäquaten Konservierungsmassnahmen ergriffen werden können.
Wichtig ist eines: Es ist Aufgabe der Bibliotheken, Information zugänglich zu machen und zu erhalten. Die Schriftlichkeit ist eines der wichtigsten Verbindungs- und Verständniselemente über Jahrhunderte. Sie erlaubt es, Vergangenes zu verstehen, und sie erlaubt Weiterentwicklung.
In welcher Form die Schriftlichkeit vorliegt und an welche Träger und Technologien sie gebunden ist, sagt etwas über die Gesellschaft aus, die die Information vermittelt. Sie muss verfügbar bleiben für kommende Generationen.
Links, weitere Informationen
Informationen zum Projekt e-Helvetica und zu einigen anderen Projekten zur Archivierung elektronischer Publikationen:
– Projekt e-Helvetica, Schweizerische Landesbibliothek (Schweiz) www.e-helvetica.admin.ch
– Nestor – Kompetenznetzwerk Langzeitarchivierung (Deutschland) www.langzeitarchivierung.de
– Österreichische Nationalbibliothek, Langzeitarchivierung (Österreich) www.onb.ac.at/about/lza/
– PADI – Preserving Access to Digital Information (Australien) www.nla.gov.au/padi
– Internet Archive (USA) www.archive.org/index.php
– Digital Preservation, Library of Congress (USA) www.digitalpreservation.gov
– Digital Preservation Coalition (Grossbritannien) www.dpconline.org/graphics