«Daten öffnen, weltweit kooperieren» Grosse Fragen, noch keine abschliessenden Antworten
Die neuen Möglichkeiten der nahezu unbegrenzten Verlinkung von Daten, die Aggregation und Analyse riesiger Datenmengen – diskutiert unter den Überbegriffen Big Data, Linked Data und Linked Open Data (LOD) – bieten Bibliotheken völlig neue Chancen, ihre Bestände und besonderen Angebote international sichtbar zu machen. Die neue Technik des Cloud Computings, also der Bereitstellung und Nutzung von Software, Rechen- und Speicherkapazitäten als Onlinedienstleistung, ermöglicht es zudem, Routinearbeiten im eigenen Haus zu reduzieren und sie stattdessen durch Automatisierung, Vernetzung und Abgleich von z.B. Katalogen und Metadaten auf viele Schultern in der Bibliothekswelt zu verteilen. Auch die Informationsauslieferung auf mobile Computer und Smartphones lässt sich über Cloud Services relativ problemlos organisieren.
Soll man seine Daten wirklich für die ganze Welt öffnen? Wie sichert man in einer völlig offenen Welt die nationalen Interessen, wie die des eigenen Hauses? Wer sorgt für eine vernünftige, nachhaltige Ordnung in der Datenablage, der Datenverknüpfung und der Informationspräsentation? Wie kann man es als Bibliothek schaffen, mit dem atemberaubenden Forschungsfortschritt mitzuhalten? Viele grosse Fragen, auf die es heute noch keine abschliessenden Antworten gibt.
Globale Clouds: Problemlösung oder Herstellerabhängigkeit?
Als eine der ersten Bibliotheken in Europa hat die Universität Tilburg Services der cloudbasierten Softwareinfrastruktur WorldShareTM Management Services (WMS) von OCLC in Betrieb genommen: «Wir betreiben, historischgewachsen, seit Jahren mehrere Bibliotheksinformationssysteme (LIS) parallel. Mit der Cloud ist jetzt die Technologie da, hier etwas zu ändern», so ein Mitarbeiter.
Durch die Nutzung einer Cloud Plattform bindet man sich technisch eng an einen Anbieter. Entsprechende Befürchtungen (in Fachkreisen unter dem Begriff «Vendor LockIn») diskutiert, begleiten die neue Technologie. Anja Smit, Direktorin der niederländischen Universitätsbibliothek Utrecht und amtierende Vorsitzende des OCLC EMEA Regional Council hielt den Bedenken in Strassburg das Verbundargument entgegen: «Alle Macht geht von den Mitgliedern aus».
Die Schweizerische Nationalbibliothek hat eine Strategie
Die Direktorin der Schweizerischen Nationalbibliothek (NB), Marie-Christine Doffey1, hat mit ihrem Team für ihr Haus eine klare Entscheidung getroffen. In ihrem KonferenzvortragAufzeichnungen der Konferenzbeiträge sind, soweit sie von den Referenten freigegeben wurde, auf der Website von OCLC bereitgestellt. http://www.oclc.org/en-europe/events/2013/emear-annual-meeting-feb-26.html. Von einigen Präsentationen gibt es zudem Videoaufzeichnungen auf YouTube, u.a. vom Vortrag von M.-C. Doffey https://www.youtube.com/watch?v=aONFHqMbdig http://www.oclc.org/en-europe/events/2013/emearc-annual-meeting-feb-26.html.brachte sie diese auf den Punkt: «Daten öffnen, weltweit kooperieren». Das bedeutet, die NB kooperiert nicht nur mit den Schweizer Bibliotheken wie zum Bei spiel im Rahmen des Metakatalogs Swissbib und «den anderen etwa 900 Bibliotheksdiensten, die im Metakatalog sind», sondern auch mit der Europeana, mit dem WorldCat «und allen anderen Möglichkeiten», so Doffey. Sie begründete die Entscheidung vor allem mit der Überzeugung, dass alle Metadaten und Informationsbestände der Schweizerischen Nationalbibliothek mit öffentlichen Geldern aufgebaut sind und deshalb auch der Öffentlichkeit zur Verfügung stehen müssten; sei es vor Ort in der Bibliothek oder virtuell. «Durch die Öffnung können andere Bibliotheken und Interessenten die Metadaten für eigene Zwecke und Innovationen nachnutzen.»
Die NB hat für die Europeana den Schweizer Bibliothekskatalog Helveticat vollumfänglich geöffnet. Alle Metadaten sind unter der Corporate-Commons-Lizenz CCO für alle Interessenten verfügbar und können angebunden werden. Doffey erklärte: «Wir müssen dort sein, wo andere Partner, andere Bibliotheken auch dabei sind, damit wir an der Diskussion teilnehmen können. Die Schweiz ist so klein, dass wir diese Öffnung auch weltweit nutzen wollen und können.» Genevieve Clavel Merrin, bei der NB verantwortlich für den Bereich «Nationale und Internationale Kooperation» ergänzte, durch den Big-Data-Austausch auf Basis verlinkter Metadaten würde ein Bestands abgleich mit grossen anderen Metadatensammlungen möglich. Zur Veranstaltung sagte Direktorin Doffey, dass auch «die ganze Diskussion über die Cloud» sehr wertvoll sei. «Als einzelne Institution haben wir zwar nicht die gleichen Probleme wie Konsortien, aber ich denke, es ist auch einmal ganz interessant, Leute zu hören wie Raymond Bérard, zu erfahren, was es da für Probleme gibt und welche Fragen gestellt werden.» Bérard, Direktor des französischen staatlichen bibliografischen Instituts ABES berichtete u.a., dass ABES für die französischen akademischen Bibliotheken eine Studie zur Ablösung der bisherigen LIS durch ein neues, geteiltes «shared LIS» durchgeführt hat. Auf Basis der gewonnenen Erkenntnisse hat ABES sein Bibliothekssystem neu ausgeschrieben.
Frankreich setzt stark auf Wikipedia für Bibliotheken
Wie Wikipedia in Bibliotheken eingebunden und von ihnen genutzt werden kann, ist in Bezug auf Big Data und Linked Data ebenfalls ein grosses Thema. Die Wissenschaftlerin Titia van der Werf, die vom niederländischen Leiden aus für OCLC die F&E-Aktivitäten mit europäischen Bibliotheken koordiniert, griff die Diskussion mit Rémi Mathis als geladenem Gast und Max Klein von OCLC ResearchOCLC-Research betreibt eine eigene Website, auf der sehr interessante Forschungsprojekte und -ergebnisse stehen www.oclc.org/research.html.in einem Workshop auf. Mathis ist Bibliothekskurator und Präsident der Wikimedia France. Er berichtete, dass das französische Kultur und Kommunikationsministerium mit Wikimedia France kooperiert, um die französischsprachigen Ressourcen in Wikipedia semantisch zu erschliessen. Klein beschäftigt sich als «Wikipedian in Residence» bei OCLC Research mit allen Fragen rund um die Weiterentwicklung von Wikipedia als Quelle für verlinkbare Daten und Informationen. Er versuchte, in 45 Minuten die Idee der freien, von Maschinen und Menschen gleichermassen lesbaren Datenbank Wikidata zu erklären – und wie die Forscher dieser Datenbank Multilingualität beibringen wollen.
Culturomics: Kulturgeschichte aus Digitalisaten herausrechnen
Auf diesem hohen Niveau internationaler Forschung ging es nahtlos weiter. JeanBaptiste Michel erforscht in Harvard «die Nutzung von Millionen digitalisierter Bücher und Dokumenten, um durch quantitative Analysen daraus z.B. Rückschlüsse zur Geschichte und Kultur zu ziehen». «Culturomics»2haben er und sein Kollege Erez Lieberman Aiden dieses neue, auf Digitalisaten aufsetzende Forschungsgebiet getauft. Ihre Arbeiten führten zu einer Software, die aus grossen Datenbeständen in den Datenverborgene Trends berechnet und grafisch als Kurven in Diagrammen sichtbar macht. Die Forschung brachte ihnen im letzten Jahr Titelseiten auf «Nature and Science» und auf der «New York Times». Google hat das Programm gekauft.
In Deutschland entsteht ein «Culturegraph»
Die Deutsche Nationalbibliothek (DNB) baut an einer Plattform, über die Dienste und Projekte zu Datenvernetzung, Persistent Identifier und Linked Open Data für kulturelle Entitäten zusammengeführt werden sollen. Markus Geipel, Softwareingenieur bei der DNB, stellte die «Culturegraph» getaufte Plattform vor. Sie soll zu einem globalen Kulturschatz-Netzwerk weit über die Grenzen einzelner Unternehmen und Einrichtungen hinaus werden.
Neue Informationsdienste mit offenen Daten
Wie auf Basis offener Daten mit neuen IKT entwickelte Dienste aussehen können, zeigten nach Jean-Baptiste Michel zwei weitere Referenten auf sehr beeindruckende Weise: Silver Oliver, Informationsarchitekt mit Spezialgebiet strategische Ausrichtung der Datennutzung für Onlinepublishing bei der britischen Unternehmensberatung Ontoba3, und Dr. Klaus Ceynowa, stellvertretender Direktor der Bayerischen Staatsbibliothek (BSB). Oliver referierte über das «Zeit alter des Hinweisens auf Dinge, die in Beziehung zum persönlichen Interesse stehen» («The age of pointing at things»). Gemeint ist das automatische Anbieten von weiterführenden Informationen direkt in den Informationsraum hinein, in dem sich der Nutzer gerade bewegt.
Dr. Klaus Ceynowa zeigte innovative Nutzungsszenarien für digitalisierte
Inhalte aus Bibliotheksbeständen, die
von der BSB mithilfe von Technologien
wie GPS-gestützte Lokalisierung (Location based Services), durch virtuelle
Darstellung angereicherte Informationsbereitstellung (Augmented Reality) sowie gestengesteuerte Präsentation und Informationssuche (Gesture
based Computing and Search) entwickelt wurden.
OCLC Research informiert umfassend über Datennutzung
Nicht nur die eingeladenen Redner, auch OCLC Research hatte Spannendes aus den Forschungslaboren zu berichten. Roy Tennant, Senior Programm Officer, führte in die «Entfesselung des Katalogisierens»4durch Datamining in LOD ein. Die über 290 Millionen WorldCatEinträge, die auf rund 1,95 Milliarden Holdings hinweisen, liefern den Rohstoff für schier unendliche Nutzungsmöglichkeiten. Van der Werf zeigte in ihrem Vortragsthema «Metadaten ausser Kontrolle: Metadatenaggregation auf Netzwerkebene», welche Aufgabe gute Metadaten erfüllen und wo die Grenzen der Technik liegen.
W3C Group für LOD-Erweiterung von Schema.org eingerichtet
Last, but not least sprach OCLC Technology Evangelist Richard Wallis im letzten Vortrag über «Linked Data und OCLC»5. Dabei berichtete er unter an derem, dass das World Wide Web Consortium (W3C) an der Weiterentwicklung des Metadatenbeschreibungsstandards Schema.org in Richtung LOD Nutzung arbeitet. Dazu wurde eine «Schema Bib Extend Community Group»6eingerichtet. Wallis leitet sie als Vorsitzender.
OCLC hat sein 4. EMEA Regional Council Meeting 2013 unter das Thema «Dynamic Data: a World of possibilities» gestellt.
- 1 www.nb.admin.ch/org/amtsvorsteherin/index.html?lang=de.
- 2 www.culturomics.org/.
- 3 www.ontoba.com/blog/bbc-news-labs.
- 4 www.oclc.org/research/news/2013/02-27.html.
- 5 Ein Interview mit Richard Wallis zu LOD erschien in B.I.T.-Online 15 (2012), Ausgabe 6, S. 566.
- 6 www.w3.org/community/schemabibex.
Résumé
- Français
Les nouvelles possibilités que présentent la mise en réseau pratiquement illimitée des données, l’agrégation et l’analyse d’énormes quantités de données (Big Data, Linked Data et Linked Open Data) offrent aux bibliothèques de nouvelles chances de valoriser leurs fonds à l’échelle internationale et de proposer des offres spécifiques. La nouvelle technique du Cloud Computing, autrement dit la mise à disposition et l’utilisation de logiciels, de capacités de calcul et de stockage comme prestation en ligne, permet en outre de réduire les travaux de routine et de répartir ces derniers via l’automatisation et la mise en réseau de catalogues et de métadonnées. La fourniture d’informations sur des ordinateurs portables et des téléphones intelligents peut également être organisée sans trop de problèmes via les Cloud-Services.