Erschliessungstheorie und AV-Dokumente
Wenn wir von «Erschliessen» reden, dann meinen wir «unsere Informationsbestände für andere Personen auffindbar, zugänglich und nutzbar machen». Das Wort «Erschliessen» wird auch ausserhalb unseres Berufsbereichs oft verwendet. Eine Gemeinde baut beispielsweise eine Erschliessungsstrasse, um ein Gelände für Fahrzeuge zugänglich und nutzbar zu machen. Im Französischen und Englischen gibt es meines Wissens keine genau entsprechenden allgemeinsprachlichen Wörter. In der Fachsprache gibt es dagegen verschiedene Begriffe mit je unterschiedlichem semantischem Gehalt, im Französischen etwa «classification», «description» oder «catalogage», welche alle nur eine bestimmte Art und einen bestimmten Teil des Erschliessungsvorganges bezeichnen, welcher im Wesentlichen aus analysieren, beschreiben und präsentieren besteht.
Analogie Kartografie
Der offene deutsche Begriff scheint mir in der heutigen digital geprägten Welt geeigneter. Er verleitet auch dazu, Analogien zu betrachten und Analogien helfen oft, eine neue Perspektive auf etwas Bekanntes zu werfen. Eine Land karte bspw. erschliesst uns die Topografie eines Gebietes, eine Strassenkarte das Strassennetz. Zur Herstellung der Karten stehen ganze Regelwerke mit Signaturen und Definitionen zur Verfügung, die bestimmen, welche Objekte für welchen Kartentyp relevant sind und wie sie dargestellt werden sollen. Gleichzeitig braucht man Messgeräte und deren Daten um Lage und Grösse dieser Objekte zu bestimmen und schliesslich muss man das Wissen darüber sammeln, wie die Menschen die jeweiligen Orte und Objekte benennen. Heute benutzt man beim Autofahren häufig Navigationssysteme. Diese Systeme haben digitale Karten eingebaut, sie kennen immer meine aktuelle Position und können mir in jedem Moment meiner Reise genau sagen, in welche Richtung ich mich weiter bewegen muss. Als Voraussetzung muss ich nur das Ziel meiner Reise im Gerät eingeben. Das Navigationsgerät erschliesst mir die Landschaft für mein Bedürfnis, auf dem besten Weg zu einem Ziel zu kommen, optimal. Das Navigationsgerät stösst aber sofort an seine Grenzen, wenn man den Zielort nicht genau benennen kann, wenn man einfach an einen schönen Ort will, der an einem Südhang liegt und ein Hotel mit Hallenbad hat. Das Navigationssystem könnte das nur, wenn es sich verbinden könnte mit touristischen Datenbanken, in denen die Ortschaften nach topografischer Ausrichtung und nach Vorhandensein und Ausstattung von Hotels erschlossen sind.
Was die Analogie uns lernen kann
Was kann man aus dieser Analogie lernen? Die klassischen Landkarten sind mit grossem Aufwand nach genau for mulierten Regeln gebildet, genau wie unsere grossen Kataloge und Informationssysteme. Wer die Landkarten in vollem Umfange nutzen will, muss sie lesen und die Signaturen verstehen können. Auch die Katalogsysteme in unseren Institutionen muss man lesen können. Erfolgreich Abfragen erfor dern von unseren Nutzer/innen einiges Wissen über die Definition der Metadatenfelder oder über die in den Einträgen verwendeten Abkürzungen. Benutze ich im Auto ein Navigations system, muss ich nicht mehr kartenlesen können, ich werde vom System zum Ziel geleitet. Bald muss ich ja auch nicht mehr autofahren können, wenn ich zum Navigationsgerät noch ein sich selbst steuerndes Auto habe. Gibt es etwas Analoges zum Navigationssystem in unseren Informationssystemen? Die Antwort ist: «Noch nicht» oder «erst in Teilbereichen». Ein analoges System müsste eine natürlich sprachliche Wissensfrage verstehen und mir Antworten dazu liefern oder zumindest Wege aufzeigen, wie ich zu Antworten kommen kann. Wolfram Alpha und Google Knowledge Graph sind auf je unterschiedliche Weise Schritte in diese Richtung. Beides sind Erschliessungssysteme, auch wenn sie in Bezug auf ihre Funktionsweise wenig gemeinsam haben mit unseren Archiv, Bibliotheks und Dokumentationssystemen. Sie analysieren und verknüpfen alle Daten, die ihre Maschinen im WWW finden, auch unsere Erschliessungsdaten, soweit sie darauf Zugriff haben. Dabei stellt sich die Frage, ob wir in Zukunft auf die Symbiose mit den grossen Internetdiensten angewiesen sein werden? Wir liefern die Daten und Metadaten und die Internetdienste er schliessen sie für die Nutzer/innen? Oder könnten auch wir in allen zugänglichen Quellen verfügbare Informationen zusammensuchen, verknüpfen und damit unsere eigene Erschliessungsarbeit beschleunigen und die Findmittel ergänzen?
Erschliessung in Theorie und Praxis – ein Überblick
In unserer täglichen Praxis findet Erschliessung in der Regel in einem sehr engen Rahmen statt. Wenn man nicht in der Lage ist, ein Erschliessungssystem von Grund auf neu zu bauen – und das sind wohl die wenigsten von uns – muss man mit dem Vorlieb nehmen, was man hat und das sind die Archiv, Bibliotheks oder Dokumentationssysteme, die bereits installiert sind. Diese Informationssysteme orientieren sich in der Regel an einem bestimmten Er schliessungsstandard, der auf einem bestimmten Modell der Informations objekte, die wir erschliessen, aufbaut. Sie geben der erschliessenden Person die möglichen Datenelemente und der suchenden Person die Abfragemöglich keiten vor. Entscheidungsspielraum haben wir meist nur beim Bestimmen der Erschliessungstiefe und bei der Wahl des beschreibenden Vokabulars. Eine automatische Analyse und Beschreibung der Informationsobjekte ist, abgesehen von der Volltextindexierung meist nur ausserhalb dieser Systeme möglich.
Erschliessungsstandards und regeln gibt es ziemlich viele. In ihnen konden siert sich die Erschliessungstheorie und die Erschliessungspraxis der Spezialisten, welche an der Ausarbeitung jeweils beteiligt waren.
ISAD(G)
Im Archivbereich dominiert der Standard ISAD(G), was «International Standard Archival Description (General)» heisst und vom International Council on Archives erarbeitet worden ist. Sein inhärentes Modell bildet das traditionelle, Papier basierte Archiv gut und seine Aggregationsformen ab. Die zentrale Einheit ist das Dossier, das aus einzelnen Dokumenten besteht und dem dokumentarischen Niederschlag einer abgeschlossenen Geschäftstätigkeit entspricht. Dossiers von gleichartigen Geschäften, die zu einer bestimmten Aufgabe gehören, werden in der Regel in Serien, die zu einem ganzen AktenplanSystem aus gebaut sein können, geordnet. Alle Dossiers einer Organisation mit eigenen Entscheidungskompetenzen wer den schliesslich gemäss dem traditionellen Provenienzprinzip zu einem Archivbestand vereint. Ergänzt wurde dieser Standard mit den beiden Standards ISAAR(CPF) und ISDF sowie einem nicht als Standard verabschiede ten Dokument «Relationships in archival descriptive systems». Archivisches Erschliessen bedeutet wesentlich, In formationsobjekte in Beziehung zu ihrem Entstehungs, Nutzungs und Überlieferungskontext zu setzen im Wissen darum, dass man Informationsobjekte erst adäquat verstehen und kritisch nutzen kann, wenn man diese Kontexte kennt. Die genannten zusätzlichen Standards regeln die Identifizierung und Beschreibung sowohl der Akteure (Personen, Körperschaften) aus diesen Kontexten wie auch der Aufgaben und Funktionen, welche diese ausführen und dabei die beschriebenen Informationsobjekte erzeugen, empfangen oder nutzen.
FRBR
Das Modell, das im bibliothekarischen Standard FRBR (Functional Requirements for Bibliographic Records) implizit erkennbar ist, bildet den traditionellen Gegenstand einer Bibliothek, das Buch ab, berücksichtigt aber bereits die digitale Welt mit ihren Möglichkeiten, Werke relativ leicht in unterschiedlichen Bearbeitungen und Formen zu reproduzieren. Das Modell kann problemlos auch für audiovisuelle Dokumente verwendet werden. Im Unterschied zu den archivischen Standards spielt hier der Herstellungs und Ver wendungskontext eine geringere Rolle. Personen und Körperschaften sind da rin nur in ihrer Rolle aus Autoren, Herausgeber, Eigentümer etc. vorgesehen und es ist nicht möglich, ein Dokument als Produkt einer spezifischen Aktivität mit spezifischen Zwecken zu beschreiben. Man geht offenbar stillschweigend davon aus, dass ein Buch oder ein au diovisuelles Dokument als selbständiges, sich selbst erklärendes Produkt für den Buchmarkt, bzw. den Film, Tonträ ger oder Fotomarkt produziert und dort über mehr oder weniger zahlreiche Vervielfältigungen und in unbekannten Kontexten verwendet wird.
Spezifische Standards
Neben diesen beiden archivischen und bibliothekarischen Standards bzw. Modellen gibt es spezifische Erschliessungsstandards der IASA (International Association of Sound and Audiovisual Archives) für Tonaufzeichnungen (IASA Cataloguing Rules 1999), der FIAF (Fédération Internationale des Archives du Film) für bewegte Bilder (FIAF Cataloguing Rules 1991) und der European Commission on Preservation and Access für Fotodokumente bzw. Fotosammlungen (SEPIADES 2003).
Aus den IASA Cataloguing rules ist kein klares, zugrundeliegendes Modell erkennbar, weil die Autoren bestrebt sind, ganz unterschiedlichen Typen von Tonaufzeichnungen gerecht zu werden. Obwohl darin empfohlen wird, sich an bibliographischen Modellen zu orientieren – nicht zuletzt, um Erschliessungsdatensätze einfacher aus tauschen zu können –, wird darauf hingewiesen, dass auch ISAD(G) ein brauchbares Modell für eine Hierarchiesche Mehrebenen Erschliessung von Tonaufzeichnungen bietet, die dann sinnvoll ist, wenn man zunächst nur auf Bestandes oder Kollektionsebene erschliesst um dann später tiefer bei Bedarf bis auf Einzeldokumente zu gehen.
Die FIAF Cataloguing Rules für bewegte Bilder gehen in ähnlicher Weise vom bibliothekarischen Standard ISBD aus, machen aber ebenfalls gleich zu Beginn klar, dass dieser dem Film nicht gerecht werden kann, da ein archiviertes Filmwerk ja häufig aus vielen Elementen besteht. Ein Film ist meist auf mehrere physische Einheiten verteilt, er kann in mehreren verschiedenen Kopien überliefert sein und von unterschiedlichstem Material aus der Produktions und Nutzungsphase begleitet sein.
Das SEPIADESModell für Fotografien (Safeguarding European Photographic Images for Access Data Element Set) bezieht sich explizit auf den archivischen ISAD(G) Standard und besteht analog aus einem Mehrebenen Modell, das zwar andere Begriffe als ISAD(G) benutzt, aber in seinen wesentlichen Elementen sehr ähnlich ist. Anstelle von Beständen spricht SEPIADES von Kollektionen und an Stelle von Serien und Dossiers von Gruppen auf mehreren möglichen Ebenen. Auch die Provenienz wird als sehr wichtig erachtet, sie taucht dann aber eher versteckt in der Entität Akquisition als Attribut auf. Die Provenienz von fotografischen Kollektionen in der Beschreibung dar zustellen kann eine ausgesprochen schwierige Aufgabe sein, da Fotobe stände oft Besitzer und Zusammensetzung wechseln können. Im SEPIADES Modell muss eine solche Herkunftsgeschichte im Freitext dargestellt werden.
Dieser kurze Überblick über eine Aus wahl von Erschliessungsstandards und modellen zeigt, dass bisher die Erschliessungsregeln vor allem aus den Bedürfnissen des jeweiligen Medientyps herausgewachsen sind. Die Mehrheit der Institutionen hat aber Bestände, welche verschiedene Medientypen umfassen und nur ein einziges Informationssystem zur Erschliessung und Nutzung. Für sie ist die Situation schwierig, sie müssen Kompromisse eingehen und eigene Modelle und Erschliessungsregeln ausarbeiten, die alle ihre Medientypen integrieren und die sich in ihrem System auch umsetzen lassen.
Integration der Standards?
Legt man die verschiedenen bereichs spezifischen Standards nebeneinander, bekommt man den Eindruck, dass ein einheitlicher Erschliessungsstan dard für alle Medientypen möglich und sinnvoll wäre. Das Zentrum des FRBR Modells mit seiner Unterscheidung von «Work», «Expression», «Manifestation» und «Item» wäre unter Anpassung der Begriffe geeignet zur Beschreibung aller Informationsobjekte. Diesen Kern könnte man in das Modell der archivischen Standards um ISAD(G) integrieren, um sicherzustellen das Entstehungs und Verwendungskontexte der Informationsobjekte adäquat beschrieben werden können. Wahrscheinlich käme man dann zu einem relativ einfachen Modell, das mit den Entitäten «Informationsobjekt», «Akteur» und «Handlung» auskommen würde, aber starkes Gewicht auf die Qualifizierung der Beziehungen dieser Entitäten untereinander legen würde, so dass bspw. ein und dieselbe Person bzw. Organisation als Autorin, Besitzerin, Produzentin, Auftraggeberin etc. mit beliebig vielen Informationsobjekten verknüpft werden könnte. Die Provenienz liesse sich so differenziert und, was im digitalen Zeitalter besonders wichtig ist, in strukturierter Form darstellen und nicht wie bisher mehrheitlich als Attribut mit einem Freitexteintrag, der sich durch Computer nur schwer auswerten lässt.
Der gleichgewichtige Einbezug von Akteuren und Handlungen neben den eigentlichen Informationsobjekten in die Erschliessung ist für Archivar/innen von Textdokumenten selbstverständlich. Bei audiovisuellen Dokumenten ist das genauso wichtig. Audiovisuelle Dokumente sind – wenn sie nicht vollständig am Computer generiert oder als künstlerische Produkte erstellt worden sind, per se Aufzeichnungen eines zeitlich und örtlich bestimmten Wirklichkeitsausschnittes. Sie haben auch heute noch – wenn auch nicht mehr so stark wie in den Frühzeiten von Fotografie, Film und Tonaufnahme – die Aura des getreuen Abbildes von Wirklichkeit. Dabei wissen wir oder sollten wir eigentlich wissen, dass bspw. audiovisuelle Aufzeichnungen aus Konfliktgebieten zu einem grossen Teil gestellt oder manipuliert sind. Wenn ich nicht zeigen kann, wer in welchem Handlungsrahmen für welche Zwecke die Aufzeichnungen erstellt und verarbeitet hat, können solche Aufzeichnungen nur Aussagen darüber erlauben, wie man einem Publikum einen Konflikt darstellen will. Rückschlüsse von den Aufnahmen auf reale Vorgänge sind ohne dieses kontextuelle Wissen nicht statthaft.
Suchbedürfnisse
Der bibliographische Standard FRBR geht nicht nur von einem bestimmten Modell der Informationsobjekte aus, ersetzt auch explizit bei den Suchbedürfnissen an, welche mit der Erschliessung befriedigt werden sollen. Die Suchfragen, die im Standard genannt werden, lassen sich leicht auf einen grösseren Nutzungsbereich erweitern:
– Ist etwas Bestimmtes, von dem ich die Provenienz, den Autor, den Titel oder eine andere Identifikationsinformation kenne, vorhanden?
– Was gibt es überhaupt von einer bestimmten Provenienz bzw. von einem bestimmten Autor, Fotografen etc.?
– Was gibt es für Dokumente über ein bestimmtes Thema?
– Wo kommen bestimmte Motive bzw. bestimmte Inhaltselemente vor?
– Wie ist etwas zugänglich bzw. benutzbar?
Zu diesen Fragen kommen spezifische betriebliche Recherchebedürfnisse zur Verwaltung der Informationsobjekte, die auch als Fragen formuliert werden könnten.
Die verschiedenen dargestellten Typen
von Suchfragen können in der Realität
sehr unterschiedliche Wichtigkeit haben, je nach Institution und Kunden
stamm und je nach Inhalt eines Bestandes. In einer Fotosammlung von Bau
werken einer Stadt bspw. wird die Suche nach Bauwerken bzw. Orten
wesentlich wichtiger und häufiger sein
als die Suche nach dem Fotografen. In
der Praxis wird es wichtig sein, zu Beginn eines Erschliessungsprojektes
diese prioritären Suchbedürfnisse zu
bestimmen. Sie sind ein Schlüssel dazu, die meist knappen Ressourcen für
Erschliessungsprojekte gezielt einzusetzen.
Inhaltsanalyse
Die klassischen «Gibt es»Fragen ent sprechen nur zum Teil den Erwartungen von Nutzer/innen. Diese möchten Informationsobjekte heute über das Internet nicht nur lokalisieren, sie möchten zunehmend direkt auf die gesuchten Fakten und Informationen zu greifen ohne sich um die Informationsobjekte, in denen diese enthalten sind, kümmern zu müssen. Bei audiovisuellen Unterlagen stellt sich dabei das Problem, wie man Bild und Toninformationen möglichst effizient analysiert und in Form von strukturierten Daten für Recherchesysteme erschliesst. Um personelle Ressourcen zu sparen, macht es Sinn, möglichst viel Analyse und Beschreibungsarbeit durch Computer ausführen zu lassen. Voraussetzung dazu ist, dass die Informationsobjekte in digitaler Form vorliegen. Für Textdokumente sind ja schon lange relativ ausgeklügelte Indexierungsverfahren bekannt und im Einsatz. Im Bereich der audiovisuellen Dokumente lassen sich seit einiger Zeit bereits Verfahren wie die Erkennung von Gesichtern und anderen Bildmustern erfolgreich einsetzen. Auch die Spracherkennung aus Tondokumenten ist weit fort geschritten und liefert für eine weitere inhaltliche Analyse brauchbare Texte. Eine detailliertere Inhaltsanalyse lässt sich also heute für alle Medientypen, die digital vorliegen, mehr oder weniger automatisieren. Natürlich sind die Ergebnisse nicht vergleichbar mit einer von ausgebildeten Personen auf der Basis einer einheitlichen Dokumentationssprache erstellten Beschreibung. Trotzdem sind die Ergebnisse für Nutzende ganz gut brauchbar. Die Google Generation hat sich an Lücken und falsche Treffer bei der Suche gewöhnt.
Öffnung und Verknüpfung der Daten
Ausserdem existieren viele Informationen und Daten, die wir für die Beschreibung unserer Objekte brauchen, bereits irgendwo, oft sogar als qualitativ hochstehende Normdatei bspw. zu einer Person oder Körperschaft. Solche Informationen braucht man heute oft auch nicht mehr ins eigene System abzuschreiben, denn man kann sie etwa als Kopie in offenen Formaten über das Internet beziehen oder man kann sie über eine InternetURL als Verknüpfung in das eigene Informationssystem einbauen. Die erste Variante setzt aller dings voraus, dass man dieselben Erschliessungsstandards anwendet, wenn man nicht potentiell aufwändige Umwandlungsarbeiten in Kauf nehmen will.
Ein Beispiel für eine Erschliessung von unterschiedlichen Informationsressourcen in verschiedenen Formaten bietet das Projekt metagrid.ch. Die noch im Aufbau begriffene Webseite bietet ein Navigationssystem durch die Informationslandschaft indem sie Informationen unter verschiedenen Aspekten verknüpft und diese wie eine Landkarte grafisch darstellt (lonsea.org). Damit ermöglicht bzw. verlangt man ein völlig anderes Suchverhalten. Anstatt ausgeklügelte Anfragen in mehr oder weniger grosse Suchmasken einzutippen, reicht es, einen Zugangspunkt, bspw. einen Personennamen zu wählen, um an den Startpunkt einer Informationslandkarte zu kommen. Von dort aus bietet das System ähnlich wie bei einem Empfehlungssystem alle möglichen Verzweigungen zum angestrebten Wissensziel an, womit wir wie der bei der eingangs dargestellten Analogie zum Navigationssystem im Auto wären. Damit aber solche Informationslandkarten möglich sind, braucht es viele Beteiligte, die ihre Daten und Informationen zur Verlinkung oder zum Download freigeben.
Schlussfolgerungen
Zusammenfassend kann man folgende Punkte festhalten: – Die traditionelle Erschliessungstheorie für audiovisuelle Medien ist auf den jeweiligen Medientyp bezogen und deshalb für den grossen Teil unserer Institutionen sowie überhaupt für neue multimediale Dokument formen nur beschränkt geeignet.
– Es dürfte sich lohnen, das manuelle Erschliessen auf einen harten Kern an standardisierten Metadaten zu beschränken und diese in einer Form zu präsentieren, die leicht verlinkbar ist. Frei werdende Ressourcen sollten für die Digitalisierung genutzt wer den, um oft überhaupt erst das Potential für die automatische Analyse und die vernetzte Nutzung zu schaffen, welche im Blick auf die Zukunft wichtiger sind, als eine detaillierte Beschreibung.
– Metadaten und Informationsobjekte sollten nicht in den eigenen Systemen vergraben werden, sondern im Sinne der Open DataBewegung an deren Institutionen für ihre Erschliessungsarbeit und unseren Nutzer/innen für ihre Auswertungen zur Verfügung gestellt werden.
Abstract
- Français
La théorie classique du catalogage des médias audiovisuels se réfère à chacun des types de médias spécifique et n’est donc adéquate que dans une mesure restreinte pour la plupart des institutions I&D concernées ainsi que, évidemment, pour les nouvelles formes de documents multimédias.
Il serait donc judicieux de limiter le catalogage manuel à un noyau dur de métadonnées standardisées et de présenter ces dernières sous une forme qui permette de travailler facilement avec des liens. Les ressources libérées devraient être utilisées pour la numérisation afin de créer d’abord le potentiel pour l’analyse automatique et l’utilisation réticulée, deux aspects qui sont prospectivement plus importants qu’une description détaillée.
Les métadonnées et les objets d’informations ne devraient pas être enfouis dans les systèmes en propre, mais être mis à disposition d’autres institutions pour leur travail de catalogage et de nos clientes et clients pour leur valorisation, et ce, dans le sens du mouvement Open Data. (traduction: sg)