3.3.2 Ordnung und Erschließung von Beständen

Ordnung und Strukturierung von Inhalten ist unverzichtbarer Bestandteil allen Informierens. Dieses Geschäft beginnt nicht erst in den Archiven und Dokumentationsstellen, sondern dort wird lediglich die intuitive Alltagspraxis mit professionellen Arbeitstechniken fortgeführt.

Am Beispiel von Tageszeitungen etwa ist leicht darzustellen, in welchem Ausmaß »Ordnungsinformation« die Nutzung unterstützt. Schon am Kiosk erleichtern verschiedene Formate, vor allem aber Schlagzeilen und Titel dem Informationssuchenden eine erste Auswahl. Innerhalb der Zeitungen selbst ermöglichen dann Ressortseiten, Themenseiten, Überschriften, Untertitel, Zwischentitel, Kasten, Tabellen, Seitennumerierungen, Datums- und Autorenzeilen sowie einige Elemente mehr (zumindest im Idealfall) den ökonomischen Einsatz von Aufmerksamkeit. Machen wir ein Gedankenexperiment. Wenn alle Tageszeitungen auf gleich großem Papier und, Titel wie Fließtext, nur mit einer einzigen Schriftgröße und Schrifttype (ähnlich wie Fernschreibmeldungen) produziert wären, so würde man, wenn man nur die Buchstaben auszählt, keinen Verlust an Information feststellen können. Und doch könnte man nicht behaupten, daß der Informierungswert derselbe geblieben wäre. Eine Überschrift scheint offensichtlich mehr zu sein als nur ein fett gedruckter Teil des Textes. Sie stellt eine andere Qualität von Information dar. Innerhalb von Textstrukturen läßt sich, wenn man dieser Einsicht konsequent folgt, analytisch zumindest so etwas unterscheiden wie »Ordnungsinformation« und »Inhaltsinformation«. Dokumentationsstellen nutzen exakt diesen »kleinen Unterschied«, um ihre Leistung zu erbringen. Sie organisieren leistungsfähige Systeme von Ordnungsinformation, um zu Inhaltsinformation hinzuführen.

Obwohl natürlich alle Tätigkeitsfelder des Dokumentationsprozesses nur aufeinander bezogen erklärbar sind, so gilt dies für Bestandserschließung und Bestandsordnung im besonderen. Vor allem die Erschließung ist nur aus dem Ziel, auf das hin sie betrieben wird, verstehbar. Jedes Dokument verfügt im Prinzip über unendlich viele Merkmale, mit denen es beschrieben werden kann. Aufgabe der Erschließung im weitesten Sinn ist es, jene Merkmale zu erheben, mit denen das Dokument im Dokumentationssystem stellvertretend dargestellt werden soll. Aus Gründen, die in folgenden Abschnitten systematisch erläutert werden, müssen nämlich im klassischen Dokumentationsprozeß Stellvertreter für die bearbeiteten Dokumente, üblicherweise Karteikarten oder Datensätze, gebildet werden. Auf diesen Stellvertretern sollten die wesentlichsten Merkmale der Dokumente verzeichnet sein, damit ein Benutzer die Relevanz eines Dokuments für sein Informationsproblem nach Möglichkeit bereits vor der Beschaffung einschätzen kann. Bei konventionellen Stellvertretern wie Karteikarten müssen ausgewählte Merkmale, etwa Autorenname oder Thema, obendrein auch für die Sortierung der Kartei und damit als Zugriffsmerkmal bestimmt werden. Bei elektronischen Datensätzen kann im Gegensatz dazu jedes eingetragene Merkmal als Findhilfe fungieren.

In der Folge werden nun die Tätigkeitsfelder Bestandsordnung und Bestandserschließung in der Mediendokumentation näher beschrieben. Um Verwirrung zu vermeiden und einen konsistenten Anschluß an die Grundbegriffe der Ordnungslehre zu gewährleisten, bleibt das Ordnungsmodell von Zeitungsauschnittarchiven allerdings vorerst vollständig ausgeklammert. Zeitungsausschnittarchive entziehen sich einer vordergründigen Beschreibung nach dem skizzierten Stellvertreter-Modell, obwohl ihre Ordnungskultur, wie sich zeigen wird, aus den allgemeinen Ansprüchen des Modells ableitbar ist.

3.3.2.1 Klassische Bestandsordnung

In unserem Zeitalter die Ordnung von Information theoretisch fassen zu wollen, ist keine leichte Aufgabe. Auf dem weiten Feld der Informationsverarbeitung vollzieht sich ein paradigmatischer Wechsel von papierzentrierten Produktions-, Verbreitungs- und Ordnungsmethoden hin zu elektronischen Verfahren und Formen. Dieser Wandel ist noch lange nicht abgeschlossen, scheint seinem Höhepunkt überhaupt erst zuzustreben, und seine Finalität ist insgesamt schwer absehbar. Das Problem in unserem Zusammenhang ist ein mehrfaches. Die Zukunft gehört elektronischen Methoden und Verfahren, das ist keine Frage. Und doch kann man konventionelle Verfahren in einer Darstellung wie dieser auf keinen Fall unberücksichtigt lassen.

Erstens wird es noch sehr lange Zeit konventionell papierergebundene (Karteien, Listen, Register etc.) Bestände und Ordnungmethoden geben. Zum Teil schlicht als Altbestände, die man vermutlich niemals rückwärts EDV-erfassen wird und zum Teil, weil konventionelle Dokumentation noch eine geraume Weile parallel zu elektronischen Verfahren betrieben wird. Für viele Ansprüche der Mediendokumentation gibt es nach wie vor keine kosten- und leistungsmäßig vertretbaren elektronischen Verfahren.

Zweitens sind Grundprobleme der Dokumentation, auch jene von elektronischen Verfahren, am einfachsten unter Zuhilfenahme von leicht vorstellbaren Karteimodellen zu erklären. Man kann dabei nämlich an das naive Alltagsverständnis des Lesers anschließen und muß nicht unnotwendig abstrakt werden. Auch die Volkswirtschaftslehre bemüht bei der Erläuterung von komplexen ökonomischen Modellen nicht ohne Grund gerne das reichlich unaktuelle Bild des kleinen Kaufmannes in seinem überschaubaren Greißlerladen und baut ihre Erläuterungen darauf auf.

Drittens schließlich scheint auch die Dokumentationstheorie den Übergang von konventionellen zu elektronischen Verfahren mit ihrer Analyse noch nicht gänzlich mitvollzogen zu haben. Dokumentarische Grundbegriffe und Standards werden sehr oft unter inexplizitem Bezug auf klassische papiergebundene Ordnungsverfahren definiert.

Wie also funktioniert(e) der Nachweis von Dokumenten ohne Computer? Wenn man aus einer unübersehbaren Zahl von Dokumenten ein bestimmtes gezielt wiederfinden möchte, ohne dazu alle Stück für Stück durchsehen zu müssen, so hat man diese nach jenem Merkmal zu sortieren, aufgrund dessen einzelne wiedergefunden werden sollen. Es gibt keine andere Möglichkeit, und damit ist eigentlich alles gesagt. Der Teufel steckt im Detail. Am Beispiel einer Bibliothek sind das Prinzip und vor allem die Probleme, die sich in weiterer Folge zwingend ergeben, leicht darzustellen. Stellt man nämlich seine Bücher alphabetisch, etwa nach dem Merkmal Nachname der Autoren auf, so wird der gezielte Zugriff auf selbige zwar grundsätzlich sichergestellt, es werden sich aber bald folgende Schwierigkeiten ergeben:

- Hat ein Werk mehrere Autoren, so müßte es in konsequenter Anwendung des Prinzips auch entsprechend oft vorhanden und aufgestellt sein.

- Will man neue Bücher einfügen, so muß jeweils der gesamte Bestand umsortiert werden.

- Schließlich ist auch noch die Platzverschwendung zu erwähnen, weil die jeweils größten Bücher die Höhe aller Regale bestimmen, um die strikte Aufstellordnung zu gewährleisten.

- Und nicht zu vergessen: die Bücher können immer nur nach einer Merkmalsklasse sortiert werden. So muß, auf die wohl gebräuchlichsten Merkmale bezogen, entschieden werden, ob man die Bücher entweder nach Autor oder nach Thema aufstellt, beides zugleich ist nicht möglich. Jeder, der mehr als fünfzig Bücher besitzt, kennt das Problem.

Um all diese Einschränkungen zu umgehen, bietet es sich an, Stellvertretereinheiten für die Dokumente zu bilden. Diese Stellvertreter werden als "Dokumentationseinheiten" bezeichnet, die Dokumente, auf die sie verweisen, nennt man in diesem Zusammenhang "dokumentarische Bezugseinheiten". Bisweilen finden sich auch die Bezeichnungen "Primärdokumente" und "Sekundärdokumente". Den Lagerort der Dokumentationseinheiten, üblicherweise eine Kartei oder ein Computer, kann man auch als "Deskriptorenspeicher" bezeichnet finden und jenen der dokumentarischen Bezugseinheiten als "Dokumentenspeicher" . Formuliert man die am Beispiel von Büchern aufgezählten Ordnungsprobleme als Ansprüche an Dokumentationseinheiten um, so müssen diese folgendes gewährleisten:

- Sie sollten leicht duplizierbar sein, um je nach Anzahl der Ausprägungen eines Dokumentmerkmals an verschiedenen Stellen der Sortierordnung aufstellbar zu sein bzw. um getrennte Ordnungen nach verschiedenen Merkmalen zu gewährleisten.

- Das Einfügen neuer Einheiten sollte unkompliziert möglich sein.

- Zuletzt sollten sie wenig Platz in Anspruch nehmen, um überschaubar angeordnet werden zu können.

Das Wunderding, das alle diese Anprüche erfüllt, ist bekannt wie Block und Bleistift. Die klassische Dokumentationseinheit der konventionellen Dokumentation ist die Karteikarte.

Wenn eine große Dokumentensammlung durch eine Kartei erschlossen ist, so werden die Dokumente üblicherweise, um Platz zu sparen, nach Formaten getrennt in der Reihenfolge ihres Eintreffens im Lager aufgestellt. Die fortlaufende Numerierung dient als Signatur gleichzeitig dazu, die Verbindung zwischen Dokumentationseinheiten und dokumentarischen Bezugseinheit zu gewährleisten. Jeder kennt dieses Prinzip aus einer Universitätsbibliothek.

Obwohl der Dokumentennachweis mit Karteikarten den Spielraum für die Organisation eines geordneten Zugriffs wesentlich erweitert, bleibt eine beträchtliche Einschränkung. Für jedes Merkmal, aufgrund dessen der Zugriff auf den Dokumentenbestand möglich sein soll, muß mit erheblichem Aufwand eine komplette Kartei geführt werden. Die Fernsehdokumentation, das Tätigkeitsfeld mit den wohl meisten dokumentationswürdigen Merkmalen pro dokumentarischer Bezugseinheit, zeigt eindrucksvoll, wie aufwendig eine derartige Erschließung in der Praxis werden kann. Wenn nur eine der Karteien des in obiger Abbildung ohnehin beispielhaft verkürzten Modells nicht geführt wird, ist der Zugriff auf die Beitragskassette über das entsprechende Merkmal nicht mehr möglich. Wer möchte im Zuge von Personaleinsparungsmaßnamen etwa entscheiden, welche Zugriffsdimension verzichtbar ist und nicht mehr geführt werden sollte?

Die massive Erleichterung, die der Computer auf dem Gebiet des Zugriffs gebracht hat, liegt hauptsächlich darin, daß elektronisch jeder einzelne Eintrag in einem Datensatz, in der »Bildschirm-Karteikarte«, als Anhaltspunkt für den Zugriff auf das Dokument verwendet werden kann, und nicht mehr nur ausschließlich jene, aufgrund welcher bisher die sortierten Ordnungen geführt wurden. Außerdem kann jedes Merkmal in einer Abfrage beliebig mit anderen Feldeinträgen kombiniert werden. Dazu kommen, um nur einige zu nennen, als zusätzliche Vorteile komfortable Möglichkeiten der Entlehnkontrolle, des Ausdrucks von Listen oder der Dezentralisierung des Dokumentennachweises durch Datenübertragung. 

3.3.2.2 Das Ordnungsmodell von Zeitungsausschnittarchiven

Nachdem die elementaren Grundbegriffe "Dokumentationseinheit" und "dokumentarische Bezugseinheit" solide eingeführt sind, nun die überraschende Ausnahme. Ausgerechnet das leistungsfähigste dokumentarische Genre im Medienbereich, die Textdokumentation von Zeitungsausschnitten, kennt in ihrem zentralen Ordnungsmodell die Trennung in Dokumente und Stellvertretereinheiten bzw. in Deskriptorenspeicher und Dokumentenspeicher gar nicht oder höchstens als untergeordnetes Hilfsinstrument.

Der Grund dafür ist leicht zu erklären, wenn wir uns nochmals vor Augen führen, wozu die Bildung von Stellvertretereinheiten (Dokumentationseinheiten) überhaupt notwendig ist. Klassische dokumentarische Bezugseinheiten wie ein Zeitschriftenaufsatz, ein Buch oder eine Filmrolle sind nicht gleichzeitig nach verschiedenen Merkmalen bzw. verschiedenen Merkmalsausprägungen sortierbar, damit ist auch kein leistungsfähiger Zugriff auf die Dokumente aus ihnen selbst heraus organisierbar. Aus diesem Grund bildet man Stellvertretereinheiten, die leicht duplizierbar, flexibel sortierbar und platzsparend anordenbar sind. Den Nachteil des umständlichen Zugriffs, nämlich zuerst in den Dokumentationseinheiten recherchieren und dann das Suchergebnis zeitraubend aus dem Magazin zusammentragen zu müssen, nimmt man für die sonstigen Vorzüge des Verfahrens gerne in Kauf.

Das Einzigartige eines Zeitungsausschnittes (großteils auch einer Fotografie) ist, daß ihm alle Vorzüge einer Karteikarte sowieso anhaften. Zeitungsauschnitte sind von Haus aus leicht zu vervielfältigen, flexibel zu sortieren und auch platzsparend anzuordnen. Aus diesem Grund kann in klassischen Zeitungsausschnittarchiven die logische Ordnung (Inhaltsordnung) auch der Aufstellordnung entsprechen. Als kleiner Vorgriff auf ein gesondertes Kapitel sei an dieser Stelle angemerkt, daß sich diese spezielle Eigenheit von Zeitungstexten, nämlich äußerlich keine Trennung in Dokumente und Stellvertretereinheiten notwendig zu machen, im Computerzeitalter durch das Aufkommen von Volltextdatenbanken nahtlos fortzuschreiben scheint.

Zeitungsartikel in Ausschnittarchiven werden üblicherweise entweder lose gelagert, auf Unterlagen aufgeklebt oder fotokopiert. Die nächsthöhere Organisationseinheit nach dem einzelnen Artikel sind thematische Dossiers, die in Form von beschrifteten Kuverts, Umschlägen oder Hängemappen realisiert sind. Diese Dossiers sind wiederum thematisch zusammengefaßt und derart zu einem strikt hierarchischen System organisiert. Als Lagereinheit dienen meist Stahlschränke mit voluminösen Schubladen. Ein häufig verwendetes Ordnungsmodell besteht darin, auf der obersten Ebene entweder nach Staaten zu gliedern und dann die Dossiermappen nach Sachgesichtspunkten weiter zu unterteilen, oder auf der obersten Ebene Sachbegriffe zu verwenden und diese nach Bedarf in Staaten zu untergliedern. Je nachdem, ob der Sachaspekt oder der regionale Aspekt wichtiger ist. Die Unterteilungstiefe hängt im Grunde schlicht von der Menge des Materials ab. Sobald eine Sektion unübersichtlich wird, muß sie weiter aufgesplittet werden. So ist es vorstellbar, daß die Gliederung "ORGANISIERTE" am Ende der Kette RUßLAND/WIRTSCHAFT/KRIMINALITÄT aus 4 dadurch zustande gekommen ist, daß das Kuvert KRIMINALITÄT überquoll und in mehrere Kuverts aufgeteilt werden mußte. Nähreres zum Wesen hierarchischer Ordnungsstrukturen allgemein in Kapitel 0. Detailaspekte, die durch das grobe Ordnungssystem der thematisch relativ weitgefassten Dossiers nicht zufriedenstellend erfaßt werden können, werden allerdings auch in Zeitungsausschnittarchiven oft durch parallel geführte Karteien nach dem Stellvertreterprinzip erschlossen. Diese Vorgangsweise wird bisweilen als "Verzettelung" bezeichnet.

Ein maßgeblicher Faktor für das Erfolgsmodell Zeitungsausschnittarchiv ist auf jeden Fall die unkomplizierte Möglichkeit, Artikel nach jedem einzelnen Merkmal, aufgrund dessen sie wiedergefunden werden sollten, separat abzulegen. Die Mehrfachablage kann durch Fotokopieren realisiert werden, oder dadurch, daß einfach entsprechend viele Exemplare der lektorierten Zeitung zur Verfügung stehen. Vor allem, wenn ein Produkt des eigenen Hauses erschlossen wird, ist die Anzahl der Auswertungsexemplare keine Kostenfrage. Die Mehrfachablage erfolgt in der Regel drei- bis achtmal, kann in Einzelfällen aber auch durchaus bis zu fünfzigmal vorgenommen werden, etwa, wenn in einem Artikel fünfzig Verhaftete namentlich erwähnt sind. Die Bestände an Zeitungsausschnitten, die sich in solchen Strukturen üblicherweise ergeben, bewegen sich im Millionenbereich, tägliche Zuwächse im Tausenderbereich sind für ein großes Archiv keine Seltenheit. (z.B. FAZ-Bestand ca. 20 Millionen, täglicher Zuwachs 1000 bis 1200 Zeitungsauschnitte, Springer-Berlin: 7 Mio. / 950, Springer-Bonn: 6.25 Mio. / 1350 Springer-Hamburg: 21 Mio. / 2900 )

Typische Merkmale und Vorzüge eines Ausschnittarchives faßt ein Praktiker wie folgt zusammen: 

"Im konventionellen Bereich haben wir nun eine genial einfache und dabei höchst wirkungsvolle Methode gefunden, diese Probleme zu lösen. Wer ein Pressearchiv mit Karteien organisieren wollte, würde bald Schiffbruch erleiden. Das Material wird vielmehr ohne Zwischenschaltung sekundärer Zugriffsmedien unmittelbar zu thematischen Dossiers zusammengefaßt. Bei der Recherche wird das Thema zunächst grob eingekreist, und wir haben dann die Möglichkeit, durch schnelles Durchblättern mit dem ´heißen Daumen´ die gesuchte Information schnell herauszufiltern, eine Methode, die sowohl bei harten Fakten als auch bei weichen Recherchen probat anzuwenden ist.

Für diese unsere berufstypische Handbewegung gibt es nun leider noch kein adäquates EDV-Pendant. Das Blättern am Bildschirm ist aus einer Vielzahl von wahrnehmungspsychologischen Gründen unvergleichlich langsamer, es fehlen wor allem die typographischen Hilfen, die das Auge halb unbewußt wahrnimmt. Es mag paradox klingen, aber gerade in punkto Schnelligkeit scheint mir das konventionelle Archiv noch immer überlegen." 

3.3.2.3 Bestandserschließung

Die allgemeine Aufgabe der Erschließung von Dokumenten besteht wie schon erwähnt also darin, jene Merkmale zu isolieren und festzuhalten, mit denen das Dokument im Dokumentationssystem vertreten sein soll. Dabei kann man eine analytische Trennung in Formalerschließung und Inhaltserschließung vornehmen. Formale Merkmale beschreiben Dokumente anhand »äußerer« Eigentümlichkeiten, inhaltliche Merkmale dagegen beschreiben seinen Inhalt. Das muß sich nicht immer ausschließen, Formalerschließung und Inhaltserschließung überschneiden sich beispielsweise, wenn der Sachtitel von Dokumenten verzeichnet wird. In der Mediendokumentation ist die Formalerschließung eigentlich nur bei den elektronischen Medien von erwähnenswerter Bedeutung. Merkmale wie Sendetitel, Akteure, Abspielgeschwindigkeit, Bandlänge, Filmformat und einige mehr müssen erkannt und vermerkt werden. Sehr viele Dokumente von Rundfunkanstalten liegen etwa in Formaten vor, die eine kurzfristige Benutzung nicht möglich machen. Das sollte man doch vor der Bestellung eines Films oder eine Tonaufnahme wissen.

Die klassische Kompetenz der Dokumentation jedoch ist die Inhaltserschließung. In diesem Bereich unterscheiden sich, wie bereits ausgeführt, Ansprüche und Verfahren am deutlichsten von denen des Archiv- und Bibliothekswesens. Eigentlich könnten alle bisherigen Ausführungen über Ordnung, Lagerung und Verzeichnung von Merkmalen in Stellvertreterdokumenten auch die Praxis des Auslieferungslagers einer Schraubenfabrik beschreiben. Es ist nicht von der Hand zu weisen, daß ein Film, solange nur äußere Merkmale beachtet werden, kaum höhere Lagerungs-, Erschließungs- und Zugriffsansprüche stellt als ein Paktet 16er Schrauben. Die materiellen Objekte dokumentarischer »Lagerverwaltung« zeichnen sich allerdings im Unterschied zu Blechschrauben dadurch aus, daß sie Informationsträger sind. Nachdem dieser Umstand obendrein den eigentlichen Grund darstellt, warum sie gesammelt und verwaltet werden, liegt es nur nahe, Zugriffsmöglichkeiten zu organisieren, die eine effiziente Nutzung der gelagerten Informationen erlauben.

In der Dokumentationstheorie gliedert sich die Inhaltserschließung in Inhaltsanalyse und Inhaltsdarstellung. Die Inhaltsanalyse, die in der Fachinformation - man stelle sich etwa medizinische oder chemische Themen vor - beträchtliche Sachkenntnis erfordert, stellt in der Mediendokumentation kein so großes Problem dar. Medieninformationen wenden sich an eine breite Rezipientenschaft. Um ihre Bedeutung einschätzen und im Zusammenhang sehen zu können, braucht der Dokumentar in der Regel nicht mehr, aber auch nicht weniger als ein umfangreiches Allgemeinwissen. Inhaltliche Spezialisierungen, wie sie bei leistungsfähigen Dokumentationen auch für Massenmedien unumgänglich sind, gliedern sich höchstens entlang der Fachbereiche Politik, Wirtschaft, Kultur (Musik), Sport und unter Umständen Wissenschaft sowie Geschichte. In Rundfunk- und Fernseharchiven ist die Inhaltserschließung (Auswertung) zeitlich sehr aufwendig, weil das Dokument zu diesem Zweck abgespielt werden muß. Inhalte, Motive, Schauplätze, Akteure und eine ganze Latte von Parametern mehr soll identifiziert werden. Wegen dieses großen Aufwandes wird die Auswertungstiefe bei AV-Dokumenten in der Praxis je nach Sinnhaftigkeit von bloßer Formalerfassung (Titel, Sendedatum, technische Daten etc.) bis hin zu detailliertester Inhalts- und Motivbeschreibung variiert. Am Beispiel der Musikdokumentation, wie sie in elektronischen Medien betrieben wird, zeigt sich besonders deutlich, auf welche Weise klassische dokumentarische Methoden an die auftretenden Serviceerfordernisse angepaßt werden können. Natürlich wird auch dort eine formale Erschließung der Musikdokumente nach Titel, Interpret, Genre etc. vorgenommen, doch ein großer Teil der Anfragen bezieht sich auf eine bestimmte ästhetische Qualität der Musik, für die herkömmliche Kategorien der Musikerschließung kaum tauglich sind. Wie soll man sich bei der Inhaltserschließung auf eine Anfrage einstellen wie: "Ich hab da einen Kirchturm gefilmt und brauch ´ne schnelle Musik dazu". Es ist möglich. Und die Musikdokumentare haben eigenständige, originelle und doch systematische dokumentarische Werkzeuge entwickelt, um Inhaltserschließung auf derartige Anfragen hin betreiben zu können.

Zurück zur Königsdisziplin in der Medienarchivierung, der Textdokumentation. Gute Medientexte sind im allgemeinen diszipliniert um ein Thema herum gebaut. Ein solches Thema ist in der Regel mit einigen wenigen Oberbegriffen exakt zu beschreiben und einzugrenzen. Diese Komprimierung auf das wesentliche wird in der Dokumentationstheorie auch zutreffend als Textkondensierung bezeichnet. Innerhalb eines Artikels können aber auch zusätzliche Detailaspekte wie Firmen- oder Personennamen bzw. Zitate nachweiswürdig erscheinen und damit ebenfalls Objekte der Inhaltserschließung werden.

Um die analysierten Inhalte von Dokumenten letztendlich festzuhalten und darzustellen, legt man Ordnungsworte fest. Das Prinzip ist dasselbe wie bei den formalen Merkmalen. Es werden auf einem Stellvertreterdokument möglichst alle Merkmale festgehalten, die einem Benutzer die Einschätzung der Relevanz eines Dokumentes für sein Informationsanliegen ermöglichen. Ist das Stellvertreterdokument eine konventionelle Karteikarte, so ist dann auch noch zu entscheiden, welches Merkmal zur Sortierung herangezogen wird. Soll das Dokument aufgrund verschiedener Merkmale wiederfindbar sein, so müssen entsprechend viele Exemplare der Karteikarte angefertigt und an den entsprechenden Stellen der Kartei einsortiert werden. Ist das Stellvertreterdokument ein Computer-Datensatz, so ist sowieso jedes Merkmal innerhalb des Datensatzes suchbar.

Inhaltsmerkmale unterliegen einem beträchtlichen Ermessensspielraum des Auswerters. Sie werden aus diesem Grund auch bisweilen als »weiche« Merkmale - im Gegensatz zu den »harten« der Formalerfassung - bezeichnet. Und tatsächlich läßt sich über das Format eines Filmes kaum streiten. Sechzehn Millimeter sind sechzehn Millimeter. Ob der Inhalt eines Films allerdings mit Militärmanöver oder Bundesheerübung, mit Verteidigung und Ausbildung, oder mit Krieg und Simulation zutreffender beschrieben ist, darüber kann es vorderhand nur Meinungen geben.Zur Standardisierung der Inhaltsbeschreibung und -ordnung gibt es in der dokumentarischen Praxis verschiedenste Modelle mit jeweils elaborierten Theorie- und Regelapparaten. Detaillierte Erörterungen dazu finden sich in der einschlägigen Fachliteratur und müssen hier nicht weiter ausgebreitet werden. In der Mediendokumentation sind so gut wie alle klassischen dokumentarischen Ordnungsformen in Verwendung, allerdings oft in pragmatisch angepaßten Varianten.

Um die Praxis der Ordnungswortvergabe (Indexierung, Beschlagwortung) in den Medienarchiven zu beschreiben, reicht eine einfache Unterteilung in freie und gebundene Verfahren fürs erste einmal aus. Die gebundenen Verfahren werden in der Folge noch etwas weiter zu unterteilen und auszuführen sein.Die freien Verfahren sind das "Referat" und die "freie Beschlagwortung". Beim Referat oder Abstract ist der Indexierer gehalten, den Inhalt des Dokumentes möglichst kurz und prägnant wiederzugeben, der Hauptzweck liegt darin, einem Benutzer die Relevanz der dokumentarischen Bezugseinheit für sein Informationsanliegen bereits vor der Beschaffung vor Augen zu führen. Am Beispiel des Referates läßt sich übrigens sehr gut zeigen, wie sich Ansprüche und Definitionen der klassischen Ordnungstheorie durch den Einsatz der EDV wandeln. In der konventionellen »Papierdokumentation« wird dem Referat keine Ordnungs-, sondern lediglich eine stellvertretende Darstellungsfunktion zugeschrieben. Das trifft soweit auch zu, weil natürlich eine freie Wortmenge in einer Kartei nicht als Sortierkriterium verwendbar und dadurch auch nicht für die Zwecke des Zugriffs organisierbar ist. In der EDV-Dokumentation ist die Situation grundlegend anders. Dort dienen Kurzreferate über die Darstellungsfunktion hinaus, beispielsweise in wissenschaftlichen Online-Datenbanken, auch als leistungsfähige Zugriffsinstrumente, weil sie eine Sammlung von für den Dokumentinhalt hochrelevantem Wortgut darstellen. In der Mediendokumentation haben sich Kurzreferate vor allem bei der Rundfunk- und Fernsehdokumentation als Erschließungsinstrumente etabliert.

Von freier Beschlagwortung spricht man, wenn der Erschließende angewiesen ist, nach eigenem Ermessen engste Oberbegriffe zu den Dokumenten zuzuordnen. Der Sinn der strikten Reduktion auf einzelne Oberbegriffe ist neben der Prägnanz die naheliegenderweise damit verbundene Sortier- und Kombinationsfähigkeit in konventionellen Nachweissystemen. Die Schwäche von Verfahren der freien Ordnungswortvergabe ist ihre Uneindeutigkeit. Was der eine als Kriminalität bezeichnet, benennt die andere mit Verbrechen. Soll man mit Solarenergie beschlagworten, mit Sonnenenergie oder gar nur Alternativenergie? Läßt sich nach Photovoltaik oder Solarthermik gesondert suchen, oder wurde alles in eins abgelegt? Um die angesprochenen Schwächen von freien Ordnungsworten zu überwinden, gibt es die Institution der "kontrollierten Vokabulars". Damit ist nichts anderes gemeint, als daß zur Beschreibung von Dokumentinhalten nur Worte aus einer verbindlichen Liste verwendet werden dürfen. Die Funktion von solchen Ordnungswortsystemen (Ordnungssystemen, Dokumentationssprachen) liegt einerseits in der Zusammenführung von Begriffen in eindeutigen Benennungen und andererseits in der Strukturierung des Wissensgebietes insgesamt. Um die Bedeutung der gebundenen Indexierung deutlich zu machen, muß darauf hingewiesen werden, daß ein adäquates Ordnungssystem, sei es in Form etwa einer Klassifikation oder eines Thesaurus, das Rückgrat jeder Dokumentation darstellt und ihre Leistungsfähigkeit entscheidend ausmacht. Die Möglichkeit der Frei- bzw. Volltextsuche innerhalb von Datensätzen durch die EDV hat auf diesem Gebiet zwar veränderte Perspektiven geschaffen, aber vor allem was Volltexte angeht, die Bedeutung von kontrolliertem Vokabular eigentlich nur ein weiteres mal nachhaltig vor Augen geführt.

Komplexe Ordnungswortsysteme werden zu Recht auch als Dokumentationssprachen bezeichnet. Die Analogie zu natürlichen Sprachen ist in der Tat groß genug, um den Begriff Sprache gerechtfertigt erscheinen zu lassen. Sie verfügen einerseits über einen umfassenden Wortschatz, zumindest für ihr Fachgebiet, und darüberhinaus auch über eine »Grammatik«, in der die Bildung von kombinierten Ausdrücken aus Ordnungsworten genau geregelt ist. Ihr hauptsächlicher Zweck besteht darin, die Uneindeutigkeit der Umgangssprache zu vemeiden. Bevor nun in weiterer Folge einige idealtypische Formen und Grundelemente von Dokumentationssprachen kurz ausgeführt werden, ein einschränkender Hinweis auf ein spezifisches Charakteristikum der Mediendokumentation. In den Dokumentationsstellen von Medienbetrieben wird im allgemeinen nicht so heiß gegessen, wie in der Dokumentationstheorie gekocht wird. Aus diesem Grund würde es in diesem Rahmen zu weit führen, auf die durchaus hochinteressanten Feinheiten von elaborierten Dokumentationssprachen und Ordnungssystemen einzugehen, wie sie sich in Teilen der Fachinformation entwickelt haben.

Mediendokumentation ist anders. Eine klassische Randbedingung von Fachinformationstätigkeit lautet beispielsweise, daß sinnvolle Arbeit nur innerhalb abgegrenzter Themengebiete möglich ist. Wo zu viele Wissensgebiete unter eine Decke gesteckt werden, sind spezifisch dokumentarische Ansprüche wie hohe inhaltliche Sach- und Fachkompetenz oder serviceorientierte individuelle Anpassung an Benutzer, aber auch intensive begriffliche Durchgestaltung des Themengebietes in Ordnungswortsystemen (Thesauri) nicht mehr realisierbar. Was diese Ansprüche angeht, hebt die Mediendokumentation in der Tat am deutlichsten von der Fachinformation ab. Medienstoff konstituiert das breitest mögliche Themenspektrum überhaupt. Die Ordnungssysteme von Medienarchiven müssen deshalb grundsätzlich breit angelegt sein, aber doch flexibel an all jenen Stellen Tiefe zulassen, wo sich Spezialisierungen ergeben. 

3.3.2.4 Ordnungswortsysteme

Ordnungssysteme erfüllen im Grunde drei Hauptfunktionen. Sie sollen einerseits die Inhaltsordnung in einem Dokumentationssystem für die daran Arbeitenden (Rechercheure wie Indexierer) transparent machen und andererseits das Sammelgebiet (oder zumindest den Dokumentenbestand) thematisch sinnvoll und gleichmäßig gliedern. Darüberhinaus sollen sie natürlich auch schlicht den Zugriff auf Dokumente ermöglichen. Wegen letzterer Funktion sind Eigenheiten konkreter Ordnungssysteme stark daraus erklärbar, ob als Deskriptorenspeicher eine konventionelle Kartei oder ein Computer in Verwendung stehen, oder ob das Ordnungssystem, wie etwa bei Zeitungsausschnittarchiven, obendrein auch gleich die Lagerordnung wiederspiegeln muß.

Daß hier zentrale Lebensfunktionen von Dokumentationssystemen angesprochen sind, wird klar, wenn man bedenkt, daß im Maximalfall (zumindest über die Jahre) eine unüberschaubare Anzahl an Eingebern (Beschlagwortern, Indexierern) mit einer unüberschaubaren Anzahl an Ordnungsworten eine unüberschaubare Anzahl an Dokumenten erschließen und ordnen, sowie eine unüberschaubare Anzahl an Rechercheuren, die mit den Eingebern keineswegs ident sein müssen, wiederum nach Dokumenten suchen.

Der Knackpunkt ist die »unüberschaubare« Anzahl an Ordnungsworten. Wenn man dieses Problem in den Griff bekommt, lösen sich die anderen weitgehend von selbst. In der Textdokumentation für Medienbetriebe liegt die Anzahl der zur Strukturierung notwendigen Ordnungsworte in der Größenordnung von ca. 800 bis höchstens 5000. Das ist für dokumentarische Verhältnisse nicht wirklich viel, vor allem, wenn man bedenkt, daß universelle Klassifikationen weit mehr als 100.000 Sachverhalte umfassen können. 

Um Wortgutsammlungen systematisch überschaubar zu machen, werden zwei Elemente, üblicherwiese verschränkt, verwendet. Einerseits die Sortierung nach dem Alphabet und andererseits die Hierarchisierung in Systeme von Ober- und Unterbegriffen. Vor allem hierarchische Strukturen sind für Zwecke der Mediendokumentation sehr vorteilhaft, weil sie eine Annäherung an Themenaspekte vom Allgemeinen zum Besonderen ermöglichen.

In 5 ist die Grundphilosophie verschiedener Ordnungswortsysteme auf einen kleinen Themenausschnitt, nämlich auf Jugend und Medien bezogen, schematisch dargestellt. Dabei ist leicht erkennbar, daß ohne hierarchische Elemente kaum leistungsfähige Darstellungen von Wissensgebieten möglich sind. Die radikalste Anwendung des hierarchischen Prinzips ist die Klassifikation. Zeitungsausschnittarchive verwenden üblicherweise klassifikatorische Systeme, weil durch deren strikt hierarchischer Struktur auch Lagerordnungen darstellbar sind. Als Nachteil von klassifikatorischen Ordnungssystemen ist zu erwähnen, daß es bisweilen zu willkürlichen und sehr künstlich anmutenden Über- und Unterordnungen kommen kann, und daß typische Querschnittmaterien in ihnen nur schwer verortbar sind. Hierarchien können in natürlichsprachlichen Schlagwortketten genauso dargestellt werden wie in kurzen und prägnanten Notationen. Diese dokumentarischen Kürzel haben allerdings den Nachteil, daß sie für Systemunkundige nur mit erhöhtem Aufwand nachvollziehbar sind und damit die angestrebte Transparenz von Ordnungssystemen wieder vermindern. So ist die Notation "A 02" für die Dokumentare der FAZ ein vertrauter und für den internen Verkehr ausreichender Begriff. Dem Außenstehenden muß er jedoch erst in die Begriffskette AUßENPOLITIK/AUSWÄRTIGES_AMT/AUßENMINISTER übersetzt werden.

Als Thesaurus bezeichnet man ein hochkomfortables und hochkontrolliertes Ordnungswortsystem, das mit Hilfe der natürlichen Sprache sowohl Über-, Unter- als auch Gleichordnungsbeziehungen von Begriffen möglichst vollständig kontrolliert. Ein Thesaurus verzeichnet sowohl "Deskriptoren" (zur Beschreibung von Dokumentinhalten zugelassene Vorzugsbenennungen) als auch "Nicht-Deskriptoren" und stellt deren Beziehung dar. Thesauri sind sehr aufwendig in ihrem Aufbau und ihrer Wartung, aber dafür sehr komfortabel bei der Anwendung, vor allem für mit dem System unvertraute Benutzer. Das erklärt auch, warum sich echte Thesauri in der Mediendokumentation kaum durchgesetzt haben. Einerseits ist das Vokablular von Medienthemen zu vielfältig, um strikt kontrolliert werden zu können, andererseits indexieren und recherchieren in kleinen und mittleren Mediendokumentationsstellen einige wenige Fachkräfte, die ihr Ordnungsvokabular nach einer gewissen Zeit im Kopf haben und für die die regelmäßig notwendige aufwendige Wartung, im Sinne einer Erweiterung und Anpassung des Thesaurus, einen unnotwendig zeitraubenden Aufwand darstellt. Im Rahmen zeitgemäßer computergestützter Dokumentationsverfahren ist allerdings auch mit einer verstärkten Verwendung von Thesauri zu rechnen. Zum einen, weil deren Wartung und Benutzung durch EDV komfortabler wird, und zum anderen, weil Thesauri sich bei der Datenbankrecherche besonders bewährt haben. Nicht zuletzt, weil für Datenbanken tendenziell gilt, daß auch eine große Anzahl von mit dem System nicht vertrauten Benutzern damit zu arbeiten in der Lage sein sollte.

Am Schluß noch zur Wartung und Pflege von Ordnungswortsystemen. Ordnungssysteme versuchen die Themen einer Welt wiederzuspiegeln, die sich in permanentem Wandel befindet. Begriffe verändern ihre Bedeutung, die Aufmerksamkeit der Öffentlichkeit richtet sich immer wieder auf neue Thematiken, die bei der Einrichtung des Ordnungssystems gänzlich unbekannt waren. Gerade im Bereich der Massenmedien, die sich ja daraus definieren, immer auf der Höhe der Zeit zu sein, stellt dieser Umstand hohe Anforderungen an die Dokumentationsstellen. In etablierten Ordnungssystemen kann die Hereinnahme von nachträglichen Ablagestellen sehr aufwendig sein. Es müssen ja bei der Einführung von zusätzlichen Begriffen auch alle im Sinne der neuen Ordnung vorher über lange Zeit »falsch« indexierten Dokumente in irgendeiner Form berücksichtigt werden.

Zu diesem Problemkreis merkte etwa ein österreichischer Archivleiter in einem Gespräch an, er habe schon viele ambitionierte Mitarbeiter gehabt, die durchaus vernünftige Vorschläge zur Umstrukturierung des Ordnungssystems ausgearbeitet hätten. Der Veränderungswille ließ allerdings deutlich nach, nachdem er grundsätzlich zugestimmt, sie aber darauf hingewiesen hatte, daß sie natürlich auch die dazu notwendige Umsortierung von zehntausenden Zeitungsauschnitten vorzunehmen hätten.

Ein Begriff, der in den 70er Jahren beispielsweise in allen Ordnungssystemen einzuführen war, ist jener der "Umweltverschmutzung". Eine Archivleiterin beschreibt den Aufgabenbereich von Systemwartung und Pflege mit diesem Beispiel:

"... Dennoch lassen sich Änderungen des Katalogs nicht umgehen, da ein dem Tagesgeschehen verpflichtetes Archiv ständig neue Entwicklungen einfangen muß. Auch sind die Begriffe selbst manchem Bedeutungswandel unterworfen, tauchen auf, verschwinden aus der öffentlichen Diskussion oder gewinnen plötzlich ungeahnte neue Dimensionen. So hat man z. B. den Begriff ´Umweltverschmutzung´, heute in aller Munde, noch vor wenigen Jahren nicht gekannt. Wird ein solch wichtiger, viele Themenbereiche umschließender Begriff dann in die Systematik eingeführt, müssen die verschiedenen Sachgebiete, die von nun an unter ihm zu subsumieren sind, erst aus älteren Zusammenhängen herausgelöst werden.

Um beim Beispiel ´Umweltverschmutzung´ zu bleiben: die Dossiers zu den Stichworten ´Verunreinigung der Luft´ und ´Verunreinigung des Wassers´ lagen früher an ganz anderen Stellen als die zu den Stichworten ´Abfallbeseitigung´ oder ´Vernichtung von Industriemüll´. Heute gehören alle diese Komplexe gemeinsam unter den neuen Oberbegriff ´Umweltverschmutzung´." 

Welche Bedeutung der Ordnungsstruktur und ihrer flexiblen Erweiterbarkeit zukommt, geht auch aus der Einschätzung hervor, daß Mängel in der Grundstruktur nach einer gewissen Zeit fast nicht mehr zu korrigieren wären und eigentlich nur durch eine Neuanfang Abhilfe schaffen könnte.Wie in so vielen Bereichen des Dokumentationswesen werden auch bezüglich der Pflege und Weiterentwicklung von Ordnungssystemen neue Impulse von der zunehmenden Etablierung computergestützter Verfahren erwartet.  

3.3.2.5 Ordnungs-, Erschließungs- und Zugriffsaspekte der EDV

Um verwirrende Überschneidungen zu vermeiden und grundlegende Problemstellungen klar herauszuarbeiten, wurden die Methoden der Ordnung und Erschließung von Information bis hierher so beschrieben, wie sie sich ohne den Einsatz elektronischer Datenverarbeitung darstellen. Auf allfällige Möglichkeiten des Computereinsatzes wurde von Fall zu Fall ohne systematische Ausführung hingewiesen. Das soll in diesem Abschnitt nachgeholt werden.

Zur kurzen Wiederholung: Als Ziel allen Ordnens und Erschließens wurde der sichere und rasche Zugriff auf Dokumente aus einer vorderhand unüberschauberen Menge beschrieben. Die grundlegenden Verfahren zur Realisierung dieses Zieles sind, soweit notwendig, die Trennung in dokumentarische Bezugseinheit und Dokumentationseinheit einerseits, sowie deren systematische Ordnung (Sortierung) andererseits. Was nun den Zugriff auf Dokumente angeht, ergeben sich durch den Einsatz der EDV massive Leistungssteigerungen auf zwei Gebieten:

1.) Durch Computereinsatz ist jedes Wort eines Datensatzes (eigentlich jedes Zeichen) für den Zugriff heranziehbar. Bei konventionellen Verfahren sind dies, zur Erinnerung, lediglich jene ausgezeichneten Begriffe, für die der zusätzliche Aufwand der Duplizierung und Einsortierung pro jeweils weiterer Zugriffdimension geleistet wird. 

2.) Darüberhinaus, und damit multipliziert sich der Effekt von Punkt 1.), ist bei der Suche jeder Eintrag in einem Datensatz mit jedem anderen Eintrag beliebig kombinierbar. Hingegen sind bei konventionellen Verfahren Kombinationen von Merkmalen nur bei der Indexierung möglich. Abgesehen von dem Fall natürlich, daß der Rechercheur zumindest einen Teil der Dokumente wiederum Stück für Stück durchsieht.  

Um den Unterschied zwischen einer konventionell hierarchischen Ablage und den Möglichkeiten der Computerspeicherung herauszuarbeiten, erinnern wir uns an den Zeitungsausschnitt aus 4 über die Mafia in Rußland. Nach dem skizzierten Modell wurde der Artikel in einer hierarchischen Ordnung fünfmal abgelegt: in das Kuvert mit der Aufschrift "ORGANISIERTE", in die Mappe KRIMINALITÄT im Abschnitt WIRTSCHAFT der Schublade RUßLAND. Im selben Abschnitt auch in das Kuvert AUSLÄNDISCHE der Mappe INVESTITIONEN. Darüberhinaus unter GERASCHTSCHENKO sowie KOERBER in der Personenkartei, und auch bei ABB in der Firmenkartei. Verschiedene Arten von Anfragen lassen sich auf dieser Basis verschieden gut, vor allem im Sinne von verschieden schnell, beantworten. Die Frage nach der organisierten Wirtschaftskriminalität in Rußland ist in Sekunden beantwortet. Ein Griff in die Schublade, und der Redakteur kann das Dossier auch schon mitnehmen. Dasselbe gilt für die Frage nach ausländischer Investitionstätigkeit in Rußland. Mit solchen Beispielen wird auch nach wie vor die Überlegenheit konventioneller Verfahren über elektronische Erschließungsmethoden illustriert. Schwieriger wird es schon, wenn ein Redakteur einen Überblick über internationale organisierte Kriminalität haben möchte. Zu diesem Zweck wäre es notwendig, in der Ablage für alle Länder einzeln nachzusehen. Eine Alternative von der Ordnungssystematik her könnte natürlich darin bestehen, eine zusätzliche Mappe ORGANISIERTE KRIMINALITÄT / INTERNATIONAL zu führen und entsprechend relevante Artikel zusätzlich auch noch dort abzulegen. Das allerdings verspräche keine grundsätzliche Lösung, denn das Beispiel ließe sich endlos weiterführen. Vor allem, wenn noch mehr dokumentationswürdige Merkmale pro Artikel zu berücksichtgen wären, könnten immer wieder Kombinationen der Merkmale formuliert werden, die in der hierarchischen Ablage keine Berücksichtigung gefunden hätten. Im Anlaßfall müssen dann jedesmal eine ganze Reihe von in Frage kommenden Stellen der Ablageordnung wiederum Artikel für Artikel durchsucht werden.

Bei der Computerspeicherung hingegen werden einfach alle relevanten Inhaltsmerkmale in einem Datensatz festgehalten. Bei der Recherche (in der Fachsprache: Retrieval) wird dann eine Suchfrage formuliert, die mit Hilfe elementarer logischer Operatoren die erwartete Dokumentenmenge beschreibt. Der Computer vergleicht automatisch die verzeichneten Merkmale aller Dokumentationseinheiten mit der gestellten Suchfrage und gibt jene, bei denen die Merkmale im Sinne der Frage übereinstimmen, als Ergebnis aus.

In obiger Abbildung ist anhand von basalen Operatoren die Logik dargestellt, nach der computergestütztes Dokumentenretrieval funktioniert. Sie wird nach dem Mathematiker, der sie formalisierte, als "Boolesche Logik" bezeichnet und ist in unseren Breiten auch schlicht als Mengenlehre bekannt. Die Grundoperatoren sind das logische "und" sowie das logische "oder". Die Suchfrage "Rußland und Kriminalität" enthält etwa die Anweisung, all jene Dokumentationseinheiten auszugeben, die sowohl mit Rußland als auch mit Kriminalität indexiert wurden. Die Suchfrage "Kriminalität oder Verbrechen" meint dementsprechend, daß im Suchergebnis alle Dokumente enthalten sein sollen, in denen entweder Kriminalität oder Verbrechen vorkommt. Die Möglichkeiten der Retrievalsysteme gehen schon lange über die einfache Boolesche Logik hinaus und reichen von der Berücksichtiung von Wortabständen bis zu phonetischen Suchmöglichkeiten. Das ist vor allem bei der Recherche in Volltexten sehr nützlich. Bemühungen, Retrievalsysteme zu entwickeln, die auch den Sinn des Gesuchten berücksichtigen, werden schon eine Weile angestellt, haben sich aber noch nicht in marktgängigen Systemen niedergeschlagen.

Bei Volltext- bzw. Faksimiledatenbanken kann die Einsicht in die gefundenen Dokumente gleich am Bildschirm erfolgen. Handelt es sich um eine Referenzdatenbank, müssen die Dokumente zusätzlich in einem gesonderten Arbeitsgang beschafft werden. Konventionelle Zeitungsauschnittarchive vermissen die Möglichkeit der nachträglichen Verknüpfung von Suchbegriffen zwar bisweilen, aber sie können damit leben, wie das folgende Zitat nachweist: 

"Im konventionell geführten Archiv wird der größte Vorzug elektronischer Archivsysteme, die Fähigkeit zur automatischen Postkoordination (die nachträgliche Verknüpfbarkeit zunächst nicht nicht miteinander in Verbindung gebrachter Suchbegriffe) manchmal schmerzlich vermißt. Zur Suche nach der sprichwörlichen Stecknadel im Heuhaufen ist die Elektronik ja trefflich geeignet. Dem konventionellen Archiv bleibt nur der Versuch, Heuhaufen gar nicht erst entstehen zu lassen. Dazu benutzt es das Instrument der Präkoordination" 

An dieser Stelle ist ein Einschub zur Begriffsklärung notwendig. Das Zitat legt irreführend nahe, die Technik der nachträglichen Verknüpfung von Suchbegriffen würde generell als Postkoordination bezeichnet. Dem ist nicht so. In der Dokumentationstheorie wird von Postkoordination nur gesprochen, wenn auch das verwendete Ordnungsvokabular aus spezifischen Elementarbegriffen, sogenannten "Uniterms", aufgebaut ist. Dabei wäre beispielsweise der Begriff "Bibliothek" durch die Deskriptoren "Gebäude", "Bücher", "Lagerung"darzustellen.

Anknüpfend an die Boolesche Suchlogik läßt sich auch gleich ein dokumentationstheoretisches Begriffspaar erläutern, von dem im Zusammengang mit Datenbankrecherche oft die Rede ist, nämlich "Precision" und "Recall". Das Wertpaar Precision und Recall stellt ein Selektionsgütemaß dar, welches das Verhältnis zwischen den im Rahmen einer Computer-Recherchefrage gefundenen Dokumenten und den tatsächlich relevanten Dokumenten ausdrückt. Precision läßt sich in diesem Sinn als Trefferquote übersetzen und Recall als Vollständigkeitsmaß. Wie ist das zu verstehen?

Jedes Ergebnis einer Datenbankrecherche enthält in einem gewissen Ausmaß relevante, teilweise relevante und nichtrelevante Dokumente. Deren Verhältnis sollte auf keinen Fall von Glück und nur in geringem Ausmaß vom individuellen Geschick des Rechercheurs abhängen, sondern durch die Suchstrategie bewußt einstellbar sein. Mit der elektronischen Recherche und ihrer Möglichkeit, Suchfragen durch Mengenoperationen zu verengen und zu erweitern, ist ein leistungsfähiges Instrument gegeben, um das Verhältnis von Precision und Recall individuell zu steuern.

Am Beispiel einer Volltextrecherche zum Thema "Mafia" läßt sich dieses Prinzip leicht darstellen: Läßt man sich in einer »weiten« Suchfrage alle Artikel ausgeben, bei denen irgendwo im Text das Wort "Mafia" vorkommt, so wurde nach dem Prinzip Recall recherchiert. Das Ergebnis ist mengenmäßig gigantisch, es scheinen unter anderem irreführenderweise alle Buch- und Filmrezesionen von "Der Pate" auf, was einen beträchtlichen Selektionsaufwand mit sich bringt. Aber man kann sich schlußendlich immerhin sicher sein, wirklich aus allen unter Umständen in Frage kommenden Dokumenten ausgewählt zu haben.

Eine »enge« Recherche, bei das Wort "Mafia" nur im Titel, und obendrein verknüpft mit dem Deskriptor "Kriminalität" vorkommen dürfte, wäre im Vergleich dazu eine Suche nach dem Prinzip Precision. Man könnte sich zwar nie sicher sein, wirklich alle möglicherweise in Frage kommenden Dokumente gesehen zu haben. Aber dafür liegen - abgesehen von wenigen Fehltreffern - tatsächlich nur relevante Artikel vor, und man hat sich in vertretbarer Zeit einen Überblick verschafft.


NÄCHSTES KAPITEL
HOME