beschlagwortung
   
Konstruktives Wissensmanagement
letzte Aktualisierung:16.10.2001
copyright: Christa Baumgartner
   
über mich
Meine Projekte

    Beschlagworten Indizieren Deskribieren Erfassen

    meint hier alles das Gleiche. Ich möchte kurz erklären, was damit gemeint ist und wie sich diese Arbeit veränderte und im Moment noch immer noch in einem Änderungsprozess drinsteckt.

    Stellt Euch vor, Ihr braucht braucht Informationen zu den grössten Stürmen in der Karibik in den letzten Jahren.

    Wie würdet Ihr die Suchfrage formulieren?
    Meine Suche wäre: Sturm und Karibik

    1 - Früher, z.B. in der Bibliothek
    öffnete man den alphabetischen Schlagwortkatalog unter "Sturm" und wurde dort fündig, oder verwiesen an "Naturkatastrophe" - dem Oberbegriff, oder zu "Wirbelsturm" - einem der Unterbegriffe. Bei Karibik das Gleiche. Die Kunden der Bibliothek mussten sich durch hunderte von Karteikärtchen hindurchlesen. Und die Bibliothekarinnen müssen zu einem Dokument vielleicht mehr als ein Dutzend verschiedene Karteikärtchen erstellen, damit das Buch unter den entsprechenden Schlagwörtern erscheint.

    2 - Zwischendurch, z.B. bei Online-Datenbanken wie Datastar
    ersetzt der Computer die Karteikärtchen. Eine Datenbank, ermöglicht es, in strukturierten Feldern "Autor" "Titel" "Schlagwort" zu suchen, und das System spuckt eine Reihe Treffer aus. Wenn das System ein gutes ist, dann ist es in der Lage, Synonyme zu suchen und hierarisch zu suchen. Also: bei der Suche nach "Sturm" wird auch gefunden "Wirbelsturm", bei "Karibik" wird auch gefunden "Trinidad". Für die Benützer - sofern sie mit der Datenbank vertraut sind - ist diese Möglichkeit komfortabel und ermöglicht, viel genauer zu suchen und schneller zum Ziel zu gelangen. Für die Dokumentalistinnen heisst das: das Dokument wird nur noch einmal erfasst.

    Beiden Systemen - Karteikärtchen und Online-Datenbank war lange Zeit gemeinsam, dass sie Referenzen anzeigten. Das Dokument selber hatte man noch nicht auf dem Bildschirm.
    Und die Beschlagwortung diente dazu, zusätzlich zu den auch suchbaren Titelwörtern mittels einer "Kunstsprache" die Dokumente inhaltlich einheitlich zu indexieren. Diese Kunstsprache nennt man Thesaurus, und der Thesaurus ist je nachdem welche Inhalte zu erschliessen sind, ein anderer. Thesauri werden den Bedürfnissen angepasst, es gibt keine absolut gültigen! Der Thesaurus der smd-Pressedatenbank umfasste etwa 6000 Begriffe (Deskriptoren).

    Durch die Digitalisierung der Printprodukte werden seit etwa 10 Jahren immer mehr Volltexte angeboten. Die erste Reaktion der Betreiber war, auf die Beschlagwortung zu verzichten, weil nun ja "jedes Wort gefunden werden kann". Herrliche Zeiten! Sie bedeuten, dass mit der Suche "Sturm" und "Karibik" vielleicht gar nichts mehr gefunden wird, weil im Dokument die beiden Wörter nicht vorkommen, stattdessen wird von Hurrikanen und Wirbelstürmen in Trinidad geschrieben. Oder: Es wird viel Falsches gefunden, nämlich auch ein Artikel über die Regierungskrise in Haiti, weil dort ein "Sturm" der Entrüstung durch die Bevölkerung in der "Karibik" ...

    3 - Heute, bez. Morgen die intelligenten Suchmaschinen
    Inzwischen ist unbestritten, dass mit dem Suche im Volltext allein kein vernünftiges Auffinden von relevanten Dokumenten möglich ist. Wie die Standards in Zukunft aussehen, ist noch nicht bekannt. Der zukünftige Weg scheint eher dahin zu tendieren, nicht mehr die einzelnen Dokumente zu beschlagworten, sondern die Intelligenz in die Suche zu integrieren. (das auszuführen, geht hier zu weit, erkläre ich gerne mündlich, allenfalls...)

    Heute versuchen wir, dem Benützer die Kenntnis einer Datenbank, Suchsprache oder gar eines Thesaurus mit 6000 Begriffen zu ersparen. Eine Möglichkeit hierzu ist zum Beispiel eine Navigation, wie wir sie im Internet haben. Der Benutzer klickt auf Naturkatstrophen und er ist im richtigen Pool für seine weitere Suche. Ein zukunftorientiertes Suchsystem ermöglicht auch eine Relevanz-Suche, d.h. je öfter ein Begriff im Volltext vorkommt, umso relevanter ist er. Ausserdem sollten in das System morphologische Regeln eingebaut sein, die z.B. Einzahl/Mehrzahl integrieren oder Deklanationen und ausserdem die Semantik - gemeint ist ein Umfeld zu einem Begriff - ermöglichen. Einige solcher Systeme sind

    Eurospider
    ConveraAutonomy

    Verbunden mit der Rubrik "Naturkatastrophen" und dem Suchwort "Sturm" ist eine richtige Selektion gemacht. Die Maschine hat gemerkt, dass Sturm auch Stürme meint, berücksichtigt auf Formen des Sturms (Hurrikan, Wirbelsturm) und zeigt die Treffer nach Relevanz geordnet an. Wenn ich nun noch im Feld Land die "Karibik" auswähle und im Datumsfeld "letzte 4 Jahre" liege ich goldrichtig.


->mykwmkwm-inhaltkwm-gelbe seiten