Meta-Wörterbuch

Das Wörterbuch-Netz: Verfahren – Methoden – Perspektiven

Die Komplexität einer Sprache spiegelt sich auch in der Anzahl entsprechender Wörterbücher. In einem digitalen 'Wörterbuch-Netz' können Zugangswege eröffnet werden, die sowohl für Wissenschaftler als auch für die interessierte Öffentlichkeit neue und oft auch überraschende Einblicke in die Vielfalt der deutschen Sprache gewähren.

Eine Sprache ist kein einheitliches oder eindimensionales System, sondern geprägt durch ständigen Wandel und Variation, nicht nur in ihrer historischen Entwicklung betrachtet, sondern auch und gerade in ihrer aktuellen Erscheinungsform. Neben dem "Standard" einer Sprache gibt es regionale Varietäten, Gruppensprachen, Fachsprachen und vieles mehr. Ist dies schon für den Muttersprachler kaum überschaubar, so ist es für den Fremdsprachenlerner noch weit schwieriger zu handhaben. Wörterbücher und Nachschlagewerke aller Art sind daher unverzichtbare Hilfsmittel, denn sie verzeichnen und ordnen nicht nur die sprachliche Vielfalt, sondern sie bieten auch den umfassendsten und effizientesten Zugriff auf Sprachinformation.

Für die Varietäten einer Sprache und die unterschiedlichen Bedürfnisse der Nutzer gibt es entsprechend ganz unterschiedliche Wörterbuchtypen, die sorgfältig wissenschaftlich aufbereitete Informationen bereithalten. Das macht sie nach wie vor zu zentralen Hilfsmitteln von Forschung und Lehre, denn die von Internet-Suchmaschinen gesammelten Daten können weder die Verlässlichkeit noch den Grad an Systematisierung und Tiefenerschließung der in Nachschlagewerken aufbereiteten Informationen erreichen und bleiben derzeit weit hinter deren Präzision und Umfang zurück.

Das Trierer 'Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften' beschäftigt sich mit der Aufbereitung von gedruckten Wörterbüchern für das Internet oder auf CD-ROM. Dazu gehören so zentrale Nachschlagewerke wie das Deutsche Wörterbuch von Jacob und Wilhelm Grimm, einige Wörterbücher zum Mittelhochdeutschen, mehrere Dialektwörterbücher oder das Goethe-Wörterbuch. Diese Wörterbücher können nicht nur je für sich benutzt und nach unterschiedlichen Kategorien recherchiert werden, sondern werden darüber hinaus in einem integrierten Verbund, dem 'Wörterbuch-Netz' zusammengeführt.

Jedes Wörterbuch wird gemäß seinen spezifischen Anforderungen aufbereitet, indem neben der reinen Erfassung der Textinformation ein Mehrwert durch zusätzliche Inhalte in Form von Meta-Daten geschaffen wird: Zunächst werden die Informationspositionen eines Wörterbuchartikels wie Stichwort, grammatische Angabe, Bedeutungsangabe, Belegzitate, Etymologie, Verweise etc. markiert, damit sie sowohl innerhalb eines Wörterbuchs als auch über mehrere Wörterbücher hinweg vergleichbar und recherchierbar gemacht werden.

Um einen integrierten Zugang zu den unterschiedlich strukturierten und mit unterschiedlichen Stichwortansätzen arbeitenden Wörterbüchern zu schaffen, können diese auf ein standardisiertes Stichwort (sog. 'Hyper-Lemma') abgebildet werden, so dass zum Beispiel sowohl dialektale, historische oder standardsprachliche Stichwörter über ein einziges solches 'Hyper-Lemma' gefunden werden können.

Die Kategorisierungen der Wörterbuchquellen nach sogenannten Symptomwerten bieten weitere Möglichkeiten, um das Material z.B. nach den Kategorien von Raum, Zeit, Textsorte und Stil etc. durchsuchen zu können. Zusammen mit der zuvor beschriebenen Strukturierung der Artikel können im Mittelhochdeutschen Wörterbuchverbund so komplexe Recherchen wie beispielsweise die nach allen Ableitungen mit dem Suffix –unge in religiösen Texten des 13. Jahrhunderts aus dem bairischen Raum durchgeführt werden. Die inhaltliche Klassifizierung von Nachschlagewerken (z.B. durch die international gebräuchliche Dewey Decimal Classification o.ä.) ist ein weiterer Mehrwert, der neue Erschließungs- und damit Suchmöglichkeiten schafft, da der Zugang über eine hierarchische, themenorientierte Sachordnung erfolgen kann. So findet man z.B. in der Ökonomischen Enzyklopädie von J.G. Krünitz gezielt alle Artikel, die sich mit botanischen Museen und Sammlungen befassen, indem man in der Gliederung 'Naturwissenschaften > Pflanzen > Museen' verfolgt; ein Mausblick bringt den Benutzer dann zum gewünschten Artikel.

Mit einer solchen Aufbereitung sind wesentliche Voraussetzungen für eine weitere Vernetzung geschaffen: Wörterbücher spiegeln die Vielfalt und Heterogenität der Sprache, sind aber auch auf vielfältige Art aufeinander bezogen, was sich bereits in expliziten Verweisen untereinander zeigt. Diese Verweise werden zunächst als monodirektionale Hyperlinks abgebildet, die jedoch mit Hilfe von automatischen Verfahren auch multidirektional erzeugt werden können, so dass beispielsweise von älteren Wörterbüchern auf jüngere verwiesen werden kann, z.B. aus dem Rheinischen Wörterbuch von 1928 in das modernere Pfälzische Wörterbuch von 1965, was im gedruckten Buch nicht möglich ist.

Darüber hinaus sind Wörterbücher auch ohne explizite Verweisnennung auf vielen Ebenen inhaltlich miteinander verbunden, da sie Informationen über dieselben bzw. vergleichbare Dinge und Begriffe aus unterschiedlichen Perspektiven bereithalten. Eine übergreifende, integrierte Recherche ist jedoch wegen der Unterschiede in der Anlage, Anordnung und Struktur der einzelnen Werke nicht ohne Weiteres möglich. Digitale Nachschlagewerke, die jedoch wie oben beschrieben strukturiert und erschlossen sind, können diese inhaltlichen Verbindungen explizit und sichtbar machen. So soll der Nutzer über ein 'Hyper-Lemma' einerseits nach allen Formen des Wortes 'Brombeere' (z.B. nhd. Brombeere, mhd. brâmber, rhein. Brame, Brambeere, Frambeer, lux. Bromelen etc.) oder nach allen möglichen Wörtern für das Ding 'Brombeere' (z.B. nhd. Brombeere, rhein. Schmärzbeere, lux. Schmääspel, moselfr. More etc.) suchen können. Dadurch kann eine neue Qualität der Informationsgewinnung erreicht und die Lücke zwischen der schwerfälligen Benutzbarkeit und eingeschränkten Verfügbarkeit der Buchversionen einerseits und der fehlenden Systematik und Beliebigkeit der Information im Internet andererseits geschlossen werden.

Das hier skizzierte ambitionierte Ideal-Ziel, ein vielfältig verknüpftes, intelligentes 'Meta-Wörterbuch' der "deutschen Sprache", steht noch in seinen Anfängen und ist gewiss nur in einer gemeinsamen Forschungs- und Umsetzungs-Anstrengung verschiedener Disziplinen realisierbar. Konzepte, Methoden und Verfahren aus den unterschiedlichen Bereichen der Informatik, der Computerphilologie bzw. Computerlinguistik, der Systematischen Linguistik sowie der Lexikographie bzw. Lexikologie müssen dafür in einem interdisziplinären Methodenbündel zusammenwirken.

Das Wörterbuch-Netz wird dann nicht nur dem wissenschaftlichen Nutzer neue und effiziente Zugänge zu Sprachinformationen bieten, sondern ist gerade auch für den Deutschlerner ein anregender und spannender Einstieg, der dazu verführen will, in den verschiedenen Wörterbüchern zu browsen, zu stöbern und zu schmökern.

Dr. Andrea Rapp
Studium der Germanistik, Kunstgeschichte und Ethnologie an der Universität Trier, seit 2005 Akademische Rätin im Fach Germanistik und Geschäftsführerin des Kompetenzzentrums für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier

Copyright: Goethe-Institut, Online-Redaktion

Haben Sie noch Fragen zu diesem Artikel? Schreiben Sie uns!
online-redaktion@goethe.de
Juni 2006

Links zum Thema