Weit mehr als Bücher-Scannen – Die Arbeit am Münchner Digitalisierungszentrum

Die Digitalisierung von Büchern ist in jüngster Zeit in die Schlagzeilen geraten – mit einem Mammutprojekt. Der Suchmaschinen-Anbieter Google will 15 Millionen Bücher aus Bibliotheken in den USA und England scannen und, soweit es die Urheberrechte erlauben, im Volltext über das WordWideWeb kostenlos zugänglich machen. 5.000 Titel sollen dafür von Hochleistungsscannern pro Tag erfasst werden, insgesamt 4,5 Milliarden Buchseiten. Das klingt ebenso simpel wie zweckmäßig.
Die Lizenz zum Erproben
Weniger simpel, doch um so zweckmäßiger ist die Pionierarbeit, die in Deutschland im Bereich der Digitalisierung geleistet wird, vor allem an den beiden Digitalisierungszentren im Norden und Süden Deutschlands. Die beiden Zentren wurden im Jahr 1997 mit Mitteln der Deutschen Forschungsgemeinschaft (DFG) eingerichtet – eins an der Staats- und Universitätsbibliothek Göttingen (SUB), eins an der Bayerischen Staatsbibliothek (BSB).Die Aufgabe der beiden Zentren ist es, anhand von konkreten Projekten eine möglichst breite Kompetenz im Bereich Digitalisierung zu erwerben. Von den gemachten Erfahrungen und dem gewonnenen Know-how sollen dann andere Institutionen, die im DFG-Förderbereich "Retrospektive Digitalisierung von Bibliotheksbeständen" tätig sind, profitieren. Die Münchener und Göttinger Spezialisten stehen ihnen bei der Konzeption und Realisierung von Projekten beratend zur Seite.
Auf der Suche nach Mehrwert
Bei ihrer Arbeit geht es den Bibliothekaren, die am Münchner Digitalisierungszentrum (MDZ) tätig sind, niemals allein um die bessere Zugänglichkeit von Publikationen. Sie versuchen immer auch für den Nutzer einen Mehrwert im Vergleich zur Druckversion zu erzielen, etwa indem sie mit der Art der Erschließung neue Möglichkeiten des Zugriffs und der Auswertung schaffen.Somit kümmert sich das Digitalisierungszentrum, das seit 2003 als Referat "Digitale Bibliothek" zur Abteilung Bestandsaufbau/Erschließung der BSB gehört, keineswegs nur um die sich rasant entwickelnde Technik der digitalen Erfassung. Die eigentliche und aufwendige Arbeit beginnt erst nach der Digitalisierung. Diese Nachbearbeitung schafft die Grundlagen dafür, dass die Benutzer sich die digitalisierten Seiten nicht nur ansehen können, sondern in ihnen auch nach Herzenslust über die Volltextsuche oder mit Hilfe einer Registerrecherche wissenschaftlich arbeiten können.
Neben der Erschließung und der Verwaltung der Daten, der Definition von Suchfunktionen und Zugriffsmöglichkeiten, arbeitet das MDZ an leistungsfähigen Modellen für ihre Bereitstellung und Präsentation (etwa in Fachportalen im Internet), an Systemen der Rechteverwaltung sowie an Lösungen für die Langzeitarchivierung der sehr heterogenen und umfangreichen Materialien (Texte, Bilder, Karten etc.). Vor allem Letzteres wird in schnelllebigen Zeiten zum Problem: Datenträger veralten, Dateiformate ändern sich, Netzpublikationen sind flüchtig, Lizenzverträge laufen aus.
Jedes Projekt ein Experimentierfeld
Da die Digitalisierung noch ein relativ neuer Aufgabenbereich ist, muss vieles erst erprobt und ausprobiert werden. Jedes Projekt zeitigt – jeweils am aktuellen Stand der Technik orientiert – neue Standards und Konzepte.Modellhaft untersucht man am MDZ etwa die Optionen für die Digitalisierung und Erschließung von Enzyklopädien und Wörterbüchern. Ein Beispiel dafür ist das Große vollständige Universal-Lexicon von Johann Heinrich Zedler, einer der wichtigsten deutschen Enzyklopädien des 18. Jahrhunderts. Jede der 68.000 Lexikon-Seiten wurde im Graphikformat digitalisiert. Damit ist zwar keine Volltextsuche in den Artikeln möglich. Da jedoch alle Stichwörter des Zedler (über eine halbe Million) suchbar erfasst sowie Namen und Geographika nachträglich markiert wurden, können die Artikel nun gezielt nach Personen, Orte und Ländern selektiert werden. Die konstant hohen Zugriffszahlen beweisen, wie groß das Interesse der Wissenschaftler an der Enzyklopädie ist.
Im Projekt "Reichtagsberichte" ging es darum, historisches Quellenmaterial verfügbar zu machen, das dank der umfangreichen Recherchen erstmals vollständig angeboten werden kann. Die Stenographischen Berichte von Sitzungen des Deutschen Reichstags, die gedruckt über 400 Bände ausmachen, gehören zu den wichtigsten Quellen der neueren deutschen Geschichte. Bislang wurden die Berichte aus dem Zeitraum 1867-1895 im Bildformat erfasst und im Internet bereitgestellt – 107.695 Seiten in 165 Bänden. Dort kann man in den virtuellen Bänden navigieren oder Rednerbeiträge (nach Sprechernamen, Sitzungsdaten und Themen) über die Volltext-Recherche im General- und Sprechregister suchen. Zurzeit arbeitet das MDZ an der Fortsetzung des Projekts für die Berichtsjahre 1919 bis 1939.
Klasse und Masse
Am Projekt "Reichstagsberichte" wird auch deutlich, wie schnell der Fortschritt der Technik neue Möglichkeiten eröffnet. Wurden die Berichte aus den frühen Jahren nicht im Volltext angeboten, weil die Frakturtype bis vor wenigen Monaten von den Texterkennungsprogrammen nur sehr fehlerhaft gelesen werden konnte, öffnen nun verbesserte Programme neue Türen. Durch diese werden die Spezialisten an den Digitalisierungszentren zuerst gehen – lange vor den Suchmaschinen-Anbietern.Darüber hinaus erarbeitet das MDZ unter dem Titel "Retrodigitaler Bestandsaufbau" auch Konzepte für Mammutprojekte à la Google. In einer ersten Stufe schafft das MDZ hier auf Landesebene eine organisatorisch-technische Infrastruktur (Scannerhard- und -software, gemeinsames Bereitstellungssystem etc.) und richtet entsprechende Workflows ein. Ein erster Schritt ist dazu mittlerweile getan: Mit Sondermitteln des Bayerischen Staatsministeriums für Wissenschaft, Forschung und Kunst konnte an der BSB eine "Digitalisierungsstraße" eingerichtet werden, die im 2. Quartal 2005 die Produktion aufnehmen soll.
Redakteurin und Publizistin in Bonn
Copyright: Goethe-Institut, Online-Redaktion
Haben Sie noch Fragen zu diesem Artikel? Schreiben Sie uns!
online-redaktion@goethe.de
April 2005










