FES | ||
|
|
TEILDOKUMENT:
[Seite der Druckausg.: 126 (Fortsetzung)]
Anne Bärhausen und Annette Euskirchen
Eine Grundbedingung für den Einstieg der Bibliothek der FES in das elektronische Zeitalter war es, den vorhandenen Datenpool, sprich den alten Kartenkatalog, das Nachweisinstrument für 300.000 Bände spezialisierter Literatur, in maschinenlesbare Daten zu "verwandeln".165.000 Katalogkarten wurden von einer Fremdfirma gemäß unseren Anweisungen manuell erfaßt und als Dateien wieder abgeliefert [ Siehe: Katalogkonversion - Erfahrungsbericht. In: Bibliotheksdienst 29 (1995), S. 1939-1947.] .
Kurze Darstellung der Ziele der Überarbeitung sowie der Ausgangslage
Das erklärte Ziel der Überarbeitung war es, unsere "alten" Daten an nationale (RAK) und internationale Standards anzugleichen und so dem Benutzer weltweit eine zuverlässige und im Ergebnis vollständige Recherche in unserem Katalog zu ermöglichen. Der Benutzer muß stets alle Veröffentlichungen von einer Person oder Institution an einer Stelle finden. Vor allem in Zeiten der elektronischen Medien führt jeder falsche Buchstabe in einem Namen, jede falsche Fassung eines Körperschaftsnamens dazu, dass die betreffende Publikation für den Benutzer nicht mehr auffindbar ist. [Seite der Druckausg.: 127] Ebenso soll der Benutzer alle Literatur zu einem Thema unter einem Schlagwort wiederfinden und durch sinnvolle Verweisungen zu diesem Schlagwort geleitet werden. Die Normierung der Schlagworte, die früher zumindest teilweise beim Einstellen der Karten in den Katalog stattfand und durch die Konversion daher verloren ging, musste also nach der Digitalisierung des Katalogs möglichst umgehend erfolgen. Wertvolle Literatur ist der Benutzung sonst entzogen, da z. B. eine Treffermenge von 79 Titeln unter dem Schlagwort "Gewerkschaft, Presse" impliziert, dies wäre der Gesamtbestand der Bibliothek zu diesem Thema. Kein Benutzer wird parallel unter dem Schlagwort "Gewerkschaftspresse" suchen und die dort "versteckten" weiteren 23 Titel jemals finden. Gleichzeitig sollten aber auch unsere speziellen Schwerpunkte weiterhin erhalten und gepflegt werden. Dies machte es unmöglich, einen bestehenden allgemeinen Schlagwort-Thesaurus zu übernehmen, da mit einem solchen Wortmaterial unsere sehr spezielle Literatur nicht sinnvoll verschlagwortet werden könnte. Konvertiert wurden insgesamt:
Der Schwerpunkt der Nachbearbeitung in der Bibliothek lag naturgemäß bei unserem eigenen Katalog sowie bei dem Katalog des Bestandes des DGB, der in unsere Bibliothek integriert wurde. An dieser Stelle nur kurz erwähnt werden sollen die Konversionen des Interimskatalogs (IK) sowie des Karl-Marx-Hauses. Der IK wurde nicht in die normale Dienstdatenbank eingespeist, sondern bleibt ein getrennter Datenbestand, da die IK-Aufnahmen nur in einem sehr stark gekürzten Datenformat konvertiert wurden. Deshalb erfolgte hier auch keine intensive Nachbearbeitung der Daten.
Für den Katalog des Karl-Marx-Hauses erfolgt die Nachbearbeitung vom KMH selbst. Der Katalog des DBG bestand aus zwei verschiedenen Teilen, dem sogenannten Kapselkatalog (ca. 30.000 Aufnahmen) mit teilweise handschriftlichen, teilweise fast unleserlichen Titelaufnahmen und dem Zettelkatalog (ca. 20.000 Aufnahmen) mit den neueren Titeln. Beide Teile wurden konvertiert. Die konvertierten Titelaufnahmen des Zettelkataloges enthalten keine Schlagworte und erreichten nicht die Qualität unserer eigenen Titelaufnahmen, sie waren jedoch integrierbar. [Seite der Druckausg.: 128] Die Daten wurden zunächst getrennt gehalten, so dass erste Angleichungen in einer geringeren und damit überschaubaren Titelmenge erfolgen konnten, inzwischen sind die Daten im FES-Katalog enthalten. Die konvertierten Titelaufnahmen aus dem Kapselkatalog bleiben aufgrund ihrer schlech-ten Qualität in einer gesonderten Datenbank bis sie einzeln überprüft sind.
Verlorene Bände, falsche Signaturen oder an die Zeitschriftenstelle abgegebene Publikationen werden im Datensatz als solche gekennzeichnet und nicht gelöscht, so dass diese Datenbank nach Abschluss der Arbeiten als eine Art Zugangsbuch immer noch Auskunft über den Verbleib aller übernommenen Exemplare geben kann. Von den ursprünglich etwa 30.000 Aufnahmen sind inzwischen etwa ein Drittel abgearbeitet, es bleibt also noch eine Menge von ca. 20.000 zu überprüfenden Datensätzen. Bisher ergibt sich somit eine Gesamtmenge von 193.000 konvertierten Titelaufnahmen im OPAC, die dort zusammen mit den ca. 80.000 seit 1993 online katalogisierten Neuanschaffungen und Aufsätzen möglichst einheitlich recherchierbar sein sollen. Eine gigantische Datenmenge, in der dennoch jedes einzelne Buch zu finden sein muss.
Konkrete Vorgehensweise bei der Überarbeitung des Datenmaterials
Zur Konversion gebracht und konvertiert wurden immer nur einzelne Alphabetabschnitte des alten Kartenkatalogs, so dass nie der ganze Katalog bei der Konversionsfirma war, die Datenlieferung erfolgte also auch sukzessiv. Jede Lieferung durchlief zunächst eine automatische Bearbeitung, bevor sie in den FES-Katalog eingespielt wurde.
Sodann erfolgte eine automatisierte Auflösung von auf den Katalogkarten aus Platzgründen häufig verwendeten Abkürzungen wie z. B. Dt für Deutschland, GrBr für Großbritannien, SP für Sozialistische Partei etc., die von der Konversionsfirma natürlich genau so abgeschrieben worden waren. Sach- und Regionenschlagworte mit einer Treffermenge, die für die Bildung von Ergebnismengen bei der Recherche zu hoch gewesen wäre (mehr als ca. 3.500 bis 4.000 Titel), wurden mit C gekennzeichnet und daraufhin automatisch im Index nach Berichtszeiträumen unterteilt dargestellt, damit sinnvolle Recherchen noch durchgeführt werden können. [Seite der Druckausg.: 129] Beispiel: Sozialistische Partei, Parteipublikationen: 19. Jh., 1850-99
Die Körperschaftsnamen im alten Körperschaften-Katalog entsprachen in der Regel nicht den heutigen genormten Ansetzungsformen. Deshalb konnten sie auch nicht in das Körperschaftenregister eingefügt werden, da sonst unterschiedliche Bezeichnungen ein und derselben Körperschaft im selben Alphabet auftauchen würden.
[Seite der Druckausg.: 130] Beispiel:
Hinter dem Präfix 2 sind zusätzlich Stichworte aus allen Körperschaftsnamen indexiert, so dass durch Verknüpfung der Stichworte zumindest für den Katalogprofi jede Körperschaft auffindbar ist.
1997 wurden mit dem Rechtschreibprüfungsprogramm PRIMUS aus dem Programmpaket MILOS alle Titelkategorien überprüft. Hierbei konnten nur deutschsprachige Titel bearbeitet werden.
Alle Daten aus Ansetzungskategorien, die noch bearbeitet werden müssen oder sollen, sind in einem Bearbeitungsregister der Dienstdatenbank mit dem Präfix bp: (Personen) oder br: (Regionen) gesammelt auffindbar, damit sie nicht aus der riesigen Datenmenge der Gesamtdatenbank mühsam herausgefiltert werden müssen. Außerdem ist so der Stand der Überarbeitung für alle Mitarbeiter stets leicht festzustellen.
[Seite der Druckausg.: 131]
Manuelle und intellektuelle Nachbearbeitung in der Bibliothek
An diese automatisierte Überarbeitung schließt sich nach dem Einspielen in die Datenbank die weitaus aufwendigere manuelle Bearbeitung an. Diese wird uns zumindest in Teilen noch auf Jahre hinaus beschäftigen. a) Personennamen Alle Personennamen aus der Konversion werden systematisch nachbearbeitet!
Beispiel:
Gorbacev, Michail Sergeevic Verweisungsformen: Gorbatschow, Michail S.
Zudem werden:
Stand: die Überarbeitung ist bis zum Buchstaben D systematisch erfolgt.
b) Körperschaften Die Körperschaftsnamen werden nicht systematisch überarbeitet.
[Seite der Druckausg.: 132]
Ansonsten werden sukzessive RAK-Ansetzungen erstellt bzw. falls vorhanden von der CD-ROM der GKD per Down-Load übernommen. c) Schlagworte Die Schlagworte wurden innerhalb von 4 Jahren alle überarbeitet!
Beispiel: Abgeordneter Siehe:
Bundestagsabgeordneter Deputierter Landtagsabgeordneter Mandat Parlamentarier Parlamentsabgeordneter Parlamentsmandat Parlamentsmitglied Reichstagsabgeordneter Volksvertreter Siehe auch:
Abgeordnetenentschädigung Parlament Parlamentsfraktion Politiker Insgesamt wurden 3.720 Normsätze für Schlagworte angelegt. d) Sachtitel Die Sachtitel sind im Titelregister alle grob überarbeitet worden, es wurden also alle Fehler entfernt, die auf den ersten Blick ersichtlich waren. Das heißt:
[Seite der Druckausg.: 133]
e) Geo-Schlagworte Die alten Regionen-SW wurden alle den neuen Geo-Schlagworten gemäß dem Geo-Thesaurus des Deutschen Bundestages zugeordnet. Die Vereinheitlichung und Zuordnung der alten Regionenbegriffe zu dem modernen Wortmaterial des Thesaurus erforderten allein ca. 4 Monate einer Halbtagskraft. Beispiel: Die alte Regionen-Abkürzung VSt erhielt zunächst die automatische Auflösung in:
Dann erfolgte gemäß dem neuen Thesaurus die Zuordnung zum neuen Geobegriff USA, auf den natürlich von allen alten Namensformen verwiesen wird. Zusätzlich wurden ca. 2.000 neue, bisher nicht im Thesaurus enthaltene Geo-SW vergeben, mit Normsätzen versehen und den entsprechenden Titeln zugeordnet. f) Signaturen Die Signaturen wurden anhand des Signaturenregisters grob überprüft. [Seite der Druckausg.: 134] Fehlende oder eindeutig falsche Signaturen wurden teilweise anhand der Mikrofiches des alten Katalogs, teilweise anhand der alten Zugangsbücher ergänzt oder berichtigt.
Resümee und Ausblick
Insgesamt kann man sagen, dass in den vergangenen 4 Jahren seit Abschluß der eigentlichen Konversion viele Arbeitsstunden und viel Know-how in das gelieferte Datenmaterial gesteckt wurden und dass dieser Prozeß noch bei weitem nicht abgeschlossen ist. Unsere bisherigen Resultate sind jedoch schon sehr zufriedenstellend, eine Datenmenge, die als Kartenkatalog früher einen ganzen Katalogsaal füllte, ist heute von jedem PC mit Internet-Zugang aus weltweit abrufbar.
Herta Däubler-Gmelin, heute Bundesministerin der Justiz, bei der Präsentation des Internet-Angebotes der Friedrich-Ebert-Stiftung, vor dem Lesesaal der Bibliothek, Juli 1996 © Friedrich Ebert Stiftung | technical support | net edition fes-library | Dezember 1999 |