FES HOME MAIL SEARCH HELP NEW
[DIGITALE BIBLIOTHEK DER FES]
TITELINFO / UEBERSICHT



TEILDOKUMENT:



[Seite der Druckausg.: 126 (Fortsetzung)]

Anne Bärhausen und Annette Euskirchen
Nachbearbeitung der Katalog-Konversion oder: Es bleibt viel zu tun, packen wir’s an!


Eine Grundbedingung für den Einstieg der Bibliothek der FES in das elektronische Zeitalter war es, den vorhandenen Datenpool, sprich den alten Kartenkatalog, das Nachweisinstrument für 300.000 Bände spezialisierter Literatur, in maschinenlesbare Daten zu "verwandeln".165.000 Katalogkarten wurden von einer Fremdfirma gemäß unseren Anweisungen manuell erfaßt und als Dateien wieder abgeliefert [ Siehe: Katalogkonversion - Erfahrungsbericht. In: Bibliotheksdienst 29 (1995), S. 1939-1947.] .
Doch von diesem Daten"roh"material bis zu einem benutzerfreundlichen Open Public Access Catalogue (OPAC), der inzwischen auch im Internet unseren gesamten Bestand übersichtlich und weitgehend fehlerfrei nachweist, war es ein arbeitsreicher Weg.
In den letzten vier Jahren wurde in einer Vielzahl von Arbeitsschritten die digitale Revolution praktisch vollzogen und es bleibt noch immer viel zu tun.

Page Top

Kurze Darstellung der Ziele der Überarbeitung sowie der Ausgangslage

Das erklärte Ziel der Überarbeitung war es, unsere "alten" Daten an nationale (RAK) und internationale Standards anzugleichen und so dem Benutzer weltweit eine zuverlässige und im Ergebnis vollständige Recherche in unserem Katalog zu ermöglichen.

Der Benutzer muß stets alle Veröffentlichungen von einer Person oder Institution an einer Stelle finden.

Vor allem in Zeiten der elektronischen Medien führt jeder falsche Buchstabe in einem Namen, jede falsche Fassung eines Körperschaftsnamens dazu, dass die betreffende Publikation für den Benutzer nicht mehr auffindbar ist.

[Seite der Druckausg.: 127]

Ebenso soll der Benutzer alle Literatur zu einem Thema unter einem Schlagwort wiederfinden und durch sinnvolle Verweisungen zu diesem Schlagwort geleitet werden. Die Normierung der Schlagworte, die früher zumindest teilweise beim Einstellen der Karten in den Katalog stattfand und durch die Konversion daher verloren ging, musste also nach der Digitalisierung des Katalogs möglichst umgehend erfolgen.

Wertvolle Literatur ist der Benutzung sonst entzogen, da z. B. eine Treffermenge von 79 Titeln unter dem Schlagwort "Gewerkschaft, Presse" impliziert, dies wäre der Gesamtbestand der Bibliothek zu diesem Thema. Kein Benutzer wird parallel unter dem Schlagwort "Gewerkschaftspresse" suchen und die dort "versteckten" weiteren 23 Titel jemals finden.

Gleichzeitig sollten aber auch unsere speziellen Schwerpunkte weiterhin erhalten und gepflegt werden. Dies machte es unmöglich, einen bestehenden allgemeinen Schlagwort-Thesaurus zu übernehmen, da mit einem solchen Wortmaterial unsere sehr spezielle Literatur nicht sinnvoll verschlagwortet werden könnte.

Konvertiert wurden insgesamt:

  • a) Katalog der Bibliothek der FES : ca. 165.000 Titelaufnahmen
  • b) Katalog des DGB : ca. 53.000 Titelaufnahmen
  • c) Interimskatalog (IK) der FES : ca. 50.000 Titelaufnahmen
  • d) Katalog des Karl-Marx-Hauses (KMH) in Trier : ca. 30.000 Titelaufnahmen

Der Schwerpunkt der Nachbearbeitung in der Bibliothek lag naturgemäß bei unserem eigenen Katalog sowie bei dem Katalog des Bestandes des DGB, der in unsere Bibliothek integriert wurde.

An dieser Stelle nur kurz erwähnt werden sollen die Konversionen des Interimskatalogs (IK) sowie des Karl-Marx-Hauses.

Der IK wurde nicht in die normale Dienstdatenbank eingespeist, sondern bleibt ein getrennter Datenbestand, da die IK-Aufnahmen nur in einem sehr stark gekürzten Datenformat konvertiert wurden. Deshalb erfolgte hier auch keine intensive Nachbearbeitung der Daten.
Die Aufnahmen werden gelöscht, wenn eine Katalogisierung des entsprechenden Titels erfolgt, ansonsten werden nur zufällig auffallende Fehler in den Signaturen oder Verfassernamen korrigiert.

Für den Katalog des Karl-Marx-Hauses erfolgt die Nachbearbeitung vom KMH selbst.

Der Katalog des DBG bestand aus zwei verschiedenen Teilen, dem sogenannten Kapselkatalog (ca. 30.000 Aufnahmen) mit teilweise handschriftlichen, teilweise fast unleserlichen Titelaufnahmen und dem Zettelkatalog (ca. 20.000 Aufnahmen) mit den neueren Titeln. Beide Teile wurden konvertiert.

Die konvertierten Titelaufnahmen des Zettelkataloges enthalten keine Schlagworte und erreichten nicht die Qualität unserer eigenen Titelaufnahmen, sie waren jedoch integrierbar.

[Seite der Druckausg.: 128]

Die Daten wurden zunächst getrennt gehalten, so dass erste Angleichungen in einer geringeren und damit überschaubaren Titelmenge erfolgen konnten, inzwischen sind die Daten im FES-Katalog enthalten.

Die konvertierten Titelaufnahmen aus dem Kapselkatalog bleiben aufgrund ihrer schlech-ten Qualität in einer gesonderten Datenbank bis sie einzeln überprüft sind.
Dabei werden die Daten anhand der Bücher überarbeitet und dem RAK-Standard angeglichen. Anschließend werden die Aufnahmen in den OPAC eingespielt und dort gegebenenfalls mit Köperschaftsnormsätzen, Personennormsätzen oder Serien verknüpft. Einzelbände von mehrbändigen Werken werden ebenfalls mit dem Gesamtwerk verknüpft. Bei der Überarbeitung auffallende Dubletten zum bereits vorhandenen Bestand werden in der vorliegenden FES-Aufnahme aufgetragen, die DGB-Titelaufnahme dann gelöscht.

Verlorene Bände, falsche Signaturen oder an die Zeitschriftenstelle abgegebene Publikationen werden im Datensatz als solche gekennzeichnet und nicht gelöscht, so dass diese Datenbank nach Abschluss der Arbeiten als eine Art Zugangsbuch immer noch Auskunft über den Verbleib aller übernommenen Exemplare geben kann.

Von den ursprünglich etwa 30.000 Aufnahmen sind inzwischen etwa ein Drittel abgearbeitet, es bleibt also noch eine Menge von ca. 20.000 zu überprüfenden Datensätzen.

Bisher ergibt sich somit eine Gesamtmenge von 193.000 konvertierten Titelaufnahmen im OPAC, die dort zusammen mit den ca. 80.000 seit 1993 online katalogisierten Neuanschaffungen und Aufsätzen möglichst einheitlich recherchierbar sein sollen. Eine gigantische Datenmenge, in der dennoch jedes einzelne Buch zu finden sein muss.

Page Top

Konkrete Vorgehensweise bei der Überarbeitung des Datenmaterials

Zur Konversion gebracht und konvertiert wurden immer nur einzelne Alphabetabschnitte des alten Kartenkatalogs, so dass nie der ganze Katalog bei der Konversionsfirma war, die Datenlieferung erfolgte also auch sukzessiv.

Jede Lieferung durchlief zunächst eine automatische Bearbeitung, bevor sie in den FES-Katalog eingespielt wurde.
Hierbei wurden alle rechecherelevanten Daten (Verfasser, Körperschaften, etc.) mit einem nachgestellten ¥ gekennzeichnet, das nur für die Abteilung Titelaufnahme sichtbar ist, damit sie eindeutig als noch nicht korrigierte Daten zu erkennen sind. Nach der erfolgten Korrektur wird das ¥ gelöscht.

Sodann erfolgte eine automatisierte Auflösung von auf den Katalogkarten aus Platzgründen häufig verwendeten Abkürzungen wie z. B. Dt für Deutschland, GrBr für Großbritannien, SP für Sozialistische Partei etc., die von der Konversionsfirma natürlich genau so abgeschrieben worden waren.

Sach- und Regionenschlagworte mit einer Treffermenge, die für die Bildung von Ergebnismengen bei der Recherche zu hoch gewesen wäre (mehr als ca. 3.500 bis 4.000 Titel), wurden mit C gekennzeichnet und daraufhin automatisch im Index nach Berichtszeiträumen unterteilt dargestellt, damit sinnvolle Recherchen noch durchgeführt werden können.

[Seite der Druckausg.: 129]

Beispiel:

    Sozialistische Partei, Parteipublikationen: 19. Jh., 1850-99
    Sozialistische Partei, Parteipublikationen: 20. Jh., 1900-20
    etc.

oder





Undisplayed Graphic


Die Körperschaftsnamen im alten Körperschaften-Katalog entsprachen in der Regel nicht den heutigen genormten Ansetzungsformen. Deshalb konnten sie auch nicht in das Körperschaftenregister eingefügt werden, da sonst unterschiedliche Bezeichnungen ein und derselben Körperschaft im selben Alphabet auftauchen würden.
Es wurden deshalb am Ende des Körperschaftenregisters zwei Nebenregister aufgebaut, indem die Zahlen 1 und 2 vor die konvertierten Angaben gesetzt wurden. Somit blieb zumindest der Körperschaftsname, wie er im alten Katalog angegeben war, recherchierbar.

[Seite der Druckausg.: 130]

Beispiel:




Undisplayed Graphic


Hinter dem Präfix 2 sind zusätzlich Stichworte aus allen Körperschaftsnamen indexiert, so dass durch Verknüpfung der Stichworte zumindest für den Katalogprofi jede Körperschaft auffindbar ist.
Wie sich aus dem Beispiel ergibt, sind diese Daten jedoch für den externen Benutzer nicht nutzbar, die hier angezeigten Schriften der Universität Frankfurt fehlen bei der Treffermenge unter der heutigen Ansetzung Universität <Frankfurt, Main> und sind nur mit Hilfe eines Bibliotheksmitarbeiters zu finden.

1997 wurden mit dem Rechtschreibprüfungsprogramm PRIMUS aus dem Programmpaket MILOS alle Titelkategorien überprüft. Hierbei konnten nur deutschsprachige Titel bearbeitet werden.
Bei etwa 15-20 % aller Aufnahmen fanden sich Tippfehler, die daraufhin per Hand korrigiert wurden

Alle Daten aus Ansetzungskategorien, die noch bearbeitet werden müssen oder sollen, sind in einem Bearbeitungsregister der Dienstdatenbank mit dem Präfix bp: (Personen) oder br: (Regionen) gesammelt auffindbar, damit sie nicht aus der riesigen Datenmenge der Gesamtdatenbank mühsam herausgefiltert werden müssen. Außerdem ist so der Stand der Überarbeitung für alle Mitarbeiter stets leicht festzustellen.

[Seite der Druckausg.: 131]

Page Top

Manuelle und intellektuelle Nachbearbeitung in der Bibliothek

An diese automatisierte Überarbeitung schließt sich nach dem Einspielen in die Datenbank die weitaus aufwendigere manuelle Bearbeitung an. Diese wird uns zumindest in Teilen noch auf Jahre hinaus beschäftigen.

a) Personennamen

Alle Personennamen aus der Konversion werden systematisch nachbearbeitet!
In Personennormsätzen werden verschiedene Namensformen einer Person durch Verweisungen zusammengeführt, damit für den Benutzer alle Schriften eines Verfassers auffindbar sind.

Beispiel:
Personennormsatz

    Gorbacev, Michail Sergeevic

Verweisungsformen:

    Gorbatschow, Michail S.
    Gorbacev, M. S.
    Gorbacev, Michail
    Alle seit 1993 aufgenommen Werke finden sich im Katalog unter dieser Ansetzungsform (53 Treffer),
    die konvertierten Schriften finden sich im Katalog unter Gorbatschow, Michail (27 Treffer),
    Gorbatschow, Michail S. (2 Treffer) und Gorbcev, Michail Sergeevic
    (1 Treffer, da die Überarbeitung der Namen noch nicht bis G vorgedrungen ist.

Zudem werden:

  • abgekürzte Vornamen ermittelt (GV, DB, in neuester Zeit hauptsächlich mit Hilfe des KVK im Internet)
  • Doppelnamen-Verweisungen und alle anderen von den RAK geforderten Verweisungen angelegt
  • neue Ansetzungen für russische oder arabische Namen in den Personensätzen verankert
  • Herausgeber in eine eigene Kategorie mit Funktionsbezeichnung (Hrsg.) gemäß RAK eingetragen

Stand: die Überarbeitung ist bis zum Buchstaben D systematisch erfolgt.
Zusätzlich werden natürlich ständig Personennamen überarbeitet, die während der täglichen Arbeit zufällig auffallen, weil z. B. ein weiteres Buch des Verfassers aufgenommen wird.

b) Körperschaften

Die Körperschaftsnamen werden nicht systematisch überarbeitet.
Bearbeitet sind:

  • sämtliche FES Ansetzungen (Büros, Abteilungen, Partnerorganisationen)

[Seite der Druckausg.: 132]

  • SPD Ansetzungen weitgehend
  • alle Ansetzungen der zahlreichen Juso-Ortsverbände
  • Gewerkschaften in hoher Zahl

Ansonsten werden sukzessive RAK-Ansetzungen erstellt bzw. falls vorhanden von der CD-ROM der GKD per Down-Load übernommen.

c) Schlagworte

Die Schlagworte wurden innerhalb von 4 Jahren alle überarbeitet!
Zunächst wurde die sehr hohe Zahl von Tippfehlern und Ansetzungsunterschieden bearbeitet, zum Beispiel alle Plural-Ansetzungen (Sozialistische Partei / Sozialistische Parteien) korrigiert, bis auch alle Schriften zu einem SW an der gleichen Stelle zu finden waren.
Dann wurde das gesamte Wortmaterial überarbeitet und für alle Schlagworte Normsätze angelegt. In den Normsätzen finden sich "Siehe"- und "Siehe auch"-Verweisungen, die den Benutzer zu den bei uns verwandten Deskriptoren leiten.

Beispiel:

Abgeordneter

Siehe:


    Bundestagsabgeordneter
    Deputierter
    Landtagsabgeordneter
    Mandat
    Parlamentarier
    Parlamentsabgeordneter
    Parlamentsmandat
    Parlamentsmitglied
    Reichstagsabgeordneter
    Volksvertreter

Siehe auch:


    Abgeordnetenentschädigung
    Parlament
    Parlamentsfraktion
    Politiker

Insgesamt wurden 3.720 Normsätze für Schlagworte angelegt.

d) Sachtitel

Die Sachtitel sind im Titelregister alle grob überarbeitet worden, es wurden also alle Fehler entfernt, die auf den ersten Blick ersichtlich waren.

Das heißt:

  • Alle Artikel (der, die, das etc. in allen Sprachen), die als 1. Ordnungswort im Register auftauchten, sind als Nicht-Sortier-Wort gekennzeichnet worden.
  • Zeichen bzw. Zahlen am Anfang von Sachtiteln sind in Zahlwörter umgesetzt worden bzw. es wurden Verweisungen angelegt.
  • Bände von mehrbändigen Werken wurden mit dem Sachtitel des Gesamtwerkes verknüpft.

[Seite der Druckausg.: 133]

  • Zahllose Serien wurden neu angesetzt und die Serienstücke unter der nun endgültigen Ansetzung des Titels zusammengeführt, fehlende Zählungen wurden zumindest teilweise ergänzt.
  • Beim Einheitssachtitel gemäß RAK wurden die Sprachbezeichnungen ergänzt.

e) Geo-Schlagworte

Die alten Regionen-SW wurden alle den neuen Geo-Schlagworten gemäß dem Geo-Thesaurus des Deutschen Bundestages zugeordnet. Die Vereinheitlichung und Zuordnung der alten Regionenbegriffe zu dem modernen Wortmaterial des Thesaurus erforderten allein ca. 4 Monate einer Halbtagskraft.

Beispiel:

    Die alte Regionen-Abkürzung VSt erhielt zunächst die automatische Auflösung in:
    Vereinigte Staaten

    Dann erfolgte gemäß dem neuen Thesaurus die Zuordnung zum neuen Geobegriff USA, auf den natürlich von allen alten Namensformen verwiesen wird.




Undisplayed Graphic

Zusätzlich wurden ca. 2.000 neue, bisher nicht im Thesaurus enthaltene Geo-SW vergeben, mit Normsätzen versehen und den entsprechenden Titeln zugeordnet.

f) Signaturen

Die Signaturen wurden anhand des Signaturenregisters grob überprüft.

[Seite der Druckausg.: 134]

Fehlende oder eindeutig falsche Signaturen wurden teilweise anhand der Mikrofiches des alten Katalogs, teilweise anhand der alten Zugangsbücher ergänzt oder berichtigt.
Da ein Buch mit falscher Signatur zwischen 600.000 weiteren Bänden spurlos verschwindet, sind die allein hierfür verwendeten 2-3 Wochen Arbeit eine sehr sinnvoll verbrachte Zeit, um teuer angeschaffte Bücher auch der Benutzung zuzuführen.

Page Top

Resümee und Ausblick

Insgesamt kann man sagen, dass in den vergangenen 4 Jahren seit Abschluß der eigentlichen Konversion viele Arbeitsstunden und viel Know-how in das gelieferte Datenmaterial gesteckt wurden und dass dieser Prozeß noch bei weitem nicht abgeschlossen ist.

Unsere bisherigen Resultate sind jedoch schon sehr zufriedenstellend, eine Datenmenge, die als Kartenkatalog früher einen ganzen Katalogsaal füllte, ist heute von jedem PC mit Internet-Zugang aus weltweit abrufbar.
Deshalb werden wir uns von der noch verbliebenen Datenmenge nicht abschrecken lassen. Wir hoffen, auch weiterhin soviel Kapazität sprich Arbeitszeit "übrig" zu haben, um diesen Überarbeitungsstandard beibehalten zu können, und besonders bei der Bearbeitung der Körperschaften sowie bei der ausführlichen Überarbeitung der Aufnahmen aus dem DGB-Bestand weitere Fortschritte zu machen. Nur so können wir die befriedigende Benutzung unseres Katalogs für die Benutzer in zunehmendem Maße sicherstellen und unsere wertvollen Bestände auch vollständig nutzbar machen.




Herta Däubler-Gmelin, heute Bundesministerin der Justiz, bei der Präsentation des Internet-Angebotes der Friedrich-Ebert-Stiftung - 1996

Herta Däubler-Gmelin, heute Bundesministerin der Justiz, bei der Präsentation des Internet-Angebotes der Friedrich-Ebert-Stiftung, vor dem Lesesaal der Bibliothek, Juli 1996


© Friedrich Ebert Stiftung | technical support | net edition fes-library | Dezember 1999

Previous Page TOC Next Page