GenDB
Aufbau einer Genealogischen Datenbank aus Einträgen von Kirchenbüchern
Die Archive der europäischen Bistümer bergen einen immensen Informationsschatz, den nahezu kompletten Abstammungs- und Verwandtschaftsplan der Bevölkerung seit Anfang der Aufzeichnung im 14./15. Jahrhundert. Ihn zu sichten und zu sichern ist eine große soziale Aufgabe der nächsten Jahrzehnte.
Der unablässige Wettlauf gegen den beständig fortschreitenden natürlichen Verfall der zu Grunde liegenden Medien zwingt zu raschem Handeln und vielseitigem Einsatz sowohl moderner Datenspeicherungstechnik als auch umfangreicher personeller Ressourcen, um – durch ständiges Kopieren und Neuorganisieren – dem endgültigen Verlust immer einen Schritt voraus zu sein. Während in früheren Zeiten dies vor Allem durch handschriftliches Vervielfältigen bewerkstelligt wurde, ersetzt heutzutage und in Zukunft das elektronische Kopieren auf das im Augenblick technologisch optimale Medium die manuelle Informationssicherung.
Im ersten Schritt ist jedoch die Erfassung der Handschriften in elektronischer Form zu bewältigen. Aufgrund der unzureichenden Qualität der Eingabedaten erscheint die automatische Erfassung durch OCR-Verfahren aussichtslos. Somit bleibt nichts anderes übrig, als sich auf die manuelle Erfassung zurückzuziehen.
Lohn des Ganzen ist eine massive Ausweitung der Möglichkeiten zu Recherche und Forschung unter gleichzeitig erheblich reduzierter mechanischer Belastung der wertvollen Bücher.
Projektinhalt |
In Zusammenarbeit mit dem Archiv des Bistum Passau (Karte der Pfarreien) wurde ein Programm entwickelt, um die dort lagernden Kirchenbücher (Auszug 100kB) systematisch in einer genealogischen Datenbank zu erfassen.
Besonderes Augenmerk galt hierbei folgenden Aspekten:
-
Einer möglichst effizienten Eingabeunterstützung, da es sich insgesamt um ca. 6000 Kirchenbücher mit etwa 4 Millionen Einträgen handelt.
-
Einer flexibel anpassbaren Oberfläche, mit der sich die teils stark variierenden Daten bequem und effizient erfassen lassen.
-
Der Personendatenzusammenführung, d.h. es soll nach der Eingabe versucht werden, die einzelnen Vorkommen der gleichen Person an verschiedenen Stellen in den Matrikeln zu identifizieren (evtl. unter abweichenden Namensschreibungen, Geburtsdaten etc.) und somit den logischen Zusammenhang aus den verschiedenen Eintragungen herzustellen (derzeit noch nicht fertig implementiert, aber in Arbeit)
Als Folge der Personendatenzusammenführung ergibt sich die Möglichkeit einer fast vollautomatischen Stammbaumerstellung. Über die erfassten Daten sind dabei beinahe beliebige Abfragen möglich. Bereits jetzt profitiert das Archiv von den eingegebenen Registerdaten, da nun erstmals Personen ohne genaue Kenntnis der damaligen Wohngegend recherchiert werden können.
Technische Details |
Das Programm ist weitestgehend plattformunabhängig, da es vollständig in Java implementiert wurde (soweit getestet unter UNIX und Windows NT/2000/XP). Es kann in Netzwerk- und Einzelplatzsystemen eingesetzt werden. Voraussetzung ist ein Datenbanksystem, das dem ANSI SQL-Standard entspricht.
Im Passauer Archiv ist ein UNIX-Netzwerk (Solaris 2.6) mit etwa 10 Linux-Clients im Einsatz, wovon 5 Clients allein für die Dateneingabe benutzt werden. Es wird ein Datenbankserver verwendet auf welchem das Datenbanksystem Oracle 9i installiert ist. Das System kann inzwischen auch offline mit PostgreSQL Datenbanken betrieben werden.
Aktueller Stand |
In der ersten Phase des Projektes wurden die kompletten Trauungsregister der Kirchenbücher eingegeben. Die Eingabe der zugehörigen Matrikeleinträge ist erheblich fortgeschritten, stagniert aber inzwischen aufgrund Personalmangels.
Stattdessen konzentriert sich das Archiv inzwischen auf die Digitalisierung der Quellen selbst, indem diese mit einem Buchscanner abfotografiert werden. Die Erfassung soll in Zukunft unter Benutzung dieser Aufnahmen durchgeführt werden, um die Aushebung und Einlagerung der Bücher zu sparen, und diese so zu schonen.
Der Inhalt der Datenbank wird inzwischen auch zu medizinischen Forschungszwecken genutzt. Insbesondere zur Erforschung der Alzheimer-Frühform (vermutlich ein Gendefekt) wurden verwandtschaftliche Beziehungen ausgewertet und Stammbäume aufgebaut. Dabei wurden weitere Verdachtsfälle aus der Vergangenheit entdeckt. Möglich wurden diese Untersuchungen durch den Umstand, dass der zweite von Dr. Alzheimer untersuchte Patient in der damaligen Diözese Passau lebte, ebenso wie viele seiner Nachkommen.
Ausblick |
Die Dauer der vollständigen Erfassung aller Matrikeln lässt sich nur schwer abschätzen, es ist jedoch mit mindestens 10 Jahren Arbeitszeit zu rechnen.
Eine Ausweitung des Projekts auf andere Bistümer (auch in Österreich) wird erhofft, ist aber noch nicht konkret. Eine Bereitstellung der Daten im Internet ist zur Zeit nicht geplant, da sowohl die rechtliche als auch finanzielle Situation noch nicht geklärt ist.

Um die Datenerfassung wieder in Gang zu bringen arbeiten wir daran, das System um eine dezentrale Komponente zu erweitern, d.h. wir schaffen eine Version, mit der es möglich wird, von einer leeren PostgreSQL Datenbank aus mit der Eingabe zu starten und die erfassten Daten später in den Gesamtbestand einzumengen. Dieses Basissystem wird zusammen mit einer Menge an fotografischen Aufnahmen auf einem Wechseldatenträger ausgeliefert. Ziel ist es, interessierten Dritten die Möglichkeit zu eröffnen, einen Beitrag zum Wachstum zu liefern, indem sie sich um die Erfassung verdient machen. Als Gegenleistung dürfen diese Personen oder Organisationen den von ihnen erfassten Teilbestand zur eigenen Nutzung behalten.