Bachelorarbeit: 1.280.000 Ortsnamen – Evaluation von Verfahren zur Identifikation von Orten

Ortsangaben spielen in historischen Quellen eine große Rolle und treten vielfältig auf. Die Darstellung auf einer Karte oder die Untersuchung von Zusammenhängen zwischen Orten ist jedoch nur möglich, wenn man nicht nur die Ortsnamen als Zeichenketten vorliegen hat, sondern eine Identifikation des sich dahinter verbergenden Ortes vorgenommen hat. Diese Zuordnung ist im Forschungsfeld des Semantic Web als named entity resolution bekannt. Erschwert wird die Identifikation durch wechselnde Ortsnamen, veränderte Verwaltungszugehörigkeiten, unterschiedliche Arten der Notation der Namen sowie Schreibfehler.

Es existieren zahlreiche Verfahren zur named entity resolution, darunter solche, die speziell für Ortsnamen entwickelt wurden. Im Rahmen einer abgeschlossenen Bachelorarbeit wurde in der Arbeitsgruppe ein semi-automatisches Verfahren zur Identifikation von Orten entwickelt, welches besonders für die Identifikation historischer Ortsnamen geeignet ist.

Ziel dieser Bachelorarbeit soll die Evaluation des an der Arbeitsgruppe entwickelten Verfahrens und mindestens eines weiteren Verfahrens anhand eines Datenbestandes von über 1,2 Millionen verschiedener Ortsnamen aus einer historischen Quelle sein. Anschließend kann versucht werden, dass an der Arbeitsgruppe entwickelten Verfahren weiter zu verbessern.

Comments are closed.