Masterprojekt/-arbeit: Crowdsourcing für Ortsdaten

Um Ortsinformationen im Semantic Web sinnvoll abbilden zu können, ist ein Ortsverzeichnis unverzichtbar. Im Zusammenhang mit historischen Quellen ist es notwendig, dass dieses Ortsverzeichnis auch detaillierte Informationen über die Vergangenheit enthält. Wo kommen diese Informationen her? Sie stehen in gedruckten Topographien und Gemeindelexika. Oft sind diese tabellarisch aufgebaut, wie in diesem Beispiel, dass Wohnplätze in Schleswig-Holstein 1890 auflistet:

10000000000008B5000001E0632B8E04

 


Auch bei der Aufbereitung von Ortsverzeichnissen können wir von den guten Erfassungen des Crowd Sourcing profitieren, bei der viele Helfer die Daten online erfassen. Einfach alle Texte abtippen zu lassen, wäre einfach aber Resourcenverschwendung, schließlich wiederholen sich sehr viele Angaben. Außerdem liegen bereits Informationen im Ortsverzeichnis vor, die nicht mehr neu erfasst werden müssen. So steht z.B. der Kreis fest, sobald die Gemeinde einmal zugeordnet wurde. Für eine effiziente Erfassung der gedruckten Quellen müssen als möglichst viele Daten wiederverwendet werden.

Ziel der Arbeit ist es, verschiedene gedruckte Quellen auf mögliche Eingabe-Optimierungen zu untersuchen und zu überlegen, wie sich diese Optimierung in einer Weboberfläche implementieren lassen. Dazu soll ein bestehendes System zur Erfassung historischer Quellen erweitert werden, so dass auch auf die speziellen Bedürfnisse von Ortsdaten Rücksicht genommen und die Erfassung dadurch sowohl effizienter als qualitativ besser wird.

Comments are closed.