Masterseminar WS2015/16

Masterseminar zum Thema record linkageIn diesem Semester wollen wir uns im Masterseminar mit dem Thema record linkage beschäftigen. Beim record linkage (auch als data matching, data linkage, entity resoluation, object identification oder field matching bekannt) geht es um das Aufspüren von identischen Objekten, häufig Personeneinträgen. Für das Seminar ist dabei alle Schritte des Matching-Prozesses von Interesse, von einzelnen Techniken der Vorverarbeitung bis hin zur Evaluation von Algorithmen. Die Evaluation von record linkage Algorithmen ist relativ schwer, da die ground truth in der Regel nicht bekannt ist und man daher Fehler simulieren muss.

Für unsere Forschung ist das Thema sowohl im Bereich des Semantic Web, wo identische Resourcen in unterschiedlichen Linked Open Data Beständen auftreten, als auch für unsere Kooperation mit den Historikern, die z.B. bei der Demographieforschung große Mengen von Personeneinträgen aus unterschiedlichen Quellen abgleichen müssen, relevant.

Einen guten Überblick über das Thema gibt das Buch »Data Matching« von Peter Christen, an dessen Aufbau wir uns im Seminar orientieren wollen.

Die Teilnehmer des Seminars sollen sich in ein Unterthema (z.B. String-Vergleiche) einarbeiten. Das entsprechende Kapitel des Buches mit der dazugehörigen Literaturliste dient als Startpunkt. Im Laufe des Semesters soll das Unterthema den Kommilitonen in einem Vortrag präsentiert werden. Gegen Ende des Semesters erwarten wir eine Ausarbeitung zu dem Unterthema im Umfang von ca. 10 Seiten.

Einen festen Vorbesprechungstermin gibt es (noch) nicht, bei Interesse bitte bei Dr. Jesper Zedlitz melden.

Comments are closed.