Semantikerhaltende Modell-Transformationen

Einer der ersten Schritte bei der Arbeit mit Forschungsdaten ist die Modellierung der Datenstruktur. Die Unified Modeling Language (UML) eignet sich dafür gut und kann als de-facto Standard bei der Modellierung und Kommunikation von Datenstrukturen gelten. Um eine konsistente Terminologie und konsistente Modelle zu erhalten, arbeitet man oft man Ontologien. Diese bieten außerdem Möglichkeiten, die in ihnen beschriebene Semantik für eine semantische Suche zu nutzen. Eine sehr gängige Sprache zum Beschreiben von Ontologien ist die Web Ontology Language (OWL 2). Beim Betrieb eines Informationssystems wird früher oder später auch eine Kommunikation Maschine-zu-Maschine erwünscht sein. Dazu werden meist Webservices eingesetzt, bei denen die Datenstruktur in der XML schema definition language (XSD) beschrieben wird.


Um die Datenstruktur nicht arbeitsintensiv und fehleranfällig drei Mal modellieren zu müssen, beschäftigt sich meine Arbeit mit der automatischen Transformation zwischen den drei “Welten” UML, OWL und XML. Wichtig dabei ist, dass bei der Transformation die Semantik erhalten bleibt. Die Idee ist es, Transformationen abstrakt auf Metamodell-Ebene zu beschreiben, um so beliebige Datenstrukturen transformieren zu können. Untersucht werden diese Transformationen darauf, welche Bereiche von ihnen abgedeckt werden und welche Auswirkungen sie auf die Semantik der Modelle haben.

Als wirtschaftswissenschaftliches Fallbeispiel dient ein Ausschnitt aus der Digitalen Reichsstatistik.

Hier wird der Nutzen der drei “Welten” UML, OWL und XML gut sichtbar: Anhand von UML-Modellen lässt sich die Datenstruktur leicht verstehen. Die hierarchische Untergliederung sowohl der Waren als auch der Länder und Provinzen lässt sich sehr gut in einer Taxonomie bzw. Ontologie darstellen. Für einen standardisten Zugriff auf die Daten z.B. in Form eines Web Feature Service (WFS) benötigtig man eine weitere Beschreibung der Datenstruktur in Form von XML-Schemata.

Comments are closed.