Seminar »Technik des Semantic Web«

semantic_web„Semantic Web“ und „Linked Open Data“ (LOD) sind momentan heiße Themen sowohl in der Forschung als auch in der Wirtschaft und sogar in der Politik. Linked Data liegen in Form sogenannter Triples (Subjekt, Prädikat, Objekt) vor. Insgesamt geht es bei LOD um große Datenmengen: Bereits vor zwei Jahren umfasste die sogenannte „LOD-Cloud“ mehr als 31 Milliarden Triples.1

In diesem Seminar wollen wir uns mit der Technik hinter Semantic Web und Linked Data beschäftigen. Welche Software kommt zum Einsatz, um die Datenmengen des Semantic Webs zu speichern? Wie kann man auf die Daten zugreifen, und wie kann man Anfragen formulieren? Welche Technik verwenden bekannte Dienste für ihre „semantischen“ Daten?

Die gängige Abfragesprache für Linked Data ist SPARQL. In einem Vortrag sollen uns diese Sprache und ihre Besonderheiten vorgestellt werden.

Triples werden mit Hilfe von Triplestores gespeichert. Vier Opensource-Projekte, die damit werben, auch mit sehr große Datenmengen performant umgehen zu können, sind bigdata, owlim, Apache Jena und der Virtuoso Universal Server

Wie funktionieren diese Triplestores? Welche Besonderheiten in der Architektur des Triplestores gibt es, so dass schnelle Abfragen auch auf großen Datenmengen möglich sind? Wie werden Daten eingefügt/geändert? Was für Anfragen kann man an einen Triplestore stellen? Welche Art von automatisiertem Schlussfolgern (Reasoning) wird unterstützt?

Eine weitere Möglichkeit der Ablage von Linked Data ist ein Mapping auf existierende Datenbanken. In der Regel handelt es sich dabei um relationale Datenbanken, aber auch ein Mapping auf immer mehr in Mode kommende „No-SQL“-Datenbanken ist denkbar.

Zwei bekannte Projekte und Informations-Anbieter im Bereich LOD sind Wikidata und DBpedia. Welche Technik (Triplestore oder Mapping?) verwenden sie? Wie kann man auf die Daten zugreifen? Wie wird Information hinzugefügt?

Organisatorisches

Eine Vorbesprechung findet am 28.10.2013, 14:00 Uhr, im Raum 1110 (Uni-Hochhaus 11. Stock) statt.

 

¹ http://lod-cloud.net/state/ Version 0.3 vom 19. September 2011
² Diese vier Triplestores wurden im Rahmen des Berlin SPARQL Benchmarks verglichen.

Comments are closed.