Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln...

16
Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei Christoph Stollwerk WS 2015/16

Transcript of Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln...

Page 1: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Semantic web technologies in pervasive computing

A survey and research roadmap

Universität zu Köln Sören Terhorst

AM2 Übung: Semantic Technologies bei Christoph Stollwerk

WS 2015/16

Page 2: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Gliederung 1. Wofür werden sensorisch aufgenommene Daten genutzt?

2. Kurz: RDF und OWL

3. Was wird von Sensoren aufgezeichnet und wie werden diese Daten verarbeitet?

4. Reasoning

5. Wie wird der Faktor „Zeit“ bei Sensordaten behandelt?

6. Herausforderungen gewisser Instanzen

Page 3: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Sensordaten als …• GPS-Daten zur Bestimmung von Hot Zones in Städten, Touristenempfehlung und Städteplanung

• Daten zur Bestimmung von Luft/- und Umweltverschmutzung in ländlichen Gegenden

• treibende Kraft für Förderung der Sensorforschung und besseren Verständnis der Umwelt

• Daten, welche aufeinander bezogen werden können (Smart Home u. Verkehrsdaten)

Wie kann ein Smart Home über die Verkehrsdaten des Besitzers darauf schließen, wann dieser nach Hause kommt?

1. Wofür werden sensorisch aufgenommene Daten genutzt?

Page 4: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

RDF• Grundlegendes Vokabular zur Einteilung von Resourcen in subClass und subProperty zur Einteilung in Beziehungen

• Sinnvoll für sensorbasierende Systeme – mit URIs können in Zusammenhang mit OWL festgestellt werden, ob lexikalischer Bezug zwischen Objekten/synonymischer Bezug besteht

• Domainneutralität

• RDF stores können mit SPARQL/SPARQL Update bearbeitet/verarbeitet werden

• Verknüpfung von Modellen und bestehenden Ontologien über Grundsätze von Linked Data

2. Kurz: RDF und OWL

Page 5: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

OWL• Darstellung von

Objekten (Bsp.: Person) Rollen – Beziehungen zw. Objekten (Bsp.: worksIn) Individuals – spezifische Objekte (Bsp.: Alice)

• Aufbau von komplexen Konzept durch Nutzung von Konstruktoren, welche oben genanntes verknüpfen hasFriend.Person alle Personen, die mind. einen Freund besitzen

• Weitreichendes Vokabular, um Beziehungen von Objekten zu beschreiben

2. Kurz: RDF und OWL

Page 6: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Sensordaten aufnehmen…• Sensorisch aufgenommene Informationen enthalten Rohdaten, deren Kontext, „domain knowledge“ (Ontologie – Beziehungen

dargestellt im System) und Events • Event – Änderung des Zustands, welcher von dem System überwacht wird. Bsp.: Herzinfarkt (Herzfrequenz o.ä.)

When – basierend auf Gregorianischem Kalender – „2012-05-10T09:32BST“ - W3C Standard (meistgenutzte Variante)

Where – basierend auf dem weltlichen Befinden des Nutzers/Objekts – wichtig zur Kontextualisierung

What – Einbringen von Objekten (physisch/virtuell) über Ontologien, welche Objekte beschreiben können.

Who - basierend auf dem Nutzer und seiner Beziehungen zu anderen Personen, um auf den Nutzungskontext schließen zu können. Ein unterschiedlicher sozialer Kontext bedarf eines anderen Nutzens des Geräts – dies muss einen kontextualisierten Output bringen.

3. Was wird von Sensoren aufgezeichnet und wie werden diese Daten verarbeitet?

Page 7: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Sensordaten aufnehmen…• Movement - Aufnahme von geografischen Daten über Sensorik, welche bereits bei heutiger Technik möglich ist

Ontologien helfen dabei, Rohdaten in solche zu bringen, welche durch bspw. Start und Stop von Bewegung in solche übertragen werden können, dass daraus auf Infrastruktur geschlossen werden kann

Bsp.: Tankstelle

3. Was wird von Sensoren aufgezeichnet und wie werden diese Daten verarbeitet?

Page 8: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Sensordaten speichern…Sensory Data Set Description Language (SDDL) und dazugehörige Ontologien

• Sensory Data Set Description Language (SDDL) und dazugehörige Ontologien Teilung und Wiederbenutzung von Daten anderer Nutzer XML-basiert für Sensoren, Antriebe, Datensatzparameter, und Events Sensoren sind domains zugeordnet, welche weitere Parameter bereithält Technische Daten zu dem dem Sensor zugeordneten verbauten Teil (Fabrikat, Größe, Abweichungsspannen bei Messung, Aufnahmefrequenz

3. Was wird von Sensoren aufgezeichnet und wie werden diese Daten verarbeitet?

Page 9: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Sensordaten speichern…Sensor Model Language (SensorML), Observations & Measurements (O&M) und Trandsducer Model Language (TransducerML)• XML-basierte Sprachen, welche auch für Sensorüberwachung, Sensorverbindung im Netzwerk und Sensorprocessing genutzt

werden kann

• Standardisierte Kommunikation und Interaktion mit jeglichen Sensorarten und Sensorsystemen

• Auch über das Netz abrufbar, weil Formate ein Nutzen über Webinterface möglich machen

• Verschleierung von Sensoranspracheschnittpunkten/-protokollen – Abhören/Ablesen nur durch authentifizierte Personen

• Nachteil: Wird in XML gespeichert und nicht wie bei SDDL in einer RDF-Ontologie – daher Verfügbarkeit für Semantic Web Technologies nur über Ecken möglich

3. Was wird von Sensoren aufgezeichnet und wie werden diese Daten verarbeitet?

Page 10: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Reasoning• Reasoning bietet die Möglichkeit auf Zurückgreifen von Algorithmen, welche Rückschlüsse auf Beziehung und Inhalt einer

Ontologie ziehen können

• In ein System eingepflegte Daten werden als hochlevelig kontextualisierte Daten bezeichnet Sensor zeichnet vom Level niedrigere Daten auf, welche durch ontologische „Reasoning tasks“ in hochlevelige Daten übertragen werden

können

• Zusammenfassung – Erfüllbarkeit – Konsistenz – Instanzkontrolle - Realisierung

4. Reasoning

Page 11: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Sensordaten mit Zeitfaktor aufnehmen…

• Multidimensional RDF – Erweitern der gängigen RDF-Triple auf Quadruple Zeit als Faktor, um gesammelte Daten zur Kontextualisierung, ob diese im Graphen berücksichtigt werden sollen

• Andere Umsetzung: Temporal Triple, welche in Beziehung zu den zu beschreibenden Triplen stehen. Diese sind Bereichen von dem Graphen zugeordnet, welcher die Inhalte der gängigen Triple enthält

• Streaming SPARQL, C-SPARQL und CQELS Queries werden hier gegen neu produzierte Daten abgeglichen und gegebenenfalls angepasst SPARQL Vokabular/Grammatik soll dadurch an neu bestehende streaming data herangeführt werden

5. Wie wird der Faktor „Zeit“ bei Sensordaten behandelt?

Page 12: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Sensordaten mit Zeitfaktor abrufen…Auf neue Daten schließen…

• Weiterentwicklung von SPARQL • Anfügen von temporal extent (zeitliches Ausmaß) an Triple und Erweiterung der Syntax• SQWRL weiterentwickelt – Filter verfügbar, welche für Queries genutzt werden können (first, first-n, last, last-n, und nth)

• Rule-based reasoning (Ontologie) vereint mit context modelling ontologies zur Schließung auf komplexen Kontexten von rohen Kontextdaten

• Causality reasoning basiert auf Reasoning vom Zustand vor den zu untersuchenden Daten und Auswirkungen von Events und Actions auf diese – Event Calculus theory

• Stream Reasoning – Kombinieren von data streams und reasoning-Technologie, um auf neue Daten in Echtzeit zu schließen und sich schnell verändernde Daten zu bearbeiten

5. Wie wird der Faktor „Zeit“ bei Sensordaten behandelt?

Page 13: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Semantic Complex Event Processing (SCEP)

• Events werden über Pattern, Eventhierarchien und Eventbeziehungen erkannt• Ontologien als Basis für Wissen/bereits vergangene Events in Bezug auf gegenwärtiges Event

5. Wie wird der Faktor „Zeit“ bei Sensordaten behandelt?

Page 14: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Herausforderung hinsichtlich…Temporal features

• Sensoren nehmen Daten normalerweise mit time-stamp auf

• Time-stamps setzen den Zeitpunkt von Datenaufnahme und der Zeitpunkt, an dem die Annahme, die die Daten treffen, als wahr angenommen wird, fest

• Kein Intervall/Zeitraum gespeichert

Ansatz: Kombinierung von Time-Stamps mit temporal extent erzeugt die Möglichkeit, die Daten am Zeitpunkt und im Zeitintervall zu erfassen

6. Herausforderungen gewisser Instanzen

Page 15: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Herausforderung hinsichtlich…Data Dynamics / Provenance

• Da Sensoren große Mengen an Daten aufnehmen und diese gespeichert werden müssen, ist es nötig, diese zu organisieren

• Statt alte Daten sukzessiv zu löschen, ist ein sinnvoller Ansatz, die Dynamik im zeitlichen Verlauf zu speichern, um diesen zu speichern und die Ausgangsdaten dadurch zu ersetzen

• Daten von Sensoren müssen erst gefiltert werden Anschließen von Sensoren nicht direkt ans System möglich

“Individual data elements are evidence of fact rather than being facts themselves”

• Provenance als Kritikpunkt für Reasoning, weil dort auf Daten geschlossen werden, allerdings keine Herkunft bekannt ist

6. Herausforderungen gewisser Instanzen

Page 16: Semantic web technologies in pervasive computing A survey and research roadmap Universität zu Köln Sören Terhorst AM2 Übung: Semantic Technologies bei.

Herausforderung hinsichtlich…Programmierung

• Programmierer sehen in einem Knowledge Graph nur die vorhandenen Daten und dahinterliegenden Ontologien, auf syntaktischer und struktureller Ebene, müssen bei ihrer Arbeit die Semantik dahinter nicht hinterfragen

• Großer Aufwand zum Erlernen von Verarbeiten von semantischen Daten

• Großer, auch finanzieller Aufwand – wenig direkter Profit fürs Unternehmen

• Programmierer müssen sich darauf einstellen, mit Daten zu arbeiten, welche fehlerbehaftet oder unsicher in ihrer Wahrhaftigkeit sind

6. Herausforderungen gewisser Instanzen