RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Post on 05-Apr-2015

114 views 4 download

Transcript of RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

RDF-S3 und eRQL:RDF-S3 und eRQL:RDF-Technologien für RDF-Technologien für

InformationsportaleInformationsportale

Karsten Tolle undKarsten Tolle undFabian WleklinskiFabian Wleklinski

InhaltInhaltSpeicherung:RDF Source related Storage System (RDF-S3)

Anfrage:easy RDF Query Language (eRQL)

Darstellung und Ranking der Ergebnisse

AusgangspunktAusgangspunkt

Zentrale SpeicherungDatenbanken, ad-hoc Anfragen

Dezentrale SpeicherungAgenten, Peer-Peer,

Alert-Systeme

Fehlende Quellinformationen Fehlende Quellinformationen

Im RDF Modell ist die Speicherung der Herkunft der Daten nicht vorgesehen. Diese Quellinformationen sind jedoch nützlich zur:– Überprüfung der Daten (Aktualität)

– Bezug weiterer Informationen (HTML)

– Glaubwürdigkeit

Jeder kann beliebige Aussagen ins Internet stellen.

http://www.abc.com vom 23.09.2004

GlaubwürdigkeitGlaubwürdigkeitStimmen die Angaben?

http://www.abc.com vom 23.09.2004

http://www.xyz.com

P 100 $ s:offer

s:by

s:price

http://www.abc.com

80 $ s:offer

s:by

s:price

????

RDF-S3 EigenschaftenRDF-S3 Eigenschaften

Speicherung der Quellinformation zu jedem RDF Tripel

Möglichkeit zum Löschen und Aktualisieren einzelner Quellen

Optimierung durch Kombination der Generischen- und Schemaspezifischen-Repräsentation der RDF-Daten innerhalb der Datenbank

RDF-S3 AufbauRDF-S3 Aufbau

hohe Datenqualität durch semantische Überprüfungsfunktionen, die der integrierte Validating RDF Parser (VRP) bietet

VRP Internal

RDF Model

ICS-VRP

Validator

RDF-S3 Loader

JDBC - SQL Stream Based API

RDF-S3

RDF/XML files

RDF-S3

Repository

RDF-S3 API

RDF-S3 DemoRDF-S3 Demo

Problem – VerständnisProblem – Verständnis

Real-World-Beispiel:– Zur Erzeugung dieser Präsentation wurde die Länge

der Tower Bridge gesucht– Suche mit "Tower Bridge" length lieferte eine

Menge Ergebnisseiten, aber:• Einheiten verschieden (z. B. “Fuß”) oder fehlend

• “Länge” einer Brücke?– Spannweite? Gesamtlänge? Länge der beweglichen Teile? …?

– Zwei „Kontexte“ nötig: Einheit und Längendefinition

Golden Gate Bridge

s:width

s:name

90 s:widthofsidewalk

10.5

Problem – VerständnisProblem – Verständnis

RDF Aussagen können oft nur in ihrem Kontext verstanden werden– Beispiel: Width of Golden Gate Bridge?

• 90! 90? 90 Meter, 90 Inch, 90 Feet?

All units of measurements are in feet. rdf:comment

Ziele1. So einfach wie möglich!

2. Nutzung der Möglichkeitendurch die Speicherung derQuellinformation!

3. Darstellung der Ergebnissein ihrem Kontext (sieheGolden Gate Bridge Beispiel)!

eRQLeRQL

Ein-Wort-Abfragen

Dokumenten-Modus

PointOfInterest-Modus

Ein-Wort-AnfrageEin-Wort-Anfrage

Sehr einfach und ohne Vorwissen einsetzbar!– Idee: nicht komplizierter als Google

Beispiel: Tripel, die „bridge“ enthalten– eRQL: bridge

– RQL: select * from {X}@P{Y} where @P like "*[bB][rR][iI][dD][gG][eE]*" or X like "*[bB][rR][iI][dD][gG]

[eE]*" or Y like "*[bB][rR][iI][dD][gG]

[eE]*"

– RDQL: ähnlich wie RQL• Perl ähnliche Notation

SELECT ?s, ?p, ?o WHERE ?s =~ „bridge“ AND ?p =~ „bridge“ AND ?o =~ „bridge“

??????

Dokumenten-ModusDokumenten-Modus

Ermöglicht die Einschränkung auf ausgewählte Quellen (oder das Weglassen nicht vertrauenswürdiger Quellen)Syntax: <Anfrage;Quellen-Liste;0|1>– Beispiel: <bridge;3,4;1>

In RQL nicht vorgesehen!In RDQL können in der from-Klausel Einschränkungen definiert werden– Aber kein gezieltes Weglassen

0: weglassen1: einschränken

PointOfInterest-ModusPointOfInterest-ModusGibt den internen Kontext (umgebener RDF Graph) der einzelnen Treffer mit an – Ergebnisse können besser verstanden werden (siehe Golden Gate

Bridge)

Die Größe des zu zeigenden Kontextes wird in der Anfrage definiertBeispiel: [bridge] ohne Kontext bridge Kontextgröße 1 (default)~ bridge Kontextgröße 2~~ bridge Kontextgröße 3 ...

eRQL eRQL PointOfInterestPointOfInterest

eRQL erweitert Fundstellen zu “POIs”– benachbarte Aussagen werden hinzugefügt

• z. B. “comment” zu “Golden Gate Bridge”

s:width

90

Golden Gate Bridge

s:name

s:widthofsidewalk

10.5

All units of measurements are feet.rdf:comment

eRQL eRQL PointOfInterestPointOfInterest

POIs werden auch für Sub-Queries gebildet– "Golden Gate Bridge" OR "Tower Bridge"

s:width90

Golden Gate Bridge s:name

s:length

Tower Bridges:name

268

eRQL eRQL PointOfInterestPointOfInterest

POIs werden auch für Sub-Queries gebildet– "Golden Gate Bridge" AND width

• POIs für “Golden Gate Bridge” und “width” werden gebildet

• Vereinigung der POIs, falls diese überlappen, sonst leer

• übereinstimmend mit “Google-Query”

s:width90

Golden Gate Bridges:name

eRqlEngineeRqlEngine

eRQL-Prototyp– kein Datenbank-Backend

• arbeitet mit RDF-Dateien

• einfache Installation

Details und Download:– www.dbis.informatik.uni-

frankfurt.de/~tolle/RDF/eRQL/

– www.wleklinski.de/rdf/

eRQL DemoeRQL Demo

ZusammenfassungZusammenfassung

RDF-S3 und eRQL bieten:

Überprüfbare Daten mehr Glaubwürdigkeit

Antworten mit Kontext mehr Verständnis der Ergebnisse

Anfragen können auf ausgewählte Quellen eingeschränkt werden bessere Ergebnisse

sehr einfach kann ohne Vorwissen genutzt werden (wichtig für Portale)

Zukünftige ZieleZukünftige Ziele

Steigerung der Performance von RDF-S3 und eRQLWeitere nützliche Anfragemöglichkeiten untersuchen Verbesserung der ErgebnisdarstellungVersionsunterstützung für Quellen unter RDF-S3...

Danke für die AufmerksamkeitDanke für die Aufmerksamkeit

Fragen?

Weitere Infos und Downloads:

http://www.dbis.informatik.uni-frankfurt.de/~tolle/rdf/

Kontakt:

Karsten Tolle: tolle@dbis.informatik.uni-frankfurt.de

Fabian Wleklinski: wleklinski@eworks.de