RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

22
RDF-S3 und eRQL: RDF-S3 und eRQL: RDF-Technologien für RDF-Technologien für Informationsportale Informationsportale Karsten Tolle und Karsten Tolle und Fabian Wleklinski Fabian Wleklinski

Transcript of RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Page 1: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

RDF-S3 und eRQL:RDF-S3 und eRQL:RDF-Technologien für RDF-Technologien für

InformationsportaleInformationsportale

Karsten Tolle undKarsten Tolle undFabian WleklinskiFabian Wleklinski

Page 2: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

InhaltInhaltSpeicherung:RDF Source related Storage System (RDF-S3)

Anfrage:easy RDF Query Language (eRQL)

Darstellung und Ranking der Ergebnisse

Page 3: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

AusgangspunktAusgangspunkt

Zentrale SpeicherungDatenbanken, ad-hoc Anfragen

Dezentrale SpeicherungAgenten, Peer-Peer,

Alert-Systeme

Page 4: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Fehlende Quellinformationen Fehlende Quellinformationen

Im RDF Modell ist die Speicherung der Herkunft der Daten nicht vorgesehen. Diese Quellinformationen sind jedoch nützlich zur:– Überprüfung der Daten (Aktualität)

– Bezug weiterer Informationen (HTML)

– Glaubwürdigkeit

Jeder kann beliebige Aussagen ins Internet stellen.

Page 5: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

http://www.abc.com vom 23.09.2004

GlaubwürdigkeitGlaubwürdigkeitStimmen die Angaben?

http://www.abc.com vom 23.09.2004

http://www.xyz.com

P 100 $ s:offer

s:by

s:price

http://www.abc.com

80 $ s:offer

s:by

s:price

????

Page 6: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

RDF-S3 EigenschaftenRDF-S3 Eigenschaften

Speicherung der Quellinformation zu jedem RDF Tripel

Möglichkeit zum Löschen und Aktualisieren einzelner Quellen

Optimierung durch Kombination der Generischen- und Schemaspezifischen-Repräsentation der RDF-Daten innerhalb der Datenbank

Page 7: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

RDF-S3 AufbauRDF-S3 Aufbau

hohe Datenqualität durch semantische Überprüfungsfunktionen, die der integrierte Validating RDF Parser (VRP) bietet

VRP Internal

RDF Model

ICS-VRP

Validator

RDF-S3 Loader

JDBC - SQL Stream Based API

RDF-S3

RDF/XML files

RDF-S3

Repository

RDF-S3 API

Page 8: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

RDF-S3 DemoRDF-S3 Demo

Page 9: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Problem – VerständnisProblem – Verständnis

Real-World-Beispiel:– Zur Erzeugung dieser Präsentation wurde die Länge

der Tower Bridge gesucht– Suche mit "Tower Bridge" length lieferte eine

Menge Ergebnisseiten, aber:• Einheiten verschieden (z. B. “Fuß”) oder fehlend

• “Länge” einer Brücke?– Spannweite? Gesamtlänge? Länge der beweglichen Teile? …?

– Zwei „Kontexte“ nötig: Einheit und Längendefinition

Page 10: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Golden Gate Bridge

s:width

s:name

90 s:widthofsidewalk

10.5

Problem – VerständnisProblem – Verständnis

RDF Aussagen können oft nur in ihrem Kontext verstanden werden– Beispiel: Width of Golden Gate Bridge?

• 90! 90? 90 Meter, 90 Inch, 90 Feet?

All units of measurements are in feet. rdf:comment

Page 11: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Ziele1. So einfach wie möglich!

2. Nutzung der Möglichkeitendurch die Speicherung derQuellinformation!

3. Darstellung der Ergebnissein ihrem Kontext (sieheGolden Gate Bridge Beispiel)!

eRQLeRQL

Ein-Wort-Abfragen

Dokumenten-Modus

PointOfInterest-Modus

Page 12: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Ein-Wort-AnfrageEin-Wort-Anfrage

Sehr einfach und ohne Vorwissen einsetzbar!– Idee: nicht komplizierter als Google

Beispiel: Tripel, die „bridge“ enthalten– eRQL: bridge

– RQL: select * from {X}@P{Y} where @P like "*[bB][rR][iI][dD][gG][eE]*" or X like "*[bB][rR][iI][dD][gG]

[eE]*" or Y like "*[bB][rR][iI][dD][gG]

[eE]*"

– RDQL: ähnlich wie RQL• Perl ähnliche Notation

SELECT ?s, ?p, ?o WHERE ?s =~ „bridge“ AND ?p =~ „bridge“ AND ?o =~ „bridge“

??????

Page 13: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Dokumenten-ModusDokumenten-Modus

Ermöglicht die Einschränkung auf ausgewählte Quellen (oder das Weglassen nicht vertrauenswürdiger Quellen)Syntax: <Anfrage;Quellen-Liste;0|1>– Beispiel: <bridge;3,4;1>

In RQL nicht vorgesehen!In RDQL können in der from-Klausel Einschränkungen definiert werden– Aber kein gezieltes Weglassen

0: weglassen1: einschränken

Page 14: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

PointOfInterest-ModusPointOfInterest-ModusGibt den internen Kontext (umgebener RDF Graph) der einzelnen Treffer mit an – Ergebnisse können besser verstanden werden (siehe Golden Gate

Bridge)

Die Größe des zu zeigenden Kontextes wird in der Anfrage definiertBeispiel: [bridge] ohne Kontext bridge Kontextgröße 1 (default)~ bridge Kontextgröße 2~~ bridge Kontextgröße 3 ...

Page 15: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

eRQL eRQL PointOfInterestPointOfInterest

eRQL erweitert Fundstellen zu “POIs”– benachbarte Aussagen werden hinzugefügt

• z. B. “comment” zu “Golden Gate Bridge”

s:width

90

Golden Gate Bridge

s:name

s:widthofsidewalk

10.5

All units of measurements are feet.rdf:comment

Page 16: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

eRQL eRQL PointOfInterestPointOfInterest

POIs werden auch für Sub-Queries gebildet– "Golden Gate Bridge" OR "Tower Bridge"

s:width90

Golden Gate Bridge s:name

s:length

Tower Bridges:name

268

Page 17: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

eRQL eRQL PointOfInterestPointOfInterest

POIs werden auch für Sub-Queries gebildet– "Golden Gate Bridge" AND width

• POIs für “Golden Gate Bridge” und “width” werden gebildet

• Vereinigung der POIs, falls diese überlappen, sonst leer

• übereinstimmend mit “Google-Query”

s:width90

Golden Gate Bridges:name

Page 18: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

eRqlEngineeRqlEngine

eRQL-Prototyp– kein Datenbank-Backend

• arbeitet mit RDF-Dateien

• einfache Installation

Details und Download:– www.dbis.informatik.uni-

frankfurt.de/~tolle/RDF/eRQL/

– www.wleklinski.de/rdf/

Page 19: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

eRQL DemoeRQL Demo

Page 20: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

ZusammenfassungZusammenfassung

RDF-S3 und eRQL bieten:

Überprüfbare Daten mehr Glaubwürdigkeit

Antworten mit Kontext mehr Verständnis der Ergebnisse

Anfragen können auf ausgewählte Quellen eingeschränkt werden bessere Ergebnisse

sehr einfach kann ohne Vorwissen genutzt werden (wichtig für Portale)

Page 21: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Zukünftige ZieleZukünftige Ziele

Steigerung der Performance von RDF-S3 und eRQLWeitere nützliche Anfragemöglichkeiten untersuchen Verbesserung der ErgebnisdarstellungVersionsunterstützung für Quellen unter RDF-S3...

Page 22: RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Danke für die AufmerksamkeitDanke für die Aufmerksamkeit

Fragen?

Weitere Infos und Downloads:

http://www.dbis.informatik.uni-frankfurt.de/~tolle/rdf/

Kontakt:

Karsten Tolle: [email protected]

Fabian Wleklinski: [email protected]