Titel

29
WS 2010/2011 Titel Semantic Web Ideen und Konzepte

description

Titel. Semantic Web. Ideen und Konzepte. WS 2010/2011. Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004. WS 2010/2011. Lernziele. . ArbeitsschritteW. Semantic Web. Sie verstehen, dass das Semantic Web mehr ist als eine diffuse Wolke. - PowerPoint PPT Presentation

Transcript of Titel

Page 1: Titel

WS 2010/2011

Titel

Semantic Web

Ideen und Konzepte

Page 2: Titel

LernzieleArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Semantic Web

Sie verstehen, dass das Semantic Web mehr ist als eine diffuse Wolke.

Sie sehen im Semantic Web eine folgerichtige Erweiterung des bestehenden Web.

Sie erhalten einen Überblick über einige Instrumente des Semantic Web.

Page 3: Titel

Die AusgangsideeArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Quelle: http://www.w3.org/People/Berners-Lee/

The first step is putting data on the Web in a form that machines can naturally understand, or converting it to that form. This creates what I call a Semantic Web – a Web of data that can be processed directly or indirectly by machines.

Quelle: Tim Berners Lee: Weaving the Web. Harper San Francisco, 1999

Page 4: Titel

ThemenArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Grenzen des heutigen Internet

Was ist das Semantic Web?

Prinzipien des Semantic Web

Beispiele

Page 5: Titel

Grenzen des heutigen InternetArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Warming up:

Semantic Web, eine Erweiterung des bestehenden Internet?

Bilden Sie bitte 3 Gruppen und

notieren Sie in jeder Gruppe 5 Punkte, die Ihnen am heutigen Internet nicht gefallen, notieren Sie bitte 3 Ideen, wie man die genannten Probleme lösen könnte

Beziehen Sie die Anregungen von „Tim Berners-Lee, James Hendler; Ora Lassila: The Semantic Web. In: Scientific American, May 2001“ mit ein.

Page 6: Titel

Ihre KritikArbeitsschritte

Kritikpunkte

Lösungsvorschläge jfa

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Page 7: Titel

IntroArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Manu Sporny: Introduction to the Semantic Web

http://www.youtube.com/watch?v=OGg8A2zfWKg

Page 8: Titel

Mein BeispielArbeitsschritte

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Wenn dieses Bild auf einer Website veröffentlicht wäre, wie würden Sie

Einen Zugriff auf das Dokument und die enthaltenen Informationen liefern?

Eine gefilterte Beschreibung des Inhaltes liefern, die die Entscheidung unterstützt, ob das Dokument für eine Anfrage relevant ist?

Auf das Dokument aufmerksam machen, Anregungen geben?

Hilfestellungen bei der Auswahl besonders nützlicher Dokumente oder Informationen im Vergleich zu anderen geben?

Balzer 2010

Page 9: Titel

Wissensorganisation heute - Digitalisierung und Vernetzung

Anforderungen Dinge eindeutig identifizieren

durch Bestimmung von Merkmalen Dinge benennen Beziehungen zwischen Dingen und

zwischen Dingen und ihren Benennungen festlegen

Unterschiedliche Aspekte von Dingen beschreiben

Unterschiedliche Sichtweisen auf Wirklichkeit ermöglichen

Methoden finden, die auch von Maschinen ‚verstanden‘ werden können

Kommunikation, Datenaustausch (zwischen Menschen, Systemen, Maschinen)

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

ProblemeWie wird das Bild und die dargestellten Objekte eindeutig identifiziert? Benennung? Jutta, Judda, Frau Lindenthal, Schwimmen, Plantschen

Welcher Aspekt ist wichtig? Therme Bad Schwartau, Erholung, Wassersport, Frau Spree und Frau Lindenthal gehen zusammen Schwimmen

Wie kann die Information so kodiert werden, dass Maschinen sie verstehen? Judda?

Bild ist in verschiedenen Datenbanken gespeichert

Page 10: Titel

Die ‚Vision‘ des Semantic WebArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Maschinen können den Sinn / die Bedeutung, der im Internet bereit gestellten Informationen interpretieren und weiter geben.

Maschinen könne Dokumente sowie die in ihnen enthaltenen Informationen eindeutig identifizieren.

Maschinen können aus den in den Dokumenten enthaltenen Informationen logische Schlussfolgerungen ziehen.

Maschinen erkennen logische Fehler in komplexen Systemen und weisen auf Korrekturmöglichkeiten hin.

Der Datenaustausch ist so sicher, dass auch vertrauliche Informationen ohne Bedenken ausgetauscht werden können.

Page 11: Titel

Der Semantic Web „Schichtkuchen“ArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

(Quelle: http://www.cs.umd.edu/users/hendler/AgentWeb.html)

Page 12: Titel

Bausteine des Semantic Web - URIArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Uniform Resource Identifier

Eine URL (Uniform Resource Locator) ist eine Form des URI URIs identifizieren und lokalisieren eine Quelle eindeutig Vergabe dezentral, jeder darf URIs vergeben Einige Angaben sind genormt Eine URI kann es nur einmal geben

Page 13: Titel

Bausteine des Semantic Web - XMLArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

<?xml version="1.0" encoding="ISO-8859-1"?><bild> <person> <name>Ulrike</name> <aktivitaet>baden</aktivitaet> <description>genießt ein Bad in Bad Schwartau</description>

</person><person>

<name>Jutta</name> <aktivitaet>baden</aktivitaet> <description>genießt ein Bad in Bad Schwartau</description>

</person>

</bild>

XML erlaubt es, durch TagsInhalte zu benennen.

Welche Probleme haben Maschinen mit der Interpretation dieser xml-Datei?

Page 14: Titel

Bausteine des Semantic Web - RDFArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

RDF ist ein maschinenlesbarerSatz

http://www.bodulli.de/uli.jpg http://purl.org/dc/elements/1.1/creatorhttp://www.bodull.de/art_of_wellness.pdf

Mit RDF lassen sich Aussagen über (Web)Ressourcen machen.

Ulrike ist Urheberin The Art of wellness

Subjekt Prädikat Objekt

Die Informationen für das RDF-Statement könnten aus

einer Datenbank kommen.

Subjekt

Prädikat

Objekt

Page 15: Titel

Semantic Web „Schemata “ArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Problem: Wie soll ein Computer Begriffe wiez. B. „creator“ und „contributor“ verstehen und aufeinander beziehen?

@prefix dc: <http://purl.org/dc/elements/1.1/> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . # A creator is a type of contributor: dc:creator rdfs:subClassOf dc:contributor .

# a: <http://bodulli.de/> is dc:creator of <http://www.bodull.de/art_of_wellness.pdf># b: <http:// http://www.bodull.de/art_of_wellness.pdf > rdfs:hasAuthor <http://bodulli.de/> .

Page 16: Titel

Semantic Web „Ontologie “ArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Mit Ontologien kann man Ressourcen und ihre Beziehung untereinander näher beschreiben und klassifizieren. “Ontologie ist eine formale Spezifikation einer Konzeptionalisierung” Gruber, 1993

‚Details kriegen wir noch‘.

Sport:

Quelle: http://robot.cmpe.boun.edu.tr/robsem/OntologyAlignment.ppt

Page 17: Titel

Bausteine des Semantic Web - Ontologie ArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

<Sport rdf:ID="RUGBY"> <hasForArea> <Area rdf:ID="OUTDOOR_GRASS_FIELD"> <rdfs:label rdf:datatype="http://www.w3.org/2001/XMLSchema#string" >Outdoor grass field</rdfs:label> </Area> </hasForArea> <isItOlympic rdf:datatype="http://www.w3.org/2001/XMLSchema#boolean" >false</isItOlympic> <isTeamSport rdf:datatype="http://www.w3.org/2001/XMLSchema#boolean" >true</isTeamSport> <hasAccessory rdf:resource="#GOAL"/> <hasAccessory rdf:resource="#BALL"/> <isAquatic rdf:datatype="http://www.w3.org/2001/XMLSchema#boolean" >false</isAquatic> <isWinterSport rdf:datatype="http://www.w3.org/2001/XMLSchema#boolean" >false</isWinterSport> <rdfs:label rdf:datatype="http://www.w3.org/2001/XMLSchema#string" >Rugby</rdfs:label> </Sport>

Ausschnitt aus einer Sportontologie (http://labotalc.loria.fr/~kasimir/downloads/owl/sport.owl)

Page 18: Titel

Bausteine des Semantic Web - LogikArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Ein Beispiel: Ein Buchclub entscheidet, wenn jemand mehr als 100 Bücher im Monat

verkauft, ist er Mitglied des Super Verkäufer Club. Ein intelligentes Programm könnte jetzt daraus ableiten:

„Ulrike (A) hat 102 Bücher verkauft (B)“„Wer mehr als 100 Bücher verkauft (B), ist Mitglied des Superverkäufer

Club“(C), daraus folgt, Ulrike (A) ist Mitglied des Super Verkäufer Club (C)

In Sprachen wie OWL ist einfacheFirst Order Logik wie:Wenn b=c u. a=b dann a=cmöglich

Page 19: Titel

Bausteine des Semantic Web - TrustArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Digitale Signatur

„Web of Trust“Tim Berners-Lee hat einen "Oh, yeah?" Button vorgeschlagen, der wenn er angeklickt wird, versucht, Gründe zu beschaffen, warum bestimmte Daten vertrauenswürdig oder nicht vertrauenswürdig sind.

Page 20: Titel

Beispiel Semantic Web AnwendungArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Quelle: http://static.rp-online.de/layout/fotos/Germany_Soccer_Bundesliga_CMN2074bdd48f70590.jpg

Wer ist das?

Page 21: Titel

Beispiel : Suche Thomas MüllerArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Es liegt eine Fülle von strukturierter Information zu Thomas Müller vor

Page 22: Titel

Beispiel : Wikipedia zu Thomas MüllerArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Wenn man die strukturierten Informationen Suchmaschinen zugänglich macht, lässt sich das Web wie eine Datenbank durchsuchen.

Dbpedia macht Wikipediaeinträge maschinenlesbar

Beispiel Thomas Müller

http://dbpedia.org/page/Thomas_M%C3%BCller

Page 23: Titel

Beispiel : Details zu Thomas MüllerArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Die Disambiguierung führt zu folgender Seite: http://dbpedia.org/page/Thomas_M%C3%BCller_%28footballer%29

Page 24: Titel

Beispiel: BBC- World Cup WebsiteArbeitsschritteW

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Die BBC – World Cup Website nutzt diese Daten für ein komplexes teilautomatisiertes Angebot

http://news.bbc.co.uk/sport2/hi/football/world_cup_2010/default.stm

URL:http://www.bbc.co.uk/blogs/bbcinternet/2010/07/bbc_world_cup_2010_dynamic_sem.html

Tools

Programmes Ontology: http://www.bbc.co.uk/ontologies/programmes/2009-09-07.shtml

Page 25: Titel

FOAF – Spielerei - Webride

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Das Semantic Web wird mit vielen kleinen Tools gebaut Ein Beispiel aus dem Social Web „FOAF“ Website von http://richard.cyganiak.de/ FOAF Profil selber erstellen http://www.ldodds.com/foaf/foaf-a-

matic.html

http://was-ist-foaf.de/

Page 26: Titel

FOAF - Spielerei

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

• Friend of a Friend (FOAF) schafft ein Netz maschinenlesbarer Webseiten, die Personen beschreiben, die Verbindungen zw. ihnen herstellen und beschreiben was sie tun.

• FOAF basiert auf einer Datei in der Markup-Sprache RDF, in der Klassen und Eigenschaften definiert werden, die in einem XML-basierten RDF-Dokument verwendet werden können.

• In einem FOAF-Dokument können Angaben über eine Person festgehalten werden (u.a. Name, Alter, Geschlecht, E-Mail-Adresse, Adresse der privaten und beruflichen Website, Weblog-Adresse, ICQ-/Jabber-/AIM-IDs, Beruf usw.) und der Person bekannte Menschen genannt werden.

• Sobald mehrere Personen diese FOAF-Dokumente veröffentlichen, z.B. im Web, können die FOAF-Dokumente aufeinander verweisen.

• FOAF hat noch Experiment-Charakter und wird vor allem in der Free Software Szene als ‚social software‘ eingesetzt.

• Es gibt eine Reihe von Softwaretools, die FOAF-Dokumente auswerten und die sozialen Beziehungen analysieren.

• Schauen wir uns ein Beispiel mit einem FOAF-Browser http://www.foafer.org/ an.

http://was-ist-foaf.de/

Page 27: Titel

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:admin="http://webns.net/mvcb/"><foaf:Person rdf:ID="me"><foaf:name>Ulrike Spree</foaf:name><foaf:title>Ms</foaf:title><foaf:givenname>Ulrike</foaf:givenname><foaf:family_name>Spree</foaf:family_name><foaf:nick>morelly</foaf:nick><foaf:mbox_sha1sum>4d82c8909c65f03c2ad3202824f88d7ac4e35c00</foaf:mbox_sha1sum><foaf:depiction

rdf:resource="http://www.bui.haw-hamburg.de/pers/ulrike.spree/spree_engel.jpg"/><foaf:workplaceHomepage

rdf:resource="http://www.bui.haw-hamburg.de/pers/ulrike.spree/"/> <foaf:knows xmlns:dcterms="http://purl.org/dc/terms/"

xmlns:rel="http://www.perceive.net/schemas/relationship/"> <foaf:Person> <foaf:nick>Judda</foaf:nick> <foaf:name>Jutta Lindenthal</foaf:name>

<foaf:mbox_sha1sum>379670d7d83ce45d09fc351ad786f882a95de343</foaf:mbox_sha1sum> <foaf:homepage rdf:resource="http://www.jlindenthal.de/index.html"/> <rdfs:seeAlso rdf:resource="http://www.jlindenthal.de/foaf.rdf"/> </foaf:Person> </foaf:knows><foaf:knows><foaf:Person><foaf:name>Detlev Balzer</foaf:name><foaf:mbox_sha1sum>1a8f80caea34937a89089a211fdbf7613814a844</foaf:mbox_sha1sum></

foaf:Person></foaf:knows></foaf:Person></rdf:RDF>

Beschriebene Person

Person, die auch ein foaf hat

Verweis auf bekannte Personen

Page 28: Titel

FOAF - Spielerei

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

Aufgabe: Erstellen Sie bitte Ihr eigenes FOAF Dokument mit dem FOAF-

Editor http://www.ldodds.com/foaf/foaf-a-matic.html und veröffentlichen Sie es auf einer Website. Berücksichtigen Sie möglichst viele SeeAlso Verweise.

http://was-ist-foaf.de/

Page 29: Titel

Beispiele - Tools

Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011

DBpedia URI Lookup:URL: http://lookup.dbpedia.org/

Disco – Hyperdata Browser. URL: http://www4.wiwiss.fuberlin.de/rdf_browser/

BBC – World Cup Website. URL:http://www.bbc.co.uk/blogs/bbcinternet/2010/07/bbc_world_cup_2010_dynamic_sem.html

BBC – Wildlife Finderhttp://www.bbc.co.uk/wildlifefinder/

Google ist auch schon da: FreebaseURL: http://www.freebase.com/

http://www.siegburg.de/imperia/md/images/cms124/aktuelles/meldungen2010/hase-und-igel-web.jpeg