Titel
description
Transcript of Titel
WS 2010/2011
Titel
Semantic Web
Ideen und Konzepte
LernzieleArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Semantic Web
Sie verstehen, dass das Semantic Web mehr ist als eine diffuse Wolke.
Sie sehen im Semantic Web eine folgerichtige Erweiterung des bestehenden Web.
Sie erhalten einen Überblick über einige Instrumente des Semantic Web.
Die AusgangsideeArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Quelle: http://www.w3.org/People/Berners-Lee/
The first step is putting data on the Web in a form that machines can naturally understand, or converting it to that form. This creates what I call a Semantic Web – a Web of data that can be processed directly or indirectly by machines.
Quelle: Tim Berners Lee: Weaving the Web. Harper San Francisco, 1999
ThemenArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Grenzen des heutigen Internet
Was ist das Semantic Web?
Prinzipien des Semantic Web
Beispiele
Grenzen des heutigen InternetArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Warming up:
Semantic Web, eine Erweiterung des bestehenden Internet?
Bilden Sie bitte 3 Gruppen und
notieren Sie in jeder Gruppe 5 Punkte, die Ihnen am heutigen Internet nicht gefallen, notieren Sie bitte 3 Ideen, wie man die genannten Probleme lösen könnte
Beziehen Sie die Anregungen von „Tim Berners-Lee, James Hendler; Ora Lassila: The Semantic Web. In: Scientific American, May 2001“ mit ein.
Ihre KritikArbeitsschritte
Kritikpunkte
Lösungsvorschläge jfa
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
IntroArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Manu Sporny: Introduction to the Semantic Web
http://www.youtube.com/watch?v=OGg8A2zfWKg
Mein BeispielArbeitsschritte
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Wenn dieses Bild auf einer Website veröffentlicht wäre, wie würden Sie
Einen Zugriff auf das Dokument und die enthaltenen Informationen liefern?
Eine gefilterte Beschreibung des Inhaltes liefern, die die Entscheidung unterstützt, ob das Dokument für eine Anfrage relevant ist?
Auf das Dokument aufmerksam machen, Anregungen geben?
Hilfestellungen bei der Auswahl besonders nützlicher Dokumente oder Informationen im Vergleich zu anderen geben?
Balzer 2010
Wissensorganisation heute - Digitalisierung und Vernetzung
Anforderungen Dinge eindeutig identifizieren
durch Bestimmung von Merkmalen Dinge benennen Beziehungen zwischen Dingen und
zwischen Dingen und ihren Benennungen festlegen
Unterschiedliche Aspekte von Dingen beschreiben
Unterschiedliche Sichtweisen auf Wirklichkeit ermöglichen
Methoden finden, die auch von Maschinen ‚verstanden‘ werden können
Kommunikation, Datenaustausch (zwischen Menschen, Systemen, Maschinen)
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
ProblemeWie wird das Bild und die dargestellten Objekte eindeutig identifiziert? Benennung? Jutta, Judda, Frau Lindenthal, Schwimmen, Plantschen
Welcher Aspekt ist wichtig? Therme Bad Schwartau, Erholung, Wassersport, Frau Spree und Frau Lindenthal gehen zusammen Schwimmen
Wie kann die Information so kodiert werden, dass Maschinen sie verstehen? Judda?
Bild ist in verschiedenen Datenbanken gespeichert
Die ‚Vision‘ des Semantic WebArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Maschinen können den Sinn / die Bedeutung, der im Internet bereit gestellten Informationen interpretieren und weiter geben.
Maschinen könne Dokumente sowie die in ihnen enthaltenen Informationen eindeutig identifizieren.
Maschinen können aus den in den Dokumenten enthaltenen Informationen logische Schlussfolgerungen ziehen.
Maschinen erkennen logische Fehler in komplexen Systemen und weisen auf Korrekturmöglichkeiten hin.
Der Datenaustausch ist so sicher, dass auch vertrauliche Informationen ohne Bedenken ausgetauscht werden können.
Der Semantic Web „Schichtkuchen“ArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
(Quelle: http://www.cs.umd.edu/users/hendler/AgentWeb.html)
Bausteine des Semantic Web - URIArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Uniform Resource Identifier
Eine URL (Uniform Resource Locator) ist eine Form des URI URIs identifizieren und lokalisieren eine Quelle eindeutig Vergabe dezentral, jeder darf URIs vergeben Einige Angaben sind genormt Eine URI kann es nur einmal geben
Bausteine des Semantic Web - XMLArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
<?xml version="1.0" encoding="ISO-8859-1"?><bild> <person> <name>Ulrike</name> <aktivitaet>baden</aktivitaet> <description>genießt ein Bad in Bad Schwartau</description>
</person><person>
<name>Jutta</name> <aktivitaet>baden</aktivitaet> <description>genießt ein Bad in Bad Schwartau</description>
</person>
</bild>
XML erlaubt es, durch TagsInhalte zu benennen.
Welche Probleme haben Maschinen mit der Interpretation dieser xml-Datei?
Bausteine des Semantic Web - RDFArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
RDF ist ein maschinenlesbarerSatz
http://www.bodulli.de/uli.jpg http://purl.org/dc/elements/1.1/creatorhttp://www.bodull.de/art_of_wellness.pdf
Mit RDF lassen sich Aussagen über (Web)Ressourcen machen.
Ulrike ist Urheberin The Art of wellness
Subjekt Prädikat Objekt
Die Informationen für das RDF-Statement könnten aus
einer Datenbank kommen.
Subjekt
Prädikat
Objekt
Semantic Web „Schemata “ArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Problem: Wie soll ein Computer Begriffe wiez. B. „creator“ und „contributor“ verstehen und aufeinander beziehen?
@prefix dc: <http://purl.org/dc/elements/1.1/> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . # A creator is a type of contributor: dc:creator rdfs:subClassOf dc:contributor .
# a: <http://bodulli.de/> is dc:creator of <http://www.bodull.de/art_of_wellness.pdf># b: <http:// http://www.bodull.de/art_of_wellness.pdf > rdfs:hasAuthor <http://bodulli.de/> .
Semantic Web „Ontologie “ArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Mit Ontologien kann man Ressourcen und ihre Beziehung untereinander näher beschreiben und klassifizieren. “Ontologie ist eine formale Spezifikation einer Konzeptionalisierung” Gruber, 1993
‚Details kriegen wir noch‘.
Sport:
Quelle: http://robot.cmpe.boun.edu.tr/robsem/OntologyAlignment.ppt
Bausteine des Semantic Web - Ontologie ArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
<Sport rdf:ID="RUGBY"> <hasForArea> <Area rdf:ID="OUTDOOR_GRASS_FIELD"> <rdfs:label rdf:datatype="http://www.w3.org/2001/XMLSchema#string" >Outdoor grass field</rdfs:label> </Area> </hasForArea> <isItOlympic rdf:datatype="http://www.w3.org/2001/XMLSchema#boolean" >false</isItOlympic> <isTeamSport rdf:datatype="http://www.w3.org/2001/XMLSchema#boolean" >true</isTeamSport> <hasAccessory rdf:resource="#GOAL"/> <hasAccessory rdf:resource="#BALL"/> <isAquatic rdf:datatype="http://www.w3.org/2001/XMLSchema#boolean" >false</isAquatic> <isWinterSport rdf:datatype="http://www.w3.org/2001/XMLSchema#boolean" >false</isWinterSport> <rdfs:label rdf:datatype="http://www.w3.org/2001/XMLSchema#string" >Rugby</rdfs:label> </Sport>
Ausschnitt aus einer Sportontologie (http://labotalc.loria.fr/~kasimir/downloads/owl/sport.owl)
Bausteine des Semantic Web - LogikArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Ein Beispiel: Ein Buchclub entscheidet, wenn jemand mehr als 100 Bücher im Monat
verkauft, ist er Mitglied des Super Verkäufer Club. Ein intelligentes Programm könnte jetzt daraus ableiten:
„Ulrike (A) hat 102 Bücher verkauft (B)“„Wer mehr als 100 Bücher verkauft (B), ist Mitglied des Superverkäufer
Club“(C), daraus folgt, Ulrike (A) ist Mitglied des Super Verkäufer Club (C)
In Sprachen wie OWL ist einfacheFirst Order Logik wie:Wenn b=c u. a=b dann a=cmöglich
Bausteine des Semantic Web - TrustArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Digitale Signatur
„Web of Trust“Tim Berners-Lee hat einen "Oh, yeah?" Button vorgeschlagen, der wenn er angeklickt wird, versucht, Gründe zu beschaffen, warum bestimmte Daten vertrauenswürdig oder nicht vertrauenswürdig sind.
Beispiel Semantic Web AnwendungArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Quelle: http://static.rp-online.de/layout/fotos/Germany_Soccer_Bundesliga_CMN2074bdd48f70590.jpg
Wer ist das?
Beispiel : Suche Thomas MüllerArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Es liegt eine Fülle von strukturierter Information zu Thomas Müller vor
Beispiel : Wikipedia zu Thomas MüllerArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Wenn man die strukturierten Informationen Suchmaschinen zugänglich macht, lässt sich das Web wie eine Datenbank durchsuchen.
Dbpedia macht Wikipediaeinträge maschinenlesbar
Beispiel Thomas Müller
http://dbpedia.org/page/Thomas_M%C3%BCller
Beispiel : Details zu Thomas MüllerArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Die Disambiguierung führt zu folgender Seite: http://dbpedia.org/page/Thomas_M%C3%BCller_%28footballer%29
Beispiel: BBC- World Cup WebsiteArbeitsschritteW
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Die BBC – World Cup Website nutzt diese Daten für ein komplexes teilautomatisiertes Angebot
http://news.bbc.co.uk/sport2/hi/football/world_cup_2010/default.stm
URL:http://www.bbc.co.uk/blogs/bbcinternet/2010/07/bbc_world_cup_2010_dynamic_sem.html
Tools
Programmes Ontology: http://www.bbc.co.uk/ontologies/programmes/2009-09-07.shtml
FOAF – Spielerei - Webride
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Das Semantic Web wird mit vielen kleinen Tools gebaut Ein Beispiel aus dem Social Web „FOAF“ Website von http://richard.cyganiak.de/ FOAF Profil selber erstellen http://www.ldodds.com/foaf/foaf-a-
matic.html
http://was-ist-foaf.de/
FOAF - Spielerei
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
• Friend of a Friend (FOAF) schafft ein Netz maschinenlesbarer Webseiten, die Personen beschreiben, die Verbindungen zw. ihnen herstellen und beschreiben was sie tun.
• FOAF basiert auf einer Datei in der Markup-Sprache RDF, in der Klassen und Eigenschaften definiert werden, die in einem XML-basierten RDF-Dokument verwendet werden können.
• In einem FOAF-Dokument können Angaben über eine Person festgehalten werden (u.a. Name, Alter, Geschlecht, E-Mail-Adresse, Adresse der privaten und beruflichen Website, Weblog-Adresse, ICQ-/Jabber-/AIM-IDs, Beruf usw.) und der Person bekannte Menschen genannt werden.
• Sobald mehrere Personen diese FOAF-Dokumente veröffentlichen, z.B. im Web, können die FOAF-Dokumente aufeinander verweisen.
• FOAF hat noch Experiment-Charakter und wird vor allem in der Free Software Szene als ‚social software‘ eingesetzt.
• Es gibt eine Reihe von Softwaretools, die FOAF-Dokumente auswerten und die sozialen Beziehungen analysieren.
• Schauen wir uns ein Beispiel mit einem FOAF-Browser http://www.foafer.org/ an.
http://was-ist-foaf.de/
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:admin="http://webns.net/mvcb/"><foaf:Person rdf:ID="me"><foaf:name>Ulrike Spree</foaf:name><foaf:title>Ms</foaf:title><foaf:givenname>Ulrike</foaf:givenname><foaf:family_name>Spree</foaf:family_name><foaf:nick>morelly</foaf:nick><foaf:mbox_sha1sum>4d82c8909c65f03c2ad3202824f88d7ac4e35c00</foaf:mbox_sha1sum><foaf:depiction
rdf:resource="http://www.bui.haw-hamburg.de/pers/ulrike.spree/spree_engel.jpg"/><foaf:workplaceHomepage
rdf:resource="http://www.bui.haw-hamburg.de/pers/ulrike.spree/"/> <foaf:knows xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:rel="http://www.perceive.net/schemas/relationship/"> <foaf:Person> <foaf:nick>Judda</foaf:nick> <foaf:name>Jutta Lindenthal</foaf:name>
<foaf:mbox_sha1sum>379670d7d83ce45d09fc351ad786f882a95de343</foaf:mbox_sha1sum> <foaf:homepage rdf:resource="http://www.jlindenthal.de/index.html"/> <rdfs:seeAlso rdf:resource="http://www.jlindenthal.de/foaf.rdf"/> </foaf:Person> </foaf:knows><foaf:knows><foaf:Person><foaf:name>Detlev Balzer</foaf:name><foaf:mbox_sha1sum>1a8f80caea34937a89089a211fdbf7613814a844</foaf:mbox_sha1sum></
foaf:Person></foaf:knows></foaf:Person></rdf:RDF>
Beschriebene Person
Person, die auch ein foaf hat
Verweis auf bekannte Personen
FOAF - Spielerei
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
Aufgabe: Erstellen Sie bitte Ihr eigenes FOAF Dokument mit dem FOAF-
Editor http://www.ldodds.com/foaf/foaf-a-matic.html und veröffentlichen Sie es auf einer Website. Berücksichtigen Sie möglichst viele SeeAlso Verweise.
http://was-ist-foaf.de/
Beispiele - Tools
Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004WS 2010/2011
DBpedia URI Lookup:URL: http://lookup.dbpedia.org/
Disco – Hyperdata Browser. URL: http://www4.wiwiss.fuberlin.de/rdf_browser/
BBC – World Cup Website. URL:http://www.bbc.co.uk/blogs/bbcinternet/2010/07/bbc_world_cup_2010_dynamic_sem.html
BBC – Wildlife Finderhttp://www.bbc.co.uk/wildlifefinder/
Google ist auch schon da: FreebaseURL: http://www.freebase.com/
http://www.siegburg.de/imperia/md/images/cms124/aktuelles/meldungen2010/hase-und-igel-web.jpeg