Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery...

31
Zwei Welten - Berlin damals und heute Abschluss Präsentation Benjamin Meier, Carl Ebinger, Michael Schäfer, Simon Kalt, Stefan Behrendt Freie Universität Berlin Abschluss Präsentation, 09. Juli 2014

Transcript of Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery...

Page 1: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Zwei Welten - Berlin damals und heuteAbschluss Präsentation

Benjamin Meier, Carl Ebinger, Michael Schäfer, Simon Kalt, Stefan BehrendtFreie Universität Berlin

Abschluss Präsentation, 09. Juli 2014

Page 2: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Überblick (Datenquelle)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

Wikipedia

Abgeleitete Datenbank

XML Schema

Python Server

Client

OpenStreetMap

Flickr

Panoramio

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

Python

base

XbaseX

valid

ate

validate

validate

valid

ate

validate

XQuery

HTTP

Leafl

etJS

REST

JSW

idget

Python

,FU Berlin, Zwei Welten, 09. Juli 2014 2

Page 3: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Datenquelle

StadtmuseumInformationsfluss

É Stadtmuseum Berlin: Schichten der GeschichteÉ Stadtansichten Berlin 18. und 19. Jahrhundert

,FU Berlin, Zwei Welten, 09. Juli 2014 3

Page 4: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Datenquelle

StadtmuseumInformationsfluss

É Stadtmuseum Berlin: Schichten der GeschichteÉ Stadtansichten Berlin 18. und 19. Jahrhundert

,FU Berlin, Zwei Welten, 09. Juli 2014 3

Page 5: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Datenquelle

StadtmuseumInformationsfluss

É Stadtmuseum Berlin: Schichten der GeschichteÉ Stadtansichten Berlin 18. und 19. Jahrhundert

Abbildung: „Das Brandenburger Tor“ von DanielChodowiecki (1764), Radierung auf Büttenpapier

TagsÉ StadtbefestigungÉ PreußenÉ AkziseÉ StadttorÉ PferdekutscheÉ Brandenburger Tor

,FU Berlin, Zwei Welten, 09. Juli 2014 3

Page 6: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Datenquelle

StadtmuseumInformationsfluss

É Stadtmuseum Berlin: Schichten der GeschichteÉ Stadtansichten Berlin 18. und 19. Jahrhundert

Abbildung: „Das Brandenburger Tor“ von DanielChodowiecki (1764), Radierung auf Büttenpapier

TagsÉ StadtbefestigungÉ PreußenÉ AkziseÉ StadttorÉ PferdekutscheÉ Brandenburger Tor

,FU Berlin, Zwei Welten, 09. Juli 2014 3

Page 7: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Idee: Aufwertung der Daten mitInformationen

Abbildung: Anreicherung der Bilder mit DBpedia und aktuellen Daten.,

FU Berlin, Zwei Welten, 09. Juli 2014 4

Page 8: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Datenquelle)

StadtmuseumInformationsfluss

,FU Berlin, Zwei Welten, 09. Juli 2014 5

Page 9: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Datenquelle)

StadtmuseumInformationsfluss

correct

,FU Berlin, Zwei Welten, 09. Juli 2014 5

Page 10: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Datenquelle)

StadtmuseumInformationsfluss

Stadtansichten

correct

XS

LT

,FU Berlin, Zwei Welten, 09. Juli 2014 5

Page 11: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Tags: Kategorisierung)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

correct

XS

LT

XQuery

,FU Berlin, Zwei Welten, 09. Juli 2014 6

Page 12: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Tags: Kategorisierung

É Undefiniert: „Stadtansicht“, füruns nicht relevant

É Abstrakt: „Preußen“,„Romantik“, „Kupferstich“

É Objekt: „Brunnen“,„Pferdekutsche“, mit Beispielbild

É Person: „Friedrich Wilhelm I.“,mit Geburts- und Sterbejahr

É Ort: „Alexanderplatz“, mitGeokoordinaten

É Gebäude: „Brandenburger Tor“,mit Bauinformationen

Undefiniert

Abstrakt

Objekt

Person Ort

Gebäude

,FU Berlin, Zwei Welten, 09. Juli 2014 7

Page 13: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Tags: Kategorisierung

É Undefiniert: „Stadtansicht“, füruns nicht relevant

É Abstrakt: „Preußen“,„Romantik“, „Kupferstich“

É Objekt: „Brunnen“,„Pferdekutsche“, mit Beispielbild

É Person: „Friedrich Wilhelm I.“,mit Geburts- und Sterbejahr

É Ort: „Alexanderplatz“, mitGeokoordinaten

É Gebäude: „Brandenburger Tor“,mit Bauinformationen

Undefiniert

Abstrakt

Objekt

Person Ort

Gebäude

,FU Berlin, Zwei Welten, 09. Juli 2014 7

Page 14: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Tags: Kategorisierung

É Undefiniert: „Stadtansicht“, füruns nicht relevant

É Abstrakt: „Preußen“,„Romantik“, „Kupferstich“

É Objekt: „Brunnen“,„Pferdekutsche“, mit Beispielbild

É Person: „Friedrich Wilhelm I.“,mit Geburts- und Sterbejahr

É Ort: „Alexanderplatz“, mitGeokoordinaten

É Gebäude: „Brandenburger Tor“,mit Bauinformationen

Undefiniert

Abstrakt

Objekt

Person Ort

Gebäude

,FU Berlin, Zwei Welten, 09. Juli 2014 7

Page 15: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Tags: Kategorisierung

É Undefiniert: „Stadtansicht“, füruns nicht relevant

É Abstrakt: „Preußen“,„Romantik“, „Kupferstich“

É Objekt: „Brunnen“,„Pferdekutsche“, mit Beispielbild

É Person: „Friedrich Wilhelm I.“,mit Geburts- und Sterbejahr

É Ort: „Alexanderplatz“, mitGeokoordinaten

É Gebäude: „Brandenburger Tor“,mit Bauinformationen

Undefiniert

Abstrakt

Objekt

Person Ort

Gebäude

,FU Berlin, Zwei Welten, 09. Juli 2014 7

Page 16: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Tags: Kategorisierung

É Undefiniert: „Stadtansicht“, füruns nicht relevant

É Abstrakt: „Preußen“,„Romantik“, „Kupferstich“

É Objekt: „Brunnen“,„Pferdekutsche“, mit Beispielbild

É Person: „Friedrich Wilhelm I.“,mit Geburts- und Sterbejahr

É Ort: „Alexanderplatz“, mitGeokoordinaten

É Gebäude: „Brandenburger Tor“,mit Bauinformationen

Undefiniert

Abstrakt

Objekt

Person Ort

Gebäude

,FU Berlin, Zwei Welten, 09. Juli 2014 7

Page 17: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Tags: Kategorisierung

É Undefiniert: „Stadtansicht“, füruns nicht relevant

É Abstrakt: „Preußen“,„Romantik“, „Kupferstich“

É Objekt: „Brunnen“,„Pferdekutsche“, mit Beispielbild

É Person: „Friedrich Wilhelm I.“,mit Geburts- und Sterbejahr

É Ort: „Alexanderplatz“, mitGeokoordinaten

É Gebäude: „Brandenburger Tor“,mit Bauinformationen

Undefiniert

Abstrakt

Objekt

Person Ort

Gebäude

,FU Berlin, Zwei Welten, 09. Juli 2014 7

Page 18: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Tags: Kategorisierung)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

correct

XS

LT

XQuery

,FU Berlin, Zwei Welten, 09. Juli 2014 8

Page 19: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Tags: Zusatzinformationen)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

correct

XS

LT

XQuery

Pyhon

,FU Berlin, Zwei Welten, 09. Juli 2014 9

Page 20: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Tags: Zusatzinformationen)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

,FU Berlin, Zwei Welten, 09. Juli 2014 9

Page 21: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Tags: Zusatzinformationen - Verwendete Tags

Abbildung: Insgesamt 154 verwendete Tags (Stufe höher als undefiniert)!

,FU Berlin, Zwei Welten, 09. Juli 2014 10

Page 22: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Tags: Zusatzinformationen)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

,FU Berlin, Zwei Welten, 09. Juli 2014 11

Page 23: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Tags: Zusatzinformationen)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

Wikipedia

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

Python

Python

,FU Berlin, Zwei Welten, 09. Juli 2014 11

Page 24: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Tags: Zusatzinformationen)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

Wikipedia

Abgeleitete Datenbank

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

Python

base

XbaseX

Python

,FU Berlin, Zwei Welten, 09. Juli 2014 11

Page 25: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Anwendung von XML-Schema)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

Wikipedia

Abgeleitete Datenbank

XML Schema

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

Python

base

XbaseX

valid

ate

validate

validate

valid

ate

validate

Python

,FU Berlin, Zwei Welten, 09. Juli 2014 12

Page 26: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Server und Client)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

Wikipedia

Abgeleitete Datenbank

XML Schema

Python Server

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

Python

base

XbaseX

valid

ate

validate

validate

valid

ate

validate

XQuery

Python

,FU Berlin, Zwei Welten, 09. Juli 2014 13

Page 27: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Server und Client)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

Wikipedia

Abgeleitete Datenbank

XML Schema

Python Server

Client

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

Python

base

XbaseX

valid

ate

validate

validate

valid

ate

validate

XQuery

HTTP

Python

,FU Berlin, Zwei Welten, 09. Juli 2014 13

Page 28: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Übersicht (Server und Client)

StadtmuseumInformationsfluss

Stadtansichten

Kategorisierte Tags

Annotierte Tags

DBpedia

Wikipedia

Abgeleitete Datenbank

XML Schema

Python Server

Client

OpenStreetMap

Flickr

Panoramio

correct

XS

LT

XQuery

Pyhon

Pyth

on/S

PARQ

L

Python

base

XbaseX

valid

ate

validate

validate

valid

ate

validate

XQuery

HTTP

Leafl

etJS

REST

JSW

idget

Python

,FU Berlin, Zwei Welten, 09. Juli 2014 13

Page 29: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Live Demonstration

http://localhost:8080/

,FU Berlin, Zwei Welten, 09. Juli 2014 14

Page 30: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Ausblick

É Informationen zu Bild (Künstler, Erstellungsjahr, Technik) abrufenÉ Titel analysieren und weitere Informationen abrufenÉ Redundante Tags identifizieren (Kind/Kinder)É Tags automatisch priorisieren und/oder kategorisierenÉ Automatische Tag Auflösung (Dom => Berliner Dom)É Fehlerhafte Tags/Auflösungen identifizieren (z.B. Fischerhütte am

Schlachtensee und nicht in den Alpen)É Text analysieren um herauszufinden ob Gebäude existiertÉ Mit maschinellen Lernverfahren weitere interessante Informationen

identifizieren und integrieren

,FU Berlin, Zwei Welten, 09. Juli 2014 15

Page 31: Zwei Welten - Berlin damals und heute - Abschluss Präsentation · Flickr Panoramio ect T XQuery Pyhon ARQL Python baseX baseX validate validate validate validate validate XQuery

Eingesetzte Bibliotheken und Programme

XMLÉ basexÉ libxml2É libxml2-utilsÉ libxsltÉ xsltproc

PythonÉ python3É python3-bs4É python3-requestsÉ python3-sparqlwrapper

SonstigesÉ Bitbucket.orgÉ BootstrapÉ gitÉ JQueryÉ LATEXÉ LeafletJSÉ make

DatenquellenÉ DBpediaÉ FlickrÉ OpenStreetMapÉ PanoramioÉ Stadtmuseum BerlinÉ Wikipedia

,FU Berlin, Zwei Welten, 09. Juli 2014 16