Smart Data als Motor für Smart Cities

7
HAUPTBEITRAG / SMART DATA } Smart Data als Motor für Smart Cities Klaus-Peter Eckert Radu Popescu-Zeletin Einleitung ,,Bis 2050 werden sieben von zehn Menschen in Städ- ten leben. Und bis in fünf Jahren werden smarte Cities in Echtzeit über Millionen von Ereignissen informiert werden, Computer besser verstehen, was die Menschen brauchen, was sie mögen, was sie tun und wie sie sich fortbewegen. Stadtverwaltungen werden somit auf Basis von frei verfügbaren Infor- mationen über ihre Einwohner genauer einschätzen können, welche Ressourcen wann und wo benötigt werden, um deren Bedürfnisse zu befriedigen. Die Einwohner ihrerseits werden über ihre Tablets und Smartphones den Kontakt mit ihrer Stadtverwaltung intensivieren ... Damit wird es für die Verwaltungen einfacher, Probleme und Missstände schneller zu beseitigen.“ 1 Mit diesen Worten beschreibt IBM in ihrer Pres- semitteilung vom Dezember 2013 einen der fünf Trends 2 , die unser Leben in den nächsten fünf Jahren nachhaltig beeinflussen können. IBM sagt dabei ein Zusammenwachsen von Entwicklungen aus Berei- chen wie mobile Technologien, soziale Netzwerke, Textanalyse, maschinelles Lernen, Sensornetze und Cloud Computing voraus. Daten werden zum Treibstoff für Prozesse in der Stadt von morgen. ,,Immer mehr entwickelt sich dabei das Bewusst- sein, dass unsere Städte als zentrale Räume in unserer Gesellschaft eine entscheidende Rolle spielen auf dem Weg in die Zukunft. Wir sind heute erstmals in 1 http://www-03.ibm.com/press/de/de/pressrelease/42779.wss 2 http://www.ibm.com/smarterplanet/us/en/ibm_predictions_for_future/ideas/ index.html 3 http://www.morgenstadt.de/de/morgenstadt-initiative.html 4 http://www.bmbf.de/de/21394.php 5 http://www.ict-smart-cities-center.com/ der Geschichte der Menschheit gefordert, eine Urba- nisierung mit bald fünf Milliarden Stadtbewohnern weltweit mit den richtigen Lösungen für eine zukunftsfähige Entwicklung aktiv zu gestalten. Nach- haltigkeitsziele sind für die Städte von morgen ent- scheidend, aber zusätzliche Dimensionen wie Resi- lienz oder Wandlungsfähigkeit gegenüber zuneh- menden Extremsituationen und sich verändernden Rahmenbedingungen erfordern neue Herangehens- weisen, Strategien und Infrastrukturen. Wie sieht die Stadt aus, in der wir morgen leben wollen? Welche Produkte und Lösungen gilt es dafür zu gestalten?“ 3 Diese Fragen stellt sich die Fraunhofer-Gesell- schaft in ihrer Vision der Morgenstadt. Die Kernthe- men der Morgenstadt bauen auf Informationen, Kommunikation, Datenaustausch und Vernetzung in Echtzeit auf: Energieversorgung, Mobilität und öffentliche Sicherheit. In der Morgenstadt wird dabei ein neuer Kommunikationsbegriff zugrunde gelegt, der die herkömmlichen, voneinander getrennten Kommunikationsinfrastrukturen miteinander ver- eint – angefangen von adaptiven Sensornetzen über Informationsnetze bis hin zur Mobilkommunika- tion. Diese Ideen für die Stadt der Zukunft werden vom BMBF in seinem Programm zur Gestaltung der ,,ZukunftsWerkStadt“ 4 unterstützt. Das Fraunhofer-Institut FOKUS identifiziert in seinem Zentrum für Smart Cities 5 die Themen- bereiche Kommunikation, Energie, Mobilität und DOI 10.1007/s00287-014-0769-5 © Springer-Verlag Berlin Heidelberg 2014 Klaus-Peter Eckert · Radu Popescu-Zeletin Fraunhofer-Institut für Offene Kommunikationssysteme FOKUS, Kaiserin-Augusta-Allee 31, 10589 Berlin E-Mail: {klaus-peter.eckert, radu.popescu-zeletin} @fokus.fraunhofer.de

Transcript of Smart Data als Motor für Smart Cities

Page 1: Smart Data als Motor für Smart Cities

HAUPTBEITRAG / SMART DATA }

Smart Data als Motorfür Smart Cities

Klaus-Peter EckertRadu Popescu-Zeletin

Einleitung,,Bis 2050 werden sieben von zehn Menschen in Städ-ten leben. Und bis in fünf Jahren werden smarteCities in Echtzeit über Millionen von Ereignisseninformiert werden, Computer besser verstehen, wasdie Menschen brauchen, was sie mögen, was sie tunund wie sie sich fortbewegen. Stadtverwaltungenwerden somit auf Basis von frei verfügbaren Infor-mationen über ihre Einwohner genauer einschätzenkönnen, welche Ressourcen wann und wo benötigtwerden, um deren Bedürfnisse zu befriedigen. DieEinwohner ihrerseits werden über ihre Tablets undSmartphones den Kontakt mit ihrer Stadtverwaltungintensivieren ... Damit wird es für die Verwaltungeneinfacher, Probleme und Missstände schneller zubeseitigen.“1

Mit diesen Worten beschreibt IBM in ihrer Pres-semitteilung vom Dezember 2013 einen der fünfTrends2, die unser Leben in den nächsten fünf Jahrennachhaltig beeinflussen können. IBM sagt dabei einZusammenwachsen von Entwicklungen aus Berei-chen wie mobile Technologien, soziale Netzwerke,Textanalyse, maschinelles Lernen, Sensornetzeund Cloud Computing voraus. Daten werden zumTreibstoff für Prozesse in der Stadt von morgen.

,,Immer mehr entwickelt sich dabei das Bewusst-sein, dass unsere Städte als zentrale Räume in unsererGesellschaft eine entscheidende Rolle spielen aufdem Weg in die Zukunft. Wir sind heute erstmals in

1 http://www-03.ibm.com/press/de/de/pressrelease/42779.wss2 http://www.ibm.com/smarterplanet/us/en/ibm_predictions_for_future/ideas/index.html3 http://www.morgenstadt.de/de/morgenstadt-initiative.html4 http://www.bmbf.de/de/21394.php5 http://www.ict-smart-cities-center.com/

der Geschichte der Menschheit gefordert, eine Urba-nisierung mit bald fünf Milliarden Stadtbewohnernweltweit mit den richtigen Lösungen für einezukunftsfähige Entwicklung aktiv zu gestalten. Nach-haltigkeitsziele sind für die Städte von morgen ent-scheidend, aber zusätzliche Dimensionen wie Resi-lienz oder Wandlungsfähigkeit gegenüber zuneh-menden Extremsituationen und sich veränderndenRahmenbedingungen erfordern neue Herangehens-weisen, Strategien und Infrastrukturen. Wie sieht dieStadt aus, in der wir morgen leben wollen? WelcheProdukte und Lösungen gilt es dafür zu gestalten?“3

Diese Fragen stellt sich die Fraunhofer-Gesell-schaft in ihrer Vision der Morgenstadt. Die Kernthe-men der Morgenstadt bauen auf Informationen,Kommunikation, Datenaustausch und Vernetzungin Echtzeit auf: Energieversorgung, Mobilität undöffentliche Sicherheit. In der Morgenstadt wird dabeiein neuer Kommunikationsbegriff zugrunde gelegt,der die herkömmlichen, voneinander getrenntenKommunikationsinfrastrukturen miteinander ver-eint – angefangen von adaptiven Sensornetzen überInformationsnetze bis hin zur Mobilkommunika-tion. Diese Ideen für die Stadt der Zukunft werdenvom BMBF in seinem Programm zur Gestaltung der,,ZukunftsWerkStadt“4 unterstützt.

Das Fraunhofer-Institut FOKUS identifiziertin seinem Zentrum für Smart Cities5 die Themen-bereiche Kommunikation, Energie, Mobilität und

DOI 10.1007/s00287-014-0769-5© Springer-Verlag Berlin Heidelberg 2014

Klaus-Peter Eckert · Radu Popescu-ZeletinFraunhofer-Institut für Offene KommunikationssystemeFOKUS, Kaiserin-Augusta-Allee 31, 10589 BerlinE-Mail: {klaus-peter.eckert, radu.popescu-zeletin}@fokus.fraunhofer.de

Page 2: Smart Data als Motor für Smart Cities

{ SMART DATA

ZusammenfassungSmart Data bedeutet, die in Big Data liegendenpositiven Potenziale gezielt nutzbar zu machenund zur Verbesserung von Steuerungs- undEntscheidungsprozessen einzusetzen. SmartData bedeutet auch, die mit Big Data verbunde-nen Risiken zu erkennen und durch geeignetetechnische, organisatorische und politischeBegleitmaßnahmen zu minimieren. Das Mit-einander von Menschen in der Stadt von morgenwird zunehmend durch die Auswertung ihrerwissentlich und unwissentlich in ihrer digitalenUmgebung hinterlassenen Spuren bestimmt.Aber nicht nur unser digitaler Alltag, sondernauch Unternehmen, Verwaltungen und alle imInternet der Dinge angesiedelten technischen Ar-tefakte werden zunehmend durch Daten in ihrenProzessen und Entscheidungen beeinflusst. DerArtikel fasst diese Wechselwirkung zwischen Da-ten und den ,,Bewohnern“ der Stadt von morgenzusammen und betrachtet die heute vorhande-nen Techniken für Big Data vor dem Hintergrundder Anforderungen von Smart Cities.

Sicherheit als Kernthemen. Verkehrsmittel derSmart City sind durch intelligente Informations-und Kommunikationstechnologien vernetzt. Ärzte,Krankenhäuser, Apotheken und Krankenversiche-rungen sind durch elektronische Systeme vernetztund können gleichermaßen auf notwendige Da-ten zugreifen. Wohnstätten sind vernetzt und insSicherheitskonzept der Stadt eingebunden. Bürger,Unternehmen und öffentliche Institutionen sind ver-netzt. Der sichere und freie Zugang zu öffentlichenDaten und Informationen ermöglicht Transparenzund Mitbestimmung im Sinne eines ,,Open Govern-ments“. Wissen wird transparent und kann nahtlosweitergegeben und überall und jederzeit abgeru-fen werden. Verwaltungsvorgänge werden auf daserforderliche Minimum reduziert.

Diese Visionen können aber nur dann wahrwerden, wenn die Daten der Stadt von morgenverantwortungsvoll und rechtskonform zusammen-gestellt, korreliert und entsprechend vorgegebenerZielsetzungen aufbereitet und zu nutzbarem Wissentransformiert werden. Womit sich der Bogen hin zuTechniken aus dem Umfeld von Big Data und BigData Analytics spannt.

Datenquellen in der Stadt von morgenBürger der Stadt von morgen kommunizieren un-tereinander unter Nutzung von Internet-basiertenTechnologien, speziell dedizierter sozialer Netz-werke. Hier fallen große Mengen textueller undgrafischer Daten an. Dabei handelt es sich typi-scherweise um unstrukturierte Daten, die mittelsText- und Bildverarbeitung zu auswertbaren Infor-mationen veredelt werden müssen. Verkehrsmittelkommunizieren untereinander oder stellen meistkurzlebige Daten zur weiteren Auswertung durchdedizierte Apps zur Verfügung. Hier fallen zu-meist Sensordaten in Form von Datenströmen an.Im Medizinbereich werden spezielle textuelle oderstrukturierte Daten ausgetauscht, die zumindestvon den beteiligten Akteuren interpretiert werdenkönnen. Eine Nutzung dedizierter Datenformate zurBeschreibung von Ereignissen ist auch in Bereichenwie Wohnstätten, öffentliche Sicherheit, Umweltda-ten, ,,Smart Grids“ oder Logistik anzutreffen. In denBereichen Bildung, Open Data, Open Governmentsteht die Bereitstellung und Auswertung von Meta-daten im Vordergrund. Einen wichtigen Baustein fürdie Stadt von morgen stellen sogenannte ,,Life Logs“dar. Dabei handelt es sich um die Spuren, die wirbei der Nutzung von Internet, Mobilkommunikationoder ganz allgemein in unserem digitalen Umfeldhinterlassen.

In der Stadt von morgen fallen strukturierte undunstrukturierte Daten an. Dabei können sowohlgroße Datenmengen als auch Datenströme mithohen Datenraten und geringer Speicherdauerauftreten.

Diese großen Datenmengen können und wer-den bereits heute vielfach ausgenutzt, um Profileund Verhaltensmuster zu erkennen und strategi-sche Entscheidungen zu treffen. Positiver Nutzenund potenzieller Missbrauch liegen hier engnebeneinander.

In der Auswertung der Daten liegen große Po-tenziale. Potenziellem Missbrauch der Daten istdurch geeignete Maßnahmen entgegenzuwirken.

Vorhersagetechnikenfür die Stadt von morgen

Um aus den anfallenden Daten smarte Daten zuerzeugen ist der Einsatz mathematisch fundierter

Page 3: Smart Data als Motor für Smart Cities

Analysemethoden und zugehöriger Vorhersagetech-niken erforderlich. Klassische Vorhersagetechnikenberuhen weitestgehend auf statistischen Methoden.Für deren Anwendung ist es erforderlich, dass die,typischerweise aus unterschiedlichen Quellenstammenden, Daten in einem ersten Schritt in eingemeinsames Datenmodell transformiert wordensind. Man versuche beispielsweise aus Wetter-daten verschiedener Wetterstationen die Durch-schnittstemperaturen verschiedener Länder zu ver-schiedenen Jahreszeiten zu vergleichen. Dazu mussman vorbereitend die Rohdaten den Ländern undJahreszeiten zuordnen und dabei die physikalischenMaßeinheiten vereinheitlichen. Anschließend kannman aus diesen Daten mit statistischen Verfahren dieDurchschnittstemperaturen ermitteln.

Das Ergebnis dieser Analyse ist zunächst ein Be-richt, der in der Vergangenheit liegende Ereignissezusammenfassend unter ausgewählten Gesichts-punkten betrachtet (description). Man hätte sichauch für nächtliche Tiefsttemperaturen, Nieder-schlagsmengen oder Sonnenstunden interessierenkönnen. In einer erweiterten Analyse kann man nunversuchen, Zusammenhänge zwischen den gemes-senen Werten zu ermitteln. Hängt beispielsweisedie nächtliche Tiefsttemperatur vom Grad der Be-wölkung ab? Das Ergebnis dieser Analyse ist einDomänenmodell, im Beispiel ein Wettermodell,das Abhängigkeiten zwischen den einzelnen Di-mensionen des Datenmodells beschreibt. Mittelsdieses Modells können im nächsten Schritt Vor-hersagen (prediction) gemacht werden. Wenn zueiner bestimmten Jahreszeit bei klarem Himmeleine Temperatur von x◦ gemessen wird, wie hoch istdie erwartete nächtliche Tiefsttemperatur? ÄhnlichVorhersagen kann mittels Simulation das erwar-tete Verhalten des modellierten Systems berechnetwerden bzw. die Korrektheit des Modells überprüftwerden. Im Folgeschritt können aus dem ModellEmpfehlungen (prescription) abgeleitet werden,die sich auf die berechneten Vorhersagen bezie-hen. Es werden Informationen ermittelt, warumzukünftig etwas passieren kann und wie wir daraufreagieren sollten. Dabei werden nicht nur konsis-tente, in einer zentralen Datenbank gespeicherteDaten ausgewertet, sondern oft widersprüchliche,unvollständige und aus verschiedenen Quellen stam-mende, oft unstrukturierte Daten betrachtet: DieDaten der Stadt von morgen werden als Elementeeines verteilten, logischen ,,data warehouse“ betrach-

tet. Um beim Beispiel Wetter zu bleiben können beider Wahrscheinlichkeit von Nachtfrost bestimmteVorsorgemaßnahmen empfohlen werden. Die Ein-bindung von Wohnstätten in das Sicherheitskonzeptder Stadt ist ein weiteres Beispiel für die Ableitungvon Empfehlungen.

Vorhersagetechniken bestehen allgemein aus derKette: Bericht, Analyse, Modellbildung, Vorher-sage/Simulation,Empfehlung.FürdieAnwendungim Kontext von Smart Cities ist eine vorgeschalteteDatenmodellierung/-veredlung erforderlich.

DieErstellungderbenötigtenModelle istohneDomänenwissen (Fachwissen) nicht möglich.

Die in dem einführenden Beispiel genanntenstatistischen Methoden stellen nur den Grund-stein für Berichte und Darstellungen in Formvon Diagrammen, Cockpits und ähnlichen ausder Tabellenkalkulation bekannten Grafiken dar.Darüber hinaus stellen Assoziationsanalysen undKorrelationsanalysen Verfahren zur Erkennungvon Abhängigkeiten dar. Die Merkmalsextraktiondient der Identifizierung relevanter Einflussgrößen,wodurch wichtige Ursache/Wirkungs-Relationenermittelt werden können. Anomalieerkennung un-terstützt die Identifizierung von ungewöhnlichenDatensätzen, wie sie beispielsweise bei Störungenin Prozessen und Abläufen auftreten und bei derErkennung zugehöriger Angriffe hilfreich sind. Re-gressionsverfahren ermöglichen vorausschauendeVorhersagen kontinuierlicher Größen. Clusteranaly-sen und Klassifikation erlauben die Gruppierungvon Objekten aufgrund von Ähnlichkeiten undPrognosen über die Zugehörigkeit zu derartigenGruppen.

Aus dieser Aufzählung erkennt man, dass dieMathematik eine Vielzahl von Verfahren zur Verfü-gung stellt, die bei der Erzeugung von Smart Datazum Einsatz kommen können. Man erkennt aberauch, dass auf dem Weg vom Bericht zur Empfeh-lung Personen benötigt werden, die diese Werkzeugesinnvoll einsetzen können.

Die Mathematik stellt eine Vielzahl statistischerVerfahren zur Verfügung, die bei Erzeugung vonSmart Data eingesetzt werden können. Dazuist jedoch die Kenntnis der Verfahren, ihrerMöglichkeiten und Grenzen, erforderlich.

Page 4: Smart Data als Motor für Smart Cities

{ SMART DATA

Ein weiteres Anwendungsfeld für analytische Ver-fahren besteht in der Ableitung von Modellen ausvorliegenden Daten. So kann man sich beispiels-weise fragen, ob bestimmte Wetterparameter dazuführen, dass gewisse Phänomene zu beobachtensind. Man messe beispielsweise die Verteilungenvon Temperatur, Luftdruck, Windstärke usw. imAtlantik und untersuche, ob es gewisse Konstella-tionen gibt, die das Auftreten von Wirbelstürmenin Florida oder den Grad des Abschmelzens derPolkappen beeinflussen. Dieses Vorgehen wird alsexplorative Datenanalyse bezeichnet. Es stellt einender wesentlichen Fortschritte beim Einsatz von BigData Technologien dar.

Explorative Datenanalyse unterstützt dieHerleitung von Modellen aus vorhandenenDatensätzen. Die Bewertung der ermittel-ten Modelle ist jedoch ohne Domänenwissen(Fachwissen) nicht möglich.

Aus dieser Zusammenstellung erkennt man, dass esbereits zahlreiche theoretische Konzepte und Ver-fahren gibt, die für die Erstellung von Smart Dataaus polystrukturierten, hochvolumigen Daten undDatenströmen für Vorhersagen eingesetzt werdenkönnen. Eine Herausforderung für die Zukunft be-steht darin, diese Konzepte auf die für smarte Städtecharakteristischen Domänen zuzuschneiden.

Werkzeuge für Smart/Big DataBig Data wird häufig mit Begriffen wie ,,hadoop“,,,map-reduce“, ,,hbase“, ,,pig“, ,,R“, ,,in-memory-computing“, oder NoSQL-Datenbanken verbunden.Eine ausführliche Diskussion dieser Technikenwürde den Rahmen des vorliegenden Artikelsdeutlich sprengen und ist zudem für den tech-nisch Interessierten in einschlägiger Fachliteraturnachlesbar.

Interessant für das Verständnis von Big Data istjedoch die zeitliche und thematische Einordnungdieser Techniken und Werkzeuge. Seitdem es di-gitalisierte Texte gibt, besteht die Anforderung, indiesen Texten nach Begriffen und Themen suchenzu können. Bibliothekare und Anbieter von Fachli-teratur müssen dazu die Texte verschlagworten. Dieso annotierten Texte werden über Indexe effizientdurchsuchbar gemacht. Für diese Aufgabe wur-den als Open Source Lösungen durch die ,,ApacheSoftware Foundation“ Frameworks wie ,,Lucene“

(1997) oder ,,Solr“ bereitgestellt. Die Verschlagwor-tung von Texten im Web ist insbesondere bei derEinbeziehung sozialer Netzwerke ein wesentlicherSchritt bei der initialen Datenveredlung für SmartData. Die Entwickler von Lucene gingen nun einenSchritt weiter und beschäftigten sich mit der Ana-lyse dieser annotierten Daten bzw. allgemein mitder Analyse von Daten mittels Techniken des verteil-ten und parallelen Rechnens. Das Ergebnis dieserArbeiten ist die Apache Open Source Implementie-rung ,,hadoop“ (2008), eine Implementierung desvon Google entwickelten ,,Map-Reduce“-Verfahrenszur Suche in großen Datenmengen. Ergänzt wirddas Suchverfahren durch das Apache Open Source,,Data-Warehouse“-Projekt ,,hive“ zur Datenanalyse,das seinerseits von Facebook entwickelt und vonAmazon erweitert wurde.

Zusammenfassend stellen sich die genann-ten Techniken für Big Data als eine Menge ApacheOpen Source Projekte dar, deren Entwicklung vonUnternehmen wie Google, Amazon und Facebookgetrieben wird. Damit ist jedoch ein Nutzerkreis vonSmart Data Technologien identifiziert, der aufgrundseiner technischen Möglichkeiten und Anforderun-gen klassische Unternehmen Verwaltungen aberauch Smart Cities um Größenordnungen überragt.Inwieweit die entwickelten Techniken trotzdemnutzbringend einsetzbar sind, muss im Einzelfallentschieden werden.

Die Verfahren zur Veredlung und Analysegroßer Datenmengen sind durch Unternehmenwie Google, Facebook oder Amazon entwickelt.Ihre sinnvolle Einsetzbarkeit für klassische Un-ternehmen und Verwaltungen ist im Einzelfallzu prüfen.

Die bislang betrachteten Verfahren eignen sichinsbesondere zur Analyse großer Datenmengen,wobei historisch gesehen ein Schwerpunkt auf an-notierte, textuelle Dokumente gelegt wird. DieseSituation ist typischerweise in sozialen Netzwerkengegeben, wo global betrachtet durch die unter-schiedlichen menschlichen Sprachen eine deutlicheKomplexitätssteigerung zu erkennen ist.

Das zweite Merkmal von Big Data ist die Be-trachtung von Datenströmen. Hier geht es auchum große Datenmengen. Die eigentliche Heraus-forderung besteht jedoch in der Flüchtigkeit derbetrachteten Daten und den quasi Realzeitan-

Page 5: Smart Data als Motor für Smart Cities

forderungen an deren Auswertung. Die bereitserwähnten, parallel arbeitenden ,,Map-Reduce“-Verfahren stellen hier keine befriedigende Lösungdar. Dafür bieten sich die Zusammenführung undtemporäre Speicherung der Daten an. Zu diesemZwecke wurden ,,In-Memory“-Techniken entwickelt.Die Daten werden dabei in einem extrem schnellzugreifbaren Speicher gehalten und dort bis zumAbschluss ihrer Auswertung gespeichert. GroßeHauptspeicher und viele Rechenkerne sind eineHardwarevoraussetzung für den Einsatz derartigerTechnologien.

Weitere Merkmale von Big Data sind dieUnstrukturiertheit, Unvollständigkeit und Wi-dersprüchlichkeit der betrachteten Daten. DieseEigenschaften machen den Einsatz klassischer Da-tenbanken oft unmöglich, da diese zumeist hoheAnforderungen bez. Konsistenz und transaktio-nalem Verhalten stellen. Stattdessen reicht dieUnterstützung einfacher Strukturen ohne strengeKonsistenzanforderungen aus. Das schnelle Le-sen und Schreiben von Daten, wie es bei häufigenDatenänderungen und auswertenden Zugriffenerforderlich ist, steht im Vordergrund. Diesen An-forderungen genügen die NoSQL (Not only SQL)Datenbanken, die zunehmend in Big Data undRealzeit-Anwendungen genutzt werden. Ein typi-sches Beispiel stellt die Apache Open Source Lösung,,HBase“ dar, die auf von Google entwickeltenKonzepten aufbaut.

Zur Analyse hochvolumiger Datenströmewerden spezielle, hochperformante Speicher-techniken benötigt, die in Verbindung mitneuartigen ,,liberalen“ Datenbanken eine fürBig Data geeignete Infrastruktur bilden.

Wie bereits bei der Zusammenstellung von Analy-setechniken ist auch bei Werkzeugen zu erkennen,dass es bereits eine Vielzahl etablierter Produktegibt und deren Nutzung zur Erzeugung von SmartData in den Domänen smarter Städte eine höherePriorität als die Entwicklung neuer Werkzeuge hat.

HerausforderungenDas ,,Window of Opportunity“ für die Einführungvon Smart Data steht weit offen – was hindert uns,Smart Data zu einem bestimmenden Wirtschafts-gut unserer Zeit zu machen? Smart Data leben vonder Extraktion und Integration von Informationen

aus verschiedenen Quellen. In vielen Fällen wer-den öffentlich verfügbare Daten mit privaten Datenkorreliert, um Prognosen und Strategien zu ent-wickeln oder um eigene Vorhersagen und Modellezu bestätigen, zu widerlegen oder miteinander mitdem Ziel der Entdeckung optimaler Lösungen zuvergleichen.

Rechtliche RahmenbedingungenDem Zusammenführen von Daten aus verschie-denen Quellen sind jedoch enge rechtliche undethische Grenzen gesetzt. Die Grundidee der Aus-wertung von Daten aus verschiedensten Quellenwiderspricht fundamental den Prinzipien derZweckbindung bei der Erhebung und Speicherungvon Daten und der Datensparsamkeit. Bundesda-tenschutzgesetz, Telemediengesetz aber auch dieEuropäische Datenschutzrichtlinie definieren einenengen Rahmen für den Einsatz von Smart Big Data,speziell im öffentlichen Sektor. Der Bürger muss alsIndividuum durch Anonymisierung und Pseudo-nymisierung seiner Daten davor geschützt werden,zum gläsernen Bürger zu werden. Seine Identität,Privatsphäre und Reputation müssen vor Mani-pulation durch Dritte geschützt werden. Das Bildeines Bürgers kann von Dritten aus Einzeldatenzusammengebaut und manipuliert werden. Wel-ches Recht auf eine digitale Identität besitzt derBürger in Smart Cities? Wie kann er seine digitaleIdentität und seine Reputation im Netz schüt-zen? Wer darf welche Daten über Dritte ins Netzstellen, die dann allgemein für Analysen und spe-ziell zur Definition des digitalen Ich des Drittenbeitragen?

Der Schutz der Privatsphäre ist ein Fundamentunserer Gesellschaft. Mögliche Einschränkun-gen der Privatsphäre durch Smart Data müssendaher stets im Auge behalten werden und durchzu etablierende Schutzmechanismen vermiedenwerden.

Fehlende StandardisierungSmart Data stellt ebenso wie Big Data ein so jungesKonzept dar, dass noch keine dedizierten Standardsexistieren. Trotzdem gibt es zumindest für Big DataÜberlegungen aus Standardisierungsorganisatio-nen wie DIN/ISO, NIST, OASIS oder TMF, einzelneAspekte wie Abfragesprachen, Sicherheitsschnitt-

Page 6: Smart Data als Motor für Smart Cities

{ SMART DATA

Abb. 1 Referenzmodell für Smart Data

stellen, Einbettung in Cloud-Infrastrukturen oderMetadatenkonzepte auf ihre Standardisierbarkeithin zu untersuchen. Belastbare Ergebnisse sind je-doch frühestens in 2014 zu erwarten. Aktuell sindin der ISO Studiengruppen eingerichtet, die sichsowohl der Standardisierbarkeit von ,,Smart Cities“als auch der Standardisierbarkeit von ,,Big Data“annehmen.

Ein wesentlicher Bestandteil der Standardi-sierungsbestrebungen besteht in der Entwicklungeines Referenzmodells bzw. einer Referenzarchi-tektur. Dieses Modell beschreibt die funktionalenKomponenten eines Big/Smart Data Systems undderen Einbettung in geeignete IKT-Infrastrukturen.Zurzeit existiert eine Reihe von durch unterschied-liche Organisationen entwickelten Modellen, diejedoch bis zu einem gewissen Punkt bereits ähnlicheStrukturen aufweisen.

Grundlage für die Identifikation standar-disierbarer Aspekte von Smart Data ist einumfassendes, allgemein akzeptiertes Referenz-modell in Verbindung mit einer zugehörigenReferenzarchitektur.

Eine akzeptierte Referenzarchitektur isteine Voraussetzung, um die Austauschbarkeitund Interoperabilität der Komponenten eineSmart Data Systems zu ermöglichen.

Die Abb. 1 zeigt ein typisches Referenzmodell,das zur Erzielung eines gemeinsamen Verständ-nisses von Smart Data und zur Identifikation

standardisierbarer Schnittstellen benutzt werdenkann.

Smart Data für die Stadt von morgen –Empfehlungen

Konkretisieren wir zusammenfassend das eingangsbeschriebene Bild der Stadt von morgen: Bürgerkommunizieren untereinander, mit Verwaltungen,Unternehmen oder mit ihrer Umgebung. Dabei hin-terlassen sie bewusst oder unbewusst eine riesigeDatenmenge. Aus dieser können kurzfristige In-teressen der Bürger wie Informationen über dasVorgehen zur optimierten Durchführung ihrerAnliegen befriedigt werden. Trendanalysen las-sen sich für die Verwaltung zur vorausschauendenPlanung von Wohngebieten, Erholungsgebieten,Verkehrsverbindungen, Gewerbeansiedlungen, so-zialen Einrichtungen usw. verwenden. Die spontaneBildung von Interessengemeinschaften, z. B. zurNachbarschaftshilfe, wird deutlich verbessert.

Private und öffentliche Fahrzeuge kommuni-zieren untereinander und mit ihrer Umgebung zurGewährleistung optimaler Verkehrsflüsse, zur Mi-nimierung der CO2-Emission oder zur Vermeidungvon Unfällen. Dabei werden kurzlebige Datenpa-kete ausgetauscht, die akkumuliert und gespeichertAufschluss über typische Verhaltensmuster und de-ren zeitliche Entwicklung geben. Parkplätze könnenbedarfsgerecht zugewiesen werden, der Umstiegvom Individual-Kfz auf den öffentlichen Perso-nennahverkehr kann bedarfsgerecht erleichtertwerden, der Bedarf an neuen Verkehrsverbindungen

Page 7: Smart Data als Motor für Smart Cities

kann frühzeitig ermittelt und kurzfristig befriedigtwerden.

Die Stadt von morgen wird, wie in Abb. 2dargestellt, über einen Regelkreis von Datenkontrolliert und gesteuert.

Im Zuge der Gewinnung erneuerbarer Energienund deren Verbrauch durch Endnutzer kommu-nizieren Sensoren bei Anbietern und Nutzernmiteinander. Die dabei ausgetauschten Datenpa-kete können ebenso akkumuliert und gespeichertwerden, um vorhandene Transportwege op-timal zu nutzen bzw. neue Transportwege zuplanen. Digitalisierte Geo-Informationen überüber- und unterirdisch vorhandene Artefakteerleichtern Planung und Realisierung neuerEnergietrassen. Abgleich und Koordination vonPlanungsdaten unterschiedlicher Verwaltungenführen zu Einsparungen und zur Optimierung beiBauvorhaben.

Sensoren messen Luftverschmutzung, Ozon-Werte, Wasserstände, Windstärke und ähnlicheUmweltgrößen. Angereichert um Informationen vonBürgern vor Ort lassen sich Menschen bei größerenund kleineren Gefahren gezielt informieren undwarnen. Am Beispiel des Erdbebens in Haiti 2010lässt sich zeigen, dass eine gezielte Auswertung vonSatellitenaufnahmen, Bewegungsdaten mobiler End-geräte und sonstiger Sensordaten zu einer effektivenund bedarfsgerechten Einsatzplanung von Hilfskräf-ten und Gütern sowie Versorgung der Bevölkerungführt, die ohne entsprechende IT-Unterstützungnicht vorstellbar ist.

Im Individualbereich kann der Gesundheitszu-stand kranker Bürger durch Sensoren überwachtwerden, sodass im Notfall schnellstmöglich der ambesten geeignete oder örtlich nächste Helfer auf kür-zestem Weg den Kranken erreichen und ihm helfenkann.

Braucht man für dieses Szenario zwangsläu-fig Smart Data? Die ehrliche Antwort ist ,,nein“.Werden die zukünftig vorhandenen Daten jedochgeeignet ausgewertet, so können die beschriebe-nen Nutzungsszenarien schneller, zuverlässigerund in vielen Situationen proaktiv und damitkostensparend umgesetzt werden.

Fraunhofer FOKUS hat auf dem Weg in die Stadtder Zukunft in zahlreichen Projekten Erfahrung-

Abb. 2 Smart Data Regelkreis

en mit datengetriebenen Ansätzen gemacht. DieTrusted Cloud Projekte6 goBerlin MIA und goBerlinbeschäftigen sich mit Informations- und Dienst-marktplätzen in kommunaler Cloud-Infrastruktur,KATWARN7 beschäftigt sich mit der Datenauswer-tung für Katastrophenwarnsysteme, Berlin OpenData8 und GovData9 stellen offene Daten im kom-munalen Umfeld bzw. bundesweit zur Verfügung,FixMyCity10 sammelt Informationen von Bür-gern über öffentlich interessierende Anliegen undsimTD11 entwickelt Konzepte für die sichere undintelligente Mobilität von morgen.

Aus diesen Arbeiten wurde die Erkenntnisgewonnen, dass bereits eine Vielzahl einsatzfä-higer Techniken und Werkzeuge existieren undeine Förderung proprietärer Werkzeuge wenig Er-folg versprechend ist. Der bereits begonnene Wegvon offenen Daten über Big Data hin zu SmartData als Grundlage für die Kontrolle und Steue-rung moderner Städte unter Berücksichtigung vonBürgerinteressen und Konzepten offener Regie-rungsformen sollte konsequent weiter beschrittenwerden. Dazu ist die Identifikation und Förde-rung strategischer Anwendungsszenarien zwingenderforderlich. Aus technischer Sicht ist ein Zusam-menwachsen von Big Data Analyseverfahren mitCloud Infrastrukturen und mobilen Endgerätenerforderlich und sollte daher durch strategischeQuerschnittsprojekte gefördert werden.

6 http://www.trusted-cloud.de/7 http://www.katwarn.de/8 http://daten.berlin.de/9 https://www.govdata.de/10 http://www.fixmycity.de/11 http://www.simtd.de