Visualisierungstechniken zur Analyse zeitlicher Verl aufe...

100
Visualisierungstechniken zur Analyse zeitlicher Verl¨ aufe ¨ uber geografischen Karten Diplomarbeit Universit¨ at Rostock, Fachbereich Informatik vorgelegt von: Christian Tominski, geboren am 14. Juli 1977 in Greifswald Betreuer: Prof. Heidrun Schumann, Dipl.-Inf. Petra Schulze-Wolgast Abgabedatum: 31. M¨ arz 2002

Transcript of Visualisierungstechniken zur Analyse zeitlicher Verl aufe...

Visualisierungstechniken zurAnalyse zeitlicher Verlaufe uber

geografischen Karten

Diplomarbeit

Universitat Rostock, Fachbereich Informatik

vorgelegt von: Christian Tominski, geboren am 14. Juli 1977 in GreifswaldBetreuer: Prof. Heidrun Schumann, Dipl.-Inf. Petra Schulze-WolgastAbgabedatum: 31. Marz 2002

Zusammenfassung

Die Darstellung mehrerer Variablen mit zeitlichen und raumlichen Abhangigkeitenist derzeit offener Forschungsgegenstand. So sind fur die Visualisierung zeitlicherVerlaufe verschiedene Techniken bekannt. Die Verbindung dieser Techniken mit ei-ner Kartendarstellung wurde bisher jedoch nicht erwogen.Daher wird in der vorliegenden Arbeit gerade diese Verbindung genauer untersucht.Am Beispiel von Gesundheitsdaten werden verschiedene Konzepte zur Kombinationder Zeitdarstellung mit Kartenentwickelt. Daruber hinaus erfolgen deren Klassifi-kation, Einordnung und Bewertung, um die problemspezifische Auswahl von Kon-zepten zu ermoglichen.Eines der entwickelten Konzepte ist das der Ikonizifierung und Positionierung, beidem eine verkleinerte Darstellung bekannter Techniken zur Zeitvisualisierung auf ei-ner Karte erfolgt. Dieses Konzept wurde in einem Visualisierungssystem realisiert,das eine Reihe von Darstellungstechniken zur Verfugung stellt und eine effektiveAnalyse der Gesundheitsdaten uber das Internet zulasst.

Abstract

The visualization of time and space dependent data with more than one variableis one of the current research topics in visualization. So there are well known tech-niques for time-series data, but their combination with geographical maps is notexamined well.Addressing this problem the thesis is about visualizing multivariate data in timeand space. By the example of health data several concepts for combining visualiza-tion of time with maps are developed. Furthermore, these concepts are classified andassessed in order to support the selection of eligible concepts for specific applicationscenarios.One of the developed concepts is Iconify and Place, for placing time representingicons on maps. This concept was implemented in a visualization system for Internetuse. One of the key features of the system a set of icons allows an effective visuali-zation health data.

CR-KlassifikationI.3., I.3.6., I.3.8., J.3.

Key WordsVisualization, Visualization System, Multivariate Data, Spatio-Temporal Data,Health Data

Inhaltsverzeichnis

1 Einleitung 5

2 Grundlagen 72.1 Visualisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.1 Allgemeine Bemerkungen . . . . . . . . . . . . . . . . . . . . 72.1.2 Visualisierungspipeline und Visualisierungskonzepte . . . . . 8

2.2 GIS und Computerkartografie . . . . . . . . . . . . . . . . . . . . . . 122.3 Mathematische Beschreibung von Zeitreihen . . . . . . . . . . . . . . 142.4 Grundlegende Bemerkungen zu LandVis . . . . . . . . . . . . . . . . 15

3 Visualisierung zeitabhangiger Daten 163.1 Verschiedene Typen von Zeit . . . . . . . . . . . . . . . . . . . . . . 163.2 Zeitabhangige Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.3 Klassifikation von Zeitdarstellungen . . . . . . . . . . . . . . . . . . 213.4 Visualisierungstechniken fur zeitabhangige Daten . . . . . . . . . . . 25

3.4.1 Zeitdiagramme . . . . . . . . . . . . . . . . . . . . . . . . . . 253.4.2 ThemeRiver [HHN00] . . . . . . . . . . . . . . . . . . . . . . 273.4.3 Kalenderdarstellung [vWvS99] . . . . . . . . . . . . . . . . . 283.4.4 Spiraldarstellung [WAM01] . . . . . . . . . . . . . . . . . . . 303.4.5 Weitere Techniken . . . . . . . . . . . . . . . . . . . . . . . . 323.4.6 Einordnung der Techniken . . . . . . . . . . . . . . . . . . . . 33

4 Visualisierung auf geografischen Karten 354.1 Allgemeine Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . 354.2 Klassifikation von Visualisierungen auf Karten . . . . . . . . . . . . 364.3 Vorstellung einiger Techniken . . . . . . . . . . . . . . . . . . . . . . 40

5 Zeitdarstellung auf Karten 445.1 Statische vs. dynamische Karten . . . . . . . . . . . . . . . . . . . . 445.2 Neue Konzepte zur Zeit- und Kartendarstellung . . . . . . . . . . . . 45

5.2.1 Ikonifizierung und Positionierung . . . . . . . . . . . . . . . . 455.2.2 Verwendung der 3. Dimension als Zeitachse . . . . . . . . . . 475.2.3 Mehrfensterkonzept . . . . . . . . . . . . . . . . . . . . . . . 515.2.4 Adaption von Kalenderdarstellung und Clusterung . . . . . . 54

5.3 Klassifikation von Zeitvisualisierungen auf Karten . . . . . . . . . . . 56

6 Das Visualisierungssystem LandV ist 586.1 Anforderungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586.2 Datenverwaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 606.3 Die Karte in LandV ist . . . . . . . . . . . . . . . . . . . . . . . . . . 65

6.3.1 Laufzeitoptimierung der Kartendarstellung . . . . . . . . . . 656.3.2 Karte als Schnittstelle . . . . . . . . . . . . . . . . . . . . . . 66

3

4 INHALTSVERZEICHNIS

6.3.3 Karte mit Lupe . . . . . . . . . . . . . . . . . . . . . . . . . . 696.4 Visualisierungstechniken . . . . . . . . . . . . . . . . . . . . . . . . . 71

6.4.1 Maximumikone . . . . . . . . . . . . . . . . . . . . . . . . . . 736.4.2 Zeitfluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 746.4.3 Zeitrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 776.4.4 Weitere Ikonen . . . . . . . . . . . . . . . . . . . . . . . . . . 796.4.5 Bewertung der Techniken . . . . . . . . . . . . . . . . . . . . 82

6.5 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

7 Schlussbetrachtung 86

A Die Programmiersprache Java 94

B Richtlinien fur Diagramme 96

Kapitel 1

Einleitung

Durch immer schnellere und leistungsfahigere Hardware ist es heute moglich, Datenin riesigen Mengen aufzunehmen und digital zu speichern. Moderne Datenbank-systeme verwalten mehrere Millionen Datensatze. Gleichzeitig ist durch Verwen-dung solcher Systeme ein schneller Zugriff auf die Daten gewahrleistet. Mit Hilfe soabgelegter Daten kann man Erklarungen fur wissenschaftliche Phanomene finden,Schlussfolgerungen fur weiteres wirtschaftliches Handeln ableiten oder einfach nurhistorische Sachverhalte sichern.

Untersuchungen haben jedoch gezeigt, dass nur ein geringer Teil einmal erfass-ter Daten tatsachlich ausgewertet wird. Dies liegt zum einen an den Kosten einersolchen Auswertung, und zum anderen an dem immensen Volumen der Daten.

Durch die wissenschaftliche Visualisierung wird versucht, die Gewinnung vonErkenntnissen aus großen Datenmengen zu erleichtern. Ziel ist es, die Daten so aufvisuelle Objekte abzubilden, dass sie vom menschlichen visuellen System moglichsteinfach und intuitiv erfassbar sind.

In nahezu allen wissenschaftlichen Bereichen werden heute Visualisierungen ein-gesetzt. Allgemein gelaufige Beispiele sind die Darstellung der Temperaturentwick-lung der Erde als Folge des Treibhauseffektes, die Prasentation der Wettersituationim Fernsehen oder die Wertentwicklungskurven von Aktienkursen, wie sie vielerseitsvon Banken im Internet zur Verfugung gestellt werden. Anhand dieser Beispiele wirdauch klar, dass unterschiedliche Anwendungsgruppen jeweils andere Anforderungenund Zielstellungen an die Visualisierung haben.

Die Moglichkeiten und Chancen der Visualisierung werden auch fur die Auswer-tung von Gesundheitsdaten und zur Information uber die aktuelle Gesundheitssi-tuation genutzt. Die vorliegende Arbeit lasst sich hier einordnen.

Zur Visualisierung lassen sich die durch Krankenkassen, Forschungsinstitute undandere wissenschaftliche Einrichtungen in großem Umfang erhobenen Daten verwen-den. Der hier zu Grunde liegende Datensatz wurde von der AOK geliefert und beruhtauf den Meldungen der Krankschreibungen1. Zu den erfassten Daten gehoren aucheine Gebietskennung und das entsprechende Datum der Krankschreibung. Somithandelt es sich um Daten, die raumliche und zeitliche Abhangigkeiten beinhalten.

Die Visualisierung solcher Gesundheitsdaten war bereits Gegenstand vorherge-hender studentischer Arbeiten am Institut fur Computergrafik. Popp geht in [Pop98]im Besonderen auf die effiziente Auswertung von Datenanfragen ein. Durch Aus-nutzung der in den Daten enthaltenen Hierarchie wird ein Datenstrom erzeugt, derzeit- und platzsparend die fur die Visualisierung notwendigen Daten bereitstellt undsomit deren anschließende Darstellung auf einer Karte uber das Internet ermoglicht.

1Aus datenschutzrechtlichen Grunden mussen die Daten einer Krankmeldung von den personli-chen Daten des Patienten getrennt werden. Fur die Visualisierung liegen die Daten daher in an-onymisierter Form vor.

5

6 KAPITEL 1. EINLEITUNG

Andere Schwerpunkte werden in [Bor99] gesetzt. Dort steht die Prasentation derDaten in Form von Ikonen2 im Vordergrund. Die Internettauglichkeit wird wie auchbei [Pop98] durch die Verwendung der Programmiersprache Java sichergestellt.

Der Schwerpunkt dieser Arbeit liegt auf der Visualisierung von zeitlichen Verlaufenin Abhangigkeit eines geografischen Kontextes. Somit sollen sich durch die Verwen-dung von Visualisierungstechniken auch die Fragen

”Wo ist eine Krankheit aufgetre-

ten?“ (z.B. Ort, Gemeinde, Postleitzahlgebiet, etc.) sowie”Wann ist eine Krankheit

aufgetreten?“ oder”Wie viele Krankheitsfalle traten in einem bestimmten Zeitraum

auf?“ beantworten lassen. Um dies zu erreichen ist es zum einen notwendig, denraumlichen Bezug der Daten sichtbar zu machen, zum anderen muss auch die zeit-liche Dimension berucksichtigt werden. Fur beide Anforderungen existieren derzeitvielfaltige Visualisierungstechniken, die aber in der Regel jeweils nur fur eine derbeiden Aufgaben spezialisiert sind.

Fur die Visualisierung von zeitabhangigen Daten werden vor allem Zeitdiagram-me eingesetzt, die einfach zu handhaben, weit verbreitet und bewahrt sind. Aktuelle-re Techniken, wie z.B. die Spiral-Darstellung aus [WAM01] und der ThemeRiver aus[HHN00] belegen, dass die Analyse bzw. das Sichtbarmachen auch von komplexenZusammenhangen in zeitlich abhangigen Daten heute moglich ist und zunehmendan Bedeutung gewinnt.

Geografische Informationssysteme (GIS) sind Systeme, die raumliche Gegeben-heiten realer oder auch kunstlicher Welten auf Computersystemen wiedergeben (sie-he auch [DZ99]). Besonders hervorzuheben sind ihre verschiedenen Moglichkeitenzur Kartendarstellung. So bieten GIS standardmaßig zweidimensionale Karten sehrguter Qualitat, in vielen Fallen auch dreidimensionale Darstellungen und nicht sel-ten sogar die Erstellung von Kartogrammen an. Sie besitzen ausgepragte Moglich-keiten zur Darstellung nahezu jeder auftretenden geografischen Eigenschaft von Ob-jekten. Einfache Darstellungen von raumlich abhangigen Daten sind ebenfalls ge-geben. Doch hier sind die verfugbaren Techniken noch ausbaufahig. Besonders diegleichzeitige Darstellung mehrerer Parameter ist derzeit noch Gegenstand aktuellerGIS-Forschung.

Die Darstellung zeitabhangiger Daten auf Karten ist bis heute jedoch nur un-zureichend betrachtet worden. Ziel dieser Arbeit ist es deshalb, zu untersuchen,inwieweit sich die verschiedenen Techniken zur Zeitvisualisierung mit der Darstel-lung geografischer Karten kombinieren lassen. Um der Forderung nach intuitiverWahrnehmbarkeit der dargestellten Informationen nachzukommen, sollen neue ef-fektive Techniken entwickelt werden. Diese sind zu klassifizieren und teilweise zurealisieren.

Das Erkennen zeitlicher und raumlicher Zusammenhange — vor allem in Hin-blick auf die Darstellung mehrerer Parameter — ist ein weiteres wichtiges Ziel. Au-ßerdem soll die Karte zur Navigation durch die Daten genutzt werden konnen. Umeine Internettauglichkeit zu sichern, ist die Verwendung der ProgrammierspracheJava gefordert. Der in [Tom01] zur Kartendarstellung entwickelte Prototyp Land-Vis kann als Ausgangspunkt fur die genannten Aufgaben genutzt werden.

2Ikone = grafisches Primitiv, das exakt positioniert werden kann und Datenwerte in Lange,Winkel, Form, Farbe,Transparenz u.a. verschlusselt

Kapitel 2

Grundlagen

In diesem Kapitel sollen grundlegende Begriffe geklart werden. Hierzu werden dieVisualisierung sowie Geografische Informationssysteme (GIS) bzw. die Computer-kartografie kurz eingefuhrt und ein knapper Einblick in die mathematische Beschrei-bung von Zeitreihen gegeben. Die Einfuhrung in die Begriffe der Visualisierungstutzt sich vor allem auf die Angaben in [SM00]. Informationen uber die Grund-lagen von GIS konnen [Bil91], [Ber95] und [DZ99] entnommen werden. Ein guterEinstieg in die Computerkartografie findet man in [KO96]. Ein umfangreiches Werkzur Darstellung raumlicher Daten als Karten und Visualisierung auf Karten stellt[Mac95] dar. Eine umfassende Sammlung von Methoden zur mathematischen Ana-lyse von Zeitreihen ist in [Sti01] und [SS99] zu finden.

2.1 Visualisierung

Von den funf wahrnehmbaren Sinneseindrucken ist der visuelle derjenige, mit demMenschen den großten Teil ihrer Umwelt wahrnehmen. Akustische und haptischeReize sowie der Geruchs- und Geschmackssinn tragen einen wesentlich geringerenAnteil zur Bildung von Umgebungseindrucken bei. Diese Tatsache soll bei der Vi-sualisierung genutzt werden.

2.1.1 Allgemeine Bemerkungen

Das Hauptziel der Visualisierung ist die Abbildung von Daten auf geometrischePrimitive und deren Attribute (Pixel, Linien, Formen, Farben, etc.). Dies soll sogeschehen, dass die Darstellung:

• expressiv,

• effektiv und

• angemessen

ist.Expressiv wird eine Visualisierung genannt, wenn sie ausschließlich die in den

Daten enthaltenen Informationen anzeigt. Die Darstellung darf keine Informatio-nen suggerieren, die nicht in den Daten enthalten sind. Wird die Datenmenge soabgebildet, dass die Wahrnehmungsfahigkeiten des menschlichen visuellen Systemsoptimal ausgenutzt und unterstutzt werden, so ist das Effektivitatskriterium erfullt.Sind daruber hinaus Kosten und Nutzen der Darstellung in einem ausgewogenenVerhaltnis, kann man von einer angemessenen Visualisierung sprechen.

7

8 KAPITEL 2. GRUNDLAGEN

Ob eine Visualisierung den genannten Anforderungen genugt, ist von verschiede-nen Faktoren abhangig. Ein wichtiger Aspekt ist das sogenannte Bearbeitungsziel.Es beschreibt die konkrete Problemstellung, die durch die Verwendung einer Vi-sualisierung gelost werden soll. Die Bearbeitungsziele Identifizieren, Lokalisieren,Anzeigen von Korrelation, Vergleichen oder Anzeigen von Verteilungen sollen hierals Beispiele fur die Visualisierung von Gesundheitsdaten genannt werden. WeitereZiele und deren genaue Beschreibung konnen in [SM00] nachgelesen werden.

Das Umfeld einer Visualisierung, in dem diese eingesetzt wird, ist ebenfalls furihre Eignung entscheidend. Dies liegt an den verschiedenen Nutzergruppen in unter-schiedlichen Anwendungskontexten. Die in dieser Arbeit entwickelten Techniken zurVisualisierung der Gesundheitsdaten sollen vor allem zur Information von Arztendienen, aber auch bei Behorden eingesetzt werden.

Ausgangspunkt fur die Visualisierung ist die Beschreibung der Daten. Hierbeiwird zwischen dem Beobachtungsraum und den Merkmalen unterschieden. Der Be-obachtungsraum reprasentiert den Bezugsraum, in dem die Daten erfasst werden.Deshalb bezeichnet man die Dimensionen des Beobachtungsraumes auch als un-abhangige Variablen, die in Beobachtungspunkten erfassten Daten1 als Merkmaleoder abhangige Variablen. Der konkrete Wert eines Merkmals wird Auspragunggenannt.

Der Beobachtungsraum der untersuchten Gesundheitsdaten enthalt drei Dimen-sionen. Zwei davon beschreiben den raumlichen, eine den zeitlichen Bezug der Da-ten. Gebiete verschiedener raumlicher Auflosungsstufen (Land, Landkreise, PLZ-Gebiete) stellen die Beobachtungspunkte dar. Zu den erfassten Daten2 gehoren dieaufgetretene Krankheit (nominales Merkmal) und die Anzahl der Erkrankungen(quantitatives Merkmal). Diese sind in einem Gebiet gultig; man spricht auch voneinem lokalen Wirkungskreis der Daten.

Je nach Eigenschaften und Strukturierung der Daten werden mehrere Daten-klassen unterschieden. Die betrachteten Gesundheitsdaten gehoren zur Klasse derMultiparameterdaten, da in den Beobachtungspunkten des Beobachtungsraumesmindestens zwei und ausschließlich skalare Merkmale erfasst werden. Weitere Klas-sen, z.B. Volumendaten oder Stromungsdaten, sind in [SM00] ausfuhrlich beschrie-ben.

2.1.2 Visualisierungspipeline und Visualisierungskonzepte

Zur Abbildung der Daten auf Bilder sind mehrere Schritte notwendig. Sie werdennacheinander durchlaufen und als Visualisierungspipeline bezeichnet. Im Einzelnensind dies die Abschnitte Filtering, Mapping und Rendering (vgl. Abb. 2.1).

MappingFiltering Rendering

Abbildung 2.1: Visualisierungspipeline

Der Filtering-Schritt ist eine Daten-zu-Daten-Abbildung, bei der die Ausgangs-daten (Rohdaten) der Visualisierung aufbereitet werden. Hierzu gehort das Ver-vollstandigen bzw. Reduzieren der Datenmenge durch Interpolation bzw. Extrapo-

1Die tatsachliche Art der Datenerfassung (gemessene, berechnete, geschatzte Werte, etc.) istnicht von Bedeutung.

2Hierbei handelt es sich um die tatsachlich fur diese Arbeit zur Verfugung stehenden Daten.Der ursprungliche AOK-Datensatz enthalt wesentlich mehr Parameter.

2.1. VISUALISIERUNG 9

lation, die Bildung von Datenclustern3, das Glatten der Datenmenge mit Filterope-rationen oder das Ableiten bestimmter Kenngroßen (Mittelwerte, Maxima, Minima,etc.) aus den Rohdaten.

Der Mapping-Schritt beinhaltet eine Daten-zu-Geometrie-Abbildung, bei der dieDaten auf geometrische Primitive und ihre grafischen Attribute (Farbe, Helligkeit,Transparenz, etc.) abgebildet werden. Dieser Mapping-Schritt wird als Kernstuckder Visualisierung angesehen. Er hat den großten Einfluss auf die zuvor genanntenGutekriterien Expressivitat, Effektivitat und Angemessenheit.

Der Rendering-Schritt dient letztendlich der Bildgenerierung. Hier werden dieGeometriedaten mit Hilfe ublicher Bildgenerierungsverfahren in Bilddaten uberfuhrt.

Wegen der großen Bedeutung des Mapping-Schrittes fur die Visualisierung solldieser nun genauer betrachtet werden. Hierzu sollen verschiedene Moglichkeiten furdie Daten-zu-Geometrie-Abbildung genannt werden:

• Abbildung auf Position,

• Abbildung auf Große,

• Abbildung auf Helligkeitswert,

• Abbildung auf Musterung oder Textur,

• Abbildung auf Farbe,

• Abbildung auf Richtung oder Orientierung und

• Abbildung auf Form.

Entsprechend der Eigenschaften der abhangigen Variablen sind bestimmte Abbil-dungen besonders geeignet, andere weniger (vgl. [SM00]).

Die Abbildung von Daten auf Farben hat sich als ein fur die Visualisierungbesonders wichtiges Instrument herausgestellt. Dies liegt zum einen an der Fahigkeitder spontanen Farbwahrnehmung des Menschen, zum anderen an dem zusatzlichenFreiheitsgrad der durch die Definition von Farbe zur Verfugung steht4.

Eine Zusammenfassung mehrerer der genannten Abbildungen erfolgt bei iko-nenbasierten Techniken. Eine Ikone ist ein exakt positionierbares grafisches Pri-mitiv, das mehrere Merkmale in geometrischen Charakteristiken (z.B. Lange oderForm) bzw. in Darstellungsattribute (z.B. Farbe oder Textur) verschlusselt. Bei-spiele hierfur sind die Chernoff-Ikone, die Kreispalette oder der Data-Jack (siehe[SM00]).

Ikonen stellen eine adaquate Moglichkeit zur Visualisierung von Multiparame-terdaten dar. Außerdem erlauben ihre Eigenschaften das Platzieren auf Karten,was sie zu einem interessanten Ansatzpunkt zur Kombination von raumlicher undzeitlicher Darstellung macht.

Im Folgenden sollen weitere Visualisierungskonzepte erlautert werden, die imKontext dieser Arbeit von Interesse sind. Nahere Informationen zu den vorgestelltenKonzepten und deren Anwendungen sind z.B. in [Spe01], [SM00] oder auch [Ras97]zu finden.

3In Clustern werden mehrere Datenwerte nach unterschiedlichen Kriterien zusammengefasst.Dies ist besonders bei großem Datenumfang sinnvoll.

4Fur genauere Ausfuhrungen zur Abbildung auf Farbe, zur Verwendung unterschiedlicher Farbs-kalen sowie zu den beim Farbmapping auftretenden Problemen sei auf [Bre99] und [SM00] verwie-sen.

10 KAPITEL 2. GRUNDLAGEN

Ubersicht&Detail und Fokus&Kontext

Bei der Visualisierung sehr großer Datenmengen entstehen Bilder, deren Darstellungim Allgemeinen mehr Platz benotigt, als auf einem grafischen Ausgabegerat, wiez.B. einem Monitor oder einem Display eines Kleinstcomputers, zur Verfugung steht.Somit kommt stets nur ein Teil der gesamten Bildinformation zur Anzeige, was demBenutzer keinen ausreichenden Einblick in die Daten gewahrt. Durch Skalierung(Verkleinerung) der Bilder wurden sie als Ganzes darstellbar sein. Hierbei gehenjedoch Details der Bildinformation mangels genugend hoher Auflosung verloren,oder aber sie werden in der Darstellung so klein, dass sie vom Benutzer nicht mehrerkannt werden konnen.

Aus dieser Problembeschreibung ergeben sich zwei Anforderungen an die Dar-stellung von Visualisierungen:

1. Forderung nach Darstellung der gesamten Daten, um einen Uberblick zugewahrleisten

2. Forderung nach detaillierter Darstellung, um Feinheiten der Visualisierungs-ergebnisse erkennen zu konnen

Abbildung 2.2: Darstellung umfangreicher BildinformationLinks ist die Realisierung des Ubersicht&Detail-Konzeptes eines Routenplaners zu sehen.

Auf der rechten Seite ist die Darstellung eines Stadtplans mittels”Rechteckigem Fish Eye

View“ aus [Jes00] abgebildet (Fokus&Kontext-Konzept).

Um beide Forderungen erfullen zu konnen, gibt es unterschiedliche Losungsvor-schlage.

Ubersicht&Detail-Konzept: Hierbei wird in getrennten Bereichen der Anzei-ge zum einen eine detailreiche Darstellung der Daten und zum anderen ei-ne Ubersichtsdarstellung angeboten. Dadurch kann es jedoch zu Verdeckun-gen zwischen Detail und Ubersicht kommen oder aber der Anzeigeplatz kannnicht optimal genutzt werden. Deshalb werden immer haufiger semitranspa-rente Darstellungen genutzt, die ein komplettes Verdecken von Informationenverhindern. Besonders im Bereich der Kartendarstellung (z.B. Routenplaner)ist die Verwendung von Ubersichtskarten beliebt. Der so entstandenen Erwar-tungshaltung der Benutzer zum Vorhandensein solcher Funktionalitat (sieheauch [Bal88], [Sta94]) sollte auf jeden Fall Rechnung getragen werden.

Fokus&Kontext-Konzept: Das Verbinden von detaillierter Darstellung (Fokus)mit der ganzheitlichen Darstellung der Daten (Kontext) in nur einem Bild ist

2.1. VISUALISIERUNG 11

Ziel von Fokus&Kontext-Techniken. Der den Benutzer besonders interessie-rende Bereich der Daten wird vergroßert detailliert dargestellt (Fokus), derRest der Daten wird so verkleinert, dass sie vollstandig, aber stark verein-facht angezeigt werden konnen. Viele moderne Visualisierungen haben dasFokus&Kontext-Konzept aufgegriffen und konnen daher den verfugbaren An-zeigeplatz optimal ausnutzen. Techniken wie

”Magic Eye View“ und

”Rechte-

ckiger Fish Eye View“ (entwickelt am Fachbereich Informatik der UniversitatRostock) sowie

”Table Lens“ und

”Star Tree“ (Firma Inxight Inc.) sollen als

Beispiele fur die Verwendung des Fokus&Kontext-Konzeptes genannt werden.

Fur die Visualisierung zeitabhangiger Daten auf geografischen Karten kommenbeide Vorgehensweisen in Betracht. Eine Beschrankung auf nur eines der Konzepteist nicht ratsam. Vielmehr ist in Abhangigkeit der konkreten Anforderungen ab-zuwagen, welches Konzept den Anwender bestmoglich unterstutzt.

Ereignisorientierte Visualisierung

Verandert sich die grafische Reprasentation der Daten automatisch uber die Zeit beibestimmten, aus den Daten ableitbaren Ereignissen, so spricht man nach [SM00] vonereignisorientierter Visualisierung. Voraussetzung hierfur ist ein in den zu visuali-sierenden Daten vorhandener Zeitbezug und die Ausnutzung . Desweiteren mussenfur die jeweiligen Daten adaquate Ereignisse genau spezifiziert werden, um die Dar-stellung optimal anpassen zu konnen.

Wahrend der Visualisierung wird das Eintreten von Ereignissen dann derartzur Veranderung der Darstellung genutzt, dass der Anwender sie sofort wahrnimmtund auch eine Assoziation zur Art des konkreten Ereignisses moglich ist. Hierzukommt die Veranderung verschiedener geometrischer Primitive und deren Attribute(Anderung der Farbskala) in Frage sowie z.B. die automatische Festlegung einerFokusregion oder Anderung der Informationsauflosung.

Weitere Untersuchungen zu diesem interessanten, noch relativ jungen Konzeptkonnten in in der Praxis zur verstarkten Nutzung der ereignisorientierten Visuali-sierung beitragen.

Semantischer Zoom

Semantischer Zoom wird ein Konzept genannt, bei dem nicht die grafische Darstel-lung (also nicht die Bilddaten) vergroßert wird, sondern der Auflosungsgrad der zuGrunde liegenden Daten erhoht wird. Hierzu kann sich nach [Spe01] die Darstellungder Visualisierung vollstandig andern. Das heißt z.B., dass zu einer symbolischenDarstellung nach einem Zoomschritt Annotationen eingeblendet werden und nacheinem weiteren von der symbolischen zu einer fotorealistischen Reprasentation ge-wechselt wird.

Abbildung 2.3: Darstellung verschiedener semantischer ZoomstufenVon links nach rechts sind verschiedene Auflosungsstufen der raumlichen Daten abgebildet.

Hierbei wird der Unterschied zum”normalen“ Zoom deutlich: Die Große der Darstellung

andert sich nicht, wohl aber der Informationsgehalt.

12 KAPITEL 2. GRUNDLAGEN

Der semantische Zoom bietet sich besonders bei Daten an, die hierarchischeStrukturen enthalten. Fur die in dieser Arbeit betrachteten Gesundheitsdaten sindsolche vorhanden. Zu ihnen zahlen zum einen die raumliche Hierarchie5 (siehe Abb.2.3 und [Tom01]) und zum anderen eine Hierarchie in der Zeit (vgl. Abschnitt3.1). Weiterhin sind auch die Krankheiten in einer hierarchischen Struktur, demsogenannten ICD9-Baum, gespeichert.

2.2 GIS und Computerkartografie

Der Begriff Geografisches Informationssystem wurde nach [Bil91] bereits 1963 vonR.F. Tomlinson bei der Erstellung eines computergestutzten Informationssystemsmit Raumbezug eingefuhrt. Hiermit wurde erstmals auf die Einfuhrung einer neu-en Technik — der EDV — bei der Verwaltung raumbezogener Daten bzw. derKartografie hingewiesen. In [Bil91] wird ein GIS als ein aus den vier Komponen-ten Hardware, Software, Daten und Anwendern bestehendes System angesehen, mitdem raumbezogene Daten digital erfasst, gespeichert, reorganisiert, modelliert sowiealphanumerisch und grafisch prasentiert werden konnen.

Durch die rasante Entwicklung in den Bereichen Hardware, Software und Grund-lagenforschung kann heute auf eine große Anzahl von kartografischen Funktionen inGIS zuruckgegriffen werden, die den Umgang mit raumbezogenen Daten erheblicherleichtern. Die Vorteile der Computerbenutzung liegen klar auf der Hand: SindDaten erst einmal erfasst worden und digital gespeichert, lassen sich hiervon vie-le verschiedene, auf die jeweiligen Anforderungen zugeschnittene Karten erstellen.Gleichzeitig sind umfangreiche Analysen der Daten sowie das Berechnen von Nach-barschaften, Entfernungen, kurzesten Wegen etc. moglich.

Nach [DZ99] zeigt sich die Abgrenzung von GIS zur Computerkartografie ledig-lich in der unterschiedlichen Gewichtung von Datenanalyse bzw. Datenprasentation.Die Auswertung von Anfragen an raumbezogene Daten und somit ihre Analyse ste-hen bei GIS im Vordergrund. Softwaresysteme zur Prasentation solcher Daten unddamit zur Erstellung digitaler Karten werden eher dem Bereich Computerkartogra-fie zugeordnet. Schwerpunkt der vorliegenden Arbeit ist die Prasentation zeitlicherVerlaufe auf Karten. Somit lasst sie sich dem Bereich der Computerkartografie zu-ordnen.

Die fur diese Arbeit interessanten Konzepte aus dem Bereich GIS und Compu-terkartografie sollen im Folgenden vorgestellt werden.

Rastermodell vs. Vektormodell

Im Rastermodell werden Flachen auf regelmaßige Zellen abgebildet. Jede Zelle isthierbei Trager genau einer Informationseinheit. Die in der Computergrafik bekann-ten Techniken zur Speicherung von Rasterdaten werden analog oder leicht angepasstauch in Raster-GIS verwendet. Der Vorteil des Rastermodells liegt in der Geschwin-digkeit, mit der raumliche Analysen durchgefuhrt werden konnen. Der Nachteildieses Modells ist jedoch der in Abhangigkeit der Auflosung der Daten immenseSpeicherplatzbedarf.

Das Vektormodell hingegen lasst neben einer Vielzahl von Berechnungen auchdas vergleichsweise sparsame Ablegen von geografischen Daten zu. Hier werdenraumliche Beziehungen durch geometrische Objekte in einem kartesischen Koordi-natensystem beschrieben. Diese Objekte sind Punkte, Linien und Flachen, die sichmit zwei unterschiedlichen Verfahren speichern lassen (vgl. Abb. 2.4):

5Hier ist das Land Mecklenburg-Vorpommern unterteilt in Landkreise, die wiederum in Post-leitzahlgebiete gegliedert sind.

2.2. GIS UND COMPUTERKARTOGRAFIE 13

Spaghetti-Verfahren: Hier werden Objekte als Folgen von Punkten beschrieben.Entscheidendes Merkmal von Spaghetti-Daten ist das Fehlen topologischerBeziehungen zwischen den Objekten.

Topologisches-Verfahren: Hier werden bei der Beschreibung von Objekten de-ren raumliche Beziehungen mit berucksichtigt. Mittels sogenannter Kanten-Knoten-Datenstrukturen lassen sich kartografische Daten optimal verwalten.

AA AA

A = [(8,8); (12,9); (30,11); ...; (8,8)]

B = [(8,8); (6,4); ...; (8,8)]

A = [L1; L2; L3; L4]]

B = [L1;L8;L9;L22; ...]]

BB BB

L1 = [P1; (12,9); (30,11); ...; P2]]

L4 = [...; P1]]

P1 = (8,8)

P2 = (22,34)

Topolo

gisch

Spag

het

ti

Abbildung 2.4: Spaghetti- und Topologisches-VerfahrenBeim Spaghetti-Verfahren werden Gebiete als Folge von Koordinatenpaaren gespeichert.

Bei topologischer Speicherung wird hierfur eine Kanten-Knoten-Datenstruktur verwendet.

In dieser Arbeit werden Daten im lvis-Format verwendet. Dies sind Vektordaten,die unter Verwendung eines topologischen Verfahrens erstellt wurden (vgl. Abschnitt2.4).

Layerkonzept

Um aufgabenspezifische Karten erstellen zu konnen, hat es sich durchgesetzt, the-matisch verschiedene Objekte auf separaten Layern6 abzulegen. Fur die Darstellungder Karte werden die einzelnen Layer dann, ahnlich wie es bei Folien moglich ist,ubereinander angezeigt (vgl. Abb. 2.5a). Durch diese Art der Prasentation wird dasGesamtbild komponiert.

Gewässer

Straßennetz

Ortschaften

Gesamte Karte

++

++

==

2000

1950

1900

Gesamte Karte

++

++

==

a) b)

Abbildung 2.5: Layerverfahrena) mit thematischen Karten; b) zur Visualisierung zeitabhangiger Daten (hier die Darstel-

lung der Entwicklung der Ausdehnung eines Siedlungsgebietes)

Eine weitere Einsatzmoglichkeit dieses Konzeptes ist die Erstellung von Lay-ern unterschiedlicher Generalisierungsstufen7. So kann durch automatische Auswahl

6Layer = Ebene7geografische Generalisierung = Vereinfachung der Daten, Reduzierung der Datenmenge

14 KAPITEL 2. GRUNDLAGEN

entsprechender Layer die adaptive Anpassung der Darstellung fur unterschiedlicheZoomstufen erreicht werden.

Die direkte Anwendung des Layerkonzeptes fur die Kartendarstellung ist imRahmen dieser Arbeit nicht notwendig, da nur ein Thema verwendet wird — die

”Gebietsgrenzen“. Eine interessante Nutzung der Layertechnik konnte sich jedoch

im Kontext der Zeitdarstellung ergeben. So ließen sich z.B. die Visualisierungenmehrerer Zeitpunkte auf verschiedenen Layern zu einer vergleichenden Darstellungkombinieren (vgl. Abb. 2.5b).

Inwieweit die vorgestellten und weitere Konzepte aus dem Bereich GIS undComputerkartografie in der Visualisierung genutzt werden konnen, ist momentanauch Gegenstand von Untersuchungen in [Pol02].

2.3 Mathematische Beschreibung von Zeitreihen

In [SS99] werden Zeitreihen aus statistischer Sicht betrachtet. Zeitreihen sind hierStichproben, das heißt wiederholte Beobachtungen einer Große, die unter identi-schen Bedingungen gewonnen wurden. Hierbei ist die Reihenfolge der Beobachtun-gen entscheidend fur die Analyse der Zeitreihen. Nach [SS99] wird eine Zeitreihewie folgt definiert:

Definition 1 (Zeitreihe) Eine (zeitlich) geordnete Folge (xt)t∈T von Beobachtun-gen einer Große wird als Zeitreihe bezeichnet. Fur jeden Zeitpunkt t einer MengeT von Beobachtungszeitpunkten liegt dabei genau eine Messung vor.

Im Allgemeinen ist die (nach [SS99]) sogenannte Parametermenge T eine endli-che, diskrete Menge von gleichabstandigen Zeitpunkten, die durchnummeriert wer-den: T = 1, 2, . . . , N . Es sind jedoch auch Beobachtungen zu unregelmaßigen Zeit-punkten sowie das Betrachten von kontinuierlichen oder theoretisch unendlichenZeitreihen moglich.

Aus einer eher okonomischen Betrachtungsweise resultiert das traditionelle Zeit-reihen-Komponentenmodell. Nach [Sti01] setzt sich eine Zeitreihe aus den folgendenvier Komponenten zusammen:

Trendkomponente: Der Verlauf der Trendkomponente Tt wird als durch langfris-tig wirkende Ursachen bedingt angesehen. Im Allgemeinen wird unterstellt,dass sie monoton wachst (z.B. auf Grund steigender Bevolkerungszahlen) odermonoton fallt (z.B. als Folge technischen Fortschritts).

Zyklische Komponente: Der Konjunkturzyklus wird durch die zyklische Kom-ponente Zt wiedergegeben. Deshalb geht man hier von einer

”wellenformigen

Bewegung“ aus.

Saisonkomponente: Der ebenfalls”wellenformige“ Verlauf der Saisonkomponente

St geht auf jahreszeitliche oder institutionelle Ursachen zuruck.

Irregulare Komponente Die irregulare Komponente Ut fasst alle durch die vor-herigen Komponenten nicht erfassten Einflusse zusammen. Im Verhaltnis zuTt, Zt und St ist Ut relativ klein und schwankt um den Wert Null.

Diese Komponenten lassen sich additiv uberlagern

xt = Tt + Zt + St + Ut

oder als multiplikative Verknupfung

xt = TtZtStUt

2.4. GRUNDLEGENDE BEMERKUNGEN ZU LANDVIS 15

auffassen, wobei Ut allerdings um den Wert Eins schwanken muss. Durch Logarith-mierung kann jedoch die multiplikative Verknupfung auf eine additive Uberlagerungzuruckgefuhrt werden.

Auch bei den vorliegenden Gesundheitsdaten lassen sich diese Komponentenfeststellen. So ist z.B. auf Grund verbesserter Behandlungsmethoden ein langfristigrucklaufiger Trend fur bestimmte Krankheiten erkennbar. Daruber hinaus lassensich mit dem Auftreten der

”Wintergrippe“ sowie dem Einschleppen von Viruser-

krankungen aus dem Ausland Beispiele fur die Saison- und die irregulare Kom-ponente finden. Das Auftreten vieler Neuerkrankungen an Wochenanfangen undwenigen an Wochenenden kann man der zyklischen Komponente zuordnen.

Mit mathematischen Methoden werden Zeitreihen verschiedenen Untersuchun-gen oder Berechnungen unterzogen. Diese sollen hier nicht weiter vertieft, sondernnur genannt werden: Bestimmung empirischer Momente (z.B. Varianz, Autokorrela-tion), Feststellung von Trends und deren Eliminierung aus der Zeitreihe, Ermittlungvon Periodizitaten, Bildung moglichst zuverlassiger Vorhersagen, etc.. Fur eine um-fassende Einfuhrung in das Gebiet der Zeitreihenanalyse sei auf die bereits zitiertenWerke [SS99] und [Sti01] verwiesen. Praktische Anwendungsbeispiele sind z.B. in[AK99] zu finden.

2.4 Grundlegende Bemerkungen zu LandVis

Zur Visualisierung von Gesundheitsdaten wurde am Institut fur Computergrafik einVektordatensatz Mecklenburg-Vorpommerns zur Darstellung der Karte verwendet([Got97], [Pop98] und [Bor99]). Dieser enthielt die Beschreibung der Gebiete furunterschiedliche raumliche Granularitatsstufen als

”Spaghetti“-Daten.

In [Tom01] ist untersucht worden, inwieweit sich durch Verwendung eines topo-logischen Verfahrens Verbesserungen der Datenhaltung und der Kartendarstellungerreichen lassen. Diese Untersuchungen fuhrten zur Entwicklung des lvis-Formates.Es beruht auf der Zerlegung der Kartengeometrie in Hotpoints, Polylines, Polygo-ne und Areas. Durch Festlegung von Eltern-Kind-Beziehungen zwischen den Areaswird die Kartendatenhierarchie beschrieben. Das lvis-Format sichert eine redun-danzfreie und konsistente Speicherung der Daten. Aus diesem Grund wird auch furdiese Arbeit der in [Tom01] entstandene und im Rahmen des TeCoMed-Projektesaktualisierte Datensatz der Gebiete Mecklenburg-Vorpommerns eingesetzt.

Der Prototyp LandVis dient zur Darstellung von Kartendaten im lvis-Format.Um den beim Einsatz von Ubersichtskarten und Detailfenstern auftretenden Nach-teil der Verdeckung einzelner Kartenteile zu minimieren, wurden semitransparenteDarstellungen entwickelt. Weiterhin sind in [Tom01] verschiedene Strategien zurPositionierung eines Detailfensters vorgestellt worden, um die Analyse raumlichabhangiger Daten zu unterstutzen.

Neben den ublichen Interaktionen zur Anpassung der Kartendarstellung (z.B.Zoom, Verschieben) sind in LandVis Navigationsmoglichkeiten zur Bewegung durchdie Kartendatenhierarchie realisiert worden.

Der Prototyp LandVis wurde so entwickelt, dass er leicht als Komponente inandere Systeme integriert werden kann. So kam er z.B. im Rahmen des TeCoMed-Projektes zum Einsatz und soll auch hier als Ausgangspunkt fur die Kartendarstel-lung genutzt werden.

Kapitel 3

Visualisierung zeitabhangigerDaten

Die Visualisierung zeitabhangiger Daten ist Gegenstand dieses Kapitels. Zunachstwerden unterschiedliche Modelle der Zeit kurz vorgestellt. Auf eine Beschreibungzeitabhangiger Daten aufbauend werden anschließend spezielle Visualisierungstech-niken erlautert.

3.1 Verschiedene Typen von Zeit

Um fur das Verstandnis unterschiedlicher Typen von Zeit zu sensibilisieren, fuhrtFrank in [Fra98] interessante Beispiele auf. Man stelle sich verschiedene Sportartenvor. Wahrend beim Laufen die Zeit vom Kommando

”Start“ bis zum Uberschreiten

der Ziellinie durch den Sportler gemessen wird, beginnt die Messung im Rennsportbeim Uberfahren der Startlinie und endet mit der Zieldurchfahrt. Im ersten Fallspielt die Reaktionszeit des Athleten eine Rolle, wahrend sie dies im zweiten Fallnicht tut. Die Zeiten des Laufers und des Rennfahrers konnen wegen der unter-schiedlichen zu Grunde liegenden Regeln nicht verglichen werden. Ahnliche Unter-schiede ergeben sich bei der Betrachtung der Spiellangen im Handball (hier stopptdie Uhr nach Spielunterbrechungen durch den Schiedsrichter) und Fußball (hier istdies nicht der Fall). Dieses Beispiel zeigt, dass ganz selbstverstandlich mit verschie-denen Typen von Zeit umgegangen wird, ohne sich dessen bewusst zu sein. NachFrank ist ein einzelnes Zeitmodell nicht in allen Situationen einsetzbar. Besondersdie Anpassung des abstrakten mathematischen Zeitmodells an die exakte Semantikeines realen Geschehens ist nicht immer einfach.

Aus diesem Grund stellt Frank in [Fra98] eine Taxonomie der Zeit auf. Dieseerhalt er durch schrittweise Unterteilung nach folgenden Kriterien:

1. Ein Kriterium ist die Art, wie zeitliche Objekte (nach [Fra98] auch Ereig-nisse genannt) aufgefasst werden: als abstrakte Zeitpunkte, die keine Dauerbesitzen, oder aber als Intervalle, die zwischen zwei Ereignissen liegen.

2. Eine zweite Unterscheidung resultiert aus der Interpretation des Zeitfort-schritts. Hier unterscheidet man: lineare Zeit (Ereignisse treffen auf einer ausder Vergangenheit in die Zukunft reichenden Zeitachse ein) und zyklische Zeit(Ereignisse auf einem sich wiederholenden Zyklus).

3. Die Betrachtung von Ereignissequenzen fuhrt zur Unterteilung der zu Grundeliegenden Zeitachsen in solche mit ordinaler und kontinuierlicher Skala. Fur

16

3.1. VERSCHIEDENE TYPEN VON ZEIT 17

ordinale Zeitskalen ist auf Grund definierter Relationen ein Ordnen von Ereig-nissen moglich, wahrend fur kontinuierliche auch quantitative Aussagen (z.B.Differenz zwischen zwei Ereignissen) gemacht werden konnen.

4. Der letzte Gesichtspunkt fuhrt zu einer Einteilung in Abhangigkeit der Art,wie Zeit gesehen bzw. beobachtet wird. Betrachtet man von einem einzelnenBlickpunkt eine Reihe von Ereignissen, wobei alle in Relation miteinanderstehen, so spricht man von geordneter Zeit. Als teilweise geordnet hingegenbezeichnet man Modelle, bei denen von mehreren Beobachtern ausgegangenwird, wobei nicht alle Ereignisse miteinander in Relation stehen. Ist die Sichtauf verschiedene zukunftige Varianten gerichtet, von denen aber nur eine ein-tritt, so spricht man von Verzweigung. Abschließend ist noch die Klasse dermehrfachen Perspektiven zu nennen, bei der mehrere zeitliche Zustande par-allel existieren konnen.

Einzel−

wahrnehmung

Kontinuierliche Zeit

linear

zyk−

lisch

ordinal

kontinuier−

lich

ordinal

kontinuier−

lich

geordnet verzweigtmehrfache

Perspektiven

Zyklische Zeit

Verzweigte

Zeit

teilweise

geordnet

Mehrfach−

wahrnehmung

Zeit mit

mehrfachen

Perspektiven

Abbildung 3.1: Zeittaxonomie nach [Fra98]

Zur Verdeutlichung ist in Abbildung 3.1 die Einteilung der Zeit nach den Krite-rien 2., 3. und 4. dargestellt. Auf einige der so gebildeten Klassen von Zeit soll imFolgenden kurz eingegangen werden. Die genaue Beschreibung aller Klassen FranksTaxonomie der Zeit sollte der interessierte Leser [Fra98] entnehmen.

Einzelwahrnehmung: Diese Klasse von Modellen deckt weitestgehend die deralltaglichen Wahrnehmung von Zeit ab. Sinneseindrucke werden nacheinan-der wahrgenommen und treten in einer linearen Reihenfolge auf. Fur zweiZeitpunkte A und B gilt dann genau eine der Relationen

”vorher“ (A < B)

oder”nachher“ (A > B) (vollstandige Ordnung). Durch die Einfuhrung der

Relation”gleichzeitig“ (A = B) (Modell mit Gleichheit), mit der auch

”vorher

oder gleichzeitig“ (A ≤ B) und”nachher oder gleichzeitig“ (A ≥ B) ableit-

bar sind, lassen sich weitere zeitliche Wahrnehmungen beschreiben. Weiterhintrennt man Modelle mit strikter Gleichheit und solche mit Gleichheit mitToleranz. Die exakte Beschreibung der Relationen und ihrer Bildung mittelsAxiomen ist in [Fra98] nachlesbar.

Kontinuierliche Zeit: Die Modelle dieser Klasse aus Franks Taxonomie werdenin physikalischen und allen an die Physik angelehnten wissenschaftlichen An-wendungen am haufigsten benutzt. Hier versteht man Zeit als kontinuierlichfließenden Strom. Zwischen zwei beliebigen Ereignissen A und B mit A < Blasst sich stets ein weiteres Ereignis I einfugen, sodass gilt A < I < B.Durch Einfuhrung eines Toleranzwertes ε sind die Modelle mit kontinuierli-cher Zeit noch zu vereinfachen. Danach werden zwei Ereignisse A und B alsgleich angesehen, wenn sie sich um einen Wert kleiner als ε unterscheiden(|A−B| < ε⇐⇒ A = B). Die meisten Berechnungen, die mit reellen Zahlen

18 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

moglich sind (z.B. Bestimmung von Differenzen oder Mittelwerten), lassensich konzeptuell auf die kontinuierliche Zeit ubertragen.

Zyklische Zeit: Naturliche Zyklen, wie sie in der Natur auftreten, bilden die his-torische Grundlage der Zeitmessung. Die Jahreszeiten, die auch einen großenEinfluss auf die untersuchten Gesundheitsdaten haben, stehen hier beispiel-haft fur eine Menge weiterer zyklischer Phanomene. Ordnungsrelationen, wiesie in anderen Modellen verwendet werden, sind hier ohne Bedeutung, da hierjedes Ereignis

”vor“ und

”nach“ einem anderen liegt.

Fur die Visualisierung von zeitabhangigen Gesundheitsdaten sind Modelle mitkontinuierlicher Zeit von großtem Interesse. Hierbei hat allerdings eine Diskretisie-rung der Zeit zu erfolgen. In Abhangigkeit der Visualisierungsziele bietet sich dieInterpretation der Gesundheitsdaten unter Verwendung eines linearen oder zykli-schen Zeitmodells an. Aus dieser Interpretation resultiert die Anwendung verschie-dener Techniken zur Darstellung, z.B. als Zeitdiagramm oder Spiraldarstellung (vgl.Abschnitt 3.4).

Abschließend soll ein weiteres, fur die Visualisierung von Gesundheitsdaten sehrinteressantes Modell vorgestellt werden, das ebenfalls eine vorhergehende Diskreti-sierung voraussetzt — das hierarchische Modell (in [Fra98]: Container Time).

Jahr

Monate

Tage

Jahr

Monate

Wochen

a)

b)

Abbildung 3.2: Hierarchische Zeita) Die Grenzen der Intervalle niedriger Auflosung decken sich mit den Grenzen hoherer

Auflosungen.; b) Die Wochenanfange und -enden passen nicht auf die Begrenzungen der

Monate und Jahre (rote Kreismarkierung).

Hierarchisches Modell: Erfolgt eine Diskretisierung der Zeit mit unterschiedli-chen Genauigkeiten und so, dass großere Auflosungen vielfache von geringerenAuflosungen sind, lassen sich hierarchische Einteilungen der Zeit bilden.

Alltagliche Beispiele hierfur sind die Einteilung des Jahres in Quartale, Mona-te und Tage oder die Einteilung einer Stunde in Minuten und Sekunden. BeideBeispiele stellen eindeutige Hierarchien dar. Mit der Unterteilung eines Jahres inMonate, Wochen und Tage hingegen erhalt man eine nicht eindeutige, da die Mo-natsanfange bzw. -enden im Allgemeinen nicht exakt mit Wochenanfangen oder-enden zusammenfallen. Gleiches gilt entsprechend auch fur Quartale und Jahre inZusammenhang mit Wochen. In Abbildung 3.2 wird dies deutlich.

Mit dem hierarchischen Modell bieten sich neue Moglichkeiten der Visualisie-rung an. Durch die Verwendung des semantischen Zooms kann eine effizientere undangemessenere Auswertung der Daten gewahrleistet werden.

3.2. ZEITABHANGIGE DATEN 19

Neben verschiedenen Zeitmodellen beschreibt Frank eine Vielzahl bekannter Re-lationen fur zeitliche Objekte. Es ware interessant zu untersuchen, inwieweit sichdiese Relationen zur Spezifikation von Ereignissen fur ereignisorientierte Visuali-sierungstechniken verwenden lassen. In Abbildung 3.3 sind zusammenfassend einigeder Relationen skizziert.

vorher/nachher:

folgend:

überlappend:

gleichzeitig:

anfangend:

endend:

während:

Abbildung 3.3: Relationen zwischen Zeitintervallen nach [All83] (aus [Fra98])

Aus der Verwendung unterschiedlicher Zeitmodelle ergeben sich viele Problemeund Fragestellungen bezuglich der Interpretation der Zeit, auf die in dieser Arbeitnicht eingegangen werden soll. Der interessierte Leser sei daher unter anderem aufdie detaillierten Ausfuhrungen in [Sho88] verwiesen.

3.2 Zeitabhangige Daten

Um die Begriffe Zeitpunkt und Zeitintervall fur diese Arbeit eindeutig festzulegen,sollen zwei Definitionen folgen:

Definition 2 (Zeitpunkt) Die Werte, die auf einer geordneten Zeitachse liegen,sollen Zeitpunkte genannt werden.

Zwischen zwei Zeitpunkten A und B konnen die Relationen A < B (vorher),A > B (nachher), A = B (gleich), A ≤ B (vorher oder gleich) und A ≥ B (nachheroder gleich) gelten.

Definition 3 (Zeitintervall) Sind zwei Zeitpunkte A und B gegeben, so soll derBereich einer geordneten Zeitachse, der zwischen beiden Zeitpunkten liegt, wobei Aund B mit eingeschlossen werden, als Zeitintervall IAB = [AB] bezeichnet werden.Es gilt: ∀C ∈ IAB : A ≤ C ≤ B.

Da die betrachteten zeitabhangigen Gesundheitsdaten stets das vorherige Mes-sen der Zeit (hier in Form eines Datums) voraussetzen und dies mit einer Diskreti-sierung der Zeitachse einhergeht (kleinste messbare Einheit), wird sich im Folgendenauf diskrete Zeitpunkte und Zeitintervalle beschrankt. Analog zu [Fra98] sollen Zeit-punkte und Zeitintervalle als zeitliche Primitive oder Zeitobjekte angesehen werden.

Der Begriff Zeitpunkt im Zusammenhang mit diskreten Zeitachsen ist nicht im-mer intuitiv verstandlich. Im Allgemeinen wird z.B. eine sekundengenaue Zeitan-gabe (12:46:33 Uhr) als Zeitpunkt verstanden. Auch bei einer tagesgenauen Da-tumsangabe (31.03.2002) ist die Verwendung des Begriffs Zeitpunkt einleuchtend.Schwieriger ist das Verstandnis einer Woche als Zeitpunkt. Hier mochte man mei-nen, dass es sich um ein Zeitintervall handelt. Tatsachlich ist die richtige Zuordnungabhangig von der zu Grunde liegenden Zeitachse. Ist die zeitliche Auflosung derZeitachse wochengenau, so handelt es sich bei der Woche um einen Zeitpunkt. Liegthingegen eine stundengenaue Auflosung vor, so ist die Woche ein Zeitintervall, das168 Zeitpunkte (Stunden) umfasst.

20 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

Ein Problem ergibt sich auch bei der Bestimmung der Dauer von Zeitintervallen.Je nach Interpretation der Daten sind folgende Berechnungen zur Bestimmung derDauer d eines Intervalls IAB = [AB] moglich:

• d = B −Az.B. zur Berechnung der Zeit zwischen dem Eintreten zweier Ereignisse A =12, 6s und B = 14, 5s mit d = 14, 5s− 12, 6s = 1, 9s sowie

• d = B −A+ 1z.B. zur Berechnung der Dauer einer Arbeitswoche Montag bis Freitag mitd = 5(Freitag) − 1(Montag) + 1 = 5.

Eine generelle Festlegung der Berechnungsvorschrift von Intervalldauern kannnicht erfolgen. Vielmehr ist der konkrete Anwendungskontext entscheidend dafur,welche Semantik der Dauer zukommt. Fur den Fall der Visualisierung der vorlie-genden Gesundheitsdaten ist die zweitgenannte Variante am sinnvollsten.

Bei der Erfassung von Daten, besonders in okonomischen und technischen Be-reichen, aber auch bei den untersuchten Gesundheitsdaten, wird in verschiedenenFormen die Zeit im Datensatz mit abgespeichert. Um fur die Visualisierung solcherDaten adaquate Techniken auswahlen oder entwickeln zu konnen, ist es notwendig,den zu Grunde liegenden Zeitbezug genauer zu spezifizieren. Daher soll zunachstdie Klarung der Begriffe Zeitabhangige Daten und Zeitbezug erfolgen. Die anschlie-ßende Definition stutzt sich auf Angaben in [SM00].

Definition 4 (Zeitabhangige Daten) Merkmale heißen zeitabhangig, wenn min-destens eine Dimension des Beobachtungsraumes mit der physikalischen Große Zeitassoziiert wird.

Synonym spricht man auch von Daten mit Zeitbezug. In dieser Arbeit sollennicht alle Arten zeitabhangiger Daten untersucht werden. Durch die Beschrankungauf Multiparameterdaten mit Zeitbezug soll eine klare Abgrenzung zu anderen Da-tenklassen, wie z.B. Stromungsdaten, erfolgen. Fur diese gibt es wiederum spezielleTechniken, die unter anderem in [SM00] nachlesbar sind.

Der in Daten enthaltene Zeitbezug kann verschiedene Auspragungen annehmen.In [SM00] wird die Einteilung in Daten mit:

• statischem,

• quasistatischem und

• dynamischem

Zeitbezug vorgeschlagen. Liegt in den gesamten Daten nur ein fester Zeitpunkt oder-raum vor, so ist von einer statischen Zeitabhangigkeit zu sprechen. Sind hingegenmehrere diskrete Zeitangaben in den Daten vorhanden, wie z. B. bei der taglichenErfassung der Schlusskurse einer Aktie oder bei der stundlichen Messung der Wind-geschwindigkeit, so liegt ein quasistatischer Bezug vor. Dieser Klasse gehoren diemeisten

”alltaglichen“ Daten an. Dies liegt an der Auffassung von Zeit als diskrete

Zeitraume wie Stunden oder Minuten bzw. Tage oder Wochen. Unter Daten mitdynamischem Zeitbezug versteht man solche, denen eine kontinuierliche Zeitachsezu Grunde liegt. Zeitreihen, wie sie bei technischen Prozessen vorkommen, stellenein Beispiel fur dynamische Daten dar.

Der Zeitbezug in den zu visualisierenden Gesundheitsdaten wird durch die Spei-cherung des Datums zum jeweiligen Datensatz hergestellt. Es liegen mehrere Beob-achtungen auf einer tagesgenau diskretisierten Zeitachse vor — es handelt sich alsoum quasistatische Daten.

3.3. KLASSIFIKATION VON ZEITDARSTELLUNGEN 21

3.3 Klassifikation von Zeitdarstellungen

Fur die Visualisierung von zeitabhangigen Daten gibt es eine Reihe von Techni-ken. Im Folgenden werden Klassifikationskriterien und deren Auspragungen fur dieDarstellung zeitabhangiger Daten entwickelt. In Abbildung 3.4 sind sie zusammen-fassend dargestellt.

Anzahl und Wertebereichs−

eigenschaften der dargestellten

zeitabhängigen Merkmale

statische Repräsentation

ein Zeitobjekt

dynamische Repräsentation

mehrere Zeitobjekte

ein

zeitabhängiges

Merkmal

mehrere zeitabhängige

Merkmale mit

gleichen Werte−

bereichseigenschaften

Zeitverhalten der Darstellung

Anzahl der dargestellten

Zeitobjekte

mehrere zeitabhängige

Merkmale mit

beliebigen Werte−

bereichseigenschaften

Abbildung 3.4: Klassifikation von Zeitdarstellungen

Es soll darauf hingewiesen werden, dass es weitere Klassifikationen von Dar-stellungen zeitbezogener Daten gibt. Eine davon ist z.B. in [VDI00] nachzulesen.Hier wird eine Unterteilung in Standbild, nicht-proportionales Bewegtbild und pro-portionales Bewegtbild vorgenommen, wobei letztere Form nochmals in Zeitlupen-,Echtzeit- und Zeitrafferdarstellungen aufgeteilt wird.

Dynamische vs. statische Reprasentation

Zur Klassifikation der Visualisierung von zeitabhangigen Daten ist die Einteilungnach Zeitverhalten der Darstellung in:

• statische und

• dynamische

Reprasentationen sinnvoll. Unter statischer Reprasentation versteht man eine Dar-stellung, die sich uber die Zeit ohne außere Einflusse (z.B. Interaktion des Betrach-ters) nicht verandert. Das heißt, dass das Ergebnis der Visualisierung in seinerGesamtheit eine einzige Bildschirmausgabe erzeugt. Beispiele hierfur sind Zeitdia-gramme und Annotationen, aber auch spezielle Ikonen sind denkbar.

Statische Formen der Darstellung eignen sich besonders bei quasistatischen Da-ten. Sie erlauben im Allgemeinen das eindeutige Identifizieren von Datenwertensowie das Erkennen zeitlicher Zusammenhange. Wird der Umfang der darzustellen-den Daten sehr groß, so konnen statische Darstellungen schnell an ihre Grenzenstoßen. Durch Verwendung des semantischen Zooms konnen diese Grenzen jedocherweitert werden, indem der Auflosungsgrad der Daten verringert wird.

Andert sich die Darstellung der Visualisierung automatisch mit der Zeit, sospricht man von einer dynamischen Reprasentation; es werden mehrere Bildschirm-ausgaben erzeugt.

Die dynamische Prasentation von Daten impliziert immer das Vorhandenseineiner Zeitachse fur die Darstellung — die sogenannte Prasentationszeit. Diese sollteauf jeden Fall an den Zeitbezug der zu visualisierenden Daten angepasst werden,da die Darstellung sonst einen Eindruck von Dynamik vermittelt, die gar nicht inden Daten vorhanden ist.

Dynamische Darstellungen, die zur Reprasentation eines Zeitbezuges als zusatz-liches Ausdrucksmittel die Prasentationszeit einsetzen (Prasentationszeit wird mit

22 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

physikalischer Zeit in den Daten gekoppelt), werden nach [BDR00] temporale Dar-stellungen genannt. Ein Beispiel hierfur ist die dynamische Anpassung der Einfarbungvon geometrischen Primitiven wahrend der Prasentationszeit. Es ist jedoch auchvorstellbar, dynamische Visualisierungen einzusetzen, ohne dass eine zeitliche Abhangig-keit der Daten vorhanden ist. Diese werden dann als nontemporal bezeichnet. AlsBeispiel hierfur ware die Veranderung der Ansicht (Bewegung einer virtuellen Ka-mera in 3D-Szenen) zu nennen. Im Folgenden wird, wenn nichts anderes gesondertherausgestellt ist, von temporalen Darstellungen ausgegangen.

aktuelles Bild

Zeitfenster im Gedächtnis

Bilder der dynamischen Repräsentation

Zeit

Abbildung 3.5: Dynamische Darstellung und deren Wahrnehmung

Dynamische Darstellungen haben den Vorteil, dass der zeitliche Umfang der zuvisualisierenden Daten theoretisch sehr groß sein kann. In der Praxis stellt sichdas menschliche Erinnerungsvermogen als begrenzender Faktor heraus. Durch dieAufnahme der Informationen als Einzelbilder in sequentieller Abfolge verbleibt imGedachtnis des Menschen stets nur ein Ausschnitt (

”Zeitfenster“) der dynamischen

Darstellung (siehe Abb. 3.5). Dies lasst sich wie folgt erklaren: Bei der Wahrneh-mung einer dynamischen Darstellung blickt der Mensch zu jedem Zeitpunkt auf einBild — das aktuelle Bild. Mit Fortschreiten der Darstellung entsteht im Gedachtnisein Zeitfenster, das zuvor gesehene Bilder speichert. Die Ausdehnung dieses Fens-ters ist abhangig von der Dynamik der Darstellung, vom Informationsgehalt derEinzelbilder und auch vom Menschen selbst. Hat das Zeitfenster nach Beginn derDarstellung seine volle Ausdehnung erreicht, verschiebt es sich auf der Achse derPrasentationszeit. Eindrucke außerhalb des Fensters gehen somit wieder verloren.Durch Interaktion und mehrfaches Ansehen der dynamischen Visualisierung kannder Umfang des Zeitfensters erweitert werden.

Bei der dynamischen Reprasentation ist das Berechnen mehrerer Einzelbildernotwendig, die in sequentieller Folge auf dem Bildschirm angezeigt werden. Hierbeibieten sich je nach zu Grunde liegendem Zeitbezug zwei verschiedene Moglichkeitender Prasentation an. Dies sind die Anzeige als:

1. Animation oder

2. Bildfolge (Slideshow).

Unterscheiden lassen sich beide Verfahren nach der Anzahl der angezeigten Bil-der pro Zeiteinheit. Animationen sind im Allgemeinen solche Darstellungen, beidenen mindestens 24 bis 30 Bilder pro Sekunde angezeigt werden. Auf Grund derTragheit des menschlichen Auges entsteht bei einer solchen Bildrate der Eindruckeiner fließenden Bewegung. Somit eignet sich diese Art der Prasentation vor allem

3.3. KLASSIFIKATION VON ZEITDARSTELLUNGEN 23

fur Daten mit kontinuierlichen Zeitbezug. Bei der Darstellung der Bilder als Slide-show wird alle zwei bis funf Sekunden ein neues Bild angezeigt. Anwendung findetdieses Verfahren vor allem bei quasistatischen Daten.

Eine unterschiedliche Qualitat der Identifizierbarkeit einzelner Datenwerte beiDarstellung als Animation oder Bildfolge ist zu beachten. Wahrend diese bei derPrasentation in animierter Form nur eingeschrankt ist, kann bei einer Slideshow vonwesentlich besserer Identifizierbarkeit ausgegangen werden. Deshalb ist es unbedingtnotwendig, die dynamische Darstellung fur den Anwender steuerbar zu machen.

Ein interessanter Ansatz ware es daher, zu untersuchen, inwieweit sich ein”zeit-

licher“ Fokus&Kontext der Art realisieren ließe, dass weniger wichtige Bereiche derZeit mittels Animation einen Uberblick ermoglichen und vermeintlich wichtigerein Form einer Slideshow ein detaillierteres Wahrnehmen zulassen. Dies konnte z.B.durch ereignisorientierte Visualisierung realisiert werden.

Klassifikation bezuglich Anzahl der dargestellten Zeitobjekte

Ein weiteres Kriterium ist die Anzahl der zu jedem Zeitpunkt der Prasentation, dasheißt pro Bild dargestellten Zeitobjekte. Es ergibt sich eine Einteilung der Visuali-sierungen in Techniken zur Darstellung von Daten bezuglich:

• eines Zeitobjektes und

• mehrerer Zeitobjekte.

Darstellungen bezuglich mehrerer Zeitobjekte kommen bei der Visualisierungvon Daten mit quasistatischen oder dynamischen Zeitbezug zum Einsatz. Der Vor-teil dieser Art der Reprasentation liegt auf der Hand. Ein zusammenhangenderZeitraum kann mit einem Blick visuell analysiert werden. Ist die Anzahl der zumZeitraum gehorenden Zeitobjekte

”uberschaubar“, so ist die Identifikation eines je-

den Datenwertes moglich. Wird die Anzahl großer, so geht diese Identifikationsei-genschaft verloren. Dennoch bleibt ein gewisser Uberblick uber die zeitliche Ent-wicklung der Daten erhalten. Zur Erleichterung der Auswertung bietet sich auchdie Verwendung des Fokus&Kontext- bzw. Ubersicht&Detail-Konzeptes an.

Beispiele fur die Darstellung von Daten bezuglich mehrerer Zeitobjekte sindunter anderem die spater vorgestellten Techniken Diagramme, ThemeRiver, Kalen-derdarstellungen und Spiraldarstellung.

Andere Reprasentationen stellen in einem Bild nur Daten bezuglich eines Zeit-objekts dar. Durch Annotation oder eine Markierung auf einem Zeitstrahl kanndem Betrachter die zeitliche Abhangigkeit der Daten verdeutlicht werden. Die Iden-tifizierbarkeit eines Datenwertes bezuglich der Zeit zahlt zu den Vorteilen dieserReprasentationsart. Nachteil ist der fehlende Uberblick uber einen Zeitraum. DieEinfarbung von Gebieten einer Karte bezuglich der Anzahl an Erkrankungen zueinem ausgewahlten Zeitpunkt kann hierfur als Beispiel angesehen werden.

Durch die Verwendung dynamischer Darstellungen oder geeigneter Interakti-onsmoglichkeiten konnen Visualisierungen bezuglich eines Zeitobjekts ebenfalls zurAuswertung von Zeitraumen genutzt werden. Dies hat jedoch stets eine Erhohungdes kognitiven Aufwands zur Folge.

Klassifikation bezuglich Anzahl und Wertebereichseigenschaften der zeitabhangi-gen Merkmale

Eine Visualisierungstechnik fur zeitabhangige Daten muss zum einen die unabhangi-ge Variable

”Zeit“ darstellen konnen und zum anderen die zeitabhangigen Merk-

male prasentieren. Die Untersuchung bestehender Techniken ergab eine Einteilung

24 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

bezuglich der Anzahl der zeitbezogen darstellbaren Merkmale und deren Wertebe-reichseigenschaften. Es wird unterteilt in Visualisierungstechniken zur Darstellung:

• eines zeitabhangigen Merkmals,

• mehrerer zeitabhangiger Merkmale mit gleichen Wertebereichseigenschaftenund

• mehrerer zeitabhangiger Merkmale mit beliebigen Wertebereichseigenschaf-ten.

Die Darstellung nur eines Merkmals bezuglich der Zeit hat den Vorteil, dass zudessen Visualisierung der gesamte Anzeigeplatz genutzt werden kann. So ist dasErkennen von Details im zeitlichen Verlauf der Daten moglich. Eine Reihe vonVisualisierungszielen (z.B. Aufzeigen von Korrelation) ist mit dieser Art der Dar-stellung jedoch nicht erreichbar. Das Einfarben von Gebieten geografischer Kartenin Abhangigkeit von der Anzahl des Auftretens einer Krankheit mit einer hellig-keitsvariierten Farbskala (siehe [Bre99]), wie es auch fur TeCoMed realisiert wurde,ware ein Beispiel fur die Darstellung nur eines Merkmals bezuglich der Zeit.

Die Darstellung mehrerer Merkmale bezuglich der Zeit erlaubt neben dem zeitli-chen Vergleich auch vergleichende Aussagen uber verschiedene Merkmale. In einigenFallen ermoglicht eine Visualisierungstechnik zwar die Darstellung mehrerer Merk-male, jedoch mussen diese dann gleiche Wertebereichseigenschaften haben. So istz.B. der spater vorgestellte ThemeRiver nur fur quantitative Merkmale einsetzbar.Ahnliche Aussagen lassen sich auch fur klassische Zeitdiagramme treffen.

Eine Beschrankung auf bestimmte Wertebereiche der Merkmale ist jedoch fur dieVisualisierung von Multiparameterdaten bezuglich der Zeit sehr nachteilig. Aus die-sem Grund werden Techniken angestrebt, die Merkmale beliebigen Wertebereichs ineiner Darstellung vereinen. Beispiele hierfur sind die Spiraldarstellung aus [WAM01]und das in dieser Arbeit entwickelte Zeitrad (vgl. Abschnitt 6.4.3).

Zusammenfassende Aussagen

An Hand der beiden zuletzt vorgestellten Klassifikationskriterien kann das Ziel die-ser Arbeit gut verdeutlicht werden. Fur die Darstellung eines Merkmals bezuglicheines Zeitobjekts eignen sich klassische Methoden der Visualisierung. Auch dasAnzeigen eines Merkmals bezuglich mehrerer Zeitobjekte oder mehrerer Merkma-le bezuglich eines Zeitobjekts kann mit bekannten Methoden, z.B. einem Zeitdia-gramm, erfolgen. Jedoch die gleichzeitige Visualisierung von mehreren Merkmalenbezuglich mehrerer Zeitobjekte ist aktueller Forschungsgegenstand. Die Entwick-lung solcher Techniken und deren Kombination mit einer Karte wird in dieser Arbeitangestrebt (vgl. Abb. 3.6).

bekannte Methodenklassische Methoden

ein Zeitobjekt

ein Merkmal

bezüglich der Zeit

mehrere Merkmale

bezüglich der Zeitbekannte Methoden

aktueller

Forschungsgegenstand

mehrere Zeitobjekte

Abbildung 3.6: Ziel der ArbeitDie Visualisierung mehrerer Merkmale bezuglich mehrerer Zeitobjekte zusatzlich in Ver-

bindung mit einer Kartendarstellung ist Ziel der vorliegenden Arbeit.

3.4. VISUALISIERUNGSTECHNIKEN FUR ZEITABHANGIGE DATEN 25

3.4 Visualisierungstechniken fur zeitabhangige Da-ten

Im folgenden Abschnitt sollen einige Visualisierungstechniken und -konzepte fur dieDarstellung zeitabhangiger Daten vorgestellt werden. Hauptaugenmerk liegt hier-bei auf Techniken, die die Auswertung eines Zeitraumes im Ganzen erlauben undgleichzeitig eine Identifikation einzelner Datenwerte zulassen. Abschließend erfolgteine kurze Vorstellung weiterer Techniken sowie eine Einordnung und Bewertung.

3.4.1 Zeitdiagramme

Eines der altesten und wichtigsten Werkzeuge zur Visualisierung zeitabhangigerDaten sind Zeitdiagramme. Unter Zeitdiagrammen (vgl. Abb. 3.7) werden solcheDarstellungen verstanden, die uber einer horizontalen Zeitachse Auspragungen ei-nes Merkmals bezuglich der Zeit abtragen. Somit wird eine visuelle Verbindungzwischen Zeit und Datenwert hergestellt. Liegen mehrere Merkmale mit dem glei-chen Wertebereich vor, so konnen sie gleichzeitig in einem Zeitdiagramm abgebildetwerden.

31.12.01 07.01.02 14.01.02 21.01.02 28.01.02

00

10

20

30

40

50

60

70

80

90

100

horizontale x− Achse

vertikale

y− Achse

�� Tick− Marks��

Diagramm−

fläche

Beschriftung

Hilfslinien

Zeit

Anzahl

Merkmal A

Merkmal B

Merkmal C

Merkmal D

Legende

Abbildung 3.7: Zeitdiagramm nach [Cle94]Hier werden vier verschiedene Merkmale mit gleichem Wertebereich bezuglich der Zeit

abgetragen. Fur jedes einzelne lasst sich auf Grund der Farbgebung und der Markierung

mit Symbolen die Veranderung uber die Zeit gut erkennen. Gleichzeitig ist das Ablesen

des konkreten Datenwertes moglich.

In [Cle94] wird eine ganze Reihe von Richtlinien fur die Erstellung aussage-kraftiger Diagramme gegeben, die auch fur Zeitdiagramme gelten. Hauptaussageist die Forderung nach klar strukturierter Informationsdarstellung. So sollen z.B.Verdeckungen innerhalb eines Diagramms moglichst vermieden, verschiedene ineinem Diagramm abgetragen Merkmale auch visuell als verschieden wahrgenom-men und die Aufnahmefahigkeiten des Betrachters eines Diagramms nicht mit zuvielen visuellen Eindrucken uberlastet werden. Ahnliche Aussagen trifft Clevelanduber die Verwendung von Achsen- und Datenbeschriftungen. Bei der Darstellungzeitabhangiger Daten ist die Bewertung der zeitlichen Veranderung eine essentielleZielstellung. Nach [Cle94] kann das optimale Erkennen und Bewerten von Verande-rungen nur dann gewahrleistet werden, wenn ein Seitenverhaltnis von moglichstEins eingehalten wird.

26 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

Weitere Kriterien, die bei der Erstellung von Diagrammen mit einfließen undsich daraus ergebende Leitsatze, lassen sich in [Cle94] nachlesen. Eine Aufzahlungder originalen Leitsatze aus [Cle94] ist auch im Anhang B zu finden.

Jan

Feb

Mar

Apr

May

JunJul

Aug

Sep

Oct

Nov

Dec

Q I Q IIIQ IVZeit

Wert

Q II

Abbildung 3.8: Verschiedene Diagramme zur Zeitdarstellung nach [Har96]links) Sektorgraph; Mitte) Gestapeltes Histogramm; rechts) Zyklisches Liniendiagramm

Zeitdiagramme stellen die einfachste und gelaufigste Darstellung von Daten mitZeitbezug dar. Weitere Diagramme, die hierfur ebenfalls geeignet sind, sollen imFolgenden kurz vorgestellt werden.

Sektorgraph (Abb. 3.8 links): Beim Sektorgraph handelt es sich um eine kreisformi-ge Darstellung eines zeitlichen Zyklus’. Diese wird entsprechend der Anzahlvon Zeitobjekten in Kreissegmente unterteilt. Fur das Abtragen der Daten-werte werden wiederum Kreissegmente gebildet. Hierbei bleibt zwischen denSegmenten ein gewisser Abstand frei, sodass sich die Segmente nur im Zentrumdes Kreises beruhren. Auf die Radien der Segmente erfolgt die Abbildung derDatenwerte.

Gestapeltes Histogramm (Abb. 3.8 Mitte): Auf der horizontalen Achse die-ses Diagramms werden die Zeitobjekte abgetragen. Zentriert uber die

”Tick-

Marks“ wird die Anzahl des Auftretens verschiedener Merkmale ubereinanderauf die Hohe von Balken abgebildet. So kann fur jedes Zeitobjekt das relati-ve Verhaltnis der Merkmale visuell erfasst werden. (Wird auf die Hohe einesBalkens nicht die Anzahl, sondern ein beliebiges quantitatives Merkmal abge-bildet, so spricht man nicht mehr von einem Histogramm, sondern von einemBalkendiagramm.)

Zyklisches Liniendiagramm (Abb. 3.8 rechts): Hier erfolgt das Abtragen ei-nes Merkmals auf zyklisch angeordnete Skalen, die vom Zentrum der Darstel-lung ausgehen. Jeder Skala sind die Datenwerte eines Zeitobjekts zugeordnet.Anschließend werden diese nach der zeitlichen Folge ihres Auftretens durchLinien verbunden. Es entsteht also ein Linienzug, der sich mehrfach durchden Zyklus ziehen kann. Geschieht dies nur wenige Male, so kann man gutdie zeitliche Entwicklung des Merkmals verfolgen. Ein Vergleich der Daten-werte eines Zeitobjekts fur verschiedene Durchlaufe des Zyklus ist ebenfallsmoglich. Wachst jedoch die Anzahl der Zyklendurchlaufe, ist die Darstellungauf Grund der Uberlagerung der Linien schnell nicht mehr interpretierbar.

Eine umfangreiche Ubersicht weiterer Diagrammdarstellungen sollte der interes-sierte Leser [Har96] entnehmen. Der Vorteil der Diagrammdarstellung zeitabhangi-ger Daten liegt darin, dass neben der Einfachheit der Darstellung fur nahezu jedeKlasse von Daten spezielle Diagramme in der Literatur bekannt sind und sich somitfur viele Visualisierungsprobleme prinzipielle Losungen finden lassen.

3.4. VISUALISIERUNGSTECHNIKEN FUR ZEITABHANGIGE DATEN 27

3.4.2 ThemeRiver [HHN00]

In [HHN00] wird ein Verfahren zur Visualisierung zeitabhangiger Daten vorgestellt.Die ThemeRiver-Technik entstand im Rahmen der Entwicklung des Informations-visualisierungssystems SPIRE der Pacific Northwest Labs.

Die Suche nach Vorkommen bestimmter Themen in Zeitschriften, Artikeln undBuchern ergibt als Ergebnis eine Suchtreffermenge mit den entsprechenden Doku-menten, die sich mit dem System SPIRE in verschiedenen Formen bezuglich ihrerAhnlichkeit darstellen. lassen Hierzu wird die Metapher

”inhaltliche Nahe ist gleich

raumliche Nahe“ verwendet. So kann eine gezielte Literaturrecherche gewahrleistetwerden.

Die Frage nach der Veranderung der Treffermenge bei Anfragen an Dokumentein unterschiedlichen Zeitraumen (z.B. Erscheinungsjahr eines Buches oder Datumeiner Tageszeitung) war Motivation fur die Konzeptionierung und Realisierung desThemeRiver Prototypen. Es sollte die zeitliche Veranderung der verschiedenen The-men fur den Systemanwender sichtbar gemacht werden.

Abbildung 3.9: Darstellung von Suchtrefferanzahlen als Histogramm (aus [HHN00])Im unteren Teil des Bildes ist die Legende der Abbildung der Themen auf Farben zu sehen.

Daruber befindend sich das Histogramm. Das visuelle”Verfolgen“ eines Themas uber die

Zeitachse ist in dieser Darstellung nur schwer moglich.

Als erste Losung dieses Problems bietet sich die Darstellung der Anzahl der ge-fundenen Themen als gestapeltes Histogramm (siehe Abschnitt 3.4.1) an. Hierbeiwird fur eine gewisse Ausgangsmenge an Themen ermittelt, wie oft sie zu bestimm-ten Zeitpunkten (z.B. Tagen) auftreten. Die Haufigkeit der verschiedenen Themenwird dann zur Ermittlung der Balkenhohen des Histogramms herangezogen. DieDarstellung als gestapeltes Histogramm hat jedoch den Nachteil, dass der Zusam-menhang eines Themas in der Darstellung uber die Zeit (x-Achse) verloren geht(vgl. Abb. 3.9).

So kann z.B. zu einem Zeitpunkt der Balken, der ein bestimmtes Thema re-prasentiert, nur eine geringe Hohe haben und nah an der x-Achse liegen. Zumnachsten Zeitpunkt konnte der Balken durch eine gestiegene Anzahl von Suchtref-fern fur dieses Thema eine großere Hohe haben und auf Grund eines anderen starkauftretenden Themas sehr weit von der x-Achse entfernt positioniert sein. SolcheSituationen machen das Verfolgen eines Themas auf der Zeitachse sehr schwierig,wenn nicht sogar unmoglich.

Zur Beseitigung dieses Nachteils werden beim ThemeRiver die ubereinanderangeordneten Balken eines Zeitpunktes uber der x-Achse zentriert. Kernstuck des

28 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

ThemeRivers ist jedoch die Verbindung der Balken benachbarter Zeitpunkte durchKurven, sodass fur jedes Thema ein kontinuierlicher Fluss vom Anfangs- bis zumEndzeitpunkt, ein sogenannter current entsteht. Dieser kann mit der themenspezifi-schen Farbe ausgefullt werden. Die Abbildung 3.10 zeigt die Zusammensetzung desThemeRivers aus den einzelnen currents.

Abbildung 3.10: Der ThemeRiver aus [HHN00]Die Abbildung zeigt den ThemeRiver fur eine Vielzahl von Themen im Zeitraum Ju-

li/August 1990. Besondere politische oder wirtschaftliche Ereignisse werden im oberen

Bildteil eingeblendet. Wichtige Themen sind im ThemeRiver durch Beschriftungen geson-

dert hervorgehoben. Somit ist der zeitliche Verlauf des Auftretens von Themen in den

Dokumenten sehr gut erkennbar. (Die notwendige Legende wird gesondert dargestellt.)

Diese Art der Darstellung ermoglicht das Erkennen der zeitlichen Entwicklungeines Themas durch die zusammenhangende Prasentation desselben. Voraussetzunghierfur ist, dass dieses Thema zu allen Zeitpunkten in der Treffermenge enthaltenist. Anderenfalls wird der zugehorige current an bestimmten Stellen unterbrochen.Da die relative horizontale Position des currents jedoch erhalten bleibt, lasst sich dervisuelle Zusammenhang zu vorherigen bzw. zukunftigen Zeitpunkten leicht wiederherstellen. Weiterhin ist durch das Erhalten der relativen Position jedes Themas zujedem Zeitpunkt der Vergleich der Themen untereinander moglich.

Diese Art der Prasentation bietet einen interessanten Ansatzpunkt zur Visua-lisierung zeitabhangiger Gesundheitsdaten. In Abschnitt 6.4.2 wird die Idee desThemeRivers zur Visualisierung solcher Daten aufgegriffen.

3.4.3 Kalenderdarstellung [vWvS99]

Kalender sind Dinge des taglichen Lebens. Sie dienen zur Bestimmung des Wochen-tags eines Datums, zur Planung von Projekten und zur Beantwortung vieler andererzeitlicher Fragen. Der Umgang mit einem Kalender ist jedem gelaufig. Somit eigneter sich sehr gut als Sinnbild bei der Visualisierung zeitabhangiger Daten. Vorausset-zung fur die Anwendung dieser Darstellungsart ist, dass den Daten ein mindestensmonats- oder wochen-, im Idealfall tagesgenauer Zeitbezug zu Grunde liegt.

In [vWvS99] wird die Prasentation in Kalenderform zur Visualisierung vonzeitabhangigen Einparameterdaten genutzt. Im konkreten Fall sind dies Energie-verbrauch und Anzahl der anwesenden Mitarbeiter einer Fabrik. Große Wichtigkeitkommt dabei der gleichzeitigen Darstellung verschiedener zeitlicher Genauigkeiten(Monat, Woche, Tag) zu. Die Erkennung von zeitlichen Mustern und Trends soll soermoglicht werden.

3.4. VISUALISIERUNGSTECHNIKEN FUR ZEITABHANGIGE DATEN 29

Ausgangspunkt fur die Visualisierung ist die Einteilung der Daten in Tagesmus-ter Yi, i = 1, . . . ,M , wobei M die Anzahl der Tage des jeweiligen Jahres ist (also 365oder 366). Hierbei haben die Tagesmuster Yi die Form Yi = (yi, ti). Der Datenwertwird durch yi wiedergegeben, die Anzahl der Stunden seit 0:00 Uhr werden in tihinterlegt.

Mittels Clusterung werden nun ahnliche Tagesmuster ermittelt. Hierzu startetein entsprechender Algorithmus mit der Eingabe der M Tagesmuster als Clusterund ersetzt dann iterativ in jedem Durchlauf die beiden ahnlichsten durch einengemittelten neuen Cluster. Die Berechnung terminiert, nachdem alle zu einem einzi-gen das durchschnittliche Muster aller Tage enthaltenden Cluster zusammengefasstwurden. Das Ergebnis der Clusterung der M Tagesmuster ist ein binarer Baum mit2M − 1 Clustern. Die unterschiedlichen Maße zur Bestimmung der Ahnlichkeit vonzwei Clustern werden in [vWvS99] vorgestellt und bewertet.

Abbildung 3.11: Die Kalenderdarstellung aus [vWvS99]Rechts sind die Tagesverlaufe zweier einzelner Tage (05.12.97 und 31.12.97) sowie funf

verschiedener Cluster in einem Zeitdiagramm dargestellt. Auf der linken Seite sind die

Tage des Kalenders entsprechend ihrer Zugehorigkeit zu den Clustern eingefarbt.

Fur die Darstellung der Struktur des Baumes wurde auf den bekannten Gra-phenlayoutgenerator dot ([GKNV93]) zuruckgegriffen. Diese Art der Darstellungmacht sichtbar, welche Cluster zusammengefasst wurden, erlaubt aber nicht denvisuellen Vergleich einzelner Tagesmuster. Aus diesem Grund stellen van Wijk undvan Selow die Tages- bzw. Clustermuster als Diagramme und die Zugehorigkeit einesCluster zu einem Tag des Jahres auf einem Kalender dar. Der visuelle Zusammen-hang zwischen Diagrammdarstellung und Kalender wird durch clusterspezifischeFarben hergestellt. Abbildung 3.11 verdeutlicht dies.

Das Ziel der gleichzeitigen Darstellung von tages- und stundenabhangigen Datenist somit erreicht. Die Prasentation des Kalenders ermoglicht das intuitive Erkennenvon Mustern auf Tagesbasis. Mit Clusterung und Diagrammdarstellung wird dieAnalyse stundengenauer Daten moglich. Zu beachten ist jedoch, dass die Anzahlder dargestellten Cluster nicht zu groß wird, da sonst die visuelle Trennung derverschiedenen Zugehorigkeiten nicht mehr gewahrleistet ist.

Fur den Einsatz dieser Technik zur Visualisierung von Gesundheitsdaten sprichtdie sehr gute Moglichkeit zur Erkennung zeitlicher Muster, wie sie in der Medizin,insbesondere bei der Analyse von Epidemien, eine wichtige Rolle spielen. Durch dieVerwendung der Kalenderanzeige wird diese Technik einfach und intuitiv in ihrerBenutzung und fuhrt zu mehr Akzeptanz von Visualisierungen bei Arzten oderBehorden.

30 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

3.4.4 Spiraldarstellung [WAM01]

Lassen sich wissenschaftliche Daten unter Anwendung eines zyklischen Zeitmodellssinnvoll interpretieren, so kann man sie mit der nachfolgend vorgestellten Technikvisualisieren. Dies gilt besonders fur Daten mit quasistatischem Zeitbezug, bei de-nen fur viele Zeitobjekte Daten vorliegen oder fur Daten deren Zeitabhangigkeiteine kontinuierlichen Zeitachse zu Grunde liegt. In [WAM01] werden an die Visua-lisierung solcher Daten folgende Anforderungen gestellt:

• Die Visualisierungstechnik soll fur nominale, ordinale sowie quantitative Da-ten einsetzbar sein.

• Es soll die Darstellung großer Datenmengen moglich sein.

• Die Visualisierung soll den Vergleich benachbarter Datenwerte sowie den Ver-gleich unterschiedlicher Zyklen gestatten.

• Der Uberblick uber die Datenmenge soll das Erkennen von periodischen Mus-tern und zeitlichen Trends zulassen.

• Der Vergleich mehrerer abhangiger Variablen (Merkmale) muss moglich sein.

Um diese Anforderungen erfullen zu konnen, werden in [WAM01] die bewahrtenTechniken Balkendiagramm, Liniendiagramm und Kreisdiagramm zu einer neuenTechnik vereint — der Spiraldarstellung. Durch die Darstellung in Spiralform kannder zyklische Charakter der Daten sehr gut wiedergegeben werden, wahrend sichgleichzeitig, anders als bei der Darstellung in Kreisform, die verschiedenen Zyklenunterscheiden lassen.

Nach [WAM01] sind Spiralen mit Polarkoordinaten einfach beschreibbar. DasPolarkoordinatensystem beruht auf der Angabe von Radius r und Polarwinkel ϕ.Polarkoordinaten (r, ϕ) lassen sich mit

(x, y) = (r cosϕ, r sinϕ)

leicht in Kartesische Koordinaten uberfuhren (und umgekehrt). Fur die Beschrei-bung von Spiralen wird die Form

r = f(ϕ),df

dϕ> 0, ϕ ∈ R+

benutzt, wobei f eine monotone Funktion ist. Fur die Visualisierung von Datenauf einer Spirale hat sich eine Spezialform als besonders geeignet herausgestellt —Archimedes’ Spirale mit:

r = aϕ, a ∈ R.

Sie hat die Eigenschaft, dass, wenn ein Strahl ausgehend vom Zentrum der Spiralezwei beliebige aufeinander folgende Zyklen der Spirale schneidet, die Schnittpunkteeinen konstanten Abstand von d = a2π haben. Der Faktor a bestimmt also, wiestark der Radius der Spirale pro Zyklendurchlauf zunimmt und kann somit zurSteuerung des Erscheinungsbildes der Spirale genutzt werden. Archimedes’ Spiraleist eine Spezialform der allgemeineren Archimedischen Spiralen der Form r = aϕk.

Vom Verandern des generellen Aussehens der Spirale im Mappingschritt derVisualisierung wird in [WAM01] abgeraten. Vielmehr wird das Abbilden der kon-kreten Datenwerte auf die Attribute Farbe, Textur, Linienmuster und Liniendickesowie auf Ikonen als geeignet angesehen, wobei das Farbmapping nach [WAM01]am effektivsten ist (vgl. Abb. 3.12).

Um zeitliche Muster in den Daten erkennen zu konnen, wird jeder Zyklus derSpirale in eine bestimmte fur jeden Zyklus gleiche Anzahl von Segmenten unterteilt,

3.4. VISUALISIERUNGSTECHNIKEN FUR ZEITABHANGIGE DATEN 31

Abbildung 3.12: Spiraldarstellung zeitabhangiger Daten aus [WAM01]Auf der linken Seite sind die Aktienkurse zweier Unternehmen (Microsoft=gelb; Sun Mi-

crosystems=rot) auf Spiralen dargestellt. Die rechte Seite verdeutlicht, wie mit Hilfe von

Skalen die Spiraldarstellung”lesbarer“ gemacht werden kann.

auf die dann jeweils ein Datenwert abgebildet wird (Farbe, Textur und/oder Dickeder Linie). Diese Anzahl spiegelt die

”Periodenlange“ der Spirale wider, das heißt,

wie viele Datenwerte in einem Zyklus der Spirale angezeigt werden. Bei einer apriori gegebenen Periodenlange der Daten wird die Darstellung der Spirale automa-tisch angepasst. Ist keine Periodenlange bekannt, so kann mit Hilfe mathematischerVerfahren versucht werden, diese zu bestimmen. Viel wichtiger jedoch ist es, eineinteraktive Veranderung der

”Periodenlange“ der Spirale zu ermoglichen. Dadurch

kann der Anwender in den Daten verborgene Periodizitaten und zeitliche Musterexplorativ ermitteln.

Um sehr große Datenmengen handhaben zu konnen, wird in [WAM01] die Erwei-terung der Darstellung auf die dritte Dimension vorgeschlagen. Die Daten werdendann in Form einer Helix reprasentiert. Der Benutzer kann in der 3D-Anzeige einenihn besonders interessierende Bereich auswahlen, der dann detaillierter mit der 2D-Spiral-Technik visualisiert wird (vgl. Abb. 3.13). Hierbei handelt es sich also um dieAnwendung des Ubersicht&Detail-Konzeptes.

Abbildung 3.13: Erweiterung der Spiraldarstellung ([WAM01])

Die Moglichkeit zum Auffinden periodischer Muster macht diese Technik furdie Visualisierung von Gesundheitsdaten besonders interessant. Gleichfalls lasst dieSpiraldarstellung eine Prasentation großer Zeitraume sowie die Auswertung vonMultiparameterdaten zu. Aus diesen Grunden wird die Idee der Spiraldarstellungin Abschnitt 6.4.4 eine abgeleitete Technik vorgestellt.

32 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

3.4.5 Weitere Techniken

In diesem Abschnitt sollen weitere Techniken zur Visualisierung zeitabhangiger Da-ten kurz erlautert werden.

Lexis Pencils [FP97]

Die Lexis Pencil-Technik verwendet ein geometrisches Objekt der Form eines Blei-stiftes fur die Darstellung von historischen Ereignissen im Leben menschlicher Indi-viduen. Dafur ordnet man jeder Seite des Stiftes eine Kategorie (Merkmal) zu (z.B.Werktatigkeit, Familienstand, Anzahl der Kinder oder Bruttoeinkommen). Von der

”Spitze“ des Stiftes ausgehend wird die zeitliche Entwicklung jeder Kategorie farb-

oder texturkodiert auf die jeweilige Seite abgetragen. Die Stifte werden dann in ei-nem Lexisdiagramm positioniert. Wie dies im Einzelnen geschieht, ist in [FP97] oder[FF97] nachzulesen. Fur die Darstellung von Gesundheitsdaten kann vor allem dieAbbildung von Informationen auf die verschiedenen Seiten eines bleistiftahnlichenObjektes als interessant angesehen werden. (vgl. Abb. 3.14).

Zeit

verschiedene

Merkmale auf den

Seiten des Stiftes

Abbildung 3.14: Lexis PencilZu Verdeutlichung wurden die Seiten des Stiftes losgelost von einem realen Datensatz mit

verschiedenen Farbskalen eingefarbt.

Mehrfensterkonzept

Bei quasistatischen Daten mit wenigen abhangigen Variablen und Zeitobjekten istder Einsatz des Mehrfensterkonzeptes sinnvoll. Hierbei handelt es sich nicht wiebei den bereits vorgestellten Techniken um eine spezielle Technik zum Visualisierenvon zeitabhangigen Daten. Vielmehr geht man beim Mehrfensterkonzept davon aus,dass eine konkrete Visualisierungstechnik vorhanden ist, die fur mehrere Zeitpunkteoder Zeitintervalle separate Ausgaben (Fenster) erzeugt. Diese werden dann fur dievisuelle Analyse der Daten speziell angeordnet und dargestellt.

Die Anordnung der Fenster auf der Darstellungsflache ist entscheidend fur dasErkennen des zeitlichen Zusammenhangs der einzelnen Fenster. Um eine Anordnunggemaß des Effektivitatskriteriums der Visualisierung zu erreichen, sind verschiedeneVorgehensweisen moglich, wovon einige in Abschnitt 5.2.3 beschrieben werden.

Animation

In Abschnitt 3.3 wurde die Animation als adaquate Moglichkeit fur die dynamischeReprasentation zeitabhangiger Daten großen Umfangs vorgestellt. Eine umfassende

3.4. VISUALISIERUNGSTECHNIKEN FUR ZEITABHANGIGE DATEN 33

Einfuhrung kann auf Grund der Komplexitat des Themas an dieser Stelle allerdingsnicht erfolgen. Deshalb konnen nur grundlegende Aussagen getroffen werden.

Das prinzipielle Vorgehen beim Erstellen von Animationen wird in [BDR00]wie folgt beschrieben. Zunachst mussen die Animationsobjekte (Objekte, die sichverandern sollen) modelliert und in den Schlusselszenen (Szenen, die das

”Gerust“

der Animation bilden) arrangiert werden. Dann sind Anderungsvorschriften festzu-legen, die beschreiben, wie sich die Animationsobjekte in Abhangigkeit vom zeitli-chen Bezug und entsprechenden Datenwerten verandern. Abschließend werden zwi-schen den Schlusselszenen weitere Szenen unter Beachtung dieser Vorschriften be-rechnet, um die fur den Eindruck fließender Bewegung mindestens notwendigen 24Bilder zu erhalten.

Nach [BDR00] konnen fur die Erstellung einer Animation verschiedene Metho-den herangezogen werden:

• Text-Animation fur dynamisch prasentierte Texte;

• Deformation zur Uberfuhrung einer Ausgangsform in eine Zielform;

• Pfad-Animation zur Bewegung eines Objektes entlang eines Pfades;

• Kamera-Animation fur 3D-Animationen mit variabler Kameraeinstellung;

• Objekt-Animation fur das”Dirigieren“ von Objekten nach Handlungsskrip-

ten.

Wie diese im Einzelnen angewendet werden und welche Berechnungen hierfur not-wendig sind sowie weitere Informationen zum Thema Animation konnen in [BDR00]nachgelesen werden.

3.4.6 Einordnung der Techniken

In Abbildung 3.15 wird die Einordnung der Techniken in das Klassifikationsschemaverdeutlicht.

mehrere zeitabh.

Merkmale beliebigen

Wertebereichs

Zeitdiagramme

ThemeRiver

Kalenderdarstellung

Spiraldarstellung

Lexis Pencil

Mehrfensterkonzept

Animation

(s)tatisch vs.

(d)ynamsich

ss

ss

ss

ss

ss

ss

dd

Anzahl

Zeitobjekte

pro Bild

mehrere

mehrere

mehrere

mehrere

mehrere

mehrere

ein zeitabh.

Merkmal

xx

xx

xx

xx

xx

abhängig von zu Grunde liegender Visualisierungstechnik

abhängig von konkreter Auspregung der Animationsmethode

mehrere zeitabh.

Merkmale gleichen

Wertebereichs

Abbildung 3.15: Einordnung der Techniken

Bei den vorgestellten Techniken (außer Animation) handelt es sich um stati-sche Reprasentationen des Zeitbezuges, da mit Ausnahme der Animation nicht vonautomatischer Veranderung der Darstellung ausgegangen wird.

Alle vorgestellten Techniken lassen die Darstellung von Daten bezuglich mehre-rer Zeitobjekte zu. Einzig fur Animationsmethoden ist keine eindeutige Zuordnungmoglich, da mit jedem Einzelbild die Darstellung der Daten bezuglich eines Zeitob-jekts1, aber auch bezuglich mehrerer erfolgen konnte.

1Dies ist im Allgemeinen auch der Fall.

34 KAPITEL 3. VISUALISIERUNG ZEITABHANGIGER DATEN

Eine Technik zur Visualisierung nur eines Merkmals ist mit der Kalenderdar-stellung gegeben. Zeitdiagramme ermoglichen die Darstellung mehrerer Merkma-le gleichen Wertebereichs. Ahnliches gilt auch fur die ThemeRiver-Technik, wobeihier zusatzlich ein quantitativer Wertebereich der Merkmale gefordert wird. DieSpiraldarstellung sowie die Lexis Pencils lassen die Kombination von Merkmalenbeliebigen Wertebereichs zu. Die Einteilung des Mehrfensterkonzept bzw. der Ani-mation kann nur in Abhangigkeit von den zu Grunde liegenden Visualisierungstech-niken bzw. der konkreten Auspragung der Animationsmethode erfolgen.

Zusammenfassung

Dieses Kapitel zusammenfassend lasst sich feststellen, dass zeitabhangige Datenunter Anwendung verschiedener Zeitmodelle interpretierbar sind. So kommen furdie untersuchten Gesundheitsdaten lineare als auch zyklische Modelle in Betracht.Gleichzeitig ist auch die Anwendung des hierarchischen Zeitmodells moglich.

Die Vorstellung verschiedener Visualisierungstechniken belegt, dass die Dar-stellung mehrerer zeitabhangiger Merkmale beliebiger Wertebereichseigenschaftenbezuglich mehrerer Zeitobjekte Ziel aktueller Forschung ist und zunehmend an Be-deutung gewinnt.

Kapitel 4

Visualisierung aufgeografischen Karten

Ziel dieser Arbeit ist die Kombination der Visualisierung zeitabhangiger Daten mitgeografischen Karten. Aus diesem Grund werden im Folgenden Eigenschaften raum-lich bezogener Daten und einige Aspekte von Karten angesprochen sowie Visuali-sierungen auf Karten kurz vorgestellt.

4.1 Allgemeine Bemerkungen

In [Bil91] wird der Raumbezug als das verbindende Element der Anwendung vonGIS oder Computerkartografie in verschiedenen Fachrichtungen bezeichnet. Dieserhat je nach Fragestellung des Nutzers unterschiedliche Auspragungen.

Raumbezug mit primarer Metrik: Ist der Raumbezug direkt durch zwei- bzw.dreidimensionale Koordinaten oder Konstruktionsvorschriften angegeben, liegtdenen ein definiertes Bezugssystem und somit eine primare Metrik zu Grunde.Durch Vermessungen oder aus Satellitenbildern gewonnene Daten waren alsBeispiele mit primarer Metrik zu nennen.

Raumbezug mit sekundarer Metrik: Schwacher definierte Metriken mit we-sentlich geringerer Genauigkeit, wie sie z.B. bei der Erfassung statistischerDaten zum Einsatz kommen, werden sekundare Metriken genannt. Beispielehierfur sind die Benennung von Gebieten mit Kennziffern (z.B. Postleitzahl),Namen (z.B. Ortsteilbezeichnung) oder Adressen (z.B. Straße und Hausnum-mer)

Fur die alphanumerische Prasentation des Raumbezuges sind sekundare Metri-ken ausreichend. Sollen jedoch grafische Ausgaben in Kartenform erfolgen, mussenstets auch Daten mit primarer Metrik vorliegen. Die in dieser Arbeit verwende-ten Daten zeigen das Zusammenspiel beider Formen des Raumbezuges. Wahrenddie Gesundheitsdaten mittels einer Gebietskennung (sekundare Metrik) raumlichreferenziert werden, liegt hingegen der Kartendatensatz, der zur grafischen Darstel-lung benotigt wird, im lvis-Format (siehe [Tom01]) vor, das sich auf die Angabezweidimensionaler Koordinaten (primare Metrik) stutzt. Erst die Kombination vonsekundarer Metrik mit der primaren macht ein Darstellen der Gesundheitsdaten aufeiner Karte moglich.

Da der Begriff”raumbezogene Daten“ in der Literatur zur Visualisierung und

GIS nicht einheitlich verwendet wird, soll fur diese Arbeit eine Definition erfolgen,die sich auf Angaben in [SM00] stutzt.

35

36 KAPITEL 4. VISUALISIERUNG AUF GEOGRAFISCHEN KARTEN

Definition 5 (Raumbezogene Daten) Liegen dem Beobachtungsraum eines Da-tensatzes Ortskoordinaten zu Grunde, die ein zwei- oder dreidimensionales Bezugs-system definieren, so soll von raumbezogenen Daten gesprochen werden.

Wie bereits in Abschnitt 2.1.1 angedeutet, lassen sich verschiedene Wirkungs-kreise eines Beobachtungspunktes im Beobachtungsraum unterscheiden. Dies giltauch im speziellen Fall eines raumlichen Bezugssystems. Entsprechend unterschei-det man:

• punktuellen Wirkungskreis (Daten gelten nur im Beobachtungspunkt),

• lokalen Wirkungskreis (Daten gelten in einem lokalen Gebiet um einen Beob-achtungspunkt) und

• globalen Wirkungskreis (Daten gelten in im gesamten Beobachtungsraum).

Bei der Visualisierung muss, um dem Expressivitatskriterium zu genugen, stets derGeltungsbereich eines Datenwertes mit veranschaulicht werden.

Es ist zu beachten, dass geografischen Daten eine spezielle Klasse raumbezogenerDaten sind. Diese dienen der Beschreibung des Bezugssystems. Geografische Datenenthalten z.B. Landergrenzen, Flussverlaufe oder Informationen uber das Straßen-netz und beruhen meist auf einer primaren Metrik. Im folgenden wird auch derBegriff Kartendaten verwendet.

Neben dem Inhalt einer Karte, das heißt”Was wird angezeigt?“, spielt der ge-

stalterische Aufbau (”Wie wird etwas dargestellt?“) eine entscheidende Rolle fur die

Effizienz der Darstellung. Hierfur sind vor allem der Anwendungskontext und dieBenutzergruppen der Karte zu hinterfragen, um auf die jeweiligen Erfordernisse ein-gehen zu konnen. So macht es zum Beispiel im Rahmen dieser Arbeit wenig Sinn, dieGesundheitsdaten auf einer komplexen Straßenatlaskarte anzuzeigen. Hier genugtdie Beschrankung auf die Darstellung der verschiedenen Gebiete. Nach [DZ99] sollteeine Karte mit einer Reihe von Zusatzinformationen ausgestattet werden. Dies sindim Einzelnen:

• der Maßstab (moglichst als Maßstabsleiste),

• eine Kompassrose oder einen Nordrichtungspfeil,

• die Legende und

• der zeitliche Stand der Kartendaten.

Bei der Erstellung einer Karte sollte nach [DZ99] auf eine �harmonische und uber-sichtliche Gliederung und damit auf einen asthetischen Gesamteindruck der Kar-te� geachtet werden. Grafische Gestaltungsfaktoren einer Karte kann der Leser intabellarischer Form in [DZ99] S.97 nachlesen.

4.2 Klassifikation von Visualisierungen auf Karten

Sollen raumbezogene Daten visualisiert werden, so bietet sich die Anwendung vongeografischen Karten besonders an. Die reine Kartendarstellung verdeutlicht dieraumlichen Zusammenhange der realen (oder kunstlichen) Welt. Aufgabe der Visua-lisierung ist es, raumbezogene Daten so auf die Karte abzubilden, dass die Darstel-lung den Anforderungen Expressivitat, Effektivitat und Angemessenheit genugen.Im Folgenden werden Kartendarstellungen und Reprasentationen von Daten aufKarten nach verschiedenen Kriterien klassifiziert. Hierbei wird davon ausgegangen,dass die Kartendaten in einem Vektorformat vorliegen. Die vorgestellten Kriterienund deren Auspragungen sind zusammenfassend in Abbildung 4.1 dargestellt.

4.2. KLASSIFIKATION VON VISUALISIERUNGEN AUF KARTEN 37

punkt−

orientiert

Verdeutlichung des

Raumbezugesdirekt indirekt

zweidimensional

linien−

orientiert

Dimensionalität der

Kartendarstellung

Repräsentationsform

der Daten

dreidimensional

semidirekt

flächen−

orientiert

Abbildung 4.1: Klassifikation der Visualisierung auf Karten

2D vs. 3D Kartendarstellung

Die Anzahl der genutzten Dimensionen fur die Darstellung der Karte kann als einKlassifikationskriterium dienen. Prinzipiell lassen sich unabhangig von der Dimen-sionalitat der geografischen Daten bzw. des raumlichen Bezugssystems folgende Dar-stellungstypen unterscheiden:

• zweidimensionale (2D) Kartendarstellung und

• dreidimensionale (3D) Kartendarstellung.

Eine 2D-Kartendarstellung (vgl. Abb. 4.2) lasst sich mit zweidimensionalenPunkt-, Linien- und Flachenelementen aufbauen. Auf einem Anzeigegerat ist alsodie direkte Abbildung der Karte moglich. Zur Darstellung der Karte Mecklenburg-Vorpommerns ist die Reprasentation der Gebietsgrenzen unterschiedlicher Granu-laritatsstufen durch Linienzuge verschiedener Starke oder Farbe denkbar.

a) b)

Abbildung 4.2: Zweidimensionale Kartendarstellungena) 2D-Kartendarstellung der Postleitzahlgebiete Mecklenburg-Vorpommerns erzeugt mit

LandV ist; b)”Enridged Contour Map“ der Alpen aus [vWT01]. Die

”abgesetzten“ Kontu-

ren verdeutlichen den mittleren Niederschlag, mit der Farbe wird die Temperaturverteilung

dargestellt.

Fur das Anzeigen geografischer Daten bietet sich auch die dreidimensionale Dar-stellung an. Der Nachteil der hierbei auftretenden Verdeckungen kann durch dasAnbieten einer intuitiven raumlichen Navigation in den Daten ausgeglichen werden.Das

”Uberfliegen“ der Karte durch Veranderung der Position und Ausrichtung der

virtuellen Kamera erlaubt daruber hinaus das explorative Auffinden besonders in-teressanter Stellen der Karte. Ebenfalls sinnvoll ist das Bewegen der Kamera entlangvorberechneter Pfade, um die raumliche Entwicklung von Merkmalen zu erkennen,die auf der Karte abgebildet werden.

38 KAPITEL 4. VISUALISIERUNG AUF GEOGRAFISCHEN KARTEN

Die einfachste Form von dreidimensionalen Darstellungen erhalt man, wenn furzweidimensionale Kartendaten in der Darstellung eine konstante Hohe angenom-men wird, das heißt, dass ein Punkt P = (x, y) zu einem Punkt P ′ = (x, y, z)mit z = konst. erweitert wird. Diese Art der Kartendarstellung ist auch fur denverwendeten Datensatz Mecklenburg-Vorpommerns denkbar (vgl. Abb. 4.3a). WieAbschnitt 5.2.2 zeigt, wird sie fur einige Visualisierungstechniken zur Analyse zeit-licher Verlaufe auf Karten sogar vorausgesetzt.

Liegt ein dreidimensionales Bezugssystem vor, so muss aus den geografischen Da-ten ein 3D-Hohenmodell erzeugt werden. Hierzu ist die Triangulierung1 der Datennotwendig. Aus der Computergrafik bekannte Verfahren zur Erstellung dreidimen-sionaler Netzstrukturen (Meshes) sind dafur einsetzbar. Ein berechnetes Hohenmo-dell kann dann mit ublichen Rendering-Verfahren (z.B. Wireframedarstellung, Flat-oder Gouraud-Shading) angezeigt werden (vgl. Abb. 4.3b).

a) b)

Abbildung 4.3: Dreidimensionale Kartendarstellungena) 3D-Kartendarstellung der Postleitzahlgebiete Mecklenburg-Vorpommerns; b) Ima-

ginarer Kustenbereich als 3D-Karte erstellt mit dem Programm Terraform von Robert

Gasch. Gut zu erkennen sind die bei der Triangulierung entstandenen Dreiecke.

Direkte vs. semidirekte vs. indirekte Darstellung

Ein weiteres Kriterium fur die Klassifikation von Darstellungen auf Karten ist dieunterschiedliche Verdeutlichung des Raumbezuges. Es lassen sich die drei Formen:

• direkte,

• semidirekte und

• indirekte

Darstellung des raumlichen Bezuges unterscheiden. Eine direkte Darstellung derDaten bedeutet, dass die Reprasentation auf der Karte an der exakten durch denRaumbezug beschriebenen Position erfolgt. Hierdurch ist das unmittelbare intuitiveErkennen der Daten in ihrem raumlichen Kontext sichergestellt. Das exakte Posi-tionieren von Ikonen auf Karten ist exemplarisch fur die direkte Darstellung desRaumbezuges. Liegen die Beobachtungspunkte nicht gleichverteilt uber der Karte,sodass es zu lokalen Haufungen kommt, oder ist die Anzahl der Beobachtungspunktesehr groß, so ist das direkte Darstellen auf der Karte jedoch nicht mehr praktikabel.Es kann dann zu Uberlappungen und somit zur Ausloschung von Informationenkommen.

1Triangulierung ist die Unterteilung einer Flache in Dreiecke

4.2. KLASSIFIKATION VON VISUALISIERUNGEN AUF KARTEN 39

Eine Losung dieses Problems ist die semidirekte Darstellung der Daten. Hierbeiversucht man, Uberlappungen durch Veranderung der Positionierung zu verhindern.Um das Beispiel der Ikonenplatzierung weiterzufuhren, wurde dies bedeuten, dassungenutzter Platz in der Karte zur Darstellung verdeckter Ikonen genutzt wird.Durch eine Linienverbindung zwischen neuer und ursprunglicher Position der Ikonekann der korrekte Raumbezug wieder hergestellt werden. Hierbei ist darauf zu ach-ten, dass moglichst keine Uberlappung der Linie mit anderen Ikonen entsteht. Ein-fache Algorithmen zur Erstellung einer semidirekten Reprasentation versuchen freieBereiche der Karte mit Ikonen zu belegen. Kompliziertere finden uber iterative Vor-gehensweisen, wie z.B. Simulated Annealing2, moglichst optimale Anordnungen derIkonen. Das Ermitteln solcher Anordnungen ist eng verbunden mit dem Labeling-Problem (siehe [ECMS97]), dessen NP -Vollstandigkeit z.B. in [MS91] nachgewiesenist. In der Praxis erfolgt deshalb die semidirekte Positionierung von Daten auf Kar-ten meistens manuell durch den Erzeuger der Karte. Semidirekte Darstellungen sindvor allem in gedruckten Medien mit permanenten3 Karten zu finden. Seltener sindsie im Bereich der Visualisierung auf interaktiven Karten anzutreffen.

Um das Uberlappungsproblem zu umgehen, werden fur computergenerierte Kar-ten haufig indirekte Darstellungen des Raumbezuges verwendet. Die Darstellungdes raumlichen Bezugssystems erfolgt getrennt von der Datenvisualisierung. DerRaumbezug wird lediglich durch Annotationen, Farbassoziationen oder Linienver-bindungen hergestellt. Vorteil dieser Art der Darstellung ist die Einsetzbarkeit jederbeliebigen Visualisierungstechnik zur Darstellung der Daten. Er wird erkauft mitdem erhohten kognitiven Aufwand, den der Betrachter aufbringen muss, um denRaumbezug erfassen zu konnen.

Punkt- vs. Linien- vs. Flachendarstellung

Abschließend soll ein letztes Kriterium genannt werden, nach dem sich Darstellun-gen auf Karten unterscheiden lassen. In Abhangigkeit der Reprasentationsform derDaten kann eine Einteilung in:

• punktorientierte,

• linienorientierte oder

• flachenorientierte

Darstellungen erfolgen.Punktorientierte Darstellungsformen werden vor allem fur die Reprasentati-

on von Daten mit punktuellem Raumbezug verwendet. Hierzu zahlen z.B. dasEinfarben eines Punktes der Karte, des exakte Positionieren von Ikonen auf derKarte oder die indirekte Reprasentation des Raumbezuges durch eine Verbindungs-linie zu einem bestimmten Punkt der Karte. Bei der punktorientierten Darstellungkann es zu Problemen kommen, wenn mehrere Punkte des Bezugssystems auf einenPunkt (Pixel) des grafischen Ausgabemediums fallen.

Werden Daten auf Linien oder Linienzuge in Karten abgebildet, so spricht manvon linienorientierten Darstellungen. Ein Beispiel hierfur ware das Einfarben derGrenze zwischen zwei benachbarten Gebieten, um die Differenz der Datenwerte bei-der Regionen zu visualisieren. Eine verbreitete Art der linienorientierten Reprasen-tation ist die Darstellung von Isolinien. Sie lassen sich fur quantitative Merkmale

2Simulated Annealing bezeichnet einen physikalischen Prozess, bei dem eine Substanz durchErhitzung in einen hoheren Energiezustand gebracht und anschließend gleichmaßig abgekuhlt wird,um besonders stabile Kristallstrukturen zu erhalten. Dieses Vorgehen wurde im Bereich der kunst-lichen Intelligenz zur Losung von Optimierungsaufgaben adaptiert.

3Nach [KO96] versteht man hierunter fur bestimmten Aufgaben optimierten Karten, die nichtmehr verandert werden.

40 KAPITEL 4. VISUALISIERUNG AUF GEOGRAFISCHEN KARTEN

berechnen, die in einem geografischen Bezugssystem erfasst wurden (siehe [SM00]).Gelaufige Beispiele sind Hohenlinien, Isobare oder Isotherme.

Das Abbilden von Daten auf die Attribute einer Flache (meist die Farbe oderTextur) wird als flachenorientierte Darstellung bezeichnet. Diese Reprasentationstellt die verbreitetste Darstellungsform dar. Zu beachten ist, dass nur Daten mitlokalem oder globalem Raumbezug eine flachenorientierte Visualisierung zulassen.

Fur die Visualisierung der betrachteten Gesundheitsdaten kommen alle dreiReprasentationsformen in Frage. Im Rahmen bisheriger Arbeiten wurden punkt-orientierte und flachenorientierte Darstellung realisiert (vgl. [Pop98], [Bor99] und[Hes02]).

4.3 Vorstellung einiger Techniken

In diesem Abschnitt sollen Techniken zur Darstellung von Daten mit raumlichenBezug auf Karten vorgestellt werden. Die Verschiedenheit der Ansatze zur Abbil-dung der Merkmale zeigt, dass es ein breites Feld an moglichen Visualisierungengibt, von denen hier aber nur wenige vorgestellt werden konnen.

Traditionelle Verfahren

Traditionell erfolgt die Visualisierung von Merkmalen auf Karten durch die Abbil-dung auf Farbe. Hierbei ist die Anzahl der gleichzeitig darstellbaren Merkmale aufGrund der Wahrnehmungsfahigkeiten des menschlichen visuellen Systems jedochbeschrankt. In [Bre99] werden verschiedene Farbschemata fur die datenabhangigeEinfarbung geografischer Gebiete vorgestellt. Brewer geht hierzu auf verschiede-ne Visualisierungsziele und die unterschiedliche Skalierung der Wertebereiche vonMerkmalen ein. So werden z.B. Differenzfarbskalen sowie bi- und trivariate Farbska-len und deren unterschiedliche Eignung fur bestimmte Problemklassen betrachtet.

Die Berechnung der bereits erwahnten Isolinien zur Visualisierung eines skala-ren Merkmals mit quantitativem Wertebereich (z.B. Hohe, Druck oder Tempera-tur) ist ein weiteres klassisches Verfahren. Isolinien verbinden alle Punkte gleicherMerkmalsauspragungen miteinander. Sie lassen sich aus den Daten z.B. mit demPixel-by-Pixel-Contouring Algorithmus (vgl. [SM00]) sehr einfach konstruieren. ZurDarstellung auf der Karte werden fur mehrere Auspragungen des betrachteten Merk-mals die Isolinien berechnet und angezeigt. Hierbei konnen zur Verdeutlichung An-notationen zu den einzelnen Isolinien oder eine Farbkodierung der Linien erfolgen.

Fur die Visualisierung mehrerer raumlich abhangiger Merkmale ist die Positio-nierung spezieller Ikonen auf Karten moglich. Diese Form der Reprasentation kannauch zur Analyse von Gesundheitsdaten genutzt werden (vgl. Abschnitt 5.2.1).

Enridged Contour Maps

Fur die direkte Darstellung von zwei skalaren Merkmalen auf 2D-Karten schlagenvan Wijk und Telea in [vWT01] eine neue Technik vor — die Enridged ContourMaps ECMs. Das besondere an ECMs ist, dass eines der beiden Merkmale auf eineFarbskala abgebildet wird, das andere zur Berechnung eines Hohenfeldes dient. DieAnwendung von Beleuchtungsverfahren (Shading) auf dieses Hohenfeld liefert alsErgebnis eine Konturkarte. Diese kann mit der Farbabbildung zu einem aussage-kraftigen Gesamtbild kombiniert werden.

Fur die Bestimmung der Hohe z(x) eines Beobachtungspunktes x ∈ R2 bezuglichdes Wertes eines Merkmals f(x) ware eine lineare Abbildung der Form

z(x) = s · f(x)

4.3. VORSTELLUNG EINIGER TECHNIKEN 41

ublich, wobei s ein passend gewahlter Skalierungsfaktor ist. In [vWT01] wird ei-ne spezielle nichtlineare Abbildungsfunktion vorgeschlagen, um eine visuelle Un-terscheidung von verschiedenen Abschnitten des Wertebereiches des Merkmals zuerreichen (Konturbildung). Die Abbildungsfunktion hat folgende Form:

z(x) = s · f(x) + sb · h(f(x) mod b

b

)Hierbei ist h(x) = ax(1− x). Dies bedeutet mit Worten ausgedruckt, dass fur auf-einander folgende Intervalle von f der Breite b eine Addition der linearen Abbildungmit einer Parabel erfolgt. Mit dem Parameter a lasst sich die Hohe der Parabel undsomit auch die Differenzierbarkeit der Intervalle in der grafischen Darstellung steu-ern. Abbildung 4.4 verdeutlicht den Unterschied zwischen linearer und nichtlinearerAbbildung.

Abbildung 4.4: Enridged Contour Maps aus [vWT01]Darstellung des synthetischen Hohenfeldes z(x) mit linearer (links) und nichtlinearer

(rechts) Abbildungsfunktion. Rechts ist deutlich die Konturbildung zu erkennen.

Mit so erstellten Abbildungen wird die visuelle Auswertung quantitativer Merk-male erheblich erleichtert, da nun ahnliche Bereiche problemlos erkennbar sind. Diesware bei einer linearen Abbildung nur schwer moglich. Erfolgt die Uberlagerung mitder Farbabbildung eines zweiten Merkmals, so entstehen Darstellungen, wie sie z.B.in Abbildung 4.2b gezeigt werden.

Van Wijk und Telea zeigen in [vWT01] weitere Anwendungsbereiche ihrer Tech-nik. So ist sie z.B. auch zur Visualisierung hierarchischer Clusterungen einsetzbar.Diese Eignung macht die ECMs ebenfalls fur die Darstellung multivariater Gesund-heitsdaten interessant. Desweiteren lasst die schnelle Berechenbarkeit der Abbil-dungsfunktion einen Einsatz von ECMs als dynamische Darstellung von zeitabhangi-gen Daten zu.

Kartogramme

Eine weitere interessante Visualisierungstechnik stellen Kartogramme dar. Kartenim herkommlichen Sinne sind flachentreue Darstellungen. Kartogramme weichenbewusst von der Flachentreue ab und verzerren Gebiete der Karte in Abhangigkeiteines bestimmten Merkmals. Dies muss jedoch so geschehen, dass die topologischenEigenschaften der Karte gewahrt bleiben (z.B. Erhaltung der Nachbarschaften, Ver-meiden des

”Aufreißens“ der Karte). House und Kocmound stellen in [HK98] einen

komplexen Algorithmus zur Erstellung von Kartogrammen vor, der im Vergleich zu

42 KAPITEL 4. VISUALISIERUNG AUF GEOGRAFISCHEN KARTEN

anderen Verfahren sehr gute Ergebnisse liefert. Bekanntestes Beispiel eines Karto-grammes ist das Bevolkerungskartogramm, bei dem die Gebiete (Lander, Gemein-den o.a.) einer Karte bezuglich der Einwohnerzahl verzerrt werden (vgl. Abb. 4.5).

Abbildung 4.5: Kartogramm aus [HK98]oben) Originalkarte der Visualisierung der Wahl 1996 in den USA. Auf Grund der uber-

wiegend blauen Einfarbung suggeriert die Darstellung Bob Dole als Wahlsieger.

unten) Visualisierung der Wahlergebnisse auf einem Bevolkerungskartogramm. Durch die

bevolkerungstreue Verzerrung kann der Betrachter sofort den korrekten Wahlsieger Bill

Clinton ablesen.

In bisherigen Arbeiten zur Visualisierung von Gesundheitsdaten erfolgte meisteine Einfarbung der Gebiete der Karte in Abhangigkeit der Anzahl an Erkrankun-gen. Kleine Gebiete der Karte mit einer hohen Einwohnerzahl (z.B. Großstadte)werden hierbei aber weniger wahrgenommen als große Gebiete mit geringer Bevolke-rungsdichte. Durch die Darstellung auf einem Kartogramm wurde man eine visuelleNormierung der Gesundheitsdaten bezuglich der Bevolkerungszahl erreichen. Wiewichtig eine visuelle Normierung fur die Expressivitat der Visualisierung sein kann,wird in Abbildung 4.5 deutlich.

Die Anwendung von Kartogrammen ist allerdings nicht weit verbreitet. Dies liegtzum einen an der gewohnungsbedurftigen Verzerrung der Gebiete, zum anderen ander Komplexitat der benotigten Algorithmen. Fur interaktive Szenarien kommensie in der Regel nicht in Frage. So ist z.B. in [HK98] die Berechnungsdauer fur einKartogramm mit mehreren Stunden angegeben. Also waren dann nur vorberechneteKartogramme anwendbar oder solche, die auf die Erhaltung der Kartentopologieverzichten, um schnellere Berechnungen zu gestatten.

Marching Sphere

Abschließend soll eine Variante der Kartennutzung aus [KLS00] vorgestellt werden.Ziel war hier die Darstellung komplexer Informationen in ihrem raumlichen Kon-

4.3. VORSTELLUNG EINIGER TECHNIKEN 43

text. Kreuseler wahlt die dreidimensionale Kartendarstellung, womit dem Anwenderdie Navigation durch eine virtuelle Welt moglich ist. Die eigentliche Informationsvi-sualisierung erfolgt durch eine spezielle Technik (siehe [KLS00]) und wird als semi-transparente Kugel uber der Karte dargestellt. Der Raumbezug wird hierbei durcheine Verbindung zwischen einem Gebiet der Karte und der zugehorigen Kugel sicht-bar gemacht (vgl. Abb. 4.6). Kreuseler stellt fest, dass die Darstellung der Kugelfur alle Gebiete nicht sinnvoll ist, da es zu Verdeckungen kommen kann und eineAuswertung der Daten nicht mehr moglich ist. Aus diesem Grund stellt er verschie-dene Interaktionsmoglichkeiten vor, um die explorative Datenanalyse bestmoglichzu unterstutzen. Hierfur geht man davon aus, dass der Anwender ein fur ihn inter-essantes Gebiet der Karte auswahlt, fur das die Darstellung der

”Informationskugel“

in normaler Große erfolgt. Folgende zusatzliche Darstellungen sind dann moglich:

Kontext: Fur die Nachbarn (Kontext) des ausgewahlten Gebietes werden ebenfallsdie Kugeln, jedoch stark verkleinert dargestellt.

Historie: Hier erfolgt die verkleinerte Darstellung der Kugeln fur Gebiete, die be-reits durch den Anwender

”besucht“ wurden.

Detail: Um die genaue Untersuchung der Daten zu ermoglichen, kann der Nutzereine Detaildarstellung der Kugel in einem separaten Fenster anfordern.

Besonders interessant fur die Visualisierung zeitabhangiger Daten auf Karten istdie Ausnutzung von Nachbarschaftsbeziehungen fur die Realisierung des Fokus&Kon-text-Konzeptes. Gleiches gilt fur die Darstellung der historischen Entwicklung derAuswahl des

”Gebietes von Interesse“, birgt sie doch die Moglichkeit zur Visuali-

sierung eines zeitlichen Verlaufs.

Abbildung 4.6: Marching Sphere aus [KLS00]

Kapitel 5

Zeitdarstellung auf Karten

5.1 Statische vs. dynamische Karten

Nachdem nun die Visualisierung von zeitabhangigen Daten sowie die Visualisierungauf Karten eingefuhrt wurden, soll eine Vorstellung von Konzepten zur Darstellungzeitabhangiger Daten auf geografischen Karten folgen.

Zunachst muss eine grundlegende Frage geklart werden, die bei der Kombinationvon Karte und Visualisierung zeitabhangiger Daten von großer Bedeutung ist. Siebetrifft das Verhalten der Karte bezuglich der Zeit, in dessen Abhangigkeit sich zweiAuspragungen unterscheiden lassen:

• statische Karten sowie

• dynamische Karten.

Karten, denen ebenfalls ein Zeitbezug zu Grunde liegt, sollen dynamisch genanntwerden. Da Karten das Abbild veranderlicher geografischer Gegebenheiten sind,ist eigentlich immer von einer dynamischen Auspragung auszugehen. Die Integrati-on der zeitlichen Dimension in GIS ist daher auch aktueller Forschungsgegenstand.Hierfur ist die Entwicklung neuer Datenstrukturen und Darstellungsformen notwen-dig, die hier nicht naher betrachtet werden sollen, jedoch z.B. in [BDR00], [EG98]oder [LGMR99a] und [LGMR99b] nachlesbar sind. Aus diesen Quellen geht hervor,dass die kartografische Animation das am haufigsten eingesetzte Mittel zur Dar-stellung dynamischer Karten ist. Oft erfolgt hierbei auch die einfache Darstellungzeitabhangiger Merkmale auf der Karte.

Statische Karten gehen von einer vernachlassigbaren oder nicht vorhandenenzeitlichen Veranderung aus. Dies steht offensichtlich im Widerspruch zur Auffas-sung der geografischen Realitat als zeitabhangig. Daher werden Karten in der Regelnur bezuglich eines Zeitintervalls als unveranderlich angenommen. Die Dauer desIntervalls hangt stark von der Thematik der geografischen Daten ab. Viel wichtigerist jedoch die Interpretation der Daten. Wird auf einer Karte z.B. der Verlauf einerGletschergrenze angezeigt, so kann diese auf Grund der kontinuierlichen Verande-rung des Gletschers immer nur fur einen konkreten Zeitpunkt gelten (dynamischeKarte). In einem anderen Anwendungsfeld konnte die Gletschergrenze aber verein-fachend als fur ein Jahr konstant interpretiert werden. Die entsprechende Kartehatte dann Gultigkeit in einem Zeitintervall der Dauer eines Jahres. Ein weiteresverdeutlichendes Beispiel betrifft die Darstellung von Kontinenten und politischerLander der Erde. Wahrend fur Kontinente (trotz standiger Veranderung derselben)von Zeitinvarianz ausgegangen werden kann, ist die politische Einteilung der Weltin wesentlich starkerem Maße abhangig von der Zeit.

44

5.2. NEUE KONZEPTE ZUR ZEIT- UND KARTENDARSTELLUNG 45

Die im Rahmen dieser Arbeit verwendete Karte des Landes Mecklenburg/Vor-pommern ist statisch (siehe [Tom01]). Fur die Visualisierung zeitabhangiger Ge-sundheitsdaten bezuglich verschiedener Gebiete der Karte konnte sich dies jedochals nachteilig erweisen, da hier nicht von einer, fur

”langere Zeit“ gultige Einteilung

des Raumes in administrative Einheiten ausgegangen werden kann. So ist z.B. dasZusammenfassen von Postleitzahlbereichen durch die Deutsche Post auf Grund tech-nischen Fortschrittes ohne weiteres denkbar. Unter der Voraussetzung regelmaßigerAktualisierung der Daten ist eine Karte ohne Zeitbezug dennoch fur das Anliegendieser Arbeit ausreichend. Deshalb beschranken sich die weiteren Betrachtungen aufden Fall der statischen Karte.

5.2 Neue Konzepte zur Kombination von Zeit- undKartendarstellung

Die in dieser Arbeit entwickelten Konzepte zur Visualisierung zeitlicher Verlaufeauf geografischen Karten werden im Folgenden erlautert. Sie tragen allgemeingulti-gen Charakter und lassen sich auch zur Visualisierung von Gesundheitsdaten (vgl.Kapitel 6) einsetzen.

5.2.1 Ikonifizierung und Positionierung

Die einfachste Art der Kombination von Zeitvisualisierungen auf Karten ist die Iko-nifizierung der Zeitdarstellung und deren direktes oder semidirektes Positionierenauf bzw. indirektes Darstellen neben einer zweidimensionalen Karte. Unter Ikonifi-zierung wird hier der Prozess der Verkleinerung der ursprunglichen Zeitdarstellungverstanden, bei dem ein grafisches Primitiv mit den Eigenschaften einer Ikone ent-steht.

Ikonifizierung

Zunachst muss gepruft werden, ob die bevorzugte Technik zur Zeitvisualisierungin ikonifizierter Form noch aussagekraftig ist. Im Idealfall behalt die entstandeneIkone die ursprungliche Aussagekraft bei. Das Erkennen eines gewissen Uberblicksuber die Daten einer Ikone kann als Minimalanforderung definiert werden.

Untersuchungen im Rahmen dieser Arbeit haben gezeigt, dass von den in Ab-schnitt 3.4 vorgestellten Techniken der ThemeRiver und die Spiraldarstellung zurIkonifizierung geeignet sind. Beide konnten neben weiteren Techniken auch in denentwickelten Prototypen LandV ist integriert werden. Hierauf wird in Abschnitt 6.4naher eingegangen.

Ein Problem, das sich bei der Ikonifizierung ergibt, ist die Festlegung der Ikonen-große. Aus Sicht des Anwenders sind große, gut ablesbare Ikonen wunschenswert.Gleichzeitig sollte es nicht zu Uberlappungen von Ikonen auf der Karte kommen.Desweiteren ist bei lokalem Raumbezug die Uberlappung einer Ikone mit den Gultig-keitsbereichen benachbarter Ikonen zu vermeiden. Letzteres ist vor allem bei derVisualisierung der Gesundheitsdaten zu beachten.

Hier sind die Gebiete (Land, Landkreis oder Postleitzahlbereich) der Karte Wir-kungskreise von Daten. Die unregelmaßige Große dieser Gebiete wirft eine neueFrage auf: Soll auf Grund der Forderung nach Expressivitat eine einheitliche Großealler Ikonen vorausgesetzt werden oder ist es akzeptabel, dass die Große an denGultigkeitsbereich angepasst wird? Fur eine einheitliche Große aller Ikonen, mussteman sich zur Vermeidung von Uberlappungen an der Große des kleinsten Gebie-tes orientieren. Dies wurde jedoch bedeuten, dass fur ein großeres Gebiet nur dieDarstellung einer sehr kleinen Ikone erfolgt, obwohl ausreichend Anzeigeplatz zur

46 KAPITEL 5. ZEITDARSTELLUNG AUF KARTEN

Verfugung stunde. Es wird also Platz auf dem Anzeigemedium verschwendet. Ande-rerseits kann die Anpassung der Ikonen an die Große eines Gebietes zu nicht mehrexpressiven Darstellungen fuhren. Hierzu kann es kommen, da die visuelle Reprasen-tation der Ikone abhangig von der Große eines Gebietes wird. Diese Abhangigkeitist dann visuell erkennbar, liegt den Daten aber nicht zu Grunde. Eine Losung desProblems konnte die Berechnung von Kartogrammen sein. Durch die Verzerrung derKarte ließen sich Gebiete relativ konstanter Große berechnen. Eine Positionierunggleich großer, gut ablesbarer Ikonen ist dann ohne Verschwendung von Anzeigeplatzmoglich. Wie bereits erwahnt, mussten solche Kartogramme jedoch auf Grund derlangen Laufzeit der benotigten Algorithmen vorberechnet zur Verfugung stehen.

Fragen Pro Kontra

Sollten große Ikonen verwen-det werden?

Ikonen sind gut ab-lesbar.

Es kann zu Uber-lappungen kom-men.

Gleiche Große fur alle Ikonender Karte fordern?

Die expressiveDarstellung istgesichert.

Es wird Anzeige-platz verschwendet.Sehr kleine Ikonensind nicht mehr er-kennbar.

Unterschiedliche Große furIkonen zulassen?

Die optimale Nut-zung der Anzeige-flache ist moglich.

Die Darstellung istnicht immer expres-siv.

Tabelle 5.1: Fragestellungen bei der Festlegung der Ikonengroße

Ein allgemeingultige Losung fur das Problem der Festlegung von Ikonengroßengibt es nicht. In Abhangigkeit von der verwendeten Karte und dem Visualisierungs-ziel sollte diese Fragestellung stets neu beantwortet werden (siehe auch Tabelle 5.1).

Positionierung

Ist fur alle Beobachtungspunkte eine Ikone adaquater Große berechnet worden, sokann deren Positionierung bezuglich der Karte erfolgen. Hierfur sind die bereitsvorgestellte Arten der direkten, semidirekten und indirekten Darstellung moglich.

Besonders bei der ikonifizierten Darstellung ursprunglich nicht als Ikonen konzi-pierter Visualisierungstechniken ist eine Kombination von (semi-)direkter und indi-rekter Positionierung sinnvoll. Sie kann z.B. zur Realisierung des Ubersicht&Detail-Konzeptes genutzt werden, indem innerhalb der Karte eine Darstellung aller Ikonenerfolgt, wahrend getrennt von der Karte eine aktuell ausgewahlte Ikone gesondertzur visuellen Analyse angeboten wird.

Fazit

Im Abschnitt 3.4 wurde auf die vielen Arten von Diagrammen zur Darstellungzeitabhangiger Daten hingewiesen. Sie konnen als Ausgangstechniken fur das Kon-zept der Ikonifizierung und Positionierung angesehen werden, mit dessen Hilfe sichdie Vorteile verschiedener Techniken auch fur die Visualisierung auf geografischenKarten nutzen lassen. Das gilt im speziellen auch fur die in dieser Arbeit betrach-teten Gesundheitsdaten. Die Verwendung des Konzeptes im entwickelten PrototypLandV ist untermauert die Eignung dieser Vorgehensweise zusatzlich.

5.2. NEUE KONZEPTE ZUR ZEIT- UND KARTENDARSTELLUNG 47

5.2.2 Verwendung der 3. Dimension als Zeitachse

Erfolgt eine dreidimensionale Kartendarstellung eines zweidimensionalen Bezugs-systems (vgl. Abschnitt 4.2), so kann die dritte Dimension zur Reprasentation derZeit genutzt werden. Hierfur sind die Zeitobjekte eines betrachteten Zeitraumesauf Punkte oder Intervalle der z-Achse des 3D-Raumes abzubilden. Jedem Zeitob-jekt wird so ein eigener Bereich in der Darstellung zugeordnet. Bei einer großenAnzahl von Zeitobjekten kann es dazu kommen, dass in der Darstellung mehrereZeitobjekte auf ein einzelnes Pixel abgebildet werden. Dies muss zur Wahrung derExpressivitat durch eine Verringerung der Anzahl der betrachteten Zeitobjekte odergeeignete Fokus&Kontext-Techniken verhindert werden.

Zur Visualisierung zeitabhangiger Daten direkt uber der Karte sollen im Folgen-den drei neue Konzepte vorgestellt werden.

Lexis Pencils uber der Karte

Dieses Konzept beruht auf der Verwendung der bereits erlauterten Lexis Pencils.Zur Darstellung auf der Karte muss fur jeden Beobachtungspunkt die Berechnungeines Pencil erfolgen. Diese konnen dann senkrecht uber der Karte dargestellt wer-den. Die

”Spitze“ eines Pencil ermoglicht eine exakte Positionierung und somit die

direkte Veranschaulichung eines punktuellen Raumbezuges. Durch das Verzeichnenvon Gebietsgrenzen in der Karte lasst sich ebenfalls ein lokaler Raumbezug verdeut-lichen (vgl. Abb. 5.1).

Karte

Lexis Pencil

Abbildung 5.1: Lexis Pencils uber der Karte

Mit wachsender Anzahl der Beobachtungspunkte kann es zu unubersichtlichenDarstellungen kommen. Dann bietet es sich an, den Durchmesser der Pencils zu ver-kleinern. Durch Variation der Durchmesser ist auch die Realisierung des Fokus&-Kontext-Konzeptes denkbar. So kann fur einen Beobachtungspunkt von Interes-se ein großerer Durchmesser verwendet werden. Ein gutes Erkennen der zeitlichenEntwicklung der abgebildeten Daten ist somit gesichert. Fur die benachbarten Be-obachtungspunkte wird ein kleinerer Durchmesser gewahlt. Hierdurch konnen Ver-deckungen in der Darstellung reduziert werden und ein Uberblick uber die Datenbleibt trotzdem erhalten.

Interaktive Navigation durch den virtuellen dreidimensionalen Raum ermoglichtdem Anwender die explorative Analyse der Daten. Wahrend der Bewegung im Raumist das Erhalten der Orientierung der Pencils bezuglich des Betrachters sinnvoll, dader Nutzer trotz Veranderung der Ansicht stets die gleichen Seiten der Pencils ange-zeigt bekommt. Welche Seite dies sein soll, kann der Nutzer durch ein gesondertesRotieren der Pencils bestimmen. Je nach Bearbeitungsziel sollte es moglich sein,einzelne oder alle Pencils auf einmal zu verandern.

Diese Art der Darstellung eignet sich besonders fur die Veranschaulichung eineslinearen Zeitmodells. Die Abbildung verschiedener Merkmale auf die Seiten einesPencil ermoglicht das Aufdecken von Korrelationen. Hierbei spielt die Zuordnung

48 KAPITEL 5. ZEITDARSTELLUNG AUF KARTEN

der Merkmale eine entscheidende Rolle. Durch die Verwendung des informations-theoretischen Ansatzes aus [The95] zur Bestimmung von stark zusammenhangendenMerkmalen kann die Vorberechnung einer gunstigen Seitenanordnung erfolgen.

Helices uber der Karte

Ahnlich wie bei der Verwendung der Lexis Pencils auf Karten, jedoch bei der Dar-stellung eines zyklischen Zeitbezuges besser geeignet ist die Positionierung von He-lices. In Abschnitt 3.4.4 wurde die Darstellung zeitabhangiger Daten in Helixformals Erweiterung der Spiraldarstellung fur den Umgang mit sehr großen Datensatzenvorgestellt.

Ein Positionieren von Helices fur jeden Beobachtungspunkt der Karte ist leichtrealisierbar; es erfolgt analog zur Verwendung der Lexis Pencils eine senkrechte Dar-stellung der Helices uber der Karte. So konnen mehrere Zyklendurchlaufe gleichzei-tig in ihrem raumlichen Kontext angezeigt werden. Wird eine Helix in der grafischenDarstellung als schmales Band reprasentiert, so lassen sich mehrere Merkmale farb-kodiert auf diesem Band abbilden, was in Abbildung 5.2 verdeutlicht wird.

Helixband

Karte

Auswahl

von Zyklen

projizierte

Spiraldarstellung

Abbildung 5.2: Helices uber der KarteHier soll die Moglichkeit der Verbindung der Helixdarstellung mit der Karte veranschau-

licht werden. (Dies geschieht nur skizzenhaft.)

Fur die Navigation gilt (wieder analog zu Lexis Pencils), dass die Orientierungjeder Helix zum Betrachter beim Bewegen durch die virtuelle Welt erhalten bleibenmuss. Neben der Rotation der Helices sollte eine weitere Interaktion angeboten wer-den: wie bei der Spiraldarstellung, ist das explorative Auffinden von Periodizitatenin den Daten durch interaktive Veranderung der Anzahl der Datenwerte pro Zykluszu ermoglichen.

Der Vorteil der Darstellung in Helixform liegt in der besonderen Eignung zurVeranschaulichung der zeitliche Entwicklung von Datenwerten eines Zeitpunktesbzw. -intervalls uber mehrere Zyklendurchlaufe. Nachteilig wirkt sich hier jedoch diedreidimensionale Darstellung aus. So ist auf Grund der geometrischen Form einerHelix stets nur die Halfte eines Zyklus’ sichtbar, jedoch kann die Art der Verwendungder Helix in [WAM01] wieder Abhilfe schaffen: Durch Auswahl aufeinander folgenderZyklendurchlaufe wird das Projizieren deren Darstellung als Spirale auf die ebeneKarte moglich (vgl. Abb. 5.2).

5.2. NEUE KONZEPTE ZUR ZEIT- UND KARTENDARSTELLUNG 49

Maximumanalyse

In [Got97] wird die Visualisierung von zeitabhangigen Gesundheitsdaten auf Kar-ten mittels sogenannter Maximumikonen vorgestellt. Es wird fur jedes Gebiet derKarte eine Ikone erzeugt, die mittels eines Zeigers das Zeitobjekt markiert, fur dasein maximaler Datenwert vorliegt, sodass das Erkennen von Ausbreitungen vonKrankheiten moglich wird.

Abbildung 5.3: Ursprungliche Darstellung Carlsteins (aus [SW97] entnommen)Die Darstellung veranschaulicht fur den Zeitraum eines Tages, wann sich eine Person wo

aufgehalten hat. Dies geschieht durch einen zusammenhangenden Linienzug. Es ist zu

erkennen, dass die Person am Tagesanfang zu Hause war und dann in chronologischer

Reihenfolge die Arbeitstelle, die Bank, erneut die Arbeit und die Post besuchte und am

Ende des Tages nach Hause zuruckkehrte. Die Verweildauer an den verschiedenen Orten

kann ebenfalls abgelesen werden.

In [SW97] wird auf eine, bereits 1978 in einer Veroffentlichung von Carlsteinvorgestellte Darstellung zur Veranschaulichung der zeitlichen Veranderung des Auf-enthaltsortes eines Individuums verwiesen. Auch dort dient die 3. Dimension zurReprasentation der Zeit (vgl. Abb. 5.3). Nach [SW97] ist diese Darstellungsform inder Vergangenheit auf Grund des hohen Aufwands bei deren Erstellung nur sehrselten eingesetzt worden. Southall und White stellen aber auch fest, dass sich unterAnwendung heutiger Methoden der Computergrafik sehr schnell derartige Visuali-sierungen realisieren lassen. Daher soll im Folgenden ein neues Konzept erlautertwerden, das die beschriebene Darstellung mit dem Prinzip der Visualisierung vonMaxima vereint.

Dazu erfolgt zunachst fur jeden Beobachtungspunkt das Eintragen einer senk-recht zur Karte stehenden Zeitachse. Alle so definierten Zeitachsen sind einheitlichskaliert. Fur jedes Zeitobjekt des betrachteten Zeitraumes erfolgt die Ermittlungdes Gebietes mit einem maximalen Datenwert. Zeitobjekte, fur die ein Maximumvorliegt, werden auf den entsprechenden Zeitachsen markiert. Man kann sich vor-stellen, dass sukzessiv fur jedes Zeitobjekt eine Perle auf jede Zeitachse geschobenwird: eine rote bei maximalem Datenwert, fur alle anderen eine farblose. So ist furjedes Gebiet sichtbar, ob und wann ein maximaler Datenwert vorliegt. Durch Ver-binden der zeitlich aufeinander folgenden Maxima mit Linien kann das Erkennenraumlicher Zusammenhange erheblich erleichtert werden (siehe auch Abb. 5.4). Zubeachten ist, dass bei den Zeitobjekten, fur die in mehreren Beobachtungspunkten

50 KAPITEL 5. ZEITDARSTELLUNG AUF KARTEN

derselbe maximale Datenwert vorliegt, eine Aufspaltung des Linienzuges erfolgenmuss.

Abbildung 5.4: Neues Konzept zur MaximumanalyseHier ist skizziert, wie in Verbindung mit der Bestimmung des maximalen Auftretens einer

betrachteten Krankheit deren Ausbreitungen veranschaulicht werden kann.

Eine so prasentierte 3D-Darstellung erlaubt eine einfachere Analyse der zeitli-chen und raumlichen Ausbreitung einer Krankheit. Fur die vergleichende Darstel-lung mehrerer Krankheiten ware die Einfuhrung separater farbkodierter Zeitachsenfur jede Krankheit denkbar. Hierbei konnte es jedoch leicht zu Uberschneidungender Linienverbindungen kommen, sodass die Anzahl der vergleichbaren Krankheitenbegrenzt ist.

Anwendung von Volumenvisualisierungen

Abschließend soll eine weitere Moglichkeit zur Visualisierung zeitabhangiger Datenmit Raumbezug aufgezeigt werden, bei der von einem punktuellen raumlichen sowieeinem quasistatischen oder dynamischen zeitlichen Bezug ausgegangen wird. Ist dieDatendichte sehr hoch, das heißt, dass sehr viele Beobachtungspunkte sehr nahebeieinander liegen, lasst sich bei der Betrachtung nur eines Merkmals die Daten-menge als Volumen auffassen. Dieses ließe sich uber einer 3D-Karte mit Hilfe vonTechniken zur Volumenvisualisierung1 darstellen. Neben Dekompositionsmethodenund der Extraktion von Isoflachen ist die farbkodierte Darstellung von Schnittensicherlich am sinnvollsten. Abbildung 5.5 zeigt eine solche Schnittdarstellung.

Abbildung 5.5: Schnittdarstellung eines klimatologischen Datensatzes (aus [SSU97])

Eine Anwendung von Schnittdarstellung fur die Visualisierung von Gesundheits-daten konnte auch in Betracht gezogen werden. Es ist jedoch davon auszugehen,

1Speziell fur die Klasse der Volumendaten entwickelte Visualisierungstechniken. In [SM00] wer-den Volumendaten als skalare Daten uber einem dreidimensionalen regelmaßigen Gitter angesehen.

5.2. NEUE KONZEPTE ZUR ZEIT- UND KARTENDARSTELLUNG 51

dass auf Grund der geringen Datendichte, keine so”weichen“ Darstellungen wie in

Abbildung 5.5 erreicht werden konnen. Gleichfalls wurde der lokale Raumbezug dieEinfarbung großerer Bereiche eines Schnittes mit derselben Farbe erfordern. Diedurch geografische Gegebenheiten bedingte unterschiedliche Große solcher Bereichekann die Expressivitat der Darstellung jedoch einschranken.

In jedem Fall wurden auch bei dieser Art der Darstellung raumliche und zeitlicheVerteilungen — wenn auch nur auf Schnitten durch Raum und Zeit — gleichzeitigsichtbar gemacht werden konnen.

Fazit

Durch die Ausnutzung der dritten Darstellungsdimension zur Abbildung der Zeit ist— neben dem gleichzeitigen Erkennen zeitlicher und raumlicher Zusammenhange— auch eine intuitive Navigation durch die Daten gesichert. Die umfangreichenMoglichkeiten zur Exploration wiegen den Nachteil der, bei der Abbildung der drei-dimensionalen virtuellen Welt auf eine zweidimensionale Anzeigeflache auftretendenVerdeckungen auf.

5.2.3 Mehrfensterkonzept

Das bereits erwahnte Mehrfensterkonzept zur Darstellung zeitabhangiger Datenberuht auf der Anordnung von Visualisierungsfenstern mehrerer Zeitpunkte oder-intervalle. Fur die im Folgenden genannten Fensteranordnungen soll davon ausge-gangen werden, dass die Fenster jeweils eine Kartendarstellung enthalten, die denraumlichen Bezug der Daten zu einem bestimmten Zeitpunkt oder -intervall visua-lisieren.

Lineare Anordnung

Liegt den Daten eine lineare Zeitachse zu Grunde, ist das lineare Anordnen (vgl.Abb. 5.6 oben) der Fenster ein adaquates Mittel zur Darstellung. Hierbei wareHintereinanderreihung in horizontaler oder vertikaler Richtung denkbar. Horizon-tale Anordnungen werden jedoch haufiger verwendet, da sie eher mit einer linearenZeitachse assoziiert werden.

Bei einer kleinen Menge von Fenstern ist die lineare Anordnung ohne Proble-me moglich. Nimmt die Anzahl der darzustellenden Fenster jedoch zu, konnen sienicht mehr alle gleichzeitig angezeigt werden. Hier konnte dann entweder die Be-schrankung auf eine Teilmenge der Fenster oder aber der Einsatz des Fokus&Kontext-Konzeptes eine Losung sein.

Um die einfache Auswahl einer Teilmenge von Fenstern gewahrleisten zu konnen,soll eine intuitive Benutzungsschnittstelle vorgestellt werden. Das Sinnbild einesKleinbild-Fotofilms, der von einer Filmrolle in eine andere gespult wird, ist jeder-mann gelaufig. So liegt es nahe, eine ahnliche Situation fur die Auswahl einer Se-quenz von Fenstern zu nutzen. Hierzu werden jeweils links und rechts der horizon-talen Fensteranordnung

”Filmrollen“ positioniert (siehe Abb. 5.6 Mitte), aus denen

mittels Interaktion neue Fenster hervortreten oder wieder in ihnen verschwinden.Uber eine Fullstandanzeige an jeder Filmrolle kann der Benutzer die Position deraktuellen Sequenz bezuglich der gesamten Zeitachse erkennen. Eine so aufgebau-te Mehrfenstertechnik stellt eine einfach zu handhabende und dennoch effektiveSchnittstelle zwischen Mensch und Maschine dar.

Die Beschrankung auf eine Teilmenge von Fenstern kann bei der Verwendungeiner Fokus&Kontext-Technik aufgehoben werden. Ein Beispiel fur diese Art derDarstellung einer linearen Anordnung ist in Abbildung 5.6 (unten) gegeben. Hier

52 KAPITEL 5. ZEITDARSTELLUNG AUF KARTEN

wird durch das Skalieren (Verkleinern) der Fenster der benotigte Anzeigeplatz ver-ringert. Im Zentrum der Darstellung steht ein Fenster stets in voller Große zurvisuellen Analyse zur Verfugung (Fokus). Links und rechts vom Fokus geht durchdie zunehmende Verkleinerung der Fenster zwar ein erheblicher Teil der Informatio-nen fur diese Teile der Zeitachse verloren, dennoch ist ein gewisser Uberblick stetsmoglich (Kontext). Durch interaktives Verschieben des Fokusbereiches kann der An-wender jedes Fenster in seiner ursprunglichen Große genau untersuchen. Diese Artder Darstellung ist bis zu einer anwendungsabhangigen Anzahl von Fenstern sehrgut moglich. Wird sie jedoch uberschritten, so kann es sein, dass die Fenster im Kon-textbereich der Anzeige so stark skaliert werden mussen, dass selbst die unmittelbaran das Fokusfenster grenzenden Teile der Darstellung nicht mehr erkennbar sind.In diesem Fall sollte auf die Auswahl von Teilsequenzen zuruckgegriffen werden,die mit der Fokus&Kontext-Darstellung sehr gut kombiniert werden kann, indemdie oben beschriebenen Filmrollen auch hier zum Begrenzen eines Teilausschnittesverwendet werden.

1950 1960 1970 1980 1990

1960 1970 1980

1950 1960 1970 1980 19901940 2000

Abbildung 5.6: Lineare AnordnungDas Bild zeigt verschiedene Moglichkeiten zur linearen Anordnung von Fenstern. Die Dar-

stellung des Pfeils zwischen den einzelnen Fenstern betont den zeitlichen Verlauf.

Zyklische Anordnung

Bei Daten mit zyklischem Zeitbezug ist die Anordnung der Fenster ebenfalls aufZyklen sinnvoll. Je nach Fensterinhalt kommen Anordnungen auf Rechtecken oderEllipsen in Frage. Die Abbildung 5.7 stellt beide Formen vergleichend dar. Die Posi-tionierung auf einer Spirale (ahnlich zu Abschnitt 3.4.4) kann ebenfalls in Betrachtgezogen werden.

Muss auf Grund einer großeren Menge von Fenstern fur die Darstellung eine Be-schrankung auf eine Teilmenge erfolgen, so lasst sich diese mit der folgenden Technikdarstellen. Hierzu erfolgt die Anordnung der Fenster in Form eines dreidimensiona-len flachen Rades (bzw. Hohlzylinders), auf dessen Innenseite die Fenster abgebildetsind. Die Prasentation des Rades erfolgt so, dass der Benutzer den Eindruck erhalt,er schaue fast parallel zur Ausdehnung des Rades und senkrecht zur gedachten Ach-

5.2. NEUE KONZEPTE ZUR ZEIT- UND KARTENDARSTELLUNG 53

Oktober

Januar April

Juli

Januar April

Oktober Juli

Abbildung 5.7: Zyklische AnordnungDie Abbildung zeigt die Anordnung der Fenster in Rechteckform (links) und auf einer Ellip-

se (rechts). Um den Charakter des Jahres zu unterstreichen, sind zu den Quartalsgrenzen

jeweils breitere Abstande zwischen den Fenstern.

se in das Rad hinein. Um die Verschwendung von Anzeigeplatz zu vermeiden, reichtes aus, die Darstellung auf den Teil zu beschranken, in dem Informationen sichtbarsind. Wichtig ist, dass das Sinnbild des Rades erhalten bleibt. In Abbildung 5.8 wirddies deutlich. Weitere Moglichkeiten stellen das Abbilden der Fenster auf die Au-ßenseite des Rades oder das waagerechte Prasentieren des Rades dar. Manuell durchgeeignete Interaktionsformen oder automatisch durch einen Steuerprozess muss ei-ne Rotation des Rades durchgefuhrt werden konnen. Eine ahnliche Prasentationmehrerer geografischer Karten wird auch in [Mac95] vorgeschlagen.

Abbildung 5.8: Zyklische Anordnung in Form eines RadesIn diesem Fall sind die Fenster auf die Innenseite des Rades projiziert. Der blau gestrichelte

Rahmen zeigt den fur die Darstellung minimal benotigten Anzeigeplatz.

Bei der Anordnung der Fenster in zyklischer Form ergibt sich die Frage, wieDaten verschiedener Zyklendurchlaufe auf einmal dargestellt werden konnen. Da-zu ist es notwendig, dass die entsprechende Visualisierungstechnik die Daten einesZeitpunktes bzw. -intervalls fur verschiedene Durchlaufe in einem Fenster anzei-gen konnen muss. Exemplarisch ware die vergleichende Darstellung eines Monatsfur mehrere Jahre. Die Fenster der Monate konnen dann wie gewohnlich zyklischangeordnet werden.

Fazit

Die hier vorgeschlagenen Fensteranordnungen und Interaktionsmethoden sind intui-tiv verstandlich und ermoglichen die Darstellung von Daten in ihrem zeitlichen undraumlichen Kontext. Durch Abstraktion von der konkreten Auspragung der Kar-te und der verwendeten Zeitvisualisierung ist der Einsatz der Mehrfenstertechnikin vielen Anwendungsbereichen denkbar, die Beschrankung auf eine relativ geringe

54 KAPITEL 5. ZEITDARSTELLUNG AUF KARTEN

Anzahl von darstellbaren Fenstern zahlt jedoch zu den Nachteilen des Mehrfenster-konzeptes.

5.2.4 Adaption von Kalenderdarstellung und Clusterung

Im folgenden Abschnitt, soll erklart werden, wie sich Methoden und Darstellungs-formen der in Abschnitt 3.4.3 vorgestellten Kalendertechnik zur Visualisierung vonGesundheitsdaten anpassen lassen.

Multiparametererweiterung der Darstellung

11 22 33

88 99

15

10

16 17

22 23 24

29 30 31

44 55 66

11 12

18

13

19 20

25 26 27

77

14

21

28

SoSaFrDoMiDiMo

Wo 1

Wo 2

Wo 3

Wo 4

Wo 5

25ICD#8ICD#4

ICD#32 ICD#21

Abbildung 5.9: Konzept zur Multiparametererweiterung der Kalenderdarstellung

Nachteil der in [vWvS99] entwickelten Technik ist die Beschrankung auf Einpa-rameterdaten. Gerade in Bezug auf die Vergleichbarkeit verschiedener Krankheitenund deren zeitlichen Verlaufe ist eine Erweiterung der bestehenden Technik not-wendig. Vorstellbar ware hierfur die Erweiterung des Diagramms um eine dritteDimension, auf der die Krankheiten abgebildet werden konnten. Um auch den Ka-lender multiparameterfahig zu machen, konnte eine Unterteilung der Tagesfeldererfolgen, ahnlich wie es beim Shape Coding (siehe [SM00]) der Fall ist (vgl. Abb.5.9). Hierbei sollte die Anzahl der Krankheiten allerdings nicht zu hoch gewahltwerden, da sonst auf Grund der Einteilung sehr kleine Bereiche entstehen, die dannnicht mehr eindeutig erkennbar waren. In diesem Falle wurde sich der Einsatz desFokus&Kontext-Konzeptes anbieten. Mit einer so erweiterten Kalenderdarstellungist dann die indirekte Kombination mit einer Karte denkbar.

Anpassung der Clusterung

Eine weitere Moglichkeit zur Erweiterung wurde die Adaption des verwendetenClusterverfahrens an multivariate zeit- und raumabhangige Daten darstellen. Inseiner ursprunglichen Form eignet sich das Clusterverfahren zur Zusammenfassungahnlicher zeitlicher Verlaufe. Es werden ahnliche Datenvektoren di = (xi0, . . . , xin)zusammengefasst, wobei xij die Datenwerte darstellen. In [vWvS99] beruhen dieDatenwerte xij auf den erfassten Daten der Stunde j eines Tages i. Somit werdendurch die Clusterung ahnliche Tage ermittelt.

Um eine raumliche Clusterung zu erhalten, konnen folgende Datenvektoren kon-struiert werden. Fur einen festes Zeitobjekt wird xij definiert als Anzahl des Auf-treten einer Krankheit j fur den Beobachtungspunkt i. Das Clusterverfahren fasst

5.2. NEUE KONZEPTE ZUR ZEIT- UND KARTENDARSTELLUNG 55

Abbildung 5.10: Darstellung einer raumlichen und zeitlichen ClusterungDie Abbildung zeigt ein erstes Bild einer Implementation zur Darstellung der Clusterung

auf Karten. Im linken Fenster kann der Anwender die anzuzeigenden Cluster auswahlen,

im mittleren wird fur die einzelnen Cluster der zeitliche Verlauf einer vorher bestimmten

Krankheit als Diagramm angezeigt. Welche Gebiete zu einem der Cluster gehoren, wird

auf der Karte mittels Einfarbung visualisiert.

dann bezuglich der ausgewahlten Krankheit(en) ahnliche Gebiete zusammen. Ana-log zur Darstellung in [vWvS99] konnte durch den Benutzer eine Auswahl ihn inter-essierender Cluster erfolgen, fur die er die Datenwerte in Diagrammform angezeigtbekommt. Allerdings wurde der Kalender durch eine Karte ersetzt werden, die ubereine Einfarbung der Gebiete deren Zugehorigkeit zu den Clustern verdeutlicht.

Eine weitere Moglichkeit der Clusterung zur Kombination zeitlicher und raum-licher Merkmale kann wie folgt realisiert werden: Die Datenwerte xij bekommendie Anzahl des Auftretens nur einer festen Krankheit zu den Zeitobjekten j desbetrachteten Zeitraumes in den Beobachtungspunkten i zugewiesen. So werden Ge-biete zusammengefasst, die eine ahnliche zeitliche Entwicklungen der Krankheitaufweisen. Abbildung 5.10 zeigt, wie dies dargestellt werden kann.

Dabei kann es je nach ausgewahlten Clustern dazu kommen, dass ein Gebietmehreren Clustern angehort. In diesem Fall hat die Einfarbung der im entstande-nen Clusterbaum tiefer liegenden Cluster Vorrang vor hoheren. Dennoch bleibt dasProblem, dass die Zugehorigkeit zu mehreren Clustern nicht verdeutlicht wird. EineLosung stellt die Anwendung der im Abschnitt 4.3 vorgestellten Enridged ContourMaps dar.

Die vorgeschlagene Erweiterung zur Multiparameterdarstellung des Kalenderskann — wenn auch in abgewandelter Form — zur vergleichenden Analyse meh-rerer Krankheiten eingesetzt werden. Eine einfache Unterteilung der Gebiete inAbhangigkeit von der Anzahl der betrachteten Krankheiten ist auf Grund ihrer re-gellosen Form nicht mehr expressiv. Vielmehr sollten direkt oder semidirekt auf derKarte positionierte Farbikonen (siehe [SM00]) die visuelle Verbindung zwischen Dia-grammdarstellung der Datenwerte ausgewahlter Cluster und Clusterzugehorigkeiteines Gebietes herstellen. Es bleibt zu untersuchen, wie in diesem Fall die Zugehorig-keit zu mehreren Clustern veranschaulicht werden kann.

Fazit

Die unterschiedliche Bildung und Darstellung von Clusterungen ist fur die Aufde-ckung von Zusammenhangen in Gesundheitsdaten sehr interessant. Diese Problema-tik ist jedoch nicht Schwerpunkt der vorliegenden Arbeit, sondern wurde in [Kor02]detaillierter behandelt.

56 KAPITEL 5. ZEITDARSTELLUNG AUF KARTEN

5.3 Klassifikation von Zeitvisualisierungen auf Kar-ten

Zur Klassifikation der entwickelten Konzepte konnen die bereits in den vorherigenAbschnitten vorgestellten Klassifikationkriterien fur Zeitdarstellungen und Visua-lisierungen auf Karten herangezogen werden. Ein weiteres Klassifikationskriteriumfur die Kombination von Zeitdarstellungen mit Karten wird vorgestellt und eineEinordnung der Konzepte entsprechend ausgewahlter Kriterien erfolgt.

Klassifikation bezuglich der Darstellung des Raum- und Zeitbezuges

Die entwickelten Konzepte zur Zeitdarstellung auf Karten lassen ein Klassifikati-onskriterium finden, das die Art der Verdeutlichung des Bezugssystems im Prasen-tationsraum betrifft. Der Prasentationsraum kann hierbei je nach Auspragung derDarstellung zwei- oder dreidimensional sein. Es sind Visualisierungstechniken un-terscheidbar, die eine

• explizite Darstellung des raumlichen und zeitlichen Bezuges oder eine

• implizite Darstellung des raumlichen und zeitlichen Bezuges

vornehmen.Von einer expliziten Darstellung des Raum- und Zeitbezuges soll gesprochen

werden, wenn jede Achse des Prasentationsraumes ausschließlich zur Verdeutlichungeiner unabhangigen Variable genutzt wird. Dies ist z.B. bei den vorgestellten Kon-zepten zur Verwendung der 3. Dimension als Zeitachse der Fall.

Eine implizite Darstellung des raumlichen und zeitlichen Bezuges liegt vor, wennAchsen des Prasentationsraumes gleichzeitig zur Verdeutlichung des raumlichen Be-zugssystems und der Zeitachse genutzt werden. Ein Beispiel hierfur ist die Positio-nierung von Ikonen auf der Karte.

Um Uberlappungen relevanter Informationen zu vermeiden, ist im Allgemeinendie explizite Darstellung anzustreben. Dies lasst sich jedoch nicht fur alle Anwen-dungsfalle realisieren und birgt unter Umstanden Nachteile. Wird z.B. zur Darstel-lung der Zeitachse die 3. Dimension des Prasentationsraumes genutzt, so kann es beidessen Projektion auf ein zweidimensionales Anzeigemedium (z.B. Monitor) eben-falls zu Verdeckung von Informationen kommen. Fur verschiedene Anwendungskon-texte ist somit stets neu zu uberdenken, wie welche Achsen des Prasentationsraumeszur Veranschaulichung des raumlichen und zeitlichen Bezuges der Daten genutztwerden sollen.

Einordnung der Konzepte

Die entwickelten Konzepte sollen nun bezuglich des neuen Klassifikationskriteri-ums und bezuglich der Dimensionalitat der Kartendarstellung, der Anzahl der proBild darstellbaren Zeitobjekte sowie der Anzahl der darstellbaren zeit- und raum-abhangigen Merkmale eingeordnet werden.

Das Konzept der Ikonifizierung und Positionierung geht davon aus, dass auf einer2D-Kartendarstellung zusatzlich die zeitliche Dimension in Ikonenform dargestelltwird. Die Ikonen erlauben im Allgemeinen das Visualisieren mehrerer Merkmalebezuglich mehrerer Zeitobjekte.

Das Konzept zur Verwendung der 3. Dimension als Zeitachse ordnet als einzi-ges der vorgestellten Konzepte jeder Achse des Prasentationsraumes nur eine un-abhangige Variable zu. Es arbeitet mit einer 3D-Kartendarstellung und ermoglichtebenfalls die Darstellung mehrerer Merkmale bezuglich mehrerer Zeitobjekte.

5.3. KLASSIFIKATION VON ZEITVISUALISIERUNGEN AUF KARTEN 57

Fur das Mehrfensterkonzept ist die implizite Darstellung des Raum- und Zeit-bezuges notwendig. Es sind 2D- oder 3D-Kartendarstellungen denkbar, die zur Vi-sualisierung eines oder mehrerer Merkmale bezuglich mehrerer Zeitobjekte zusam-mengefasst werden.

Ahnliches gilt auch fur die Adaption von Kalenderdarstellung und Clusterung.Hier wird sich jedoch auf 2D-Kartendarstellungen beschrankt und es sind auchVisualisierungen bezuglich nur eines Merkmals denkbar.

Die Einordnung der Konzepte ist zusammenfassend in Abbildung 5.11 darge-stellt.

Ikonifizierung und

Positionierung

Verwendung der

3. Dimension als

Zeitachse

Mehrfensterkonzept

Adaption von

Kalenderdarstellung

und Clusterung

Darstellung des

Raum− und

Zeitbezuges

Anzahl der

Zeitobjekte pro

Bild

Anzahl der

Merkmale

implizit

explizit

implizit

implizit

2D

3D

2D / 3D

2D

mehrere

mehrere

mehrere

eins / mehrere

mehrere

eins / mehrere

eins / mehrere

eins / mehrere

Dimensionalität

der

Kartendarstellung

Abbildung 5.11: Einordnung der Konzepte

Kapitel 6

Das VisualisierungssystemLandV ist

Im Rahmen dieser Arbeit wurde das Visualisierungssystem LandV ist entwickelt.Der Name leitet sich aus dem in [Tom01] entwickelten Prototyp zur Kartendarstel-lung LandVis ab. Das tiefgestellte t soll hier die besondere Stellung zeitabhangigerDaten (abgeleitet aus dem engl. time) hervorheben.

In den folgenden Abschnitten sollen die Anforderungen an das System, die Be-dingungen fur den Einsatz von LandV ist sowie dessen Architektur beschriebenwerden. Danach werden Details der Kartendarstellung verdeutlicht. Eine Erlaute-rung der zur Verfugung stehenden Visualisierungstechniken schließt sich an. Hierbeiwird teilweise auf den vorhergehenden Abschnitt 3.4 zuruckgegriffen.

6.1 Anforderungen

Fur die Implementierung des Systems wurde auf die objektorientierte Programmier-sprache Java (siehe Anhang A) zuruckgegriffen. Das Entwicklerpaket J2SDK (Java2Software Development Kit) der Version 1.4 beta kam hierbei als Programmierum-gebung zum Einsatz. Die Verwendung einer noch nicht vollstandig abgeschlossenenBeta-Version ist durch das Vorhandensein verschiedener neuer Klassen (z.B. furregulare Ausdrucke1) in der Version 1.4 gerechtfertigt. Da sich an den Klassen-beschreibungen, das heißt den Schnittstellen zu den Klassen, bis zur endgultigenFreigabe der Version 1.4 nichts mehr andern wird (lediglich klasseninterne Imple-mentationsdetails konnten sich andern), sollte LandV ist auch problemlos mit derendgultigen Version 1.4 zusammenarbeiten.

Hard- und Softwarebedingungen

Fur die Entwicklung bzw. den Einsatz von LandV ist ergeben sich folgende Bedin-gungen an die Hard- und Software.

1. Bedingung fur die Lauffahigkeitkeit von LandV ist ist das Vorhandensein derJava 1.4 Laufzeitumgebung. Fur den Einsatz im Internet muss weiterhin einBrowser zur Verfugung stehen, der mit der virtuellen Maschine der Laufzeit-umgebung zusammenarbeiten kann.

2. Um einen effizienten Umgang mit den Daten zu ermoglichen, ist der Einsatz ei-nes Datenbankmanagementsystems (DBMS) unabdingbar. Zum Einsatz kann

1Regulare Ausdrucke ermoglichen die einfache und schnelle Auswertung von Stringvergleichennach gewissen Regeln.

58

6.1. ANFORDERUNGEN 59

jedes DBMS kommen, das einen Treiber fur die Java-DatenbankschnittstelleJDBC zur Verfugung stellt.

3. Es sollten die minimalen Hardwarebedingungen der Java-Laufzeitumgebungerfullt werden. Diese sind fur die jeweilige Version auf den Internetseiten derSun Microsystems Inc. ([Sun02]) nachzulesen. Gleichfalls muss den Anforde-rungen des jeweiligen DBMS Rechnung getragen werden. Es wird jedoch emp-fohlen, eine leistungsstarkere Rechnerplattform einzusetzen, als es die Mini-malbedingungen beschreiben. Begrundet liegt dies in der intensiven Nutzungder grafischen Ausgabeklassen von Java sowie der Tatsache, dass auf das Da-tenbankmanagementsystem teilweise sehr hohe Last ausgeubt werden kann.

Entwickelt wurde das System LandV ist auf einem Athlon 650MHz mit 492MBHauptspeicher, der gleichzeitig auch Haupttestplattform war. Als Java-fahiger Brow-ser kam der Netscape Browser 6.1 zum Einsatz. Bei der Wahl des DBMS fiel dieEntscheidung auf MySQL in der Version 3.23.41. Die weite Verbreitung von MyS-QL sowie die bekannte Schnelligkeit dieses DBMS bewogen zu der Entscheidung.Viel wichtiger jedoch waren die freie Verfugbarkeit von MySQL und der geringeadministrative Aufwand beim Einrichten der Datenbank.

Anforderungen bezuglich der Daten

Da LandV ist zur Visualisierung von Gesundheitsdaten entwickelt wurde und eineIntegration im Projekt TeCoMed vorgesehen ist, mussen entsprechende Anforde-rungen an die zu visualisierenden Daten gestellt werden.

1. Als Kartendaten kommen nur solche in Frage, die im lvis-Format (vgl. [Tom01])vorliegen.

2. Die zu visualisierenden Daten mussen einen quasistatischen Zeitbezug vorwei-sen, der uber die Angabe eines Datums hergestellt wird.

3. Der raumliche Bezug der Daten muss lokalen Charakter haben. Er sollte ubereine sekundare Metrik (z.B. eine Gebietsnummer) hergestellt werden.

In LandV ist werden der Datensatz von Mecklenburg-Vorpommern und aus demTeCoMed-Projekt abgeleitete Gesundheitsdaten verwendet. Eine direkte Ubernah-me der TeCoMed-Daten war nicht moglich, da eine standige Verfugbarkeit fur dieDauer der Entwicklung nicht gewahrleistet werden konnte.

Anforderungen an LandV ist

Ziel des Systems LandV ist ist die Kombination von Visualisierungstechniken zurDarstellung zeitabhangiger Daten mit einer geografischen Karte. Aus diesem Ziellasst sich eine Reihe von Anforderungen formulieren.

1. Die Visualisierung muss den Forderungen nach Expressivitat und Effektivitatnachkommen. Die Angemessenheit der entwickelten Techniken wird nur alswunschenswert bezeichnet, da das System LandV ist prototypischen Charak-ter tragt und eine Optimierung aller Techniken im Rahmen dieser Arbeit nichterfolgen kann.

2. Die Darstellung der Karte muss wegen ihrer zentralen Bedeutung konsistentsein (vgl. [Tom01]); Gebietsgrenzen verschiedener Granularitatsstufen mussendeutlich angezeigt werden. Die aus kartografischen Systemen und GIS be-kannte Funktionalitat sollte allerdings nur in einem eingeschrankten Rahmenubernommen werden, um die Komplexitat des Systems niedrig zu halten.

60 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

3. Es muss ein hoher Grad an Nutzerfreundlichkeit erreicht werden, um dasSystem einer großen Gruppe von Anwendern zuganglich zu machen.

4. Das System sollte so gestaltet sein, dass es leicht erweiterbar ist. Hierbei liegtdas Hauptaugenmerk auf der spateren Integration weiterer Visualisierungs-techniken.

5. LandV ist muss ein ressourcenschonendes und außerst performantes Laufzeit-verhalten aufweisen, um auf moglichst vielen Systemplattformen einsetzbarzu sein und einen hohen Grad an Interaktivitat bieten zu konnen.

Diese sehr allgemein gehaltenen Forderungen zeigen, dass ein einfaches und den-noch leistungsstarkes System entstehen soll. Dazu muss dem Benutzer ein uber-sichtlicher Funktionsumfang zur Verfugung stehen, ohne dass er mit schwierigenBefehlen oder komplexen Funktionsschritten uberlastet wird. Mit diesem Funkti-onsumfang soll ein Hochstmaß an Aufgaben abgedeckt werden. Die Forderung nachErweiterbarkeit der Visualisierungstechniken spiegelt die Dynamik wider, die aktuellin diesem Forschungsbereich herrscht. So konnten z.B. wahrend des Entwicklungs-prozesses bekannt gewordene neue Techniken problemlos in LandV ist integriertwerden.

6.2 Datenverwaltung

Das Auslesen von Daten aus Dateien, wie es haufig bei Prototypen von Visualisie-rungstechniken praktiziert wird, ist bei zeitabhangigen Daten im Allgemeinen nichtmehr moglich. Fur den vorliegenden Fall der Gesundheitsdaten gilt dies besonders.Die Menge der Daten ist so umfangreich und nimmt standig zu, sodass ein DBMSzum Einsatz kommen muss. Aber nicht nur die Fahigkeit zum Umgang mit großenDatenmengen, sondern auch die Moglichkeit des Einsatzes von Anfragesprachenberechtigen die Forderung nach einem DBMS.

Fur das Zusammenspiel mit LandV ist wurde ein relationales, SQL-fahiges DBMSgewahlt2. Hierdurch ist das Ablegen von Informationen in Tabellenform moglich,auf die mittels SQL-Anfragen zugegriffen werden kann.

Fur den zur Verfugung stehenden Teil der Gesundheitsdaten aus TeCoMed wur-de ein Datenbankentwurf konzipiert, der die schnelle Auswertung von Anfragenermoglichen soll, was die einzelnen Tabellen und ihr Zusammenspiel folgend aufwei-sen.

Zeitbezug

Der Zeitbezug in den Daten muss nach den formulierten Bedingungen uber einDatum hergestellt werden. Damit ware das Abspeichern des Datum zu den erfass-ten Merkmalen die einfachste Form der Datenhaltung. Hiermit ließen sich jedochAnfragen uber Zeitintervalle (z.B. Wochen oder Monate) nur sehr aufwandig be-rechnen, was diese Art der Speicherung nicht praktikabel macht. Daher wurde dieEinteilung der Zeitachse in mehrere Intervallklassen (Perioden) vorgenommen. Zuden verfugbaren Perioden gehoren Jahr, Quartal, Monat, Woche und Tag. Fur je-de Periode wird die Zeitachse in entsprechende Intervalle zerlegt, die durch einAnfangs- und ein Enddatum gekennzeichnet sind und uber eine Periodennummer(in Zusammenhang mit der Periode) identifizierbar sind. Fur die Intervalle der Pe-riode Tag bedeutet dies, dass Anfangs- und Enddatum stets gleich sind. Durch die

2Fur grundlegende Informationen zu relationalen DBMS und SQL (Structured QueryLanguage) sei auf [HS95] verwiesen.

6.2. DATENVERWALTUNG 61

Festlegung anwendungsspezifischer Intervallklassen ist auch die Bildung anderer In-tervalle denkbar. So ware z.B. die Periode Arbeitswoche moglich, die zur Erstellungvon Intervallen, die mit einem Montag beginnen und einem Freitag (oder Samstag)enden, genutzt werden konnte. Die Abbildung 6.1 verdeutlicht die vorgeschlageneArt der Einteilung der Zeitachse.

... Zeit

...

2002 31.12.2002jahr

2003 01.01.2003jahr

200201 31.03.2002quartal

200202 01.04.2002quartal

200201 31.01.2002monat

200202 01.02.2002monat

200201

Nummer AnfangsdatumPeriode

200202

2002001 01.01.2002tag

2002002

Enddatum

01.01.2002

31.12.2003

01.01.2002

30.06.2002

01.01.2002

28.02.2002

31.12.2001

07.01.2002 13.01.2002

02.01.2002

woche

woche

tag

01.01.2002

06.01.2002

02.01.2002

Abbildung 6.1: Einteilung der Zeit in verschiedene Perioden

Durch diese Art der Datenhaltung kommt es zur redundanten Speicherung vonInformationen. Das heißt, die Daten, die fur die Perioden Jahr, Quartal, Monatund Woche gespeichert sind, enthalten Informationen, die auch in den tagesgenauenDaten verfugbar sind. Die redundante Speicherung ermoglicht jedoch den schnellenZugriff auf die Information. Durch eine Vorberechnung der Perioden kann auf einstandiges Aggregieren von Datenwerten durch die Visualisierungstechnik verzichtetwerden, was eine erhebliche Lasteinsparung bedeutet. Wie immer beim Einsatz vonRedundanz fur eine Zugriffsoptimierung ist auch hier unbedingt auf die standigeKonsistenz der Daten zu achten. Das heißt im Besonderen fur die Gesundheitsda-ten, dass nach dem Hinzufugen neuer Krankschreibungen zur Datenbank stets einRekalkulationsprozess die Konsistenz der Daten wieder herstellen muss. Ein einfa-cher Algorithmus soll die prinzipielle Vorgehensweise hierbei verdeutlichen.

Algorithmus:

foreach Tag t mit neuen Daten datatforeach Periode P ∈ (woche,monat, quartal, jahr)

foreach Intervall I ∈ P mit t ∈ IErmittle Daten dataI des Intervalls IBerechne dataI += datatSchreibe neues dataI in Datenbank

hcaerofhcaerof

hcaerof

Durch diese Art der Vorberechnung ist sichergestellt, dass nur die tatsachlichnotwendige Anzahl von Intervallen berucksichtigt werden muss und dass mittelsSQL-Anfragen stets zu allen Perioden und deren Intervallen korrekte Daten ermit-

62 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

telt werden konnen. Wird aus dem Anwendungskontext das Abfragen von Datenbeliebiger, variierender Intervalle notig, kann fur die Berechnung die hierarchischeStruktur der Zeit ausgenutzt werden. Soll z.B. eine Visualisierung des Intervalls25.01.2002 bis 14.03.2002 erfolgen, ware das Ermitteln von 49 Tagesdatensatzenund deren anschließende Kumulierung notig. Bei Ausnutzung der Hierarchie ist dasAbfragen des Monats Februar, der Woche vom 04.03.2002 bis 10.03.2002 und wei-terer 14 einzelner Tage notwendig. Die Abbildung 6.2 verdeutlicht dies.

49 16

Anzahl der für das

Zusammenrechnen

benötigten

Datenwertemit Ausnutzung

der Hierarchie

(unten)

Januar Februar März49

77 11 11 44

ohne Ausnutzung

der Hierarchie

(oben)

33

Abbildung 6.2: Berechnung der Datenwerte fur beliebige IntervalleVerdeutlicht wird die Berechnung am Beispiel des Intervalls 25.01.2002 bis 14.03.2002. Zu

beachten ist die enorme Aufwandsreduzierung bei Ausnutzung der zeitlichen Hierarchie.

Diese Art der Zerlegung eines beliebigen Zeitintervalls kann unter Umstandenaufwandiger sein als die simple Abfrage der Tagesdaten. Werden jedoch die Inter-valle sehr lang oder soll die Anzahl der Anfragen aus Performancegrunden niedriggehalten werden, stellt die Ausnutzung der Hierarchie eine angemessene Methodedar.

Die vorgestellte Strategie zur Verwaltung der zeitabhangigen Daten hat jedochauch Nachteile. Zum einen vervielfacht sich der benotigte Speicherplatz bei red-undanter Datenhaltung. Dies ist besonders bei sehr großen Datenmengen, wie siez.B. im Rahmen des TeCoMed-Projektes verwendet werden, kritisch, zum anderenerhoht sich die Laufzeit der Berechnungen zur Akkumulation neuer Datensatze.

Daher ist im konkreten Anwendungfall abzuwagen, inwieweit die Zugriffsopti-mierung durch Einfuhrung von Redundanz tragbar ist oder dem Anwender langeWartezeiten zugemutet werden konnen. Die fur diese Arbeit zur Verfugung stehen-den Daten lassen erstgenanntes ohne Einschrankung zu.

Raumbezogene und geografische Daten

Es soll nun auf die raumlichen Daten eingegangen werden. Diese liegen laut denformulierten Bedingungen im Datenformat lvis vor. Hierbei handelt es sich um einVektorformat, dem das topologische Verfahren zu Grunde liegt. Fur eine genaueBeschreibung des lvis-Formates sowie der hierarchischen Struktur der geografischenDaten sei auf [Tom01] verwiesen.

Da die Beschreibung der Gebiete auch losgelost von LandV ist in anderen Syste-men zum Einsatz kommt bzw. kommen soll und dort mitunter die Verwendung vonDBMS nicht geplant ist, liegt der Kartendatensatz in einer Datei vor. Dies machtden Einsatz eines Parsers notwendig, der die Daten aus der Datei ausliest und diejeweiligen Objekte erzeugt. Die Anwendung der in Java 1.4 integrierten Klassen furregulare Ausdrucke erleichtert das Auswerten der Daten hierbei erheblich.

6.2. DATENVERWALTUNG 63

Die Struktur des lvis-Formates wurde auch ein Abbilden der Kartendaten in Ta-bellenform zulassen. So ließen sich die Kartendaten auch in eine Datenbank eintra-gen. In diesem Fall konnte auf ein Einlesen der Datei verzichtet werden. Stattdessenware das Ermitteln der Daten uber SQL-Anfragen moglich. Fur diese Arbeit wurdeauf das Integrieren der Kartendaten in die Datenbank verzichtet. Sollte sich jedochherausstellen, dass vermehrt DBMS-verwendende Systeme die Gebietsbeschreibungeinsetzten, ware dem unbedingt anzuraten.

Der raumliche Bezug der Gesundheitsdaten wird uber eine Gebietskennung her-gestellt. Dabei gibt es zwischen den Gebietskennungen im lvis-Format und denen derGesundheitsdaten des TeCoMed-Projekts Diskrepanzen, die durch eine Zwischenab-bildung der Kennungen auf eine dritte Kennung behoben werden mussen. Dies stelltjedoch bei Verwendung einfacher Abbildungstabellen keine Herausforderung dar.

Die Datenstruktur

Die gerade beschriebenen Vorgehensweisen zur Speicherung und weitere Sachverhal-te bilden das Gesamtbild der Datenstruktur des LandV ist Systems. Hierbei werdenlediglich die Kartendaten nicht durch ein DBMS verwaltet. Samtliche anderen Da-ten liegen jedoch in einer Datenbank, deren Entwurf nun erlautert werden soll.

Der Datenbankentwurf fur LandV ist enthalt vier Tabellen. Hierzu zahlen dieTabellen perioden (Tab. 6.1), krankheiten (Tab. 6.2) und gebiete (Tab. 6.3).Diese Tabellen sind unabhangig von konkreten Gesundheitsdaten, sie stellen eineGrundlage fur ihre Speicherung dar. Die verbleibende Tabelle ist die standig inVeranderung befindliche erkrankungen-Tabelle (vgl. Tab. 6.4). In ihr sind die An-zahl der Erkrankungen pro Gebiet, pro Krankheit und pro Intervall gespeichert. Sieenthalt die hochste Anzahl an Datensatzen.

Spaltenbezeichnung Typ Schlussel

periode VARCHAR(7) Xperiodennr INT(11) Xvon DATE Xbis DATE X

Tabelle 6.1: Beschreibung der perioden-Tabelle der Datenbank

Spaltenbezeichnung Typ Schlussel

krankheitsnr INT(11) Xbezeichnung VARCHAR(120)

Tabelle 6.2: Beschreibung der krankheiten-Tabelle der Datenbank

Spaltenbezeichnung Typ Schlussel

gebietsnr INT(11) Xbezeichnung VARCHAR(60)

Tabelle 6.3: Beschreibung der gebiete-Tabelle der Datenbank

Durch die Verwendung separater Tabellen fur Gebiete und Krankheiten lasst sichder Informationsgehalt der Daten leicht ausbauen. So konnten z.B. zu jedem Gebietnoch Informationen wie Große, Bevolkerungszahl oder ahnliches in entsprechendenTabellenspalten hinterlegt werden. Ist z.B. das Speichern der Struktur des kom-pletten ICD9-Baumes3 (vgl. [Pop98]) notwendig, so ist dies durch Einfugen einer

3Der ICD9-Baum ist eine hierarchische Einteilung aller Infektionskrankheiten.

64 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

Spaltenbezeichnung Typ Schlussel

periode VARCHAR(7) Xperiodennr INT(11) Xgebietsnr INT(11) Xkrankheitsnr INT(11) Xanzahl INT(11)

Tabelle 6.4: Beschreibung der erkrankungen-Tabelle der Datenbank

periode vonperiodennr

tag 24.01.2002

bis

24.01.2002

woche

2002024

07.01.2002 13.01.2002

gebietsnr bezeichnung

18507 18507 Grimmen

130570 Nordvorpommern

krankheitsnr bezeichnung

55 Grippe

11 akute Infektion der oberen Atemwege

periode periodennr

tag 2002024

gebietsnr krankheitsnr

18055 55

woche 200202 1118465

anzahl

99

15

200202

Karte

Abbildung 6.3: Datenbankentwurf fur LandV ist

Spalte, die die ICD9-Kennung des jeweiligen ubergeordneten ICD9-Baumknotensenthalt, moglich.

In Abbildung 6.3 wird zusammenfassend das Gesamtbild des Datenbankentwur-fes skizziert. Auf Grund des immensen Datenvolumens wurde sich fur die Entwick-lung von LandV ist auf 10 AOK Diagnosen (siehe Projektunterlagen TeCoMed) ausden Jahren 1998 bis 2000 beschrankt. Zur Ubernahme der Daten von TeCoMedwurden aus tagesgenauen Daten4 der Gebiete aller raumlichen Hierarchiestufen dieDaten der Wochen, Monate, Quartale und Jahre durch Summieren berechnet.

Fur diese Arbeit war es ursprunglich vorgesehen, direkt auf die Daten aus Te-CoMed zuzugreifen. Da jene Daten aber wahrend der Laufzeit der Diplomarbeitnicht zur Verfugung gestellt werden konnten, wurde dies nicht verwirklicht. Daherist auch nur ein Teil des Datengehaltes des TeCoMed-Projektes fur LandV ist vor-handen und umfangreiche Tests der entwickelten Visualisierungen (z.B. fur Neuer-krankungen oder aktuell Erkrankte5 bzw. absolute bevolkerungsunabhangige Datenund relative bevolkerungsnormierte Daten) sind nicht moglich. Sollte dennoch ei-ne Anbindung an TeCoMed gefordert werden, so durfte dies durch Anpassen derSQL-Anfragen mit moderatem Aufwand realisierbar sein.

4Es stand die Anzahl der Neuerkrankungen zur Verfugung.5Wahrend der Entwicklung von LandV ist wurde festgestellt, dass die Daten der

”aktuell Er-

krankten“ nur irrefuhrenderweise diese Bezeichnung tragen. Vielmehr handelt es sich hierbei umdie durchschnittliche Anzahl der Neuerkrankungen.

6.3. DIE KARTE IN LANDV IST 65

6.3 Die Karte in LandV ist

Fur die Darstellung des zweidimensionalen Raumbezuges der Gesundheitsdatenwurde eine zweidimensionale Karte6 gewahlt. Dies geschah mit Hinblick auf dieIntegration der entwickelten Karte und der entsprechenden Zeitdarstellungen indas TeCoMed-Projekt.

Zur Kartendarstellung in TeCoMed wurde der Prototyp LandVis integriert, der— wie erwahnt — auch hier als Ausgangspunkt genutzt wird. Dessen Implementa-tion liefert eine optisch ansprechende Karte und bietet eine Reihe von Interaktions-und Navigationstechniken. Nachteil an LandVis ist die auf Grund des prototypi-schen Charakters fehlende Optimierung der verwendeten Algorithmen.

Daher wurde fur LandV ist eine Analyse der bestehenden Implementation vor-genommen. Hierbei flossen die Erfahrungen der bisherigen Anwender von LandVissowie die veranderten Anforderungen im Kontext von Zeitdarstellungen mit ein. DieUntersuchungen fuhrten zu dem Ergebnis, dass unbedingt eine Laufzeitoptimierungzu erfolgen hatte. Da die Javaklassen fur grafische Ausgaben selbst nicht optimiertsind7, mussen die sie verwendenden Algorithmen moglichst effizient sein.

Desweiteren war eine Uberarbeitung der Interaktion notwendig. Es erfolgte einkomplettes Redesign der Kartendarstellung, da sich die erforderlichen Anderungennicht durch Erweiterung bzw. Anpassung von LandVis erreichen ließen.

6.3.1 Laufzeitoptimierung der Kartendarstellung

Das hier verwendete Kartendatenformat lvis ermoglicht die redundanzfreie Spei-cherung geografischer Daten durch Verwendung eines topologischen Modells (sieheAbschnitt 2.2), das im Prototypen LandVis bei der Darstellung der Karte jedochnicht weiter eingesetzt wird. Hier liegt der Ansatzpunkt zur Laufzeitoptimierung inLandV ist.

Bei der Darstellung eines zweidimensionalen Gebietes G ⊂ R2 als geschlossenenLinienzug (Polygon) G = (g1, . . . , gn) mit g1 = gn und n ∈ N ist das Durchlaufenaller zum Polygon gehorenden Koordinatenpaare gi = (xi, yi); 1 ≤ i ≤ n notwendig.Fur die Darstellung benachbarter Gebiete G und H wurde also das zweimaligeDurchlaufen deren gemeinsamer Grenze ZGH = (z1, . . . , zk), wobei z1 bis zk diegemeinsamen Koordinatenpaare der beider Polygone sind, erfolgen.

Das lvis-Format vermeidet Redundanz bei der Speicherung, indem Gebiete ingenau solche gemeinsamen Grenzen aufgespaltet werden, auf die fur die Gebiets-beschreibung referenziert wird (siehe [Tom01]). Neu in LandV ist ist, dass fur dasZeichnen der Gebiete auf die Karte diese gegebene Grenzeinteilung genutzt wird,um das wiederholte Durchlaufen gemeinsamer Grenzen zu vermeiden (vgl. Abb.6.4). Hierzu ist der folgende spezielle Darstellungsalgorithmus notwendig.

Algorithmus zeicheGebiet(G):

foreach Grenze Z des Gebietes Gif Z ist im System noch nicht markiert

Zeichne ZMarkiere Z im System als gezeichnet

fihcaerof

Dieser Algorithmus stellt also nur die Grenzabschnitte eines Gebietes dar, dienoch nicht markiert sind. Die Markierung muss an den entsprechenden Darstel-

6Obwohl auf Grund der vorgestellten Konzepte zur Kombination der Zeitdarstellung mit Kartenauch eine dreidimensionale Karte vermutlich interessante Ergebnisse gebracht hatte.

7Ein Blick in die frei verfugbaren Quellen bestatigt diese Aussage.

66 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

IIHH

1. zeichneGebiet(G)

2. zeichneGebiet(H)

3. zeichneGebiet(I)

GG

vermiedenes wiederholtes

Durchlaufen der Grenze

Abbildung 6.4: Optimierung der Kartendarstellung fur LandV istDie farbigen Linien zeigen, welche Grenzen eines Gebietes bei Aufruf der Methode gezeich-

net werden. Die dunneren schwarzen Linien zeigen die Bereiche, die ohne Optimierung

doppelt durchlaufen worden waren.

lungskontext gebunden werden, damit sie fur mehrmalige Aufrufe des Algorithmuserhalten bleibt. Um explizit das wiederholte Zeichnen von Gebieten z.B. wegenveranderter Liniendicke oder Linienfarbe moglich zu machen, kann durch Aufrufeiner einzelnen Methode die aktuell gespeicherte Markierung geloscht werden.

Durch die geschickte Ausnutzung des topologischen Modells nicht nur fur dieSpeicherung, sondern auch fur das Darstellen der geografischen Daten konnte ei-ne erhebliche Beschleunigung des Anzeigeprozesses der Karte erreicht werden. Dadas doppelte Durchlaufen von Grenzen vermieden wird, ist eine deutliche Verrin-gerung der zur Kartendarstellung benotigten Zeit zu verzeichnen (vgl. Abb. 6.5).Eine Halbierung der Darstellungszeit konnte nicht erreicht werden, da der Zugriffauf die Grenzen uber eine Schlussel-Wert-Datenstruktur (Hash) erfolgt und einennicht vernachlassigbaren Overhead erzeugt.

Land PLZ− GebieteLandkreise

10

20

30

40

50

ms

00

LandVistt

LandVis

Abbildung 6.5: Benotigte Zeit zum Darstellen der KarteDas Diagramm zeigt, dass sich die Darstellungszeit der Karte in LandV ist (grun) im Ver-

gleich zu LandVis (rot) vor allem bei der Darstellung der PLZ-Gebiete deutlich verringert.

6.3.2 Karte als Schnittstelle

Die Anzeige einer Karte auf einem grafischen Ausgabegerat dient der Wiederga-be realer oder kunstlicher raumlicher Zusammenhange. Jedoch ist die Darstellungnicht die einzige Aufgabe einer computergenerierten Karte. Vielmehr ist sie aktiverBestandteil der Schnittstelle zwischen Mensch und Maschine. Allein die im Allge-meinen exklusive Nutzung der verfugbaren Anzeigeflache durch die Karte macht

6.3. DIE KARTE IN LANDV IST 67

deren Verwendung nicht nur als Ausgabe-, sondern auch Eingabeschnittstelle not-wendig. Aus diesem Grund sollen im Folgenden einige Funktionalitaten erlautertwerden, die die Karte des Systems LandV ist zur Verfugung stellt.

Identifikation

Eine der wichtigsten Aufgaben, die eine Karte ubernehmen kann, ist die Identifi-kation der raumlichen Daten. Durch Verwendung der Maus als Zeigegerat konnenzweidimensionale Bildkoordinaten erfasst werden. Diese lassen dann bei Berucksich-tigung der Bildentstehung8 eine Identifikation von geografischen Objekten zu. Essind zwei prinzipielle Vorgehensweisen vorstellbar:

• Online-Identifikation und

• Offline-Identifikation.

Wird auf jede Mausbewegung reagiert und werden entsprechende Berechnungenangeregt, um Objekte zu identifizieren, so soll von einer Online-Identifikation ge-sprochen werden. Diese Art der Identifikation hat den Vorteil, dass der Anwenderstets eine Zuordnung von Mauszeiger und geografischem Objekt, z.B. durch Anno-tation, erhalt. Sind jedoch sehr viele Objekte dargestellt, so konnen die notwendigenBerechnungen mitunter sehr lange andauern, was den Grad der Interaktivitat starkeinschrankt. In diesem Fall sollte versucht werden, Eigenschaften der Daten (hier-archische Strukturen, Nachbarschaftsbeziehungen, etc.) fur die Beschleunigung derIdentifikationsberechnungen heranzuziehen. Hierzu wurde die in Abbildung 6.6 ge-zeigte Strategie entwickelt.

BaG != null ?

NaG != null ?

MZ mit BaG prüfen

MZ mit Nachbarn

von BaG prüfen

NaG != null ?

MZ mit allen Gebieten

der Karte prüfen

MZ außerhalb

der Karte ?

ja

ja

ja

ja

nein

nein

nein

nein

Abbildung 6.6: Strategie zur Online-Identifikation in LandV istBaG: Bisheriges aktuelles Gebiet; NaG: Neues aktuelles Gebiet; MZ: Mauszeiger

prufen: Zeigt die Maus auf ein gepruftes Gebiet, so erfolgt die Zuweisung

NaG:=Gebietskennung, ansonsten NaG:=null.

Alternativ dazu konnte auch eine Offline-Identifikation angeboten werden. Dannerfolgt die Identifikation erst nach Auslosen eines bestimmten interaktiven Ereig-

8Hiermit ist das Durchlaufen der Koordinatentransformationen zur Bildberechnung in entge-gengesetzter Richtung gemeint, um aus Bildkoordinaten Koordinaten der Kartendaten zu erhalten.Bei der Darstellung dreidimensionaler Karten kann es unter Umstanden zu Mehrdeutigkeiten kom-men, die durch geeignete Verfahren oder Nutzereingaben beseitigt werden konnen.

68 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

nisses (z.B. Mausklick). Da die Berechnungen jeweils nur beim Eintreten des Ereig-nisses erfolgen mussen und nicht nach jeder Mausbewegung, stellt diese Identifikati-onsart eine geeignete Alternative fur ressourcenbeschrankte Anwendungsszenariendar.

Auswahl

Nicht selten kommt es vor, dass den Anwender nur ein bestimmter Teil der darge-stellten Informationen einer Karte interessiert. Um diesen einer weiteren eingehen-den visuellen Uberprufung unterziehen zu konnen, ist die Auswahl einer Teilmengeder Information notwendig. Das konnte z.B. uber Auswahllisten oder alphanumeri-sche Eingaben erfolgen.

Die Auswahl von geografischen Objekten ist ebenfalls interaktiv mit Hilfe derKarte durchfuhrbar. Am Beispiel einer Gebietsauswahl fur zweidimensionale Kartensoll dies erklart werden. Hierbei soll es moglich sein, eine Teilmenge aller dargestell-ten Gebiete zu benennen. Eine einfache Variante zur Auswahl von Gebieten stelltdie Selektion mittels Mausklick dar. Nach Eintreten des entsprechenden Hardwa-reereignisses, muss zunachst das jeweilige Gebiet identifiziert werden (siehe auchvorheriger Abschnitt). Dieses wird dann in die Menge der ausgewahlten Gebieteubernommen und in der Karte markiert. Um es aus dieser Menge wieder zu entfer-nen, kann nach erneutem Mausklick eine entsprechende Veranderung der Auswahlerfolgen. Fur die Auswahl kleiner Teilmengen ist diese Vorgehensweise ausreichend.

Fordert der Anwendungskontext jedoch, dass eine Auswahl mehrerer Gebieteauf einmal moglich sein muss, so sollte dies mittels Rubberband-Technik9 moglichsein. Hierbei kann der Anwender durch Klicken und Verschieben der Maus einenrechteckigen Bereich in der Karte

”aufziehen“, der zur Auswahl verwendet wird.

Zur Bestimmung der Zugehorigkeit eines Gebietes zur Auswahl sind zwei Strategiendenkbar:

• Selektion durch Inklusion oder

• Selektion durch Uberschneidung.

Ist es notwendig fur die Auswahl eines Gebietes, dieses komplett mit dem rechte-ckigen Bereich zu

”uberziehen“, so soll von Selektion durch Inklusion gesprochen

werden. Fasst man den rechteckigen Bereich RB und ein Gebiet G als Mengenzweidimensionaler Punkte p ∈ R2 und die Auswahl A als Menge von Gebieten auf,so wird durch diese Selektion das umschlossene Gebiet G der Auswahlmenge Azugeordnet.

Wenn G ⊆ RB =⇒ A = A ∪G

Diese Art der Selektion ist sehr intuitiv, da man ein Gebiet komplett”umschlie-

ßen“ muss, damit es zur Auswahl gehort. In manchen Fallen ist dies jedoch nichtpraktikabel. Zum Beispiel dann nicht, wenn sich die einzelnen Gebiete uber großeBereiche der Anzeigeflache erstrecken. Hier bietet sich die Selektion durch Uber-schneidung an. Ein Gebiet G wird als zur Auswahl zugehorig angesehen, wenn sichder rechteckige Bereich RB und Gebiet G uberschneiden.

Wenn G ∩RB 6= ∅ =⇒ A = A ∪G

Hierdurch konnen große Gebiete ausgewahlt werden, ohne dass der Anwender diesekomplett

”umschließen“ muss. Der Nachteil dieser Selektionsstrategie ist, dass sie

nicht in jedem Fall intuitiv ist, da teilweise Gebiete mit in die Auswahl ubernommenwerden, die der Anwender eigentlich nicht selektieren wollte.

9Rubberband = Gummiband

6.3. DIE KARTE IN LANDV IST 69

Deshalb ist abzuwagen, ob dem Anwender das weite”Aufziehen“ des Auswahl-

bereiches bei großen Gebieten (Selektion durch Inklusion) oder die besonders beikleineren Gebieten teilweise nicht intuitive Auswahl (Selektion durch Uberschnei-dung) zugemutet werden kann. Ein adaptives Umschalten der Auswahlstrategiein Abhangigkeit der durchschnittlichen Gebietsgroße in der Darstellung ware alsLosung dieses Problems moglich. Es ist in jedem Fall sinnvoll, eine Kombinationder Auswahl per Mausklick und der Bereichsauswahl anzubieten.

Weitere Funktionen

Die im vorherigen Abschnitt vorgestellten Selektionen, die unter Anwendung derRubberband-Technik die Auswahl von Gebieten der Karte ermoglichen, dienenebenfalls zur Realisierung einer Zoomfunktion. Hierzu werden die ausgewahlten Ge-biete so vergroßert, dass sie den gesamten Anzeigebereich der Karte ausfullen. DieseFunktionalitat ermoglicht es, einen Teilbereich der Karte genauer zu untersuchen,ohne vorher ein manuelles Vergroßern und Verschieben der Darstellung vornehmenzu mussen.

Eine weitere Neuerung in LandV ist ist die Auslagerung einiger Funktionen ausder Karte auf Schalter. So waren z.B. das Navigieren durch die Kartendatenhier-archie (siehe [Tom01]) und das Vergroßern bzw. Verkleinern der Darstellung direktmittels Mausinteraktion auf der Karte moglich. Es hat sich jedoch gezeigt, dasszu viele Funktionen direkt mit der Maus ausgefuhrt werden mussten. Desweiterenwar den Anwendern nicht intuitiv ersichtlich, welche Interaktionsmoglichkeiten ih-nen zur Verfugung standen. Deshalb erfolgte die Verlegung auf Schalter, die uberSymbole (Ikonen) ihre Funktionalitat deutlich anzeigen konnen. Diese Verbesserungwurde bereits wahrend dieser Arbeit parallel in das TeCoMed-Projekt ubernommenund fuhrte auch dort zu einer besseren Akzeptanz des Systems bei den Anwendern.

Weitere grundlegende Interaktionsmoglichkeiten wie das Drehen der Kartendar-stellung sind in LandV ist derzeit nicht notwendig, da eine reine 2D-Darstellungder Karte erfolgt. Sollen die in Abschnitt 5.2.2 vorgestellten Konzepte in LandV istrealisiert werden, so mussen fur die dann benotigte 3D-Darstellung der Karte neueNavigations- und Interaktionstechniken entwickelt bzw. vorhandene angepasst wer-den.

6.3.3 Karte mit Lupe

Die Vergroßerung, besonders von kleineren Gebieten der Karte ist notwendig, um ei-ne detaillierte Analyse der abgebildeten Daten zu ermoglichen. In [Tom01] wird diesdurch eine adaptives Fokusfenster erreicht. Durch die Verwendung semitransparen-ter Darstellungen werden die auftretenden Verdeckungen minimiert. Rase prasen-tiert in [Ras97] eine andere Moglichkeit, um dem Anwender eine kartografischeLupe zur Verfugung stellen zu konnen. Er verwendet fur seine Lupe die bekannteFischaugen-Projektion (vgl. neben [SB94] auch [Jes00]). Diese Idee wurde aufgegrif-fen und fur die Anwendung in LandV ist adaptiert.

Durch Festlegung eines Fokuspunktes Pf = (xf , yf ) in der Karte kann der An-wender das Zentrum der Lupe bestimmen. Weiterhin interaktiv einstellbar sind derRadius r der Lupe und deren Vergroßerungsfaktor m. In Abhangigkeit dieser dreiParameter erfolgt eine Verzerrung der Karte.

Hierzu war es notwendig, alle Darstellungsroutinen so umzustellen, dass sie nichtmehr direkt mit Koordinatenangaben arbeiten, sondern mit Indizes in ein Feld, dasalle im Datensatz Mecklenburg/Vorpommerns vorkommenden Koordinatenangabenenthalt. Da das Feld bereits beim Einlesen der Daten gefullt wird, war auch eineUberarbeitung der geografischen Datenstruktur erforderlich. So konnte erreicht wer-den, dass samtliche Kartenobjekte nur noch Referenzen in ein Feld enthalten. Eine

70 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

Abbildung 6.7: Kartendarstellung mit Lupe aus LandV istEs sind vergleichend die Darstellungen der Karte ohne und mit Lupe abgebildet. Es ist

deutlich zu erkennen, dass erst durch die Lupe das im Fokus befindliche Postleitzahlgebiet

18507(Rostock) sichtbar wird.

Kopie dieses Feldes kann im LandV ist-System von zentraler Stelle angefordert wer-den. So wird gesichert, dass verschiedene Kartendarstellungen (z.B. zentrale Karte,Ubersichtskarte, etc.) eines Datensatzes moglich sind.

Fur die Darstellung der Lupe mussen die Punkte des Feldes F entsprechend derParameter neu angeordnet werden. Hierzu wird der folgende Algorithmus verwen-det.

Algorithmus transformierePunkte(F , Pf , r,m):

Berechne q = mr

foreach Punkt P ∈ FBerechne Distanz d zwischen P und Pf

if d ≤ rBerechne neue Distanz dneu = d(m+1)

dq+1

Berechne mit dneu neuen Punkt Pneu

Ersetze P in F durch Pneu

fihcaerof

Alle Darstellungen der Karte, die nun auf das Feld F zugreifen, enthalten eineLupenverzerrung (vgl. Abb. 6.7) entsprechend der Parameter Fokuspunkt, Radiusund Vergroßerung. Da aber nur eine Verschiebung von Punkten erfolgt, zur Darstel-lung der Karte jedoch Linienverbindungen zwischen den Punkten erzeugt werden,handelt es sich hierbei nicht um eine korrekte Lupendarstellung der Karte.

Fur eine korrekte Lupenverzerrung musste jede Linie der Karte mit hinreichen-der Genauigkeit10 abgetastet werden. Fur jeden Abtastpunkt musste dann der vor-gestellte Algorithmus durchlaufen werden. Zu Beschleunigung der korrekten Lu-pentransformation konnte vor der Abtastung uberpruft werden, ob die betrachteteLinie den Lupenkreis schneidet. Nur wenn dies der Fall ist, wird der Teil der Linie,der sich im Lupenkreis befindet, weiter verarbeitet.

Auf diese komplizierte und rechenaufwendige Berechnung der Lupe wurde inLandV ist aus Performancegrunden verzichtet. Daher ist der Einsatz der Lupe inLandV ist nur dann sinnvoll, wenn die einzelnen Punkte in der grafischen Reprasen-tation ausreichend nah beieinander liegen. Dies ist im Allgemeinen auf Grund dersehr genauen Gebietsbeschreibung im vorliegenden Datensatz auch der Fall. Le-

10z.B. an jedem Schnittpunkt der Linie mit den Pixeln des Bildschirms

6.4. VISUALISIERUNGSTECHNIKEN 71

diglich wenn die Darstellung durch die Zoomfunktion sehr stark vergroßert wurde,kommt es zu wahrnehmbaren Darstellungsproblemen. Hier kann aber argumentiertwerden, dass der Einsatz der Lupe bei ohnehin starker Vergroßerung von vornhereinnicht sinnvoll ist.

6.4 Visualisierungstechniken

Um die Visualisierung zeitabhangiger Daten in LandV ist zu ermoglichen, erfolgtedie Realisierung des Konzeptes der Ikonifizierung und Positionierung. Hierzu wur-den bewahrte Techniken integriert, Techniken zur Zeitdarstellung adaptiert undeine neue Darstellung mehrerer Merkmale bezuglich der Zeit entwickelt, die im Fol-genden genauer betrachtet werden.

Unter einer Visualisierungstechnik wird in LandV ist eine Klasse verstanden,die eine bestimmte Art von Ikonen verwaltet, wobei die Ikonen Instanzen einerentsprechenden Ikonen-Klasse sind. Die Visualisierungstechnik bzw. eine Instanzvon ihr erstellt hierfur beim Aufruf des Konstruktors eine leere Ikone fur jedesGebiet der Karte und initialisiert die je nach Auspragung der Technik vorhandenenVisualisierungsparameter wie z.B. Start- und Endzeitpunkt, zeitliche Genauigkeit(Tag, Woche, Monat, etc.) oder ausgewahlte Krankheiten. Um dem Anwender eineBeschreibung der Ikone anbieten zu konnen, wird daruber hinaus versucht eine RTF-Datei (Rich-Text-Format) mit dem Namen der Visualisierung einzulesen. Ist einesolche Datei nicht vorhanden, bleibt die Beschreibung leer. Wird eine passende Dateigefunden, kann deren Inhalt formatiert ausgegeben werden. RTF-Dateien lassensich mit Hilfe vieler Textverarbeitungssysteme erstellen und bearbeiten. So ist esauch nach Abschluss der Entwicklung von LandV ist moglich, die Beschreibung derTechniken anzupassen, ohne dafur die Quellen des Systems verandern zu mussen.

Der Anwender kann in LandV ist mittels Auswahlliste die aktuelle Visualisie-rungstechnik bestimmen. Fur die ausgewahlte Technik erfolgt das Fullen der Le-gende mit dem Inhalt der Beschreibungsdatei und die Darstellung der Parameterin einem speziellen, fur jede Technik gleichen Bereich der Anzeige (vgl. Abb. 6.8).Desweiteren wird der LandV ist-Karte mitgeteilt, dass Anforderungen zum Zeichnenvon Ikonen nun an die ausgewahlte Technik zu richten sind.

Technikauswahl

Beschreibung aus

RTF− Datei (aktiv)

Parameterfenster

(inaktiv)

Abbildung 6.8: Visualisierungstechnik - Auswahl, Legende, Einstellungen

Zum Zeichnen der Ikonen wird der Visualisierungstechnik die aktuelle Auswahlder Gebiete (siehe Abschnitt 6.3.2) ubermittelt. Die Ikonen der ausgewahlten Ge-biete uberprufen dann, ob sie einen gultigen Status haben. Eine Ikone soll gultiggenannt werden, wenn sie nicht leer ist, und wenn seit ihres letzten Aufrufes keineVisualisierungsparameter geandert wurden.

Ist die Ikone nicht gultig, so wird eine Datenbankanfrage angestoßen, die sie

72 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

wieder in einen gultigen Zustand versetzt. Dies geschieht nebenlaufig, sodass beibesonders umfangreichen Anfragen die Arbeit mit LandV ist nicht beeintrachtigtwird. Jedoch ist es dann auch notwendig, dem Benutzer mitzuteilen, dass seineAnforderungen vom System entgegengenommen wurden und bearbeitet werden.Dies wird in LandV ist durch eine Statusleiste realisiert, in der der Anwender aufnoch laufende Datenbankprozesse hingewiesen wird (vgl. Abb. 6.9).

Abbildung 6.9: Statuszeile in LandV ist

Ist die Ikone in einem gultigen Zustand, so wird sie auf der Karte dargestellt.Die in Abschnitt 5.2.1 aufgeworfenen Fragen wurden in LandV ist wie folgt gelost.Die Große der Ikonen orientiert sich an der Große der Bounding-Box11 ihres ent-sprechenden Gebietes. Um Probleme durch Verdeckungen zu verringern, wird dieAusdehnung der Ikonen zusatzlich halbiert. Die daraus resultierende Verkleinerungder Ikonen kann durch Verwendung der Kartenlupe wieder ausgeglichen werden.

Die Positionierung einer Ikone erfolgt so, dass sie zentriert uber dem Mittelpunktder Bounding-Box angezeigt wird. Dies kann jedoch auf Grund der Beliebigkeit derForm eines Gebietes zu Problemen fuhren, wenn der Mittelpunkt der Bounding-Boxnicht im zugehorigen Gebiet selbst liegt. Durch Vorberechnung gunstiger Positio-nen mit einem Labeling-Algorithmus (vgl. [ECMS97]) konnte das Problem jedochumgangen werden.

Abbildung 6.10 stellt die prinzipielle Vorgehensweise beim Anzeigen von Ikonendar. Sie ist fur die Ikonen aller Visualisierungstechniken gleich. Lediglich die Im-plementierung der Datenbankanfragen und der Darstellungsmethode unterscheidetsich fur die verschiedenen Arten von Ikonen.

Ikone

gültig?

Zeichne Ikone

Ermittle Daten für

Ikone aus DB

nein

ja

Abbildung 6.10: Vorgehen beim Zeichnen von Ikonen in LandV istDie gestrichelte Linie soll die Nebenlaufigkeit der Datenbankanfrage verdeutlichen.

Durch die Ausnutzung der Objektorientierung kann eine erhebliche Reduzie-rung des Programmieraufwands bei der Integration von Visualisierungstechniken inLandV ist erreicht werden. Die Entwicklung der abstrakten Klassen VisTec (eineVisualisierungstechnik) und Icon (eine Ikone) macht dies moglich (vgl. Abb. 6.11).

Fur das Einbinden einer Visualisierungstechnik erbt die entsprechende Klassevon der abstrakten Klasse VisTec alle Methoden. Lediglich die Initialisierung derIkonen sowie die Erzeugung des Einstellungsfensters muss implementiert werden, dajede Technik ihre eigenen Ikonen benutzt und spezifische Parametereinstellungen er-fordert. Die Erzeugung des Beschreibungsfensters kann auf Grund der Verwendung

11Bounding-Box = kleinstes umschließendes Rechteck

6.4. VISUALISIERUNGSTECHNIKEN 73

von RTF-Dateien bereits in der abstrakten Klasse erfolgen und muss nicht fur jedeVisualisierungstechnik explizit implementiert werden.

Ahnliches gilt auch fur die Entwicklung von Ikonen. Hier sind nur die Methodenzum Abfragen der Datenbank und zum Darstellen der Ikone zu implementieren.Hierbei ist zu beachten, dass die Ikone so entwickelt wird, dass sie ein Mappingder Daten auf die Geometrie entsprechend der ihr zugewiesenen Große durchfuhrt.Soll eine Ikone auf Nutzereingaben reagieren konnen, so muss dies ebenfalls fur jedeIkone gesondert implementiert werden. Alle anderen zusatzlichen Funktionalitatensind bereits in der abstrakten Klasse Icon vorhanden und stehen durch Vererbungauch der konkreten Ikone zur Verfugung.

VisTec

VisTecMaximumIkone

VisTecZeitfluss

VisTecZeitrad

Icon

IconMaximumIkone

IconZeitfluss

IconZeitrad

LandVistt

. .

.

. .

.

Abbildung 6.11: Beziehungen der fur die Visualisierung notwendigen KlassenAuf die Darstellung der Attribute und Methoden der Klassen wurde aus Grunden der

Ubersichtlichkeit verzichtet.

6.4.1 Maximumikone

Die in [Got97] vorgestellte Maximumikone (vgl. auch Abschnitt 5.2.2) wurde furLandV ist in verbesserter Form ubernommen. Nachteile der ursprunglichen Maxi-mumikone waren die geringe Betonung des Maximumpfeiles und die fehlende Skalaam Ikonenkreis. Dies fuhrte im visuellen Zusammenspiel mit der Karte zur Wahr-nehmung der Ikone als raumlichen Richtungsanzeiger. Um eine Verbesserung zuerreichen, musste das Erscheinungsbild der Ikone starker mit ihrem zeitlichen Be-zug verbunden werden.

a) b)

Abbildung 6.12: Maximumikonea) Originale Maximumikone aus [Got97]; b) Verbesserte Maximumikone mit einer Skalen-

einteilung fur die Monate eines Jahres.

Hierzu wurde der Zeiger so angepasst, dass er einem Uhrzeiger ahnelt (vgl. Abb.6.12). Wichtiger fur das Ablesen des Zeitobjekts mit maximalem Datenwert ist je-doch die Einfuhrung einer Skalenunterteilung am Ikonenkreis. Fur die kompletteIkone wird stets der Zeitraum eines Jahres12 angezeigt. In Abhangigkeit der aus-gewahlten zeitlichen Genauigkeit (quartalsgenau, monatsgenau, etc.) erfolgt die Un-

12Wird ein beliebiger Zeitraum auf den Ikonenkreis abgebildet, so ist es schwieriger, dem visuellerkannten Maximum ein entsprechendes Zeitobjekt im Zeitraum zuzuordnen.

74 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

terteilung des Ikonenkreises in die entsprechende Anzahl von Teilstucken, die durch

”Tick-Marks“ visuell unterscheidbar gemacht werden. Der Maximumpfeil wird dann

so ausgerichtet, dass er im Falle von Zeitpunkten direkt auf die”Tick-Marks“, bei

Zeitintervallen genau zentriert zwischen zwei”Tick-Marks“ zeigt und somit das

Zeitobjekt, fur das ein maximaler Datenwert vorliegt, exakt identifizierbar macht.Bei der Implementation der Datenbankanfragen fur die Maximumikone wur-

de festgestellt, dass ihr Verhalten beim gleichzeitigen Auftreten eines maxima-len Datenwertes fur mehrere Zeitobjekte eines betrachteten Zeitraumes in [Got97]nicht spezifiziert ist. Gemaß dem Bearbeitungsziel

”Erkennen der Ausbreitung einer

Krankheit“ wurde fur LandV ist festgelegt, dass in diesem Fall stets auf das fruhsteZeitobjekt gezeigt werden soll.

Durch die Integration der verbesserten Maximumikone in LandV ist steht einegeeignete Visualisierung der raumlichen und zeitlichen Ausbreitung von Krankhei-ten zur Verfugung (siehe Abb. 6.13). Als Erweiterung der Ikone ware es denk-bar, zwei bis drei Maximumpfeile verschiedener Krankheiten anzuzeigen. Uber eineFarbassoziation konnten die Pfeile visuell an eine bestimmte Krankheit gebundenwerden. Bei der Ausrichtung der Pfeile ware darauf zu achten, dass sie sich nichtvollstandig uberdecken. Dies konnte erreicht werden, indem fur jeden Pfeil eineprozentuale Abweichung der exakten Position in der Darstellung festgelegt wird. Soerweiterte Maximumikonen ließen dann auch das Aufzeigen von Korrelationen beimAuftreten von Krankheiten zu.

Abbildung 6.13: Karte mit Maximumikonen

6.4.2 Zeitfluss

Um die zeitliche Entwicklung mehrerer Krankheiten vergleichend darstellen zu konnen,wurde in LandV ist der Zeitfluss integriert. Diese Technik ist abgeleitet von dem inAbschnitt 3.4.2 vorgestellten ThemeRiver.

Das prinzipielle Vorgehen zur Erstellung des ThemeRivers ist bei der Implemen-tation des Zeitfluss ubernommen worden. Fur eine gewisse Menge von Krankheitenwird fur jeden Zeitpunkt eines ausgewahlten Zeitraumes die Anzahl des Auftretensder Krankheiten aus der Datenbank abgefragt. Fur jeden Zeitpunkt erfolgt danndas aquidistante Abtragen der Werte auf ubereinander angeordnete Stutzpunkte,die uber der Zeitachse zentriert werden (siehe Abb. 6.14).

6.4. VISUALISIERUNGSTECHNIKEN 75

Anzahl der verschieden

Krankheiten zum

Zeitpunkt tii

Zeitttii

tti− 1

Abbildung 6.14: Abbildung der Datenwerte auf Stutzpunkte

Die jeweiligen Stutzpunkte einer Krankheit sind durch Kurvenstucke zu ver-binden. Fur die Darstellung wird der Bereich zwischen der Kurve einer Krankheitund der nach unten benachbarten Kurve mit einer krankheitsspezifischen Farbe ein-gefarbt. Hierdurch entstehen die einzelnen Krankheitsflusse (bei ThemeRiver cur-rents genannt), die im Gesamtbild den Zeitfluss ergeben.

Fur die Verbindung der Stutzpunkte zu einer Kurve bietet die Java2D-Klassen-bibliothek einfache Moglichkeiten. Die Kurvenstucke werden mit Hilfe der KlasseCubicCurve2D erzeugt, die die Beschreibung eines Kurvenstuckes mit zwei Stutz-und zwei Kontrollpunkten zulasst und anschließend zu einer gesamten Kurve inForm einer Instanz der Klasse GeneralPath zusammengefasst (siehe [Sun02]). Umeinen stetigen Ubergang zwischen zwei Kurvenstucken zu erhalten, mussen die Kon-trollpunkte benachbarter Kurvenstucke aufeinander abgestimmt werden.

Stützpunkt

Kontrollpunkt

a) b)

Anpassungen der

Kontrollpunkte

Maximum−

Stützpunkt

normaler

Stützpunkt

Abbildung 6.15: Probleme bei der Kurvenberechnunga) einfache Ausrichtung der Kontrollpunkte; b) notwendige Anpassungen der Kontroll-

punkte

Deshalb werden zunachst die Kontrollpunkte eines Stutzpunkts Pi = (xi, yi) inAbhangigkeit der Richtung des durch Pi−1 und Pi+1 beschriebenen Vektors ausge-richtet13. Hierbei kommt es jedoch dazu, dass die Kurve an Stutzpunkten, fur dieein lokales maximales bzw. minimales yi vorliegt, uber den Stutzpunkt hinaus geht.In Abbildung 6.15a wird dies durch eine rote Markierung deutlich gemacht.

Durch die gesonderte Positionierung der Kontrollpunkte bei lokalen Maximaund Minima kann dieses Problem behoben werden (Abb. 6.15b). Die fur diese Spe-zialfalle notwendige Anpassung der Position der Kontrollpunkte an die y-Werte desStutzpunktes birgt jedoch ein neues Problem. Es kann nun auf Grund der unre-gelmaßigen Verteilung der Maxima bzw. Minima zu Uberschneidungen der Kurvenverschiedener Krankheiten kommen. Das kann durch erneute Anpassung, genauer

13In vielen Softwareprodukten (Excel, StarOffice, etc.) wird dieses Vorgehen genutzt, um”wei-

che“ Kurvenverbindungen von Punkten in Diagrammen zu erhalten.

76 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

gesagt durch Verschieben der Kontrollpunkte in Richtung der Stutzpunkte vermie-den werden. In der Darstellung fuhrt dies jedoch zu sehr

”spitzen“ Kurven.

Die beschriebenen Probleme fuhren dazu, dass der Zeitfluss in LandV ist nichtden visuellen Gesamteindruck des originalen ThemeRivers erreicht, was vor alleman der Beschrankung auf die Java-Klasse CubicCurve2D liegt. Fur einen optimalenZeitfluss ware die Entwicklung eigener Kurvenklassen z.B. unter Anwendung derin [HL92] vorgestellten Methoden notwendig gewesen. Das konnte im zeitlichenRahmen der Arbeit nicht geschehen, hatte doch fur die Integration in LandV isteine laufzeitoptimierte Implementierung der Algorithmen erfolgen mussen.

Da der Zeitfluss in ikonifizierter Form darstellt wird, ist die Beschriftung derZeitachse sowie verschiedener Daten nicht mehr moglich. Hierin unterscheidet sichder Zeitfluss vom ursprunglichen ThemeRiver. Um dennoch die Identifikation vonMerkmalsauspragungen bezuglich der Zeit durch Annotation zu erlauben, wurde imZeitfluss eine spezielle Interaktionstechnik integriert. Durch Klicken mit der Mausauf die Ikone kann der Anwender einen Krankheitsfluss und einen Zeitpunkt spezifi-zieren. Die Bezeichnungen der Krankheit und des Zeitpunktes sowie der zugehorigeDatenwert werden dann auf der Ikone angezeigt. Um eine permanente Verdeckungfeiner Details des Zeitflusses durch die Annotation zu vermeiden, wird zeitgesteuertdie Farbintensitat der Beschriftung solange verringert, bis sie vollstandig verschwin-det. Die Dauer zwischen Mausklick und Verschwinden der Beschriftung sollte fur denAnwender einstellbar sein. Als Erweiterung ware es denkbar, mehrere unabhangigeBeschriftungen anzubieten, die dann vergleichende Aussagen zuließen. Allerdingssollte die Anzahl der Beschriftungen auf Grund moglicher Uberlappungen niedriggehalten werden.

Abbildung 6.16: Karte mit Zeitfluss

Die Ikonifizierung des Zeitflusses birgt ein weiteres Problem. Bei einer hohenAnzahl von darzustellenden Zeitpunkten ist die Ikone nur noch schwer zu interpre-tieren. Dies gilt besonders dann, wenn die abgebildeten Daten hohen Schwankungenunterliegen. Um den Zeitfluss dennoch auswertbar zu machen, bietet sich eine Ad-aption der Fokus&Kontext-Technik

”Perspecitve Wall“ an. Sie wird z.B. in [Spe01]

beschreiben. Nach Festlegung eines zeitlich zusammenhangenden Bereiches der Iko-ne (Fokus) kann der Kontextbereich durch perspektivische Verzerrung verkleinertwerden, wodurch im Fokusbereich mehr Platz fur die Darstellung der Informationen

6.4. VISUALISIERUNGSTECHNIKEN 77

zur Verfugung steht. Ahnliches konnte auch durch die Adaption des”Rechteckigen

Fish Eye View“ aus [Jes00] erreicht werden.Zusammenfassend wird festgestellt, dass der fur LandV ist entwickelte Zeit-

fluss trotz bestehender Verbesserungsmoglichkeiten den zeitlichen Verlauf mehrererKrankheiten sehr gut vergleichend darstellen kann (siehe Abb. 6.16).

6.4.3 Zeitrad

Fur die Visualisierung mehrerer Merkmale bezuglich der Zeit wurde eine neue Tech-nik entwickelt — das Zeitrad. Da es auch auf Linienverbindungen zwischen Achsenberuht, ist eine gewisse Ahnlichkeit mit der Visualisierungstechnik

”Parallele Koor-

dinaten“ (vgl. [SM00]) erkennbar.Das Zeitrad arbeitet jedoch mit einer speziell an die Bedurfnisse der Visuali-

sierung zeitabhangiger Daten auf Karten angepassten Anordnung von sogenanntenMerkmalsachsen um eine zentrale Zeitachse. Die Anordnung muss folgende Kriteri-en erfullen:

1. Es sollen sich stets zwei Merkmalsachsen gegenuber liegen um Korrelationenaufzeigen zu konnen.

2. Hierbei sollen jeweils gegenuberliegende Merkmalsachsen die gleiche Orientie-rung haben.

3. Die Langen der Merkmalsachsen und die der Zeitachse sollen gleich sein.

4. Das Verhaltnis von Lange der Achsen und benotigtem Anzeigeplatz soll an-gemessen sein.

5. Zur gleichzeitigen Auswertung mehrerer Merkmale bezuglich der Zeit solltenmehrere Merkmalsachsen einen Winkel kleiner oder gleich 45◦ bezuglich derZeitachse haben.

a) b) c) d)

Abbildung 6.17: Mogliche Anordnungen von Merkmalsachsen um eine Zeitachsea) Quadrat; b) Hexagon; c) Achteck; d) Zehneck

Wegen Forderung 1 kommen nur Anordnungsformen in Frage, die eine gerad-zahlige Anzahl von Seiten aufweisen. Die Abbildung 6.17 zeigt solche Formen, diezusatzlich die Bedingungen 2 und 3 erfullen. Es ist ersichtlich, dass das Quadrat unddas Hexagon die Bedingung 5 nicht erfullen. Die Form des Zehnecks und hoherern-Ecke widersprechen der Anforderung 4. Fur die Anordnung der Merkmalsachsenum eine Zeitachse wurde daher die Form eines Achtecks gewahlt.

Durch Linien zwischen jedem Zeitobjekt der Zeitachse und den korrespondie-renden Werten auf den Merkmalsachsen kann die zeitliche Entwicklung mehrererMerkmale visualisiert werden. In Abbildung 6.18 wird dies deutlich. Hierfur wirdeine geeignete Skalierung der Merkmalsachsen vorausgesetzt. Fur die Darstellung

78 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

1 Zeitachse

8 MerkmalsachsenRotationsbereich 135°

Abbildung 6.18: Das Zeitrad

der Anzahl des Auftretens verschiedener Krankheiten bietet es sich an, alle Merk-malsachsen bezuglich der maximalen Anzahl zu skalieren.

Wie Abbildung 6.18 entnommen werden kann, ist fur die ober- und unterhalb derZeitachse liegenden Merkmalsachsen eine optimale Auswertung der Daten moglich.Dies gilt fur die vier schrag zur Zeitachse angeordneten Merkmalsachsen nur nocheingeschrankt, fur die zwei senkrecht zu ihr stehenden gar nicht mehr. Um jedoch alleDaten auswertbar zu machen, ware eine interaktive Rotation der Zeitachse denkbar.Dies fuhrt jedoch zu erheblichem kognitiven Aufwand, da die Richtungsanderung derZeitachse das Wahrnehmen der zeitlichen Veranderungen erschwert. Daher wurdedas Problems durch Rotation der Merkmalsachsen gelost. Somit steht die Zeitachsebei der Auswertung immer gleichbleibend im Mittelpunkt. Damit die Orientierungder Merkmalsachsen stets von links nach rechts gerichtet bleibt, wurde zusatzlicheine Beschrankung des Rotationswinkels auf 135◦ eingefuhrt.

Abbildung 6.19: Karte mit Zeitrad

Da es bei einer hohen Anzahl von Zeitobjekten durch Uberschneidungen derLinien schnell zu unubersichtlichen Darstellungen kommen kann und um der un-terschiedlichen Auswertbarkeit der Daten gerecht zu werden, wurde zusatzlich einespezielle Anzeigestrategie implementiert. Bei der Darstellung des Zeitrades werden

6.4. VISUALISIERUNGSTECHNIKEN 79

hierfur die Linien, die den senkrecht stehenden Merkmalsachsen zugeordnet sind,ausgeblendet (Information Hiding). Fur die vier schrag liegenden Merkmalsachsenerfolgt das Zeichnen der entsprechenden Linien mit abgeschwachter Farbintensitat.Die zugehorigen Linien der ober- und unterhalb der Zeitachse befindlichen Merk-malsachsen werden in voller Farbintensitat uber die bereits dargestellten Liniengezeichnet.

Ein so erstelltes Zeitrad erlaubt dann die visuelle Analyse von bis zu acht Merk-malen (bzw. Krankheiten). Hierbei konnen zeitliche Entwicklungen und zwischenje zwei Merkmalen auch Korrelationen sichtbar gemacht werden (vgl. Abb. 6.19).Fur das Erkennen von korrelierenden Merkmalen bietet es sich auch hier an, einemoglichst gunstige Zuordnung der Merkmale zu den Merkmalsachsen mittels derinformationstheoretischen Methode aus [The95] vorzuberechnen.

6.4.4 Weitere Ikonen

Im Rahmen der Entwicklung von LandV ist entstanden Konzepte und prototypischeImplementationen weiterer Ikonen, die bisher noch nicht in das System LandV istintegriert wurden. Sie lassen sich jedoch auf Grund der Verwendung eines SQL-fahigen DBMS und der Einfachheit der Schnittstelle zwischen LandV ist und denVisualisierungstechniken mit moderatem Programmieraufwand fur die Anbindungan die Datenbank und minimalem Aufwand fur die Anpassung der Darstellungjederzeit in LandV ist einbinden.

Zeitspirale

Eine der prototypischen Implementationen ist die Zeitspirale. Sie wurde analog zuder in Abschnitt 3.4.4 vorgestellten Spiraldarstellung entwickelt.

Durch folgenden Algorithmus wird eine aus Liniensegmenten aufgebaute Spira-le erstellt, die fur die Visualisierung einer Krankheit einsetzbar ist. Hierbei gehenStart- und Endradius der Spirale, die Anzahl der Zeitobjekte pro Spiralzyklus unddie Anzahl aller Zeitobjekte des betrachteten Zeitraumes mit ein. Die einzelnenLinien werden in Abhangigkeit der Anzahl des Auftretens der Krankheit zum kor-respondierenden Zeitobjekt eingefarbt.

Algorithmus:

∆w := 2π/Anzahl der Zeitobjekte pro Zyklus∆r := (Endradius-Startradius)/Anzahl aller ZeitobjekteWinkel w := π/2Radius r := StartradiusBerechne Punkt P1 mit (x1, y1) := (r · cosw, r · sinw)foreach Zeitobjekt Z des betrachteten Zeitraumes I

Erhohe w um ∆wErhohe r um ∆rBerechne Punkt P2 mit (x2, y2) := (r · cosw, r · sinw)Berechne Farbe c fur Datenwert des Zeitobjekts ZZeichne Linie von P1 nach P2 mit Farbe cP1 := P2

hcaerof

Das Erscheinungsbild der Spirale kann interaktiv verandert werden. Eine wich-tige Rolle spielt hierbei die Anzahl der pro Spiralzyklus abzubildenden Zeitobjekte.Durch Veranderung dieses Parameters ist es moglich periodisches Verhalten derbetrachteten Krankheit aufzudecken. Die Abbildung 6.20 verdeutlicht, wie mit Hil-fe der Zeitspirale interaktiv Periodizitaten in Gesundheitsdaten gefunden werden

80 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

Abbildung 6.20: Die ZeitspiraleAuf der linken Seite der Abbildung ist die Spirale bei 25 Tagen pro Spiralzyklus zu sehen

(gesamte Spirale = 1 Jahr). Ein periodisches Verhalten der Daten ist nicht zu erkennen.

Nach der Erhohung auf 28 Tage (rechts) ist jedoch ein deutliches Muster zu erkennen. In

diesem Fall liegt es an der Tatsache, dass zu Wochenbeginn stets viele Neukrankschrei-

bungen eingehen zu Wochenenden jedoch kaum eine.

konnen.

Die stets gleiche Anzahl von Zeitobjekten und somit Liniensegmenten pro Spiral-zyklus fuhrt dazu, dass deren Lange vom Spiralinneren nach außen stetig zunimmt.Die Verwendung der Einfarbung zur Datenabbildung fuhrt jedoch zu nicht expres-siven Darstellungen. Durch Variieren des Startradius’ der Spirale kann die Differenzder Langen des ersten und letzten Liniensegmentes verringert werden, womit zwarweniger Zyklen dargestellt werden konnen, jedoch die Expressivitat der Darstellunggesichert ist. Auch die in Abbildung 6.20 dargestellten Spiralen verwenden einenvon Null verschiedenen Startradius.

Wird fur die Integration der Zeitspirale in LandV ist zusatzlich die Multipara-meterfahigkeit der originalen Spiraldarstellung (vgl. 3.4.4) ubernommen, so kanndem Anwender eine sehr interessanten Technik zum Auffinden zeitlicher Muster inGesundheitsdaten geboten werden.

Zeitscheibe

Zur Visualisierung von Gesundheitsdaten fur den Zeitraum eines Jahres wurde dieZeitscheibe entwickelt. Wahrend die bisher vorgestellten Techniken eine feste zeit-liche Genauigkeit voraussetzen (z.B. tagesgenau fur eine Kalenderdarstellung), wares das Ziel, fur die Zeitscheibe alle zeitlichen Hierarchiestufen in einer Ansicht zuvereinen.

Hierzu wurde eine spezielle kreisformige Anordnung14 der Hierarchie gewahlt.Die Zeitscheibe wie folgt aufgebaut (siehe Abb. 6.21): Es wird ein Kreis erzeugt, derdas Zentrum der Zeitscheibe darstellt und zur Reprasentation des gesamten Jahresdient. Um diesen Kreis herum werden schrittweise Ringe fur die HierarchiestufenQuartal, Monat, Woche und Tag gelegt und entsprechend der Anzahl ihrer Zeitob-jekte in Segmente unterteilt. Somit stehen fur alle moglichen zeitlichen Elementeeines Jahres geometrische Primitive (fur das Jahr der Kreis, fur den Rest Ringseg-mente) zur Verfugung, die z.B. durch Einfarben zur Visualisierung genutzt werdenkonnen.

14Ahnliche Anordnungen sind fur die Darstellungen anderer Hierarchien in der Literatur be-kannt. Hierzu zahlt z.B. der Sunburst (vgl. [SCGM00]) zur Darstellung der Verzeichnisstruktureines Dateisystems.

6.4. VISUALISIERUNGSTECHNIKEN 81

Tagessegmente

Wochensegmente

Monatssegmente

Quartalssegmente

Jahreskreis

1. Januar31. Dezember

Abbildung 6.21: Das Prinzip der Zeitscheibe

Die von innen nach außen zunehmende Anzahl von Ringsegmenten, hat zur Fol-ge, dass deren Flacheninhalt nach außen stark abnimmt. Es stellt sich die Frage,inwiefern dies bei Verwendung der Einfarbung expressiv ist. Da es sich hier jedochum die Darstellung einer Hierarchie handelt, kommt den Knoten nahe der Wur-zel eine hohere Bedeutung zu; sie reprasentieren mehr Informationen. So spielt eineinzelner Tag (geringer Flacheninhalt) fur den Jahresdurchschnitt (großer Flachen-inhalt) nur eine geringe Rolle. Die Zeitscheibe kann daher als expressiv bezeichnetwerden.

Da die Anzahl der Ringsegmente — besonders bei den Tagen — sehr hoch ist,feine Details der hochsten Auflosungsstufe aber dennoch sichtbar gemacht werdensollen, ware es sinnvoll, spezielle Fokus&Kontext-Interaktionen anzubieten. Hierzusind z.B. in [SZ00] verschiedene Strategien entwickelt worden, die leicht auf dieZeitscheibe ubertragbar sind.

Zur vergleichenden Darstellung von zwei bis drei Krankheiten ließen sich dieRinge der einzelnen Hierarchiestufen entsprechend in zwei oder drei Ringe auf-teilen (vgl. Abb. 6.22). Jeder Krankheit wird ein eigener Farbton zugewiesen. ZurVerdeutlichung der Hierarchie ist hierbei die zusatzliche Hervorhebung der Ringseg-mente notwendig. Dies fuhrt jedoch vor allem in den Tagesringen zu Uberdeckungder Einfarbung. In diesem Fall mussen entweder der betrachtete Zeitraum einge-schrankt, Hierarchiestufen ausgeblendet oder die erwahnten Fokus&Kontext-Interaktionenangeboten werden.

Abbildung 6.22: Zeitscheibe zur Visualisierung zweier MerkmaleDie Zeitscheibe zeigt farbkodiert die Datenwerte zweier Merkmale fur das Jahr, die Quar-

tale und die Monate an. Die einzelnen Ringsegmente werden durch eine schwarze Umran-

dung hervorgehoben. Da diese Umrandung in hohem Maße die Einfarbung des Tagesringes

verdeckt hatte, ist dieser nicht dargestellt.

82 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

Im Rahmen der Arbeit wurde eine einfache Implementation der Zeitscheibe er-stellt (siehe Abb. 6.23). Eine Integration in LandV ist erfolgte derzeit noch nicht,ist aber ohne Probleme moglich und sinnvoll. Dies hat zwei Grunde. Zum einenist die Zeitscheibe sehr gut zur Ikonifizierung und Positionierung und somit zurDarstellung auf der Karte geeignet. Zwar gehen durch die Verkleinerung Feinheitender außeren Ringe verloren, trotzdem bieten die Ikonen auf der Karte stets einengewissen Uberblick uber die Daten (vgl. Abb. 6.23, rechte Darstellung).

Abbildung 6.23: Die ZeitscheibeAuf der Zeitscheibe (Wochen ausgeblendet) ist das Auftreten einer Krankheit farbkodiert

abgebildet. Fur die hoheren Hierarchiestufen wurden die Tagesdaten zusammengefasst

und gemittelt. Es ist zu erkennen, dass im Herbst und Winter mehr Krankschreibungen

als im Sommer eingehen. Daruber hinaus sind deutlich die hohe Anzahl der”Wochenan-

fang“-Krankschreibungen und eine geringere Anzahl an Erkrankten in der Weihnachts-

und Silvesterzeit auszumachen. Vergleichend ist eine starke Verkleinerung abgebildet, die

immer noch einen Uberblick uber die Daten gewahrleistet.

Der zweite Grund fur die Empfehlung zur Integration in LandV ist ist die Eig-nung der Zeitscheibe als Schnittstelle zur Eingabe von beliebigen Zeitraumen. Wahrendein Zeitraum meist durch die alphanumerische Eingabe eines Start- und Enddatumsbestimmt wird, konnte dies bei Verwendung zweier Zeitscheiben (

”von“ und

”bis“)

durch einfache Mausklicks geschehen. Beschrankt sich die maximale Dauer des Zeit-raumes auf ein Jahr, so wurde hierzu eine ausreichen.

Die Zeitscheibe erleichtert auf Grund ihrer vielseitigen Einsetzbarkeit als Vi-sualisierungstechnik fur Gesundheitsdaten und als Schnittstelle zur Eingabe vonZeitraumen die Auswertung von und den Umgang mit zeitabhangigen Daten.

6.4.5 Bewertung der Techniken

Die Bewertung der Techniken in Bezug auf ihre Effektivitat stellt eine Aufgabe dar,die im Rahmen dieser Arbeit nur in Ansatzen bearbeitet werden kann. Nach [WT97]sind hierfur die folgenden drei Schritte notwendig.

1. Definition von Visualisierungszielen, das heißt: welche Charakteristiken oderEigenschaften der Daten will der Anwender mit welchem Maß an Genauigkeitden Bildern der Visualisierung entnehmen?

2. Finden oder Erzeugen von entsprechenden Datensatzen unterschiedlicher Aus-pragung

3. Durchfuhrung von Anwenderstudien zur Bestimmung der Effizienz verschie-dener Visualisierungstechniken bezuglich der Visualisierungsziele

Insbesondere bei Betrachtung des dritten Schrittes wird klar, dass die folgendenAussagen uber die Effizienz der Techniken zur Visualisierung weder objektiv sind,noch einen Anspruch auf allgemeine Gultigkeit haben. Hierfur waren Tests mit

6.4. VISUALISIERUNGSTECHNIKEN 83

mehreren unterschiedlich mit den Daten vertrauten bzw. trainierten Personen notig.Dies war im Rahmen der Arbeit nicht durchfuhrbar.

Da in LandV ist neben dem Konzept der Ikonifizierung und Positionierung keineweiteren der in Abschnitt 5.2 vorgestellten Konzepte realisiert wurden, konzentriertsich die vergleichenden Bewertung auf den zeitlichen Aspekt der Visualisierung.Ziele, die bei der Visualisierung von Daten mit Zeitbezug erreicht werden sollen,konnten z.B. die folgenden sein:

• (1) Identifikation einzelner Datenwerte bezogen auf ein konkretes Zeitobjekt

• (2) Vergleich der der Datenwerte unterschiedlicher Zeitobjekte

• (3) Auffinden von Periodizitaten in den Daten

• (4) Erkennen von Korrelationen zwischen zeitabhangigen Merkmalen

• (5) Erkennen zeitlicher Muster

• (6) Veranschaulichung der zeitlichen Entwicklung bzw. Dynamik

Bezuglich dieser Ziele soll eine Bewertung der vorgestellten Ikonentechniken er-folgen. In Abbildung 6.24 ist ein Bewertungsschema abgebildet, in dem aus Sichtdes Autors die Eignung der Techniken fur die verschiedenen Bearbeitungsziele zu-sammengefasst wird.

Maximumikone

Zeitfluss

Zeitrad

Zeitspirale

Zeitscheibe

(1)

Identifikation

++

==

++

−−

++

(2)

Vergleich

++

==

++

==

++

(3)

Periodizität

−−

==

−−

++

==

(4)

Korrelation

==**

++

++

==**

==**

(5)

Muster

−−

++

++

==

==

(6)

Dynamik

−−

++

==

==

==

Abbildung 6.24: Bewertung der TechnikenDie Nummern in Klammern sind die einzelnen Bearbeitungs- bzw. Visualisierungsziele. Ih-

re Beschreibung ist dem Text zu entnehmen. Zur Bewertung einer Technik bezuglich eines

Ziels wird entweder gut geeignet (+), geeignet (=) oder weniger geeignet (-) zugeordnet.∗) Voraussetzung fur diese Bewertung ist eine vorgeschlagene Erweiterung.

Auf Grund der Einfachheit der Maximumikone ist ein Identifizieren des Zeitob-jektes mit maximalem Datenwert gut moglich. Da lediglich die Anzeige des Maxi-mumpfeils erfolgt, ist bei vergleichender Betrachtung mehrerer Zeitobjekte sofortersichtlich, zu welchem das Maximum auftrat. Ein Aufzeigen von Korrelation istebenfalls moglich. Fur Ziele 3, 5 und 6 ist die Maximumikone nicht geeignet, dastets nur der maximale Datenwert veranschaulicht wird. (Im Zusammenspiel mitder Karte lasst die Maximumikone allerdings die raumliche Entwicklung der Merk-male gut erkennen.)

Der Zeitfluss eignet sich besonders zum Aufzeigen von Korrelation, Musternund zeitlicher Entwicklung der Daten. Dies liegt an der Darstellung der Daten alskontinuierlichen Fluss. Durch die Einfuhrung der speziellen Interaktion zur Identifi-kation der Datenwerte bezuglich der Zeit sind auch exakte vergleichende Aussagenzwischen Datenwerten verschiedener Zeitobjekte moglich.

Die besondere Starke des Zeitrades liegt im Aufzeigen von Korrelation und Mus-tern. Durch die Festlegung der Form des Zeitrades als Achteck sowie die Verbindungvon Zeit- und Merkmalsachsen mit Linien sind jeweils zwei Merkmale sehr gut und

84 KAPITEL 6. DAS VISUALISIERUNGSSYSTEM LANDV IST

weitere vier gut auswertbar. Bei ausreichender Ikonengroße sind Identifikation undVergleich der Zeitobjekte ebenfalls gut moglich. Lediglich Periodizitaten lassen sichmit dem Zeitrad nur schwer aufzeigen.

Dagegen ist die Zeitspirale direkt darauf ausgelegt, interaktiv das Auffinden vonPeriodizitaten zu ermoglichen. Durch die hierfur notwendige Veranderung der Spi-rale erschwert sich jedoch die Identifikation der Zeitobjekte. Neben dem Erkennenzeitlicher Muster erlaubt die Darstellung in Form einer Spirale das Vergleichen be-nachbarter Zeitobjekte und Zyklusdurchlaufe.

Da die Zeitscheibe die hierarchische Struktur mehrerer zeitlicher Genauigkeits-stufen gleichzeitig darstellt, wird ein Identifizieren und Vergleichen der Zeitobjekteerleichtert. Wie auch bei der Zeitspirale lasst die kreisformige Anordnung der Zeit-objekte ein Erkennen von Periodizitaten und zeitlicher Muster zu. Daruber hinausist auch die zeitliche Entwicklung der Daten nachzuvollziehbar.

Abschließend wird daruber hinaus festgehalten, dass lineare Darstellungen derDaten bezuglich der Zeit (Zeitfluss, Zeitrad) vor allem dann sinnvoll sind, wenndie Daten unter Anwendung eines linearen Zeitmodells interpretiert werden. Furzyklische Daten hingegen sind kreisformige Darstellungen der Zeitachse (Zeitspirale,Zeitscheibe) besser geeignet.

Weiterfuhrende Bewertungen der entwickelten Techniken sollten nach erfolgterRealisierung weiterer Konzepte zur Kombination der Zeitdarstellung mit der Karteden raumlichen Aspekt der Visualisierung mit einfließen lassen. Hierzu sind neueVisualisierungsziele zu formulieren und entsprechende Test mit verschiedene Da-tensatzen durchzufuhren.

6.5 Zusammenfassung

In diesem Kapitel wurde das Visualisierungssystem LandV ist beschrieben. Es stelltein Grundgerust fur die Visualisierung von zeitabhangigen Daten (im speziellen Ge-sundheitsdaten) auf einer Karte dar. Die Verwendung des Prinzips Ikonifizierungund Positionierung der Zeitvisualisierung fur die Verbindung mit der Karte hat ei-nige Probleme aufgeworfen, fur die nur einfache Losungen implementiert werdenkonnten. So erfolgen Großenzuordnung und Positionierung der Ikonen in Abhangig-keit der Bounding-Boxen der jeweiligen Gebiete. Hierbei wird jedoch nicht beachtet,dass fur vergleichende Aussagen unter Umstanden das Seitenverhaltnis aller Ikonengleich sein musste. Ein weiterer Nachteil ergibt sich bei der Positionierung, die imIdealfall von einem speziellen Labeling-Algorithmus vorgenommen werden sollte.

Ein Aspekt, der in LandV ist bisher nur wenig Beachtung findet, betrifft die Ver-wendung von Farbe. Fur den speziellen Fall der vorliegenden 10 AOK-Diagnosenkonnten Aussagen erfolgen. So ware es z.B. fur Vergleiche sinnvoll, jeder Diagnose inverschiedenen Visualisierungstechniken den gleichen Farbton zukommen zu lassen.Fur den allgemeinen Fall der Gesundheitsdaten (die jedoch nicht genutzt werdenkonnten) ist solch eine Aussage jedoch auf Grund der hohen Anzahl an Diagno-sen bzw. Krankheiten nicht mehr zutreffend. Um widerspruchliche Aussagen dieserArt zu vermeiden, wurde der Farbaspekt bewusst fur die Weiterentwicklung vonLandV ist im TeCoMed-Projekt offen gelassen.

Fur die Weiterentwicklung von LandV ist musste die Anwendbarkeit der Lupen-darstellung starker untersucht werden. Eine Moglichkeit, die Lupe nicht nur einfachzur Vergroßerung der Gebiete der Karte einzusetzten, besteht in der Anbindungan den Positionierungsprozess der im Abschnitt 6.4 vorgestellten Visualisierungs-techniken. So ware es denkbar, fur das Gebiet im Lupenzentrum stets auch diezugehorige Ikone zentriert uber der Lupe zu positionieren. Gleichgroße Ikonen derNachbargebiete konnten dann am Lupenkreis positioniert werden.

6.5. ZUSAMMENFASSUNG 85

Die Arbeit mit LandV ist hat zwar gezeigt, dass die Navigation durch die raum-lichen Daten und deren Hierarchie sehr gut moglich ist, aber dennoch einen ent-scheidenden Nachteil hat. Einmal besuchte Orte der Karte mussen, um sie erneutauszuwerten, manuell wieder aufgesucht werden. Dies ist zeitaufwandig und be-hindert ein effizientes analysieren der Daten. Eine Losung stellt die Speicherungeiner Navigationshistorie mit allen relevanten Darstellungsparametern wie Karten-ausschnitt, Zoomfaktor etc. dar, die es dem Anwender erlaubt, ahnlich wie es beiWebbrowsern der Fall ist, an bereits besuchte Orte zuruckzukehren.

Eine weitere Moglichkeit der Verbesserung besteht bei der Navigation durch dieZeit. Wahrend fur die Navigation durch den Raum die Karte als zentrale Schnitt-stelle dient, so ist fur jede Visualisierung gesondert die alphanumerische Eingabe deszu betrachtenden Zeitraumes notwendig. Da jedoch der zeitliche Aspekt von großerBedeutung ist, sollte versucht werden, die Navigation in der Zeit ebenfalls von einerzentralen Schnittstelle, z.B. unter Anwendung eines Zeitstrahls oder von Zeitschei-ben, zu ermoglichen. Auch hierbei ware die Speicherung einer Navigationshistoriesinnvoll.

Zusammenfassend kann festgestellt werden, dass LandV ist ein leicht mit neuenVisualisierungstechniken zu erweiterndes Visualisierungssystem fur die Darstellungvon Gesundheitsdaten ist. Gemaß den genannten Anforderungen ist ein benutzer-freundliches, einfach zu handhabendes und effektives System entstanden, dass alsApplikation oder als Applet im Internet lauffahig ist. Die entwickelte Datenstruk-tur in Verbindung mit der Verwendung eines DBMS ermoglicht daruber hinaus eineeffiziente Verwaltung der Daten und gestattet LandV ist schnelle Zugriffe auf diegespeicherten Informationen.

Kapitel 7

SchlussbetrachtungFur die Visualisierung zeitabhangiger Daten sowie die Darstellung raumlich abhangi-ger Daten auf Karten gibt es bekannte jeweils auf eine Aufgabe spezialisierte Metho-den. Derzeit ist die Visualisierung mehrerer zeit- und raumabhangiger Merkmale aufgeografischen Karten jedoch offener Forschungsgegenstand. In dieser Diplomarbeitwurden erste Losungsvorschlage entwickelt und vorgestellt.

Das vorgeschlagene Konzept der Ikonifizierung und Positionierung ermoglicht es,die Vielzahl vorhandener Methoden zur Zeitdarstellung auf Karten zu verwenden.Die Realisierung dieses Konzeptes im Visualisierungssystem LandV ist erzeugt aus-sagekraftige Zeitdarstellungen auf Karten, die die Analyse zeitlicher Verlaufe undraumlicher Verteilungen unterstutzen.

Die verwendeten Zeitdarstellungen haben hierbei einen entscheidenden Einflussauf die Effektivitat der Visualisierung. Deshalb wurden neben bewahrten Ikonenweitere bekannte Techniken fur die Anwendung auf der Karte adaptiert. Daruberhinaus wurde eine neue Ikonentechnik entwickelt — das Zeitrad. Es ist so konzi-piert und realisiert, dass die visuelle Auswertung mehrerer zeitabhangiger Merkmalegleichzeitig moglich ist.

Das Konzept der Ikonifizierung und Positionierung in Verbindung mit entwi-ckelten, adaptierten bzw. verbesserten Zeitdarstellungen macht LandV ist zu einemleistungsfahigen System, das die expressive, effektive und angemessene Visualisie-rung von Gesundheitsdaten ermoglicht. Durch einfache Schnittstellen ist daruberhinaus eine Erweiterung des Systems um zusatzliche Zeitdarstellungen leicht reali-sierbar.

Die Weiterentwicklung des Systems LandV ist sollte auf Grund der vorgeschla-genen Erweiterungs- und Verbesserungsmoglichkeiten in Betracht gezogen werden.Dies ist vor allem fur die Verwendung des Systems im Rahmen des TeCoMed-Projekts sinnvoll.

Da nur die Ikonifizierung und Positionierung realisiert wurde, ware es sinnvoll,Implementationen der weiteren Konzepte in der Praxis zu testen. Hierbei erscheinendie vorgeschlagenen Darstellungen zur Verwendung der 3. Dimension als Zeitach-se am interessantesten. Jedoch auch die verschiedenen Vorschlage zum Mehrfens-terkonzept sowie die Ansatzen zur Clusterung bieten Einstiegspunkte fur weitereArbeiten. Fur letzteres ware besonders die Verwendung alternativer Darstellungen(z.B. Enridged Contour Maps) zur Verdeutlichung von Clusterzugehorigkeiten in-teressant.

Die vorliegende Arbeit hat aufgezeigt, dass zur die Analyse zeitlicher Verlaufeauf Karten eine Reihe von Konzepten denkbar ist. Die Implementation des SystemsLandV ist belegt die Effektivitat des Konzeptes der Ikonifizierung und Positionie-rung. Weiterfuhrende Arbeiten konnten untersuchen, inwieweit sich auch die wei-teren Konzepte zur Kombination von Zeit- und Kartendarstellung (vgl. Abschnitt5.2) gemaß den Anforderungen der Visualisierung realisieren lassen.

86

Abbildungsverzeichnis

2.1 Visualisierungspipeline . . . . . . . . . . . . . . . . . . . . . . . . . . 82.2 Darstellung umfangreicher Bildinformation . . . . . . . . . . . . . . 102.3 Darstellung verschiedener semantischer Zoomstufen . . . . . . . . . . 112.4 Spaghetti- und Topologisches-Verfahren . . . . . . . . . . . . . . . . 132.5 Layerverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.1 Zeittaxonomie nach [Fra98] . . . . . . . . . . . . . . . . . . . . . . . 173.2 Hierarchische Zeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.3 Relationen zwischen Zeitintervallen nach [All83] (aus [Fra98]) . . . . 193.4 Klassifikation von Zeitdarstellungen . . . . . . . . . . . . . . . . . . 213.5 Dynamische Darstellung und deren Wahrnehmung . . . . . . . . . . 223.6 Ziel der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.7 Zeitdiagramm nach [Cle94] . . . . . . . . . . . . . . . . . . . . . . . 253.8 Verschiedene Diagramme zur Zeitdarstellung nach [Har96] . . . . . . 263.9 Darstellung von Suchtrefferanzahlen als Histogramm (aus [HHN00]) 273.10 Der ThemeRiver aus [HHN00] . . . . . . . . . . . . . . . . . . . . . . 283.11 Die Kalenderdarstellung aus [vWvS99] . . . . . . . . . . . . . . . . . 293.12 Spiraldarstellung zeitabhangiger Daten aus [WAM01] . . . . . . . . . 313.13 Erweiterung der Spiraldarstellung ([WAM01]) . . . . . . . . . . . . . 313.14 Lexis Pencil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.15 Einordnung der Techniken . . . . . . . . . . . . . . . . . . . . . . . . 33

4.1 Klassifikation der Visualisierung auf Karten . . . . . . . . . . . . . . 374.2 Zweidimensionale Kartendarstellungen . . . . . . . . . . . . . . . . . 374.3 Dreidimensionale Kartendarstellungen . . . . . . . . . . . . . . . . . 384.4 Enridged Contour Maps aus [vWT01] . . . . . . . . . . . . . . . . . 414.5 Kartogramm aus [HK98] . . . . . . . . . . . . . . . . . . . . . . . . . 424.6 Marching Sphere aus [KLS00] . . . . . . . . . . . . . . . . . . . . . . 43

5.1 Lexis Pencils uber der Karte . . . . . . . . . . . . . . . . . . . . . . . 475.2 Helices uber der Karte . . . . . . . . . . . . . . . . . . . . . . . . . . 485.3 Ursprungliche Darstellung Carlsteins (aus [SW97] entnommen) . . . 495.4 Neues Konzept zur Maximumanalyse . . . . . . . . . . . . . . . . . . 505.5 Schnittdarstellung eines klimatologischen Datensatzes (aus [SSU97]) 505.6 Lineare Anordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525.7 Zyklische Anordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . 535.8 Zyklische Anordnung in Form eines Rades . . . . . . . . . . . . . . . 535.9 Konzept zur Multiparametererweiterung der Kalenderdarstellung . . 545.10 Darstellung einer raumlichen und zeitlichen Clusterung . . . . . . . . 555.11 Einordnung der Konzepte . . . . . . . . . . . . . . . . . . . . . . . . 57

6.1 Einteilung der Zeit in verschiedene Perioden . . . . . . . . . . . . . . 61

87

88 ABBILDUNGSVERZEICHNIS

6.2 Berechnung der Datenwerte fur beliebige Intervalle . . . . . . . . . . 626.3 Datenbankentwurf fur LandV ist . . . . . . . . . . . . . . . . . . . . 646.4 Optimierung der Kartendarstellung fur LandV ist . . . . . . . . . . . 666.5 Benotigte Zeit zum Darstellen der Karte . . . . . . . . . . . . . . . . 666.6 Strategie zur Online-Identifikation in LandV ist . . . . . . . . . . . . 676.7 Kartendarstellung mit Lupe aus LandV ist . . . . . . . . . . . . . . . 706.8 Visualisierungstechnik - Auswahl, Legende, Einstellungen . . . . . . 716.9 Statuszeile in LandV ist . . . . . . . . . . . . . . . . . . . . . . . . . 726.10 Vorgehen beim Zeichnen von Ikonen in LandV ist . . . . . . . . . . . 726.11 Beziehungen der fur die Visualisierung notwendigen Klassen . . . . . 736.12 Maximumikone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736.13 Karte mit Maximumikonen . . . . . . . . . . . . . . . . . . . . . . . 746.14 Abbildung der Datenwerte auf Stutzpunkte . . . . . . . . . . . . . . 756.15 Probleme bei der Kurvenberechnung . . . . . . . . . . . . . . . . . . 756.16 Karte mit Zeitfluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . 766.17 Mogliche Anordnungen von Merkmalsachsen um eine Zeitachse . . . 776.18 Das Zeitrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 786.19 Karte mit Zeitrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 786.20 Die Zeitspirale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 806.21 Das Prinzip der Zeitscheibe . . . . . . . . . . . . . . . . . . . . . . . 816.22 Zeitscheibe zur Visualisierung zweier Merkmale . . . . . . . . . . . . 816.23 Die Zeitscheibe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 826.24 Bewertung der Techniken . . . . . . . . . . . . . . . . . . . . . . . . 83

Tabellenverzeichnis

5.1 Fragestellungen bei der Festlegung der Ikonengroße . . . . . . . . . . 46

6.1 Beschreibung der perioden-Tabelle der Datenbank . . . . . . . . . . 636.2 Beschreibung der krankheiten-Tabelle der Datenbank . . . . . . . . . 636.3 Beschreibung der gebiete-Tabelle der Datenbank . . . . . . . . . . . 636.4 Beschreibung der erkrankungen-Tabelle der Datenbank . . . . . . . . 64

89

Literaturverzeichnis

[AK99] Akaike, Hirotugu und Genshiro Kitagawa (Herausgeber): ThePractice of Time Series Analysis. Statistics for Engineering and Phy-sical Science. Springer-Verlag, New York, 1999.

[All83] Allen, J.F.: Maintaining Knowledge About Temoral Intervalls. Com-munication of the ACM, 26(11):832–843, 1983.

[Bal88] Balzert, Helmut: Einfuhrung in die Software-Ergonomie. de Gruy-ter, Berlin, 1988.

[BDR00] Buziek, Gerd, Doris Dransch und Wolf-Dieter Rase (Heraus-geber): Dynamische Visualisierung. Springer-Verlag, Berlin, 2000.

[Ber95] Bertelme, Norbert: Geoinformatik - Modelle Strukturen Funktio-nen. Springer-Verlag, Berlin, 1995.

[Bil91] Bill, Ralf: Grundlagen der Geo-Informationssysteme. HerbertWichmann Verlag, Karlsruhe, 1991.

[Bre99] Brewer, Cynthia A.: Color Use Guidelines for Data Representati-on. Technischer Bericht, Department of Geography, Penn State, 1999.

[Bro92] Brodlie, K.W. (Herausgeber): Scientific Visualization. Springer-Verlag, Berlin, 1992.

[Bor99] Bornchen, Christian: Ikonische Informationsprasentation imWWW. Studienarbeit, Universitat Rostock, 1999.

[Cle94] Cleveland, William: The Elements of Graphing Data. HobartPress, Summit New Jersey, 1994.

[DZ99] Dickmann, Frank und Klaus Zehner: Computerkartographie undGIS. Westermann Schulbuchverlag, Braunschweig, 1999.

[ECMS97] Edmondson, Shawn, Jon Christensen, Joe Marks und StuartShieber: A General Cartographic Labeling Algorithm. Cartographica,33(4):13–23, 1997.

[EG98] Egenhofer, Max J. und Reginald G. Golledge (Herausgeber):Spatial and temporal reasoning in geographic information systems. Ox-ford University Press, New York, 1998.

[EVJ97] Earnshaw, Rae, John Vince und Huw Jones (Herausgeber): Vi-sualization and Modeling. Academic Press, San Diego, 1997.

[FF97] Fuller, Mark und Brian Francis: The Use of Visualization inthe Examination of Work and Life Histories. In: Visualization andModeling. Academic Press, San Diego, 1997.

90

LITERATURVERZEICHNIS 91

[FP97] Francis, Brian und John Pritchard: Visualisation of his-torical events using Lexis pencils. Technischer Bericht, Cen-tre for Applied Statistics Fylde College, Lancaster, 1997.www.cas.lancs.ac.uk/alcd/visual.

[Fra98] Frank, Andrew U.: Different Types of”

Times“ in GIS. In: Spati-al and temporal reasoning in geographic information systems. OxfordUniversity Press, New York, 1998.

[GKNV93] Gansner, Emden R., Eleftherios Koutsofios, Stephen C.North und Kiem-Phong Vo: A Technique for Drawing Di-rected Graphs. Software Engineering, 19(3):214–230, 1993.www.research.att.com/sw/tools/graphvis/.

[Got97] Gotze, Christian: Modellwahl und Tests von Daten spezieller Ver-teilungsklassen und deren Visualisierung im Internet. Diplomarbeit,Universitat Rostock, 1997.

[Har96] Harris, Robert L.: Information Graphics: A Comprehensive Illus-trated Reference. Managment Graphics, Atlanta, Georgia, 1996.

[Hes02] Hess, Andreas: Benutzerschnittstelle fur die Visualisierung von Ge-sundheitsdaten. Studienarbeit, 2002. (in Arbeit).

[HHN00] Havre, Susan, Beth Hetzler und Lucy Nowell: ThemeRi-ver: Visualizing Theme Changes over Time. Technischer Bericht,Battelle Pacific Northwest Division, Richland, Washington, 2000.www.pnl.gov/infovis/technologies.html.

[HK98] House, Donald H. und Christopher J. Kocmound: ContinuousCartogram Construction. In: Proceedings Visualization ’98, Los Ala-mitos, 1998. IEEE Computer Society.

[HL92] Hoschek, Josef und Dieter Lasser: Grundlagen der geometrischenDatenverarbeitung. B.G. Teubner, Stuttgart, 1992.

[HS95] Heuer, Andreas und Gunter Saake: Datenbanken: Konzepte undSprachen. International Thomson Publishing, Bonn, 1995.

[Jes00] Jeschke, Stefan: Darstellung zweidimensionaler graphischer Datenmit dem Rechteckigen FishEye-View. Studienarbeit, 2000.

[KLS00] Kreuseler, Matthias, Norma Lopez und Heidrun Schu-mann: A Scalable Framework for Information Visualization. Tech-nischer Bericht, Universitat Rostock, 2000. www.informatik.uni-rostock.de/˜mkreusel.

[KO96] Kraak, Menno-Jan und Ferjan Ormeling: Cartography: Visua-lization of Spatial Data. Longman Singapore Puplishers, Singapore,1996.

[Kor02] Kornelsen, Lars: Informationsvisualisierung mit geografischem Be-zug. Diplomarbeit, Universitat Rostock, 2002.

[LGMR99a] Longley, Paul A., Michael F. Goodchild, David Maguire undDavid W. Rhind (Herausgeber): 1: Principles and Technical Issues,Band 1 der Reihe Geographical Information Systems. John Wiley &Sons, New York, 2 Auflage, 1999.

92 LITERATURVERZEICHNIS

[LGMR99b] Longley, Paul A., Michael F. Goodchild, David Maguire undDavid W. Rhind (Herausgeber): 2: Managment Issues and Applicati-ons, Band 2 der Reihe Geographical Information Systems. John Wiley& Sons, New York, 2 Auflage, 1999.

[Mac95] MacEachren, Alan M.: How maps work: Representation, Visuali-zation and Design. The Guilford Press, New York, 1995.

[MS91] Marks, Joe und Stuart Shieber: The Computational Complexi-ty of Cartographic Label Placement. Technischer Bericht TR-05-91,Mitsubishi Electric Research Laboratory; Havard University, 1991.

[MS99] Middendorf, Stefan und Reiner Singer: Java Programmierhand-buch und Referenz fur die Java-2-Plattform. dpunkt. Verlag, Heidel-berg, 1999.

[Pol02] Pollack, Ralf: Einsatz von Prinzipien der Kartografie in der Infor-mationsvisualisierung. Diplomarbeit, Universitat Rostock, 2002. (inArbeit).

[Pop98] Popp, Sven: Hierarchisch strukturierte Gesundheitsdaten. Diplomar-beit, Universitat Rostock, 1998.

[Ras97] Rase, Wolf-Dieter: Fischauge-Projektionen als kartographi-sche Lupen. Salzburger Geographische Materialien, Angewand-te Geographische Informationsverarbeitung IX(Heft 26), 1997.www.sbg.ac.at/geo/agit/.

[SB94] Sarkar, Manojit und Marc H. Brown: Graphical Fisheye Views.Communications of the ACM, 37(12):73–83, 1994.

[SCGM00] Stasko, John, Richard Catrambone, Mark Guzdial und KevinMcDonald: An Evaluation of Space-Filling Information Visualizati-ons for Depicting Hierarchical Structures. Technischer Bericht GIT-GVU-00-03, GVU Center and College of Computing, Georgia Instituteof Technology, 2000. www.cc.gatech.edu.

[Sho88] Shoham, Yoav: Reasoning about Change. The MIT Press, Cam-bridge, 1988.

[SM00] Schumann, Heidrun und Wolfgang Muller: Visualisierung -Grundlagen und allgemeine Methoden. Springer-Verlag, Berlin, 2000.

[Spe01] Spence, Robert: Information Visualization. Addison-Wesley, Har-low, 2001.

[SS99] Schlittgen, Rainer und Bernd H. J. Streitberg: Zeitreihenana-lyse. R. Oldenbourg Verlag, Munchen, 1999.

[SSU97] Schmidt, B., U. Streit und Ch. Uhlenkuken: Entwicklung vonWerkzeugen zur geowissenschaftlichen Visualisierung (GeoViSC) furdie klimatologische Planung. Salzburger Geographische Materiali-en, Angewandte Geographische Informationsverarbeitung IX(Heft 26),1997. www.sbg.ac.at/geo/agit/.

[Sta94] Stary, Christian: Interaktive Systeme: Software-Entwicklung undSoftware-Ergonomie. Vieweg, Braunschweig, 1994.

LITERATURVERZEICHNIS 93

[Sti01] Stier, Winfried: Methoden der Zeitreihenanalyse. Springer-Verlag,Berlin, 2001.

[Sun02] Sun Microsystems Inc.: Java im Internet, 2002. www.java.sun.com.

[SW97] Southall, Humphrey und Ben White: Mapping the Life Course:Visualising Migrations, Transitions & Trajectories. Technischer Be-richt, Department of Geography, Queen Mary & Westfield College,University of London, 1997. www.lifeline.qmw.ac.uk.

[SZ00] Stasko, John und Eugene Zhang: Fokus+Kontext Display andNavigation Techniques for Enhancing Radial, Space-Filling Hierar-chy Visualizations. Technischer Bericht GIT-GVU-00-12, GVU Cen-ter and College of Computing, Georgia Institute of Technology, 2000.www.cc.gatech.edu.

[The95] Theisel, Holger: Analyse und Visualisierungshilfe fur mehrdimen-sionale wissenschaftliche Daten. Informatik F&E, 10(2):91–98, 1995.

[Tom01] Tominski, Christian: Kartendarstellung mit Fokus und Kontext-Technik. Studienarbeit, Universitat Rostock, 2001.

[VDI00] VDI: Entwurf VDI 3633 Richtlinie, 2000.

[vWT01] Wijk, Jarke J. van und Alexandru Telea: Enridged ConturMaps. Technischer Bericht, Eindhoven University of Technology, 2001.www.win.tue.nl/˜vanwijk.

[vWvS99] Wijk, Jarke J. van und Edward R. van Selow: Cluster and Ca-lendar based Visualization of Time Series Data. Technischer Bericht,Eindhoven University of Technologie; Netherlands Energy ResearchFoundation ECN, 1999. www.win.tue.nl/˜vanwijk.

[WAM01] Weber, Marc, Marc Alexa und Wolfgang Muller: VisualizingTime-Series on Spirals. Technischer Bericht, Institut fur grafische Da-tenverarbeitung, Darmstadt, 2001. www.igd.fhg.de/˜alexa.

[WT97] Ward, Matthew O. und Kevin J. Theroux: Perceptual Bench-marking for Multivariate Data Visualization. In: Proceedings ScientificVisualization ’97, Los Alamitos, 1997. IEEE Computer Society.

Anhang A

Die ProgrammierspracheJava

Um die in dieser Arbeit entwickelten Techniken internetfahig zu machen, wurde furdie Implementation auf die Sprache Java zuruckgegriffen. Sie liegt mittlerweile inder Version 1.4.0 vor und steht auf den Internetseiten der Firma Sun MicrosystemsInc. frei zur Verfugung.

Beschreibung von Java

Java ist eine an C++ angelehnte objektorientierte Programmiersprache. Durch Fea-tures wie strikte Objektorientierung und Garbage Collection1 ist sie einfacher zuhandhaben und robuster als C++. Eigentlich fur den Einsatz in hybriden Syste-men zur Steuerung von elektronischen Haushaltsgeraten geplant, entdeckte manJava nach dort ausbleibendem Erfolg fur das im Boom befindliche World WideWeb. Durch die Moglichkeit der Einbindung kleiner Java-Programme, sogenannterApplets, in bis dahin statische Web-Seiten gewann diese Sprache immer mehr anBedeutung.

Heute wird Java — nicht nur fur Applets — in vielen Bereichen von Industrie undWissenschaft eingesetzt. Teilweise werden gesamte Standard-Softwareprodukte, wiez.B. StarOffice, mit Java implementiert, was wegen der Plattformunabhangigkeitihren Einsatz unter vielen Rechnerarchitekturen und Betriebssystemen ermoglicht.

Besonders mit den in Version 1.2.0 eingefuhrten umfangreichen Moglichkeitenzur Grafikprogrammierung stellt Java nun auch eine geeignete Entwicklungsumge-bung fur den Bereich Visualisierung dar. Konzipierte Techniken lassen sich schnellprototypisch implementieren und spater auf Grund der Objektorientierung gut wei-terentwickeln.

Nachteilig wirkt sich die Verwendung von Java auf das Laufzeitverhalten der Pro-gramme aus. Durch Interpretation bzw. Just-In-Time-Kompilierung des Java-Codesund Garbage Collection ist ein erhohter Bedarf an Rechenleistung und vorhandenemSpeicher zu erkennen, der mit der heutigen Technik jedoch leicht zu decken sein soll-te. Dennoch sind Javaprogramme bis heute stets langsamer als C++-Programme.

Eigenschaften von Java

Die folgenden Eigenschaften der Programmiersprache Java entsprechen den in [MS99]genannten. Dieses Buch soll hier zum Einstieg in Java sowie als Nachschlagewerkempfohlen werden.

1Das Verwalten von Speicherreferenzen sowie das Freigeben nicht mehr referenzierter Bereicheim Speicher wird Garbage Collection genannt.

94

95

Interpretierte Sprache: Java-Quellcode wird nicht direkt in Maschinenspracheubersetzt, sondern in einen Bytecode. Dieser wird zur Laufzeit interpretiert.Alternativ — und heute am haufigsten angewandt — ist die Laufzeitkom-pilierung, bei der wahrend der Laufzeit ein maschinenoptimierter Code er-zeugt werden kann. Dieses Verfahren beschleunigt die Ausfuhrung von Java-Programmen in erheblichem Maße.

Portabilitat: Durch die Verfugbarkeit von Interpretern fur viele Rechnerarchi-tekturen lassen sich mit Java portable Programme erstellen. Erwahnenswertist die Tatsache, dass selbst die Java-Datentypen systemunabhangig definiertsind.

Objektorientierung: Durch die Objektorientierung konnen Javaentwickler vonden Vorteilen der objektorientierten Modellierung und Programmierung pro-fitieren. Konzepte wie Vererbung (keine multiple Vererbung), Kapselung undPolymorphismus tragen zur Erstellung von ubersichtlichen Projekten bei.

Robustheit: Durch den konsequenten Verzicht auf Zeiger, wie sie in C++ ublichsind, und eine Speicherverwaltung unter Verwendung eines Garbage Collec-tors, ist Java weniger anfallig gegen Programmierfehler. Zur Robustheit tragtauch der Verzicht auf eine automatische Typkonvertierung wahrend der Lauf-zeit bei.

Weitere Eigenschaften: Java bietet weiterhin die Moglichkeiten zur Thread- undverteilten Programmierung und stellt verschiedene Schnittstellen zu anderenSystemen bereit (z.B. JDBC zur Anbindung von Datenbanken).

Diese Auflistung erhebt nicht den Anspruch auf Vollstandigkeit, soll jedoch dieVerwendung von Java fur diese Arbeit untermauern. Ausfuhrlichere Informatio-nen kann der interessierte Leser auf den WWW-Seiten der Sun Microsystems Inc.([Sun02]) finden.

Anhang B

Richtlinien fur Diagramme

Da im Abschnitt 3.4.1 nicht auf alle Anforderungen, Bedingungen bzw. Richtlini-en fur die Erstellung von Diagrammen eingegangen werden konnte, ist hier eineAufzahlung der Aussagen aus [Cle94] zusammengefasst. Der interessierte Leser soll-te fur die Erklarung der genauen Bedeutung sowie verdeutlichende positive undnegative Beispiele die Originalliteratur verwenden.

Zitat [Cle94]:

�Make the data stand out. Avoid superfluity.�

�Use visually prominent graphical elements to show the data.�

�Use a pair of scale lines for each variable. Make the data rectangle slightly smallerthan the scale-line rectangle. Tick marks should point outward.�

�Do not clutter the interior of the scale-line rectangle.�

�Do not overdo the number of tick marks.�

�Do not allow data labels in the interior of the scale-line rectangle to interfere withthe quantitative data or to clutter the graph.�

�Avoid putting notes and keys inside the scale-line rectangle. Put a key outside,and put notes in the caption or in the text.�

�Overlapping plotting symbols must be visually distinguishable.�

�Superposed data sets must be readily visually assembled.�

�Visual clarity must be preserved under reduction and reproduction.�

�Put major conclusions into graphical form. Make captions comprehensive and in-formative.�

�Error bars should be clearly explained.�

�When logarithms of a variable are graphed, the scale label should correspond tothe tick mark labels.�

�Proofread graphs.�

�Strive for clarity.�

�The aspect ratio of a graph is an important factor for judging rate of change.�

�When the orientations of line segments are judged to decode information aboutrate of change, bank the segments to 45◦.�

�Choose the range of the tick marks to include or nearly include the range of data.�

�Subject to the constraints that scales have, choose the scales so that the data rec-

96

tangle fills up as much of the scale-line rectangle as possible.�

�It is sometimes helpful to use the pair of scale lines for a variable to show twodifferent scales.�

�Choose appropriate scales when data on different panels are compared.�

�Use a logarithmic scale when it is important to understand percent change ormultiplicative factors.�

�Showing data on logarithmic scale can cure skewness toward large values.�

�Use a scale break only when necessary. If a break cannot be avoided, use a fullscale break. Do not connect numerical values on two sides of a break. Taking logscan cure the need for a break.�

�A large amount of quantitative information can be pace into a small region.�

�Graphing data should be an iterative, experimental process.�

�Graph data two or more times when it is needed.�

�Many useful graphs require careful, detailed study.�

Danksagung

An dieser Stelle mochte ich allen danken, die mir beim Erstellen dieser Arbeit hilf-reich zur Seite standen. Besonderer Dank gilt hierbei Petra, die wirklich immer furmich Zeit hatte und in kritischen Diskussionen meine Ideen in die richtigen Bahnengelenkt hat. Ebenso danke ich ihr fur das mehrfache Korrekturlesen der Arbeit.

Spezieller Dank gilt Frau Professor Schumann. Sie hat mich bei der Abfassung derschriftlichen Arbeit maßgeblich unterstutzt. Auch sie fand stets Zeit fur mich, sogar,wenn dies — vor allem zum Ende der Arbeit — kurzfristig notwendig wurde.

Mein Dank gilt auch Frau Professor Uhrmacher fur das Durcharbeiten der schrift-lichen Fassung sowie die Begutachtung der Arbeit.

Ich mochte hier auch meinen Eltern danken. Mit ihrer Unterstutzung in allen Le-benslagen waren sie es, die mir das Studium ermoglicht haben. Fur die Korrektur-lesung dieser Arbeit gebuhrt meiner Mutter ein besonderer Dank.

Herzlich danke ich auch meiner Anja, die mich wahrend der Arbeit so viele Stun-den ertragen und auf mich verzichten musste. Sie hat mich in schwierigen Zeitenaufgebaut und mir Mut und Kraft gegeben. Danke.

Selbststandigkeitserklarung

Ich erklare, dass ich die vorliegende Arbeit selbststandig und nur unter Verwendungder angegebenen Literatur und Hilfsmittel angefertigt habe.

Rostock, 28. Marz 2002 Christian Tominski

Thesen

1. Bei der Visualisierung von zeit- und raumabhangigen Daten ist es wichtig,diesen Zusammenhang auch in der grafischen Darstellung zu verdeutlichen.Dies gilt insbesondere auch bei der Visualisierung von Gesundheitsdaten.

2. Der Zeitbezug der Daten kann unter Anwendung verschiedener Zeitmodelleinterpretiert werden. Fur die betrachteten Gesundheitsdaten eignen sich be-sonders lineare und zyklische Modelle sowie das Modell der hierarchischenZeit.

3. Zeitabhangige Daten lassen sich mit speziellen Visualisierungstechniken gemaßden Anforderungen nach Expressivitat, Effektivitat und Angemessenheit dar-stellen. Diese Techniken lassen sich nach Zeitverhalten der Visualisierung, An-zahl dargestellten Zeitobjekte sowie Anzahl und Wertebereichseigenschaftender visualisierten zeitabhanigen Merkmale klassifizieren.

4. Geografische Informationssysteme (GIS) sind auf die Visualisierung von Da-ten mit Raumbezug spezialisiert, wobei die Darstellung mehrerer Merkmaleauf Karten aktueller Forschungsgegenstand ist. Visualisierungstechniken zurDarstellung von raumbezogenen Daten auf Karten lassen sich nach Dimen-sionalitat der Kartendarstellung, Verdeutlichung des Raumbezuges sowie Re-prasentationsform der Daten klassifizieren.

5. Die Kombination von Zeitdarstellungen mit Karten kann die Analyse vonzeitabhangiger Daten mit geografischem Bezug in hohem Maße erleichtern.Die in dieser Arbeit entwickelten Konzepte Ikonifizierung und Positionierungsowie Verwendung der 3. Dimension als Zeitachse stellen solche Kombinatio-nen dar. Ebenso lasst sich das bekannte Mehrfensterkonzept fur die Darstel-lung von Daten mit Raum- und Zeitbezug nutzten.

6. Das Konzept Ikonifizierung und Positionierung ermoglicht die Verwendungvieler bekannter Zeitdarstellungen in Verbindung mit geografischen Karten.Hierbei erfolgt das verkleinerte (ikonifizierte) Anzeigen der Zeitvisualisierungauf der Karte.

7. Es wurde das Visualisierungssystem LandV ist realisiert, das durch Verwen-dung des Konzeptes Ikonifizierung und Positionierung und die Integrationverschiedener Techniken zur Zeitdarstellung eine effiziente Analyse der be-trachteten Gesundheitsdaten ermoglicht.

8. Im System LandV ist ist eine neuartige Technik zur Visualisierung von Datenmit Zeitbezug integriert worden — das Zeitrad. Es ermoglicht die expressiveund effektive Darstellung mehrerer Merkmale bezuglich eines betrachtetenZeitraumes.