Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization...

16
Scientific Visualization J.W.Goethe-Universit¨ at 19. August 2000 Thadd¨ aus Hajduga Graphische Datenverarbeitung Datenvisualisierung > 3 Dimensionen Thadd¨ aus Hajduga [email protected] J.W.Goethe-Universit¨ at Graphische Datenverarbeitung Germany, Frankfurt am Main Vorwort Wenn Daten in Form von Zahlen, meist in Tabellen ange- ordnet, pr¨ asentiert werden, bleiben uns die Zusammen- ange oft verborgen. Die Datenvisualisierung ist ein Mit- tel, daß uns hier helfen soll, Einsicht zu gewinnen. Der Ausdruck “Using Vision to Think” oder “Ein Bild sagt mehr als tausend Worte” geben den Grund f¨ ur die Ver- wendung von Graphik an. Die Visualisierung birgt je- doch viel Probleme in sich, eines davon ist die Darstel- lung von Daten mit mehr als 3 Dimensionen. Dieser Arti- kel zeigt, welche M¨ oglichkeiten auf diesem Gebiet existie- ren. Die hier vorgestellten Methoden benutzen Projektio- nen auf kleinere Dimensionen, andere Anordnungen der Achsen, dynamische Darstellungen, Reduktionden durch Unterr¨ aume um eine mehrdimensionale Datenmenge ab- zubilden. Stichw¨ orter: large-scale Multivariate Data, Scientific Visualization, Multiple Dimensions, Dimensional Stacking, Scatterplot Matrices, Parallel Coordina- tes, Grand Tours, Worlds within Worlds, Brushing Inhaltsverzeichnis 1 Einleitung 1 2 Dimensional Embedding Techniques 1 2.1 Hierarchical Axis in 1D .......... 2 2.1.1 Beispiel ............... 2 2.1.2 Subspace Zoom Tools ....... 2 2.1.3 Animation Tools .......... 3 2.1.4 Decimate Tools ........... 3 2.2 Dimensional Stacking in 2D ........ 4 2.2.1 Ohne abh¨ angiger Variable ..... 4 2.2.2 Mit abh¨ angiger Variable ...... 4 2.3 World within Worlds in 3D ........ 5 3 Dimensional Subsetting Techniques 5 3.1 Scatterplot Matrices ............ 6 3.2 Tours .................... 6 3.2.1 Projection Pursuit ......... 6 3.2.2 Grand Tour ............. 6 3.2.3 Correlation Tour .......... 7 4 Axis Reconfiguration Techniques 7 4.1 Parallel Coordinates ............ 7 4.2 Hierarchical Parallel Coordinates ..... 8 4.2.1 Hierarchical Cluster ........ 9 4.3 Proximity-based Coloring ......... 9 4.4 Dynamic Extent Scaling .......... 10 4.5 Dimension Zooming ............ 11 5 Subspace Filtering Techniques 11 5.1 Brushing / Masking ............ 11 5.2 Structure-based Brushing ......... 12 5.3 Dynamic Masking ............. 12 6 Werkzeuge 13 6.1 n-Vision / Autovisual ........... 13 6.2 Xmdv .................... 14 6.3 XGobi .................... 14 6.4 C2-Cave ................... 15 7 On-line Resources 15 8 Schlußwort 15 1 Einleitung Es gibt viele Bereiche, in denen die Auswertung von Da- ten eine wichtige Rolle spielt. Ob in der Forschung, der 1

Transcript of Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization...

Page 1: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

Graphische Datenverarbeitung

Datenvisualisierung > 3 Dimensionen

Thaddaus [email protected]

J.W.Goethe-UniversitatGraphische DatenverarbeitungGermany, Frankfurt am Main

Vorwort

Wenn Daten in Form von Zahlen, meist in Tabellen ange-ordnet, prasentiert werden, bleiben uns die Zusammen-hange oft verborgen. Die Datenvisualisierung ist ein Mit-tel, daß uns hier helfen soll, Einsicht zu gewinnen. DerAusdruck “Using Vision to Think” oder “Ein Bild sagtmehr als tausend Worte” geben den Grund fur die Ver-wendung von Graphik an. Die Visualisierung birgt je-doch viel Probleme in sich, eines davon ist die Darstel-lung von Daten mit mehr als 3 Dimensionen. Dieser Arti-kel zeigt, welche Moglichkeiten auf diesem Gebiet existie-ren. Die hier vorgestellten Methoden benutzen Projektio-nen auf kleinere Dimensionen, andere Anordnungen derAchsen, dynamische Darstellungen, Reduktionden durchUnterraume um eine mehrdimensionale Datenmenge ab-zubilden.

Stichworter: large-scale Multivariate Data, ScientificVisualization, Multiple Dimensions, DimensionalStacking, Scatterplot Matrices, Parallel Coordina-tes, Grand Tours, Worlds within Worlds, Brushing

Inhaltsverzeichnis

1 Einleitung 1

2 Dimensional EmbeddingTechniques 12.1 Hierarchical Axis in 1D . . . . . . . . . . 2

2.1.1 Beispiel . . . . . . . . . . . . . . . 22.1.2 Subspace Zoom Tools . . . . . . . 22.1.3 Animation Tools . . . . . . . . . . 32.1.4 Decimate Tools . . . . . . . . . . . 3

2.2 Dimensional Stacking in 2D . . . . . . . . 42.2.1 Ohne abhangiger Variable . . . . . 42.2.2 Mit abhangiger Variable . . . . . . 4

2.3 World within Worlds in 3D . . . . . . . . 5

3 Dimensional SubsettingTechniques 53.1 Scatterplot Matrices . . . . . . . . . . . . 63.2 Tours . . . . . . . . . . . . . . . . . . . . 6

3.2.1 Projection Pursuit . . . . . . . . . 63.2.2 Grand Tour . . . . . . . . . . . . . 63.2.3 Correlation Tour . . . . . . . . . . 7

4 Axis ReconfigurationTechniques 74.1 Parallel Coordinates . . . . . . . . . . . . 74.2 Hierarchical Parallel Coordinates . . . . . 8

4.2.1 Hierarchical Cluster . . . . . . . . 94.3 Proximity-based Coloring . . . . . . . . . 94.4 Dynamic Extent Scaling . . . . . . . . . . 104.5 Dimension Zooming . . . . . . . . . . . . 11

5 Subspace Filtering Techniques 115.1 Brushing / Masking . . . . . . . . . . . . 115.2 Structure-based Brushing . . . . . . . . . 125.3 Dynamic Masking . . . . . . . . . . . . . 12

6 Werkzeuge 136.1 n-Vision / Autovisual . . . . . . . . . . . 136.2 Xmdv . . . . . . . . . . . . . . . . . . . . 146.3 XGobi . . . . . . . . . . . . . . . . . . . . 146.4 C2-Cave . . . . . . . . . . . . . . . . . . . 15

7 On-line Resources 15

8 Schlußwort 15

1 Einleitung

Es gibt viele Bereiche, in denen die Auswertung von Da-ten eine wichtige Rolle spielt. Ob in der Forschung, der

1

Page 2: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

Industrie, der Wirtschaft, oder im privatem Umfeld ha-ben wir es mit Daten zu tun. Diese konnen verschieden-ster Art sein, wie zum Beispiel Meßwerte aus Experi-menten, Produktionsdaten, Finanzdaten, oder aber auchals unstrukturierte Dokumente vorliegen. Das Ziel einerAnalyse besteht darin, den Verlauf der Daten zu erken-nen, beziehungsweise die Abhangigkeiten zwischen denVariablen zu entdecken, oder aber auch Daten mit be-stimmten Kriterien herauszufiltern. Um diese Aufgabenbewaltigen zu konnen, sind verschiedene visuelle Dar-stellungen notig. Sie unterstutzen unseren Verstand beidieser Tatigkeit. In der heutigen Informationsgesellschaftwerden die Daten zunehmend großer und komplexer. So-mit stoßen wir bei der Visualisierung schnell an die Gren-ze der 3. Dimension. Den sobald Daten mit mehr als dreiVariablen graphisch dargestellt werden sollen, stehen wirals Menschen vor einem großen Problem. Unsere Vor-stellungskraft reicht nicht aus, um Projektionen nutzenzu konnen, die mit Hilfe von konventionellen Technikenerstellt wurden und noch mehr Dimensionen enthalten.Somit mußten andere Techniken zur Visualisierung vonDaten erfunden werden. Die Suche begann in den 70erJahren. Seit dem wurden verschiedene Methoden ent-wickelt. Einige davon werden in den folgenden Kapitelnvorgestellt und deren Funktionsweise erklart. Die einzel-nen Methoden sind in Gruppen eingeteilt. Sie spiegelndie Ideen wieder, die alle Methoden dieser Gruppe ge-meinsam haben.

2 Dimensional EmbeddingTechniques

Bei den nun folgenden Methoden werden, wie die Uber-schrift es sagt, verschiedenen Dimensionen ineinandereingebettet. Dies muß man sich auf folgende Weise vor-stellen: Um in einer Darstellung eine hohere Anzahl vonDimension unterzubringen, ersetzt man komplette Ab-schnitte in einem Graph, der eine kleinere Dimensionali-tat besitzt durch weitere Koordinatensysteme, die meistdem außern System entsprechen. Durch die Schachte-lung der Koordinatensysteme erreicht man eine hohereDimensionalitat, wobei allerdings eine mehrfache Bele-gung der tatsachlichen Achsen in Kauf genommen wer-den muß. Bei den hier vorgestellten Methoden existierenzwei wesentliche Unterschiede:

• Fur die Darstellung werden zwei- oder dreidimen-sionale Koordinatensysteme verwendet

• Die Darstellung besitzt in einer (1D), zwei (2D)oder drei (3D) Dimensionen mehrfach belegte Ach-sen

2.1 Hierarchical Axis in 1D

Diese Methode nutzt eine zweidimensionale Darstellungder Daten. Die beiden Achsen stehen hierbei in einemrechten Winkel zueinander. Die Methode eignet sich aus-schließlich zur Darstellung von Datensatzen mit funktio-nalem Charakter, denn es wird zwischen abhangigen undunabhangigen Variablen unterschieden. Theoretisch kon-nen beliebig viele von den unabhangige Variablen darge-stellt werden. Die Auflosung des Ausgabemediums stellthier jedoch eine Beschrankung dar. All diese Variablenwerden auf einer einzigen Achse plaziert. Die andere Ach-se ist fur die Darstellung der einzigen abhangigen Varia-ble zustandig. Wir verwenden hier fur die unabhangigenVariablen ausschließlich die horizontale und fur die ab-hangige Variable die vertikale Achse. Eine umgekehrteAnordnung ist aber genauso moglich. Um den Graphenzu erstellen geht man folgendermassen vor: Zu erst mußeine hierarchische Ordnung der unabhangigen Variablenbestimmt werden, die das Erscheinungsbild des Graphenwesentlich beeinflußt. Aber unabhangig davon, fur wel-che Ordnung man sich entscheidet, sind alle Informatio-nen dem Graphen zu entnehmen. Eine geschickte Wahlkann jedoch die Arbeit erleichtern. Als nachstes muß derWertebereich jeder Dimension, unabhangig voneinander,in diskrete Abschnitte eingeteilt werden. Außerdem be-kommt jede Dimension eine unterschiedliche Farbe zu-gewiesen. Mit Hilfe dieser Informationen, wird die hori-zontale Achse an Hand der Ordnung rekursiv in vertikaleStreifen eingeteilt. Sie nehmen an jeder Stelle fur alle un-abhangigen Variablen einen bestimmten Wert an. Nunkonnen die Werte an den jeweiligen Stellen als Streifen(Rechtecke mit der Hohe Null) der entsprechenden Farbeeingetragen werden. Dabei gibt die abhangige Variablederen Position in vertikaler Richtung an. Dann werdendie Rechtecke eingezeichnet, die die ubergeordneten Di-mensionen darstellen. Sie erhalten die Farbe, die ihrerDimension entspricht. Ihre Große und Position wird da-bei von der Werten (Rechtecken) der untergeordnetenDimension bestimmt. Der Minimal- und Maximalwertgeben die Position der unteren und oberen Kante desRechtecks an. Die Rechtecke sind als Symbole anzuse-hen, die den Verlauf der Daten bezuglich einer Dimensi-on darstellen.

2.1.1 Beispiel

Die beschriebene Vorgehensweise wird nun an Hand ei-nes konkreten Beispiels verdeutlicht. Um den Verlauf derFunktionen hervorzuheben, sind in allen Graphen Spli-nes eingefugt, die durch die Position aller Rechtecke einerDimension laufen. Abbildung 1 zeigt einen Datensatz mitvier Dimensionen, der von der Funktion D = x2e−y + zerzeugt wurde. Die beiden Darstellungen unterscheidensich in der Ordnung der Variablen:

2

Page 3: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

• Obere Abbildung

– rot, Variable z mit 4 Werten

– blau, Variable y mit 4 Werten

– weiß, Variable x mit 5 Werten

• Untere Abbildung

– rot, Variable x mit 5 Werten

– blau, Variable y mit 4 Werten

– weiß, Variable z mit 4 Werten

Abbildung 1: Darstellung der Funktion D = x2e−y + zmit unterschiedlicher hierarchischer Ordnungen

2.1.2 Subspace Zoom Tools

Um diese Form der Darstellung effizient nutzen zu kon-nen, wurden zusatzliche Werkzeuge entwickelt, die eineManipulation der Ansicht erlauben. Die ist notwendig,da durch die Beschrankung des Ausgabemediums nichtalle Daten angezeigt werden konnen, beziehungsweise dieAnsicht nicht genugend detailiert ist. In Abbildung 2 se-hen wir einen Graphen mit 7 Dimensionen. Die Ordnungder Dimensionen mit Hilfe der entsprechenden Farbenausgedruckt lautet: gelb mit 5 Werten, turkis mit 6 Wer-ten, violett mit 5 Werten, rot mit 7 Werten, blau mit 5Werten und weiß mit 9 Werten. Dies bedeutet, daß wirfur dir horizontale Achse 47.250 Punkte brauchten, umalle Daten anzeigen zu konnen. Um dennoch die Mog-lichkeit zu bekommen diese Daten zu sehen, kann mandurch die Selektion eines Rechtecks in diesen hineinzoo-men, wodurch dieser uber die volle Breite des Displaysangezeigt wir. Der neue Graph zeigt nun einen Unter-raum an, dessen Dimension um eins verringert ist. DieserVorgang laßt sich mehrfach wirderholen. Die verschiede-nen Ansichten konnen gleichzeitig angezeigt werden.

Abbildung 2: Zoom durch die Unterraume 6D bis 2D

2.1.3 Animation Tools

Ein weiteres Hilfsmittel, um Interessante Eigenschaftenzu entdecken, ist das Animations-Tool. In diesem Modusdurchlauft die Animation alle Werte einer ausgewahltenVariable. Diese Variable selbst und solche mit einer ho-heren Ordnung werden dann nicht mehr dargestellt. Nurnoch die tiefer eingebetteten Variablen werden als Se-quenz gezeigt. In Abbildung 3 sieht man eine Animationuber die funf Werte der roten Variable. Die Dampfungder Funktion wurde in der Mitte durch eine automati-sche Skalierung aufgehoben, wahrend sie im unteren Teilgut zu erkennen ist. In beiden aber kann man sehen, daßsich die Gaußkurve nach rechts bewegt. Zum besserenVerstandnis ist die gesamte Funktion oben abgebildet.

Abbildung 3: Originaler Datensatz (oben), Animationmit Autoskalierung (Mitte), ohne (unten)

3

Page 4: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

2.1.4 Decimate Tools

Um interessante Regionen zu entdecken, kann die ange-zeigte Datenmenge mit Hilfe von Werkzeugen herabge-setzt werden. Der Graph in Abbildung 4 zeigt Daten mit4 Dimensionen an. Er besteht aus 6.375 Werten und sei-ne Ordnung ist: rot mit 15 Werten, blau mit 15 Wertenund weiß mit 17 Werten. Die Reduktion wir auf zwei ver-schiedene Weisen bewerkstelligt. Bei der ersten Methodewird der gleiche Bereich angezeigt, jedoch werden dieWerte in einer groberen Schrittweite abgetastet. DieseSchrittweite kann fur jede Dimension separat festgelegtwerden. So wird fur die betreffende Dimension z.B. nurjede zweite, dritte, vierte oder sonstige Wert angezeigt.Die andere Methode zeigt im Gegensatz zur Ersten, nichtden vollen Bereich der Daten an, sondern nur einen be-stimmten Ausschnitt der Daten. Diese Ausschnitt kannfur jede Dimension einzeln festgelegt werden. Er laßt sichjederzeit beliebig variieren.

Abbildung 4: Originaler Datensatz (oben), reduzierterDatensatz (Mitte), Teilmenge der Daten (unten)

2.2 Dimensional Stacking in 2D

Im Gegensatz zur ersten Methode, werden jetzt beideAchsen einer zweidimensionalen Darstellung mehrfachbelegt. Dies bedeutet, daß die Schachtelung der Dimen-sionen nun in zwei Richtungen ausgefuhrt wird. Somitkann jede Variable entweder auf der horizontalen, oderauf der vertikalen Achse angebracht werden. Aufgrundder Schachtelung, die von einer frei wahlbaren Ordnungabhangig ist, kann ein und der selbe Datensatz verschie-dene Darstellungen besitzt. Das Einbetten einer Dimen-sion in eine andere macht es notwendig, daß fur jedeDimension ein Bereich festgelegt wird, der in diskreteAbschnitte eingeteilt werden muß. Von dieser Technikexistieren zwei Variationen. Sie unterscheiden sich dar-

in, ob die darzustellenden Daten eine abhangige Variablebesitzen oder nicht.

2.2.1 Ohne abhangiger Variable

Falls nun Daten dargestellt werden sollen, die keinen,oder zuminsdestens keinen bekannten funktionalen Zu-sammenhang besitzen, ist diese Methoden zu wahlen.Die Daten werden nun als Punkte einer einzigen Far-be in den Graphen eingezeichnet. Falls eine Datensatzin einen Gitterpunkt fallt, wir dieser gefarbt. Da so, beieiner großeren Datenmenge, bald alle Gitterpunkte ge-farbt wahren, wurde man in einer solchen Darstellungnicht viel erkennen. Deshalb kann man eine Schrankeangeben, die die Anzahl von Datensatzen angibt, die inden selben Gitterpunkt fallen mussen, bevor dieser ge-farbt wird. Einen solchen Graphen kann man in Abbil-dung 5 sehen. Er besitzt 4 Dimensionen, die jweils in10 Abschnitte eingeteilt sind. Hier wird zusatzlich einausgewahlter Bereich angezeigt, der durch andersfarbigeRechtecke hervorgehoben ist. Die Datenpunkte, die indiesen ausgewahlten Bereich fallen, werden in einer an-deren Farbe dargestellt. Diese Moglichkeit der Auswahlist vorallem dann interessant, wenn verschiedene Ansich-ten gezeigt werden, die miteinander verbunden sind.

Abbildung 5: Dimensional Stacking ohne abhangiger Va-riable

2.2.2 Mit abhangiger Variable

Bei dieser Variante der Methode, geht es darum, Datenmit funktionalem Charakter zu visualisieren. Wir unter-scheiden hier wieder zwischen abhangigen und unabhan-gigen Variablen. Die unabhangigen werden auf der hori-zontalen und der vertikalen Achse aufgetragen, wahrend

4

Page 5: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

die einzige abhangige Variable durch die Farbe der Punk-te kodiert wird. Eine Farbskala, die aus einem Farbver-lauf besteht, spiegelt den Wert der Datensatze bezuglichdieser Dimension wieder. Abbildung 6 zeigt ein solchesBeispiel, welches durch die FunktionD = x2+u2+y2+v2

erstellt wurde. Diese 5-dimensionale Darstellung bestehtaus 194.481 Punkten, wobei die Variablen x, u auf derhorizontalen und y, v auf der vertikalen Achse ange-bracht sind.

Abbildung 6: Dimensional Stackung mit abhangiger Va-riable

2.3 World within Worlds in 3D

Die Grundlage diese Methode ist eine 3-dimensionaleDarstellung, die fur sich genommen nichts besonderesdarstellt. Sie kann auf die ubliche Weise, durch eine Pro-jektion auf einem 2-dimensionalen Display, erzeugt wer-den. Die Navigation innerhalb einer solchen Projektionstellt sich aber als besonders schwierig heraus. Deshalbwird hier eine Technik benutzt, die man unter dem Be-griff “Virtual Reality” kennt. Sie nutzt speziele Hardwa-re, um einen realistischen 3-dimensionale Eindruck zuerwecken und die Interaktion mit den dargestellten Ob-jekten zu erleichtern. Fur die Visualisierung wird eine“Datenbrille” benutzt, die fur jedes Auge eine separa-tes Bild erzeugt. Da sich diese Bilder in der Perspek-tive unterscheiden, wird so in unserem Gehirn ein 3-dimensionaler Eindruck produziert. Fur die Interaktionkommt ein “Datenhandschuh” zum Einsatz. Durch seineSensoren kann die Position der Hand, ihre Orientierungund die Neigung der Finger registriert werden. Somitkann der Benutzer nach den Objekten greifen und diese

manipulieren, Knopfe aktivieren oder durch Gesten be-stimmte Aktionen auslosen. Um nun Daten mit mehr als3-Dimensionen zu visualisieren, plaziert diese Methodeverschiedene Koordinatensysteme ineinander. Sie kon-nen ein-, zwei- oder dreidimensional sein. Im Falle von 3-Dimensionen bekommt das außerste Koordinatensystemdrei Variablen zugewiesen. Das nachfolgende innere Ko-ordinatensystem bekommt die nachsten drei Variablenzugeteilt. Dadurch konnen schon bereits 6-Dimensionenvisualisiert werden. Dieser Vorgang kann mehrfach wie-derholt werden, wodurch noch hohere Dimensionen er-reicht werden. Wie man in Abbildung 7 sieht, konnenauch mehrere Systeme auf gleicher Ebene nebeneinan-der existieren. Die Werte fur einen bestimmten Punktergeben sich durch dessen Position innerhalb des inne-ren Systems, in dem er sich befindet. Die Werte der rest-lichen Variablen dieses Punktes werden von der Positi-on des Ursprungs des Koordinatensystems bestimmt, indem sich der Punkt befindet. Somit sind die Variablen,die von den außeren System festgelegt werden, innerhalbdes inneren System konstant. Dadurch wird die Komple-xitat des Systems reduziert, da alle “außeren Variablen”konstant gehalten werden. Die inneren Systeme zeigensomit nur kleine Ausschnitt in 3-dimensionaler Darstel-lung. Diese konnen durch Verschiebung des gesamten in-neren Systems verandert werden. Außerdem besteht dieMoglichkeit, die inneren Systeme zu skaliert, zu rotiertund zu verschieben, ohne daß sich dies auf die Datenauswirkt. Diese Moglichkeiten erleichtern das Betrach-ten und Vergleichen der Daten. Zudem wird dem Benut-zer die Auswahl der Darstellungsform geboten. Die dreiAlternativen sind: Korper, Flache oder einzelne Punkte.

Abbildung 7: Flachendarstellung mit 6-Dimensionen

5

Page 6: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

3 Dimensional SubsettingTechniques

Die lineraren Algebra definiert Formeln, die es erlaubenVektoren auf andere Vektoren oder Flachen zu projezie-ren. Hierbei geht der Anteil, der orthogonal zur Projek-tionsflache steht verloren. Diese Projektionen haben einekleinere Dimensionalitat, die es im Falle von 2 Dimen-sionen erlaubt, die Daten auf einem normalen Displayanzuzeigen.

3.1 Scatterplot Matrices

Durch diese Technik werden mehrdimensionale Datenin der Darstellung jeweils auf 2-Dimensionen reduziert.Dies passiert auf einfachste Weise, wodurch keine spe-zielen Techniken fur die Erstellung des Graphen notwen-dig sind. In einer 2-dimensionalen Darstellung werden je-weils immer nur zwei Variablen gegeneinander aufgetra-gen. Um alle Dimensionen zu betrachten, werden mehre-re solcher Systeme in Form von einer Matrix angeordnet.Wenn nun N -dimensionale Daten visualisiert werden sol-len, wird eine N×N -Matrix erstellt. Die Zeilen und Spal-ten werden jeweils mit den N verschiedenen Variablenbeschriftet. Dann werden die Datenpunkte in die Gra-phen entsprechend den Beschriftungen eingetragen. Mitdieser Methode konnen die Relationen zwischen zwei Va-riablen leicht festgestellt werden. Sie machen sich durchmathematisch Strukturen (Linien, Parabeln, etc.) in deneinzelnen Systemen bemerkbar. Eine Spezialfall ist dieDiagonale der Matrix. Hier werden die Variablen gegensich selbst aufgetragen, somit erhalt man die Verteilungdieser Variable. Mit Hilfe von Zoom und Verschiebungkonnen noch mehr Dimensionen visualisiert werden.

Abbildung 8: Sctterplot Matrix mit 7-Dimensionen

3.2 Tours

Im Gegensatz zu den anderen Techniken, ist dies ist ei-ne dynamische Visualisierungsmethode. Sie basiert aufder Rotation einer Projektion. Ein Spezialfall ist die 3-dimensionale Rotation auf einem 2-dimensioanlem Dis-play, der vielen bekannt sein mußte. Diese Technik wirdbeispielweise in mathematischen Systemen eingesetz, umeine 2D-Projektion von allen Seiten betrachten zu kon-nen. Die 3-dimensionalen Daten werden in diesem Fallvon einer Funktion mit zwei unabhangigen Variablen er-zeugt. Somit stellen die “Tours” eine Verallgemeinerungdieses Spezialfalls dar.

Random Choice: Bei dieser Auswahl, wird eine zufal-lige Abfolge von Projektionen erzeugt. Sie kanneingesetzt werden, um einen Uberblick uber dieForm der Daten zu erhalten. Die Animation be-schreibt einen unendlichen Pfad, wodurch der Be-nutzer alle moglichen Ansichten gezeigt bekommenwurde, vorausgesetzt er konnte unendlich lange zu-schauen.

Precomputed Choice: Der Benutzer kann je nachdemwelche Absicht er verfolgt, einen Pfad auswahlen.Dieser hat einen vorgegeben Verlauf und eine end-liche Lange. Er ist so konzipiert, daß bestimmteProjektionen erreicht werden. Als Beispiel sind diePacked Tour und die Little Tour zu nennen.Letztere besitzt einen Pfad, der alle Paare von 2D-Projektionen verbindet.

Data-driven Choice: All diese Methoden werden un-ter dem Ausdruck Guided Tours zusammenge-faßt, da der Pfad an Hand der vorliegenden Da-ten automatisch bestimmt wird. Es wird versuchtmit Hilfe von Formeln Interessante Projektionenzu entdecken und diese dem Benutzer zu prasen-tieren. Die hier vorgestellte Methode ist bekanntunter Projection Pursuit.

Manual Choice: Hier bewegt der Benutzer den Blick-winkel mit Hilfe von Eingabemedien (z.B. Maus).Als Basis fur diese Bewegung dient eine zuvor aus-gewahlte Dimension. Diese kann dann “in und ausder Projektionsflache gezogen” werden. Der Frei-heitsgrad der Manipulation kann durch Auswahleingeschrankt werden. Diese Art nennen wir Ma-nual Tours.

3.2.1 Projection Pursuit

Die grundlegende Idee ist, den Pfad fur die Bewegungder “Tours” zu optimieren. Man ist daran interessiertmoglichst schnell die interessanten Projektionen zu ent-decken. Als interessant werden solche Stellen angesehen,wo die Daten die die hochste Struktur entsprechend den

6

Page 7: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

Kriterien aufweisen. Die Ausbreitung oder Gruppierungder Daten kann ein Kriterium sein. Um diese Stellenzu bestimmen berechnet eine mathematische Funktioneinen Index. Er gibt an wie interessant eine Projektionist. An Hand dieser Werte wird der Pfad bestimmt.

3.2.2 Grand Tour

Bei diesem Type der Projektion werden zwei orthogo-nale Linearekombinationen aller Variablen gegeneinan-der dargestellt. Der Benutzer bestimmt welche Variablendargestellt werden und welche nicht, wobei die Gezeigtenauch fixiert werden konnen. Der Ablauf der Animationwird manuell, zufallig oder durch eine Funktion (Projec-tion Pursuit) bestimmt. Hierbei sind auch Geschwindig-keit und Richtung (vorwarts oder ruckwarts) wahlbar.Der manuellen Verlauf wird mit der Maus gesteuert undkann durch die Auswahl von: schrag, horizontal, vertikal,radial oder Winkel eingeschrankt werden.

Abbildung 9: Grand Tour mit 7-Dimensionen

3.2.3 Correlation Tour

Diese Darstellung unterscheidet zwischen zwei Gruppenvon Variablen. Sie werden entsprechend ihrer Ausrich-tung als X-Variablen und Y-Variablen bezeichnet.Bei dieser Projektionsart werden die Linearkombinatio-nen der X-Variablen gegen die Linearkombinationen derY-Variablen gezeichnet. Wie bei der “Grand Tour” istder Ablauf auch hier manuell, zufallig oder durch eineFunktion (Projection Pursuit) steuerbar und die Rich-tung und Geschwindigkeit variierbar. Die Kontrolle dermanuellen Tour unterscheidet sich jedoch einwenig. Eswerden zwei Dimensionen bestimmt, eine fur jede Aus-richtung. Die Moglichen Modi der Manipulation sind:

horizontal, vertikal, kombiniert und gleichmaßig kombi-niert.

Abbildung 10: Correlation Tour mit 7-Dimensionen

4 Axis ReconfigurationTechniques

Alle anderen hier vorgestellten Methoden basieren aufeiner Darstellung, bei der die Achsen in einem rechtenWinkel zueinander stehen. Dies erfordert bei hoherenDimensionen Projektionstechniken, die den verfugbarenRaum schlecht ausnutzen und nur schwer zu verwertensind. Deshalb beschreitet diese Methoden einen volligneuen Weg, indem alle Achsen parallel zueinander an-geordnet werden. Die Visualisierung kann in jede belie-bige Richtung erfolgen, wobei wir uns hier fur die hori-zontale Anordnung der Achsen entschieden haben. Wiewir noch sehen werden, wurde die grundlegende Technikspater noch erheblich erweitert, um die Arbeit mit ihrzu erleichtern nud einige Nachteile zu beseitigen.

4.1 Parallel Coordinates

Fur jede Dimension existiert jeweils eine Achse mit ih-rem eigenen Wertebereich. Diese parallelen Achsen wer-den im gleichen Abstanden horizontal angeordnet. DieWerte eines Datensatzes werden als Punkte auf der jewei-ligen Achse angebracht. Diese Punkte werden der Reihenach verbunden, so daß ein Linienzug entsteht der sichvon links nach rechts erstreckt. Dieser Linienzug repra-sentiert einen Datensatz und seine Charakteristik. DieserVorgang wird fur jeden Datensatz wiederholt. Diese Me-

7

Page 8: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

thode hat viele Vorteile, die Wichtigsten sind hier aufge-fuhrt:

• Die Komplexitat der Darstellung ist sehr niedrig,es sind keine aufwendigen Berechnungen notig

• Darstellung kann in verschieden Richtungen erfol-gen (horizontal, vertikal, rotiert, etc.)

• Jede Variable wird gleich behandelt, im Gegensatzzu vielen anderen Methoden

• Kann fur beliebige Anzahl von Dimensionen ver-wendet werden, nur Beschrankt durch Auflosungdes Ausgabemediums

Abbildung 11: Sieben Dimensionen mit kleiner Daten-menge

Diese Technik soll mit Abbildung 11 verdeutlicht wer-den. Hier sieht man einen 7-dimensionalen Datensatzmit einer geringen Datenmenge. Die Bezeichnungen dereinzelnen Dimensionen sind an den Achsen angebracht.Der eigentliche Prozeß, der die Beziehungen zwischenden Daten aufdecken soll, besteht in der Erkennung vonzweidimensionalen Mustern. Um nun Informationen undSchlusse aus diesen Darstellungen ziehen zu konnen, mußman nach Verteilungen und Haufungspunkten suchen. Sosieht man in der gleichen Abbildung, daß ein Teil der Da-ten selektiert ist. Dort erkennen man leicht, daß es zweibesonders auffallende Anhaufungen gibt. Diese liegen aufden Achsen Cylinder und Origin. Somit weiß man nun,daß es zwischen diesen Variablen einen Zusammenhanggibt. Auf diese Weise kann man nun die Daten auswer-ten. Doch falls die Datenmenge großer ist, bekommt man

Probleme. In Abbildung 12 wird dies deutlich. Durch dieUberlagerung der vielen Linien ist nicht mehr viel zu er-kennen. Man weiß nicht mehr wie die Linien verlaufen,sondern sieht nur noch einen breiten Streifen, der an denAchsen eine unterschiedliche Ausdehnung hat.

Abbildung 12: Funf Dimensionen mit großer Datenmen-ge

4.2 Hierarchical Parallel Coordinates

Da die einfache Methode der Parallelen Koordinaten kei-ne effiziente Darstellung bei sehr großen Datenmengenerzielen kann, mußten weitere Algorithmen entwickeltwerden, um diesen Nachteil zu beseitigen. Diese Technikerzielt eine Verbesserung, in dem keine einzelnen Linienmehr gezeichnet werden, sondern die Daten zu Grup-pen verdichtet werden. Sie werden dann als Streifen mitunterschiedlichen Ausdehnungen dargestellt. Die Abbil-dungen 13 und 14 zeigen beide den selben Datensatz,der hier zum Vergleich mit beiden Methoden visuali-siert wurde. Die Darstellung einer Gruppe besteht auseinem Streifen, der sich uber alle Achsen erstreckt. SeineAusdehnung variiert in vertikaler Richtung von Achse zuAchse, und stellt zugleich die Ausdehnung der Gruppebezuglich der betreffenden Dimensionen dar. Jeder die-ser Streifen besitzt eine Mittellinie, die sozusagen denDurchschnitt der Gruppe wiederspiegelt. Wahrend dieMittellinie mit voller Deckungskraft gezeichnet wird, be-sitzt der restliche Teil des Streifens einen Verlauf. Vonder Mitte nach außen hin nimmt die Transparenz zu unddie Farbe ab. Durch die Aggregation werden weniger Li-

8

Page 9: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

nien gezeichnet, die auf Grund der transparenten Dar-stellung auch bei Uberlagerung noch gut zu erkennensind. Wie diese Gruppierung erstellt wird, kann man indem folgenden Abschnitt nachlesen.

Abbildung 13: Jeder Datensatz wird als einzelne LinieDargestellt

Abbildung 14: Daten sind in Gruppen eingeteilt, die alsStreifen dargestellt werden

4.2.1 Hierarchical Cluster

Fur viele dieser Methoden ist eine Gruppierung der Da-ten notwendig. Diese sollte so flexibel sein, daß verschie-dene Stufen der Aggregation bestimmt werden konnen.

Der Algorithmus gruppiert die Datensatze nach einemMaß, der die Nahe zueinander angibt. Dabei wird derAbstand zwischen Paaren von Datensatzen bestimmt.Diese Informationen werden in Form eines Baumes ge-speichert. Die Daten konnen auf folgende Weise formalbeschrieben werden:Die Menge E besteht aus k N -dimensionalen Daten:

E = {e1, e2, e3, . . . , ek}

Jeder dieser Datensatze ist ein N -Vektor:

ei = {xi1, xi2, xi3, . . . , xiN}

Die Menge E wird in m Partitionen P unterteilt:

E =m⋃i=1

Pi

Pi ∩ Pj = 0, i 6= j

Eine Partition Q ist in einer Partition P eingebettet,wenn jede Komponente von Q in einer Menge von Pvollstandig enthalten ist. In diesem Fall wird die MengePi von allen Komponenten aus Q gebildet. Dies laßt sichin einem Baum dadurch darstellen, daß alle Komponen-ten Qi Kinder von dem Knoten Pi sind. Um nun eineunterschiedliche Detaillierung der Aggregation zu errei-chen, wahlt man eine bestimmten Tiefe aus. Die Knotendieser Tiefe stellen nun die einzelnen Gruppen dar. DieBlatter eines solchen Knoten sind die einzelne Datensat-ze dieser Gruppe.

4.3 Proximity-based Coloring

Die einfarbige Darstellung der Linien macht das Verfol-gen dieser nicht besonders leicht, vorallem wenn sich vie-le davon kreuzen. Somit ist es besonders aufwendig ausso einer Darstellung Informationen zu gewinnen. Durchdie Verwendung von verschiedenen Farben kann dieserProzeß wesentlich erleichtert werden. Den Unterschiedkann man gut zwischen den Abbildungen 15 und 16 se-hen. Bei einer großen Menge von Daten wird es alledingsschwierig, jeder Linie eine andere Farbe zuzuweisen, diesich gut von den ubrigen abhebt. Wenn man allerdingsbedenkt, daß man bei dieser Methode die Unterschiedeund die Ahnlichkeiten der Datensatze untersucht, um anInformationen zu gelangen, ware eine Farbgebung, diediese Eigenschaften hervorhebt von Vorteil. Somit erhal-ten ahnliche Daten auch ahnliche Farben. Und solche,die sich starker unterscheiden, bekommen Farben, dieeinen hoheren Kontrast zueinander aufweisen. Die Ver-teilung der Farben passiert an Hand des bereits erklarten“Hierarchiebaumes”. Hierbei werden verwandte Knotenals naher betrachte, wie solche zwischen denen keine Be-ziehung besteht. Die Große der Gruppe spiegelt sich in

9

Page 10: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

dem zugewiesenen Farbbereich wieder. Großere Gruppenbesitzen mehr Farbabstufungen wie kleinere Gruppen.

Abbildung 15: Einfarbige Darstellung

Abbildung 16: Mehrfarbige Darstellung

4.4 Dynamic Extent Scaling

Genau wie die anderen erweiterten Methoden der Paral-lelen Koordinaten, versucht auch diese die Uberdeckungder Streifen zu reduzieren. Durch die Zusammenfassungder Datensatze zu Gruppen, wurde die Anzahl der darge-stellten Objekte deutlich reduziert. Allerdings sind diesenun nicht mehr durch dunne Linien dargestellt, sonderndurch Streifen, die eine beachtliche Ausbreitung in verti-kaler Richtung haben konnen. Um dieses Manko auszu-

loschen, wurde die Moglichkeit einer gleichmaßigen Ska-lierung geschaffen. Hierbei bestimmt der Benutzer, uberdie Ausbreitung der Streifen. Sie reicht von der tatsach-lichen Breite bis hin zur Reduzierten Darstellung in dernur die Mittlelinie gezeichnet wird. Die relative Breiteder Streifen zueinander bleibt erhalten, so daß die Pro-portionen nicht verloren gehen. Die einzige Information,die durch diesen Prozeß verloren geht, ist die tatsachlicheAusdehnung der Daten in den jeweiligen Dimensionen.Beim Graphen in Abbildung 17 ist die rote Linie schlechtzu sehen, diese ist nach der Skalierung in Abbildung 18bestens zu erkennen.

Abbildung 17: Orginale Streifenbreite

Abbildung 18: Reduzierte Streifenbreite

10

Page 11: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

4.5 Dimension Zooming

Wenn man sich nun fur einen schmalen Ausschnitt ausdem gesammten Graphen interessiert, hat man das Pro-blem, daß man die Unterschied zwischen diesen Datennicht besonders gut erkennen kann. In dieser komplet-ten Darstellung ist hier nur eine geringe Variation zuerkennen. Deshalb kann mit dieser Methode der selek-tierte Bereich auf die volle Große des Graphen expan-diert werden. Bei dieser Technik wird der Graph verzerrt,da jede Dimension unabhangig von der anderen skaliertwird. Weil der Graph durch die Verzerrung vollig andersaussehen kann, verliert man schnell den Zusammenhangzu den restlichen Daten. Um diesen Effekt herabzuset-zen, wird eine kleine Uberschicht der Daten gezeigt. Au-ßerdem wird der Zoom-Prozeß animiert, wodurch beimUbergang von der einen in die andere Darstellung, dieUnterschiede in der Skalierung zwischen den Dimensio-nen verdeutlicht werden.

Abbildung 19: Der vollstandige Graph mit einer Maske

Abbildung 20: Die Maske der Auswahl

Abbildung 21: Der gezoomte Bereich

5 Subspace Filtering Techniques

Die Filterung von Daten ist ein dynamischer interakti-ver Prozeß, bei dem der Benutzer mit unterschiedlicheHilfsmitteln Teilmengen aus den dargestellten Daten se-lektieren kann. Als Feedback erhalt er die neue Daten-menge prasentiert. Diese entspricht vielleicht nicht dengewunschten Kriterien, und so muß dieser Vorgang mehr-fach wiederholt werden. Bei einer Analyse sind nicht im-mer alle Daten gleich interessant. Nicht aus allen Daten-satzen lassen sich die gleichen Informationen gewinnen.Deshalb ist es oft hilfreich, wenn man bestimmte Daten-satze herausfiltern kann. Dies wird genutzt, um Datenmit bestimmten Eigenschaften hervorzuheben. Teilweiseist es moglich diese selektierten Daten zu manipulieren.

5.1 Brushing / Masking

Der Ausdruck “Brushing” bezeichnet im Zusammenhangmit der Datenvisualisierung den Prozeß der interaktivenSelektion einer Teilmenge von Daten. Der Zweck hier furkann verschiedener Art sein. Einerseits konnen die selek-tierten Daten hervorgehoben werden, was durch unter-schiedliche Farben oder Symbole passiert. Andererseitskonnen verschiedene Operationen, wie zum Beispiel mas-kieren, loschen oder andere benutzerdefinierte Funktio-nen auf den selektierten Bereich angewendet werden. DieSelektion kann mit den folgenden Hilfsmitteln erfolgen:

Indirect Technique: Die Selektion wird nicht auf demeigentlichen Graphen ausgefuhrt, der die Daten an-zeigt, sondern mit Hilfe von zusatzlichen Tools in

11

Page 12: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

Form von “Slidern” oder symbolischen Darstellun-gen.

Shaded Region: Die Region der Selektion wird durcheinen andersfarbigen Hintergrund hervorgehoben.Die Wahl der Farbe hierfur spielt eine wichtige Rol-le. Sie muß genugend Kontrast zu den ubrigen Far-ben haben

Brush Outline: Die selektierte Region wird von einemungefullten Polygon umgeben. Diese Form hat denNachteil, das sie sich bei einigen Techniken zu we-nig von den Daten abhebt.

Invisible Extents: Die Ausdehnung der Auswahl wirdnicht visuell dargestellt. Dies hat den Vorteil, daß,keine zusatzlichen storenden Objekte im Graphenenthalten sind. Allerdings erschwert dies auch zu-gleich die Auswahl.

Die folgenden Hilfsmittel erweitern die Moglichkeitder Selektion, wodurch auch komplexere Mengen ausge-wahlt werden konnen:

Multiple Brushes: An Stelle eines einzigen Bereiches,kann der Benutzer jetzt mehrere verschiedene Be-reiche gleichzeitig wahlen. Diese werden zur Un-terscheidung mit verschiedene Farben gezeichnet.Bereiche, die von mehreren Selektionen uberdecktwerden, erhalten die Farbe der Selektion mit derhochsten Prioritat.

Logical Operators: An statt den Bereich durch meh-rere Selektionen einfach zu erweitern, kann es vonVorteil sein, die Selektionen mit Hilfe von logi-schen Operatoren zu verknupfen. Dies konnen un-are (NOT) und binare (AND, OR, XOR) Opera-toren sein.

Ramped Buoundaries: Bei dieser Selektion wird zwi-schen Daten unterschieden, die in der Mittel liegenund solchen, die sich an den Außenbereichen befin-den. Die Selektion hat keinen harten Rand mehr,sondern einen weichen, der als Farbverlauf darge-stellt wird. Daten, die in diese Außenbereiche fallenwerden andersfarbig dargestellt.

5.2 Structure-based Brushing

Dies ist eine indirekte Selektionsmethode, bei der der be-reits vorgestellte Hierarchiebaum durch ein Dreieck sym-bolisiert wird. Dieses Werkzeug besteht aus verschiede-nen Teilen, die in Abbildung 22 mit Buchstaben gekenn-zeichnet sind. Die Symbole haben die folgende Bedeu-tung:

(a) Dieses Dreieck reprasentiert dem Hierarchie-Baum,der die Gruppierung der Daten wiederspiegelt

(b) Die mehrfarbige Konturlinie stellt den Schnitt desBaumes in der ausgewahlten Tiefe dar und spiegeltden “Level-of-Deteil” (LOD) wieder

(c) Die einfarbige Konturlinie beschreibt die angenaher-te Form des gesammten Baumes

(d) Innerhalb des großen Dreiecks (a) ist ein anderesDreieck enthalten, dies besitzt eine andere Hinter-grundfarbe und stellt die aktuelle Selektion dar.

(e) Die Breite und Position des Dreiecks (d) wird mitdiesen beiden Reglern bestimmt

(f) Eine Farbskala fur die “Level-of-Deteil”-Kontur (b)

Links oben in der Ecke der Abbildung ist die Tiefe desBaumes und die Tiefe der Selektion abzulesen. Der se-lektierte Teil der Daten, ist der Teil der Konturlinie (b),der uber dem Dreieck (d) liegt. Aus dem Farbverlauf derKonturlinie (b) oder der Farbskala (f) konnen die ver-wendeten Farben fur den Graphen entnommen werden.

Abbildung 22: Strukture-based Brushing Tool

5.3 Dynamic Masking

Mit Hilfe einer Maskierung konnen Daten ausgeblendetwerden. Bei dieser Methode wird allerdings der entspre-chende Bereich nicht komplett ausgeblendet, sondern Be-nutzer kann den Grad der Ausblendung dynamisch re-geln, wodurch der Kontext zu den restlichen Daten er-halten bleibt. Ein Slider kontrolliert die relative Durch-sichtigkeit zwischen dem ausgewahlten und dem nichtausgewahlten Bereich. Diese laßt sich stufenlos zwischenden beiden Extremen einstellen:

• Nur die selektierten Daten sind sichtbar

12

Page 13: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

• Nur die Daten, die nicht in der Auswahl enthaltensind bleiben sichtbar

In der Abbildung 23 sieht man eine große Datenmen-ge visualisiert, in der vieles auf Grund von Uberlagerun-gen nicht zu erkennen ist. Deshalb wurde in Abbildung24 die Durchsichtigkeit des nicht selektierten Bereicheserhoht, wodurch die gewunschten Daten besser sichtbarwerden.

Abbildung 23: Darstellung ohne Maskierung

Abbildung 24: Darstellung mit hervorgehobenen

6 Werkzeuge

6.1 n-Vision / Autovisual

Abbildung 25: n-Vision

Entwickler:Clifford Beshers, [email protected] Feiner, [email protected]

Institut:Department of Computer ScienceColumbia UniversityNew York, New York 10027

Erscheinung:1990

Homepage:http://www.cs.columbia.edu/graphics/projects/AutoVisual/AutoVisual.html

Techniken:

• Worlds within Worlds

• Virtual Reality

• Identify Points

• Locate Minima / Maxima

• Scale / Rotate / Translate

• Multiple Copies

13

Page 14: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

6.2 Xmdv

Abbildung 26: Xmdv

Entwickler:Matthew O. Ward, [email protected] R. MartinYing-Huey Fua

Institut:Computer Science DepartmentWorcester Polytechnic InstituteWorcester, MA 01609 USA

Erscheinung:1994

Homepage:http://davis.wpi.edu/∼xmdv

Techniken:

• Dimensional Stacking in 2D

• Scatterplot Matrices

• Parallel Coordinates

• Hierarchical Parallel Coordinates

• Proximity-based Coloring

• Dynamic Extent Scaling

• Dimension Zooming

• Multiple Brushes / Masks

• Structure-based Brushing

• Dynamic Masking

• Linked Views

6.3 XGobi

Abbildung 27: XGobi

Entwickler:Deborah F. Swayne, [email protected] Cook, [email protected] Buja, [email protected]

Institut:Bellcore (Telcordia Technologies Inc.)Morristown, New Jork 07962-1910

Erscheinung:1990

Homepage:http://research.att.com/areas/stat/xgobi

Techniken:

• Scatterplots

• Parallel Coordinates

• Brushing / Masking

• Linked Views

• Grand Tour

• Correlation Tour

• Missing Data

14

Page 15: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

6.4 C2-Cave

Abbildung 28: C2-Cave

Entwickler:Jurgen Symanzik, [email protected] Cook, [email protected] Kohlmeyer, [email protected] Lechner, [email protected] Cruz-Neira, [email protected] Nelson, [email protected]

Institut:Iowa State University / ICEMTAmes, Iowa 50011

Erscheinung:1996

Homepage:http://www.public.iastate.edu/∼dicook/research/C2/statistic.html

Techniken:

• Virtual Reality

• CAVE - Hardware

• Scatterplots

• Brushing / Masking

• Linked Views

• Grand Tour

• Correlation Tour

7 On-line ResourcesClifford Beshers:

http://www.cs.columbia.edu/∼beshers

Steven Feiner:http://www.cs.columbia.edu/∼feiner

Matthew O. Ward:http://www.cs.wpi.edu/∼matt

Deborah F. Swayne:http://www.research.att.com/∼dfs

Dianne Cook:http://www.public.iastate.edu/∼dicook

Andreas Buja:http://www.research.att.com/∼andreas

Jurgen Symanzik:http://www.math.usu.edu/∼symanzik

Carolina Cruz-Neira:http://vulcan.ee.iastate.edu/∼cruz

Brad Kohlmeyer:http://www.public.iastate.edu/∼mink

American Statistical Association:Statistical Graphics Sectionhttp://www.bell-labs.com/topic/societies/asagraphics

8 Schlußwort

Dieser Artikel stellt nur einen Teil der vorhandenen Ent-wicklungen auf diesem Gebiet vor. Fur einen deteiliertePrasentation sollte man allerdings weitere Literatur zurate ziehen. Um noch einige andere interessante Techni-ken zu nennen, die sich mit dem gleichen Problem be-schaftigen, wahren da zu erwahnen: “Andrew Curves” -nutzt die Uberlagerung von Sinuswellen mit verschobe-nen Phasen, “VisDB” - farbt Punkte (Datensatze) nachihrer Relevanz oder“InfoCrystal” - visuelle Filterung vonunstrukturierten Daten. Besonders erwahnenswert sindauch die beiden Programme “Xmdv” und “XGobi”, dieals Source-Code frei verfugbar sind. Fur weitere Nachfor-schungen kann ein Blick auf die Internetseiten der Ame-rican Statistical Association hilfreich sein.

Literatur

[1] S.Feiner and C.Beshers. Worlds within Worlds:Metaphors for exploring n-dimensional vir-tual Worlds. 1990

[2] T.Mihalisin, J.Timlin and J.Schwegler. Visuali-zing Multivariate Functions, Data and Dis-tributions. 1991

[3] A.Buja and D.Asimov. Grand Tour Methods:An Outline. 1986

[4] D.Cook and A.Buja. Manual Controls For High-Dimensional Data Projections. 1996

15

Page 16: Graphische Datenverarbeitung Datenvisualisierung 3 Dimensionen · Scienti c Visualization J.W.Goethe-Universit at 19. August 2000 Thadd aus Hajduga Industrie, der Wirtschaft, oder

Scientific VisualizationJ.W.Goethe-Universitat

19. August 2000Thaddaus Hajduga

[5] D.Cook, A.Buja, J.Cabrera and C.Hurley. GrandTour and Projection Pursuit. 1995

[6] A.Buja, D.Cook, D-Asimov and C.Hurley. Theo-ry and Computational Methods for Dyna-mic Projections in High-Dimensional DataVisualization. 1999

[7] A.Inselberg. Multidimensional Detective.

[8] Y.H.Fua, M.O.Ward and E.A.Rundensteiner. Hier-archical Parallel Coordinates for Explorationof Large Datasets.

[9] M.O.Ward. Creating and Manipulating N-Dimensional Brushes.

[10] A.R.Martin and M.O.Ward. High DimensionalBrushing for Interactive Exploration of Mul-tivariate Data. 1995

[11] A.F.X.Wilhelm, E.J.Wegman and J.Symanzik.Visual Clustering and Classification: TheOronsay Particle Size Data Set Revisited.

[12] M.O.Ward. XmdvTool: Integrating MultipleMethods for Visualizing Multivariate Data.1994

[13] D.F.Swayne, D.Cook and A.Buja. XGobi: Inter-active Dynamic Data Visualization in the XWindow System 1998

[14] D.F.Swayne and A.Buja. Missing Data in Inter-active High-Dimensional Data Visualization.1997

[15] J.Symanzik, D.Cook, D.B.Kohlmeyer, U.Lechnerand C.Cruz-Neira. Dynamic Statistical Gra-phics in the C2 Virtual Reality Environment.1997

[16] J.Symanzik, D.Cook, D.B.Kohlmeyer, U.Lechnerand C.Cruz-Neira. Dynamic Statistical Gra-phics in the CAVE Virtual Reality Environ-ment.

[17] D.Cook, C.Cruz-Neira, U.Lechner, L.Nelson,A.Olsen, S.Pierson and J.Symanzik. Using Dy-namic Statistical Graphics in a HighlyImmersive Virtual Reality Environment toUnderstand Multivariate (Spatial) Data.

[18] E.J.Wegman, J.Symanzik, J.P.Vandersluis, Q.Luo,F.Camelli, A.Dzubay, X.Fu, N.A.Khumbah,R.E.A.Moustafa, R.L.Wall, Y.Zhu. The MiniCA-VE - A Voice-Controlled IPT Environment.

[19] L.Nelson, D.Cooka and C.Cruz-Neira. XGobi vsthe C2: Results of an Experiment ComparingData Visualization in a 3-D Immersive Vir-tual Reality Environment with a 2-D Work-station Display.

[20] D.A.Keim and H.P.Kriegel. VisDB: DatabaseExploration Using Multidimensional Visua-lization.

[21] A.Spoerri. InfoCrystal: A Visual Tool for In-formation Retrieval.

16