LU Visualisierung 2005:
Statistische Analysen mit Parallelen Koordinaten
Jürgen Platzer, 0025360


Weiter zu: k means Clustering

Aufgabenstellung

Parallele Koordinaten erlauben eine Darstellung von mehreren Dimensionen. Die Interaktionsmöglichkeiten dieser Visualisierung sollen genutzt werden, um statistische Analysen durchzuführen.

Zu diesem Zweck wurde ein k means Clustering, eine Hauptkomponentenanalyse (PCA) und die Berechnung der Mahalanobis und der robusten Distanz implementiert.

In einem zweiten Arbeitsschritt wurden zu den parallelen Koordinaten ein linked Scatterplot und eine Outlier Detection implementiert.

Diese Ausarbeitung ist in folgende Abschnitte unterteilt:

Selektionen in parallelen Koordinaten und linked Scatterplot

Unter Linked Views (Verbundene Sichten) versteht man, dass sich Interaktionen, die in einer Visualisierungsansicht durchgeführt wurden, auch auf andere Ansichten auswirken. Hier werden zur Demonstration zwei Beispiele vorgestellt.

In den folgenden Abbildungen wurde jeweils der Iris-Datensatz in einem Scatterplot als auch in Parallelen Koordinaten dargestellt. (Mehr Informationen zu diesem Datensatz können hier bzw. im Abschnitt k means Clustering nachgelesen werden.) Während im Scatterplot nur die ersten beiden Dimensionen abgebildet sind, kann man in den Parallelen Koordinaten alle 6 Dimensionen betrachten.

In der ersten Abbildung wurde auf der zweiten Dimension in den Parallelen Koordinaten eine Selektion durchgeführt. Die ausgewählten Daten werden rot dargestellt. Diese Auswahl wird auch im Scatterplot dargestellt.

Linked Views - Selektion in den Parallelen Koordinaten
Abbildung 1: Linked Views - Selektion in den Parallelen Koordinaten



In der zweiten Abbildung wurde im Scatterplot eine Selektion auf den ersten beiden Dimensionen durchgeführt. Die Einfärbung der ausgewählten Daten wird interaktiv auf die zweite Visualisierung, den Parallelen Koordinaten, übertragen.

Linked Views - Selektion im Scatterplot
Abbildung 2: Linked Views - Selektion im Scatterplot

Zurück zu den Unipages

Weiter zu: k means Clustering