Changelog
Version 0.0.2 (13. Oktober 2020)
Die Version 0.0.2 stellt von der Funktionalität, die der Benutzer verwenden kann, die Abgabe für
die Lehrveranstaltung VU Visualisierung aus dem
Wintersemester 2005/06 dar.
Da für diese Abgabe eine externe Bibliothek für Matrizen-Operationen verwendet wurde,
habe ich diese durch Eigententwicklungen ersetzt, um die ursprüngliche Funktionalität wieder herzustellen.
Zusätzlich wurden noch Testroutinen für diese Operationen eingeführt.
- Mahalonobis-Distanz und robuste Distanz
-
Im Menü
Tools / Distances
ist die Berechnung der Mahalanobis-Distanz und
der robusten Distanz wieder verfügbar.
-
Damit dies funktioniert wurde eine eigene Version der Matrix-Inversion und der
Determinanten-Berechnung implementiert.
- Principal Component Analysis (PCA)
-
Im Menü
Tools / Principal Component Analysis
ist die Berechnung
der klassischen und robusten Hauptkomponenten wieder verfügbar.
-
Damit dies funktioniert wurde eine eigene Version der Eigenwert- und Eigenvektor-Zerlegung
implementiert.
- Outlier Detection
-
Im Menü
Applications / Outlier detection
ist die Anwendung zur Ausreißer-Erkennung
jetzt verfügbar.
-
Damit diese Anwendung funktioniert wurde eine eigene Version der Matrix-Inversion und der
Determinanten-Berechnung implementiert.
- Testroutinen
Um die Korrektheit von Rechen-Algorithmen sicherzustellen, wurden Testroutinen für folgende Berechnungen
implementiert:
- Matrix-Inversion
- Determinanten
- Eigenvektoren
- Eigenwerte
- Kovarianz-Matrix
- Mahalanobis-Distanz
- Berechnung der Hauptkomponenten-Koordinaten
- Refactorings
-
Die Klasse
CovarianceCalculator
und DistanceCalculator
wurde auf die Verwendung der eigenen
Matrix-Klassen SymmetricMatrix
und SquareMatrix
umgestellt.
-
Die neue Klasse
MCDCovarianceCalculator
realisiert jetzt die Berechnung der robusten
Kovarianzmatrix und greift dabei auf die neuen Hilfsklassen MCDSolution
und MCDBestSolutions
zu.
-
Die Klasse
PrincipalComponentAnalysis
wurde an die neue Funktionalität der Eigenwertzerlegung angepasst.
Version 0.0.1 (20. April 2018)
Die Version 0.0.1 stellt im wesentlichen die Abgabe meines Programms für die Lehrveranstaltung VU Visualisierung aus dem
Wintersemester 2005/06 dar.
Allerdings habe ich aus Lizenz-rechtlichen Gründen Funktionalitäten, welche Matrix Operationen
wie Inversion, Eigenwert- und Eigenvektorberechnung umfassen, aus dem Programm ausgenommen. Daher ist derzeit
die Ausreißer-Detektion, die PCA und die Berechnung von Distanzen nicht enthalten.
Der aktuelle Funktionsumgang ist:
- Parallele Koordinaten Visualisierung
-
Linked View mit dem 2D Scatterplot: D.h. Selektions-Interaktionen werden in beiden
Visualisierungen gleichzeitig dargestellt.
-
Dimensionsauswahl
-
Dimensionen können geflippt werden. (Maximum Wert oben oder unten in der Visualisierung.)
-
Dimensionsnamen sowie Werte Minima und Maxima können separat aus- oder eingeblendet werden.
- 2D Scatterplot Visualisierung
-
Linked View mit den parallelen Koordinaten: D.h. Selektions-Interaktionen werden in beiden
Visualisierungen gleichzeitig dargestellt.
-
Dimensionsauswahl
-
2D Selektionen können interaktiv gezogen werden.
- Farbgebung
- Die Farben können gemäß der aktuellen Selektion oder den Werten einer ausgewählten Dimension festgelegt werden.
- Für beide Varianten kann ein Farbverlauf festgelegt werden.
- k Means Clustering
-
Die Dimensionen, die fürs Clustering verwendet werden sollen, können ausgewählt werden.
Bzw. können die Dimensionen auch gewichtet, und somit deren Auswirkung auf das Clustering gesteuert werden.
- Die Anzahl der Cluster kann festgelegt werden.
- Die maximale Anzahl der Iterationen des Clusterings kann festgelegt werden.
-
Die minimale Aktualisierung eines Clusterzentrums kann in Prozenten festgelegt werden.
Wird kein Clusterzentrum, um diesen Wert aktualisiert, so bricht das Clustering ab.
-
Die Clusterzugehörigkeiten und der Abstände zu den zugewiesenen Clusterzentren können dem Datensatz zugewiesen werden.
Mit diesen Informationen kann die interaktive Datenexploration fortgesetzt werden bzw. die Daten können auch exportiert werden.
- Export
- Die ausgewählten Daten können als CSV Datei exportiert werden.
- Die aktuelle Visualisierung kann als Bilddatei exportiert werden.