So, habe hier einen kurzen Überblick der Clusteranalyse für nominalskalierte Merkmale erstellt. Weiterlesen
Schlagwort-Archive: Clusteranalyse
Ablauf einer hierarchischen Clusteranalyse mit mehr als zwei Variablen
Nachdem eine einfache hierarchische Clusteranalyse mit zwei Variablen durchgeführt wurde, ist nun eine Clusteranalyse mit mehr Variablen der nächste Schritt. Der Datensatz zu dem Beispiel befindet sich als xls-Datei hier unter dem Namen „Bewerbergebnisse“.
Es geht um die Ergebnisse von 20 Bewerbern in insgesamt 10 Tests, die verschiedenen Kategorien zugeordnet sind. Als erstes bietet sich die Durchführung einer Faktorenanalyse an, um die Clusteranalyse zu vereinfachen. Damit soll die interne Struktur der
Variablen untersucht werden, mit dem Ziel die Datenstruktur zu vereinfachen.
Wir verwenden das verbreitetste Verfahren der orthogonalen Rotation, nämlich die Varimax-Rotation, bei der die Komplexität der Faktoren minimiert wird, indem die Unterschiede der Ladungen innerhalb eines Faktors maximiert werden. Hohe Ladungen je Faktor werden tendenziell noch höher, geringe noch geringer. Weiterlesen
Eingeordnet unter Statistische Methoden
Durchführung einer hierarchischen Clusteranalyse
Im folgenden wird eine schnelle Clusteranalyse durchgeführt. Wer mag, findet den Datensatz im XLS-Format unter dem Namen Kaugummi hier.
In der Tabelle finden sich 20 Kaugummisorten aus 6 Ländern: 1-Spanien, 2-Deutschland, 3-Frankreich, 4-Niederlande, 5-Mexico, 6-USA. In der ersten Spalte mit Dezimalzahlen finden sich die Kosten für den Kaugummi, in der nächsten die Kalorien und in der letzten Spalte der Zuckeranteil in Gramm.
Bei dieser Einteilung werden wir zwei Variablen berücksichtigen: die Kosten und die Kalorien. Weiterlesen
Eingeordnet unter Statistische Methoden