220 11 BESCHREIBENDE STATISTIK 11.3 Streuungsmaße Empirische Varianz und Standardabweichung R Im Folgenden sind zwei Häufigkeitsverteilungen mit gleichem Mittelwert ‾ xdargestellt. In der linken Abbildung liegen die Daten relativ eng um ‾ x. Dagegen weichen die Daten in der rechten Abbildung augenscheinlich „im Durchschnitt“ stärker von ‾ xab. Man sagt daher: Die Streuung der Daten um den Mittelwert in Abb. 11.1 a ist kleiner als in Abb. 11.1 b. Abb. 11.1 a x–s x x+s 0 5 10 123 456789xi H(xi) Abb. 11.1 b x x + s x – s 0 5 10 123 456789xi H(xi) Wie kann man das Ausmaß der Streuung der Daten x 1 , x 2 , … , x n um ‾xzahlenmäßig erfassen? Eine nahe liegende Idee ist, den Mittelwert der Abweichungen der Daten von ‾xanzugeben: (x 1 – ‾x) + (x 2 – ‾x) + … + (x n – ‾x ) _____ n Dieser Term ist aber als Streuungsmaß nicht geeignet, denn er liefert stets den Wert 0: (x 1 – ‾x) + (x 2 – ‾x) + … + (x n – ‾x ) _____ n = x 1 + x 2 + … + x n – n · ‾x ____ n = x 1 + x 2 + … + x n _ n – ‾x = ‾x – ‾x = 0 Um zu verhindern, dass positive und negative Abweichungen vom Mittelwert einander beim Summieren aufheben, kann man die Abweichungen durch deren (nicht negative) Quadrate ersetzen und erhält damit den „Mittelwert der Abweichungsquadrate“: (x 1 – ‾x ) 2 + (x 2 – ‾x ) 2 + … + (x n – ‾x ) 2 _____ n Dieser Ausdruck ist als Streuungsmaß geeignet, denn jeder Variablenwert trägt umso mehr zur Streuung bei, je mehr er sich vom Mittelwert unterscheidet. Der Mittelwert der Abweichungsquadrate hat jedoch einen praktischen Nachteil. Werden die Daten zB in der Einheit Meter gemessen, dann erhält man den Mittelwert der Abweichungsquadrate in der Einheit Quadratmeter. Um auch das Streuungsmaß in der gleichen Einheit zu erhalten wie die gegebenen Daten, zieht man die Wurzel aus dem Mittelwert der Abweichungsquadrate. Damit ergeben sich die folgenden Begriffe: Definition Es sei x 1 , x 2 , …, x n eine Liste von reellen Zahlen mit dem Mittelwert ‾x. Dann nennt man • s 2 = (x 1 – ‾x ) 2 + (x 2 – ‾x ) 2 + … + (x n – ‾x ) 2 _____ n die empirische Varianz der Liste, • s = � ____________________ (x 1 – ‾x ) 2 + (x 2 – ‾x ) 2 + … + (x n – ‾x ) 2 _____ n die empirische Standardabweichung der Liste. 11.30 Berechne den Mittelwert, die empirische Varianz und die empirische Standardabweichung der Liste 3, 1, 2, 5, 4! LÖSUNG ‾x = 3 + 1 + 2 + 5 + 4 _ 5 = 15 _ 5 = 3 s 2 = (3 – 3) 2 + (1 – 3) 2 + (2 – 3) 2 + (5 – 3) 2 + (4 – 3) 2 _______ 5 = 0 + 4 + 1 + 4 + 1 _ 5 = 10 _ 5 = 2 w s = � _ 2 ≈ 1,41 Nur zu Prüfzwecken – Eigentum des Verlags öbv
RkJQdWJsaXNoZXIy ODE3MDE=