Mathematik verstehen 6, Schulbuch

221 11.3 ������������� Sind ​a 1 ​, ​a 2 ​, …, ​a k ​die möglichen Werte einer Variablen und treten diese unter den n Zahlen der Liste mit den absoluten Häufigkeiten H​ 1 ​, ​H 2 ​, …, ​H k ​auf, dann gilt: ​s 2 ​= ​ ​H 1 ​· (​a 1 ​– ​‾x ​) 2 ​+ ​H 2 ​· (​a 2 ​– ​‾x ​) 2 ​+ … + H​ k ​· ​(​a k ​– ​‾x ​) 2​ _______ n ​ und s = ​� ____________________________ ​ ​H 1 ​· (​a 1 ​– ​‾x ​) 2 ​+ ​H 2 ​· (​a 2 ​– ​‾x ​) 2 ​+ … + H​ k ​· ​(​a k ​– ​‾x ​) 2​ _______ n ​ Dabei gilt jeweils: ​H 1 ​+ ​H 2 ​+ … + ​H k ​= n . Die Formel in der Definition der empirischen Varianz ist gut geeignet, diesen Begriff zu verstehen, jedoch in der Anwendung auf längere Listen ohne Technologieeinsatz mühsam. Man benützt in diesem Fall besser den folgenden Satz: Satz (Verschiebungssatz für die empirische Varianz) Für die empirische Varianz s​ 2 ​einer Liste ​x 1 ​, ​x 2 ​, …, ​x n ​mit dem Mittelwert ​‾x ​gilt: ​​s 2​ = ​1 _ n ​· (​x 1 ​ 2 ​+ ​x 2 ​ 2 ​+ … + ​x n ​ 2)​ – ​‾x ​2​ BEWEIS = ​ 1 _ n ​· [(​x 1 ​– ​‾x )​ 2 ​+ (x​ 2 ​– ​‾x ​) 2 + … + (x​ n ​– ​‾x )​ 2]​ = = ​1 _ n ​· [(​x 1 ​ 2 ​– 2 ​x 1 ​‾x ​+ ​‾x ​ 2)​ + (x​ 2 ​ 2 ​– 2 ​x 2 ​‾x ​+ ​‾x ​ 2)​ + … + (x​ n ​ 2 ​– 2 ​x n ​‾x ​+ ​‾x ​ 2)​] = = ​1 _ n ​· [(​x 1 ​ 2 ​+ ​x 2 ​ 2 ​+ … + ​x n ​ 2)​ – 2​‾x ​· (​x 1 ​+ ​x 2 ​+ … + ​x n)​ + n · ​‾x ​ 2]​ = = ​1 _ n ​· (​x 1 ​ 2 ​+ ​x 2 ​ 2 ​+ … + ​x n ​ 2)​ – 2​‾x ​· ​‾x ​+ ​‾x ​2 ​= ​1 _ n ​· (​x 1 ​ 2 ​+ ​x 2 ​ 2 ​+ … + ​x n ​ 2)​ – ​‾x ​2​  BEISPIEL In Aufgabe 11.30 hätten wir auch rechnen können: ​‾x ​= ​1 _ 5 ​·(3+1+2+5+4)=3 s​ 2 ​= ​1 _ 5 ​· (​3 2 ​+ ​1 2 ​+ ​2 2 ​+ ​5 2 ​+ ​4 2)​ – ​3 2 ​= 2 s = ​� _ 2 ​≈ 1,41 Manchmal erhebt man eine Stichprobe aus einer Grundgesamtheit, berechnet aus den n Daten der Stichprobe den Mittelwert und die empirische Varianz und betrachtet diese Ergebnisse als Schätzwerte für die entsprechenden Kennzahlen in der Grundgesamtheit. Während das für den Mittelwert keine Probleme bereitet, kann man für die Varianz zeigen, dass man einen besseren Schätzwert für die Grundgesamtheit erhält, wenn man die Summe der Abweichungsquadrate in der Stichprobe durch n – 1 statt durch n dividiert. Die so errechnete Varianz bezeichnet man auch als Stichprobenvarianz. Die Division durch n – 1 sollte aber nur dann vorgenommen werden, wenn die Absicht besteht, die Ergebnisse der Stichprobe auf die Grundgesamtheit zu übertragen. Sofern man nur die Stichprobe betrachtet, ist es besser, durch n zu dividieren. Für große Stichproben macht es im Übrigen kaum einen Unterschied, ob man durch n oder durch n-1 dividiert. Klarerweise ist die Stichprobenvarianz immer größer als die empirische Varianz. Multipliziert man die vorhin definierte Varianz s​ 2 ​mit ​ n _ n – 1 ​, erhält man die Stichprobenvarianz. Der Verschiebungssatz geht dabei in folgende Form über: Stichprobenvarianz = ​ 1 _ n – 1 ​· (​x 1 ​ 2 ​+ ​x 2 ​ 2 ​+ … + ​x n ​ 2 ​– n · ​‾x ​2)​ BEACHTE Bei Technologieeinsatz stehen im Allgemeinen empirische Varianz und Stichprobenvarianz nebeneinander zur Verfügung. Leider sind die von verschiedenen Herstellern verwendeten Bezeichnungen nicht einheitlich. Nur zu Prüfzwecken – Eigentum des Verlags öbv

RkJQdWJsaXNoZXIy ODE3MDE=