Mathematik verstehen 6, Schulbuch

221 12 . 3  ������������� Sind ​a​ 1 ​, ​a​ 2 ​, …, ​a​ k ​die möglichen Werte einer variablen und treten diese unter den n Zahlen der Liste mit den absoluten Häufigkeiten ​H​ 1 ​, ​H​ 2 ​, …, ​H​ k ​auf, dann gilt: ​s​ 2 ​= ​ ​h​ 1 ​· (​a​ 1 ​– ​ _ x​)​ 2 ​+ ​h​ 2 ​· (​a​ 2 ​– ​ _ x​)​ 2 ​+ … + h​ ​ k ​· (​ ​a​ k ​– ​ _ x​)​ 2 ​ _______ n ​ und s = ​ 9 ____________________ ​ ​h​ 1 ​· (​a​ 1 ​– ​ x​)​ 2 ​+ ​h​ 2 ​· (​a​ 2 ​– ​ _ x​)​ 2 ​+ … + h​ ​ k ​· ​(​a​ k ​– ​ _ x​)​ 2 ​ _______ n ​​ Dabei gilt jeweils: ​H​ 1 ​+ ​H​ 2 ​+ … + ​H​ k = n . Die Formel in der Definition der empirischen varianz ist gut geeignet, die Bedeutung dieses Begriffs zu verstehen, jedoch zur Berechnung für längere Listen ohne Technologieeinsatz mühsam. In solchen Fällen eignet sich der folgende Satz besser: satz (verschiebungssatz für die empirische varianz) Für die empirische varianz s​ ​ 2 ​einer Liste x​ ​ 1 ​, ​x​ 2 ​, …, ​x​ n ​mit dem Mittelwert ​ _ x​gilt: ​ s​ 2 ​= ​ 1 _ n ​· (​x​ 1 ​ 2 ​+ ​x​ 2 ​ 2 ​+ … + x​ ​ n ​ 2 ​) – ​ _ x​ 2 ​ Beweis : = 1 _ n · [(x 1 ​– ​ _ x​)​ 2 ​+ (​x​ 2 ​– ​ _ x​) 2 + … + (x​ ​ n ​– ​ _ x​)​ 2 ] = = 1 _ n · [(x 1 ​ 2 ​– 2​x​ 1 ​ _ x​+ ​ _ x​ 2 ​) + (​x​ 2 ​ 2 ​– 2​x​ 2 ​ _ x​+ ​ _ x​ 2 ​) + … + (​x​ n ​ 2 ​– 2​x​ n ​ _ x​+ ​ _ x​ 2 )] = = 1 _ n · [(x 1 ​ 2 ​+ ​x​ 2 ​ 2 ​+ … + x​ ​ n ​ 2 ​) – 2​ _ x · (x 1 ​+ ​x​ 2 ​+ … + x​ ​ n ) + n · _ x​ 2 ] = = 1 _ n · (x 1 ​ 2 ​+ ​x​ 2 ​ 2 ​+ … + x​ ​ n ​ 2 ​) – 2​ _ x · _ x​+ ​ _ x​ 2 = 1 _ n · (x 1 ​ 2 ​+ ​x​ 2 ​ 2 ​+ … + x​ ​ n ​ 2 ​) – ​ _ x​ 2 ​ c Beispiel : In Aufgabe 12.30 hätten wir auch rechnen können: ​ _ x = 1 _ 5 · (3 + 1 + 2 + 5 + 4) = 3 ​s​ 2 = 1 _ 5 · (3 2 ​+ ​1​ 2 ​+ ​2​ 2 ​+ ​5​ 2 ​+ ​4​ 2 ​) – ​3​ 2 = 2 s = 9 _ 2 ≈ 1,41 Manchmal erhebt man eine stichprobe aus einer grundgesamtheit , berechnet aus den n Daten der Stichprobe den Mittelwert und die empirische varianz und betrachtet diese Ergebnisse als (zugegebenermaßen unsichere) Schätzwerte für die entsprechenden Kennzahlen in der Grund- gesamtheit. Während das für den Mittelwert keine Probleme bereitet, kann man für die varianz zeigen, dass man einen besseren Prognosewert für die Grundgesamtheit erhält, wenn man die Summe der Abweichungsquadrate in der Stichprobe durch n – 1 statt durch n dividiert. Die so er- rechnete varianz bezeichnet man auch als stichprobenvarianz . Die Division durch n – 1 sollte aber nur dann vorgenommen werden, wenn die Absicht besteht, die Ergebnisse der Stichprobe auf die Grundgesamtheit zu übertragen. Sofern man nur in der Stichprobe bleibt, ist es besser, durch n zu dividieren. Für große Stichproben ist es übrigens unerheblich, ob man durch n oder durch n – 1 dividiert (es macht zB kaum einen Unterschied, ob man durch 1 000 oder durch 999 dividiert). Multipliziert man die vorhin definierte varianz s​ ​ 2 ​mit ​ n _ n – 1 ​, erhält man die Stichprobenvarianz. Der verschiebungssatz geht dabei in folgende Form über: stichprobenvarianz = ​ 1 _ n – 1 ​· (​x​ 1 ​ 2 ​+ ​x​ 2 ​ 2 ​+ … + x​ ​ n ​ 2 ​– n · ​ _ x​ 2 ​) Beachte : Technische Hilfsmittel bieten im Allgemeinen beide Formen der varianz (Division durch n bzw. n – 1) an und verwenden dafür verschiedene Bezeichnungen. Diese sind leider nicht einheitlich. Klarerweise ist die Stichprobenvarianz stets größer als die empirische varianz ​s​ 2 ​. Nur zu Prüfzwecken – E gen um des Verlags öbv

RkJQdWJsaXNoZXIy ODE3MDE=