158 Schließende und beurteilende Statistik > Schließende Statistik 7 Berechnung des Konfidenzintervalls Um das Konfidenzintervall ohne großen Rechenaufwand zu ermitteln, nimmt man zwei Vereinfachungen vor. 1) Man nimmt an, dass die Zufallsvariable X binomialverteilt ist, und nähert die Binomialverteilung durch eine Normalverteilung an. 2) Zu jedem möglichen Wert p der Grundgesamtheit gibt es einen Schätzbereich für die relative Häufigkeit h in der Stichprobe, welchen man mit der entsprechenden Normalverteilung mit den jeweiligen Parametern μ = n · pund σ = 9 _n · p · (1 − p) berechnen kann. Die zweite Vereinfachung besteht darin, dass man diesen (verschiedenen) Normalverteilungen denselben Parameter σ = 9 _n · h · (1 − h) zuweist. h ist dabei die bekannte relative Häufigkeit der Stichprobe. Das Konfidenzintervall wird nun mit den genannten Vereinfachungen in einem Beispiel berechnet: Bei einer Befragung von 1 000 Personen zeigen 215 Personen eine Präferenz für die Partei A. Man will nun von der bekannten relativen Häufigkeit h = 215 _ 1 000 = 0,215der Stichprobe auf die unbekannte Wahrscheinlichkeit p (= relativer Anteil) für die Präferenz von A in der Grundgesamtheit schließen. Die Sicherheit soll 0,95 betragen. Das gesuchte Konfidenzintervall lautet [p min; p max]. Man betrachtet die Graphen der Dichtefunktonen (1. Vereinfachung) der beiden (noch unbekannten) Normalverteilungen Nmin(n · p min; 9 _n · h · (1 − h) )und Nmax(n · p max; 9 _n · h · (1 − h) ) in der nebenstehenden Abbildung. In der Mitte dieser Dichtefunktionen ist der Graph der (bekannten) Dichtefunktion N (n · h; 9 _n · h · (1 − h) ) dargestellt. Die Graphen aller drei Dichtefunktionen haben verschiedene Lagen, aber die gleiche, symmetrische Form, da sie Normalverteilungen mit demselben Parameter σ darstellen (Vereinfachung 2). Dadurch muss das gesuchte Konfidenzintervall [p min; p max] symmetrisch zu p = hliegen. Aus den Definitionen des Konfidenzintervalls und der Symmetrie der Graphen folgt, dass die Graphen der beiden Dichtefunktionen von N min und N max so liegen müssen, dass die relative Häufigkeit h den linken bzw. rechten Rand des jeweiligen 95 %-Schätzbereiches bildet. Aus Symmetriegründen muss der 95 %-Schätzbereich der bekannten grünen Dichtefunktion mit dem Intervall [n · p min; n·pmax] übereinstimmen. Da man h aus der Stichprobe kennt, kann man diesen Schätzbereich berechnen. Daraus kann man danach die Grenzen des Konfidenzintervalls p minund pmax bestimmen: Der grüne Graph entspricht der Normalverteilung N(n · h; 9 _n · h · (1 − h) ) = N(215; 12,99). P(215 − k ≤ X ≤ 215 + k) = 0,95 Daraus kann man den Wert für k mit einem elektronischen Hilfsmittel oder mit Hilfe der Standard-Normalverteilung berechnen. F(215 + k) = Φ( (215 + k) − 215 _ 12,99 ) = 0,975 = Φ(1,96) ⇒ (215 + k) − 215 _ 12,99 = 1,96 ⇒ k = 25,46 Ó Vertiefung Konfidenzintervall ohne Vereinfachungen ermitteln ch453p 215 95 % approximierte Glockenkurve für pmin pmin Glockenkurve für p = h p = h = 0,215 p = h approximierte Glockenkurve für pmax pmax 95 % 95 % 215 215 – k 215 + k 95 % approximierte Glockenkurve für pmin pmin Glockenkurve für p = h p = h approximierte Glockenkurve für pmax pmax 95 % p = h = 0,215 Ó Technologie Anleitung Symmetrisches Intervall bestimmen f8r2z3 Nur zu Prüfzwecken – Eigentum des Verlags öbv
RkJQdWJsaXNoZXIy MjU2NDQ5MQ==