Mathematik HTL 4/5, Schulbuch

141 3.3 Testen von Hypothesen Analog können wir für die übrigen Kombinationen die erwarteten Häufigkeiten berechnen und in einer Tabelle zusammenfassen. Den Vergleich von tatsächlich aufgetretener zu erwarte- ter Häufigkeit kennen wir schon vom Chi-Quadrat-Test. Diesen führen wir mit allen Merkmalskombinationen der Tabelle durch und erhalten die Teststatistik QK = (618 – 678,4) 2 __ 678,4 + (432 – 398,7) 2 __ 398,7 + (86 – 58,9) 2 __ 58,9 + (648 – 587,6) 2 __ 587,6 + (312 – 345,3) 2 __ 345,3 + (24 – 51,1) 2 __ 51,1 = 44,42. Es lässt sich zeigen, dass bei Unabhängigkeit der beiden Merkmale QK eine Chi-Quadrat-Vertei- lung mit (3 – 1)(2 – 1) = 2 Freiheitsgraden hat. Wir werden daher die Unabhängigkeitshypothese verwerfen, wenn QK > χ 2; 0,99 2 ist. Aus der Tabelle entnehmen wir χ 2; 0,99 2 = 9,210. Da 44,42 > 9,21 ist, können wir die Unabhängigkeit von Geschlecht und Bildungsstand in diesem Unternehmen mit 99% Sicherheit verwerfen. Der Bildungsstand der Mitarbeiterinnen und Mitar- beiter ist offensichtlich vom Geschlecht abhängig. Das eben beschriebene Verfahren heißt Kontingenztest oder Chi-Quadrat-Unabhängigkeitstest. Die qualitativen oder diskret quantitativen Merkmale X und Y haben die Wertebereiche M x = {x 1 , …, x r } bzw. M y = {y 1 , …, y s }. Wir wollen anhand einer Stichprobe vom Umfang n testen, ob X und Y statistisch voneinander unabhängig sind. Dazu werden in einer Kontingenztafel die Häufigkeiten h ij aller Kombinationen (x i , y j ), die in der Stichprobe auftreten, angegeben. H(x i ) = ; j = 1 s h ij ist die Zeilensumme der i-ten Zeile der Kontingenztafel und gibt die absolute Häufig- keit an, mit der das Merkmal x i in der Stichprobe auftritt. H(y j ) = ; i = 1 r h ij ist die j-te Spaltensumme und gibt die absolute Häufigkeit des Merkmals y j in der Stichprobe an. Sind die beiden Zufallsvariablen X und Y unabhängig, so ergibt sich die erwartete Häufigkeit e ij der Kombination (x i , y j ) aus der Formel e ij = H(x i )·H(y j ) __ n . Summieren wir nun (h ij – e ij ) 2 __ e ij für alle Kombinationen aus x i und y j , so erhalten wir die Teststatistik QK = ; i = 1 r ; j = 1 s (h ij – e ij ) 2 __ e ij . Im Falle der Unabhängigkeit von X und Y ist QK Chi-Quadrat-verteilt mit f = (r – 1)(s – 1) Freiheits- graden. Die Nullhypothese H 0 : „X und Y sind unabhängig“ wird angenommen wenn, QK ª χ f; 1 – α 2 ist. Die Sicherheit dieses Tests ist 1 – α . bei Unabhängigkeit erwartete Häufigkeiten P M A Σ M 678,4 398,7 58,9 1136 W 587,6 345,3 51,1 984 Σ 1 266 744 110 2120 Kontingenztest Chi-Quadrat- Unabhängig- keitstest beobachtete Häufigkeiten y 1 … y s Σ x 1 h 11 … h 1s H(x 1 ) … … … … … x r h r1 … h rs H(x r ) Σ H(y 1 ) … H(y s ) n Nur zu Prüfzwecken – Eigentum des Verlags öbv

RkJQdWJsaXNoZXIy ODE3MDE=