Mathematik anwenden HAK 4, Schulbuch

188 Zusammenfassung Die absolute Häufigkeit des Wertes y eines Merkmals ist die Anzahl der Elemente der Grundge- samtheit dieses Merkmals, die den Wert y haben. Der Wert, der am häufigsten vorkommt, heißt Modus des Merkmals. Wenn mehrere Werte des Merkmals gleich oft und am häufigsten vorkommen, dann sind alle diese Werte Modi . Die relative Häufigkeit eines Wertes des Merkmals erhält man, indem man seine absolute Häu- figkeit durch die Anzahl der Elemente der Grundgesamtheit dividiert. Wenn x 1  , x 2  , …, x n die Werte eines quantitativen Merkmals x (dessen Grundgesamtheit n Ele- mente enthält) sind, dann ist das arithmetische Mittel oder der Mittelwert von x ​ _ x​= ​  ​x​ 1 ​+ ​x​ 2 ​+ … + ​x​ n ​ ___ n  ​  . Das geometrische Mittel von x ist ​ n 9 _______ ​x​ 1 ​·​x​ 2 ​·…·​x​ n ​ ​  . Das Minimum bzw. Maximum eines Merkmals ist der kleinste bzw. größte Wert dieses Merkmals. Die Spannweite eines Merkmals ist die Differenz zwischen seinem Maximum und Minimum. Wir ordnen die Werte x 1  , …, x n eines quantitativen Merkmals x so an, dass x 1 ª … ª x n ist. Der Median oder das 2. Quartil von x ist dann der „Wert in der Mitte“. Das 1. Quartil oder untere Quartil ist der Median der „unteren Teilliste“ und das 3. Quartil oder obere Quartil ist der Median der „oberen Teilliste“. Die Differenz von 3. und 1. Quartil heißt Quartilsabstand oder Interquartilsabstand . Ein Boxplot-Diagramm stellt Minimum, Maximum, Median sowie 1. und 3. Quartil über einer Zahlengeraden dar. Es besteht aus einem Rechteck (box), das vom 1. und 3. Quartil begrenzt wird, und in dessen Inneren eine Linie den Median markiert. Links und rechts der Box führen sogenannte Antennen zum Mini- mum bzw. Maximum. Ist ​ _ x​das arithmetische Mittel eines quantitativen Merkmals, n die Anzahl der Elemente der Grundgesamtheit und sind x 1  , x 2  , …, x n die Werte des Merkmals, dann heißt ​ σ ​ 2 ​= ​  ​(​x​ 1 ​– ​ _ x​)​ 2 ​+ ​(​x​ 2 ​– ​ _ x​)​ 2 ​+ … + ​(​x​ n ​– ​ _ x​)​ 2 ​ _____  n  ​ Varianz dieses Merkmals. Ihre Wurzel σ = ​ 9 __ ​ σ ​ 2 ​​ heißt Standardabweichung. Die Zahl ​  σ _ ​ _ x​  ​ heißt Variationskoeffizient. y 1  , …, y n … Merkmalsausprägungen des Merkmals y (0 < y 1 ª … ª y n ) s i = ​ ;  k = 1 ​  i ​ y​ k ​​… i-te Merkmalsumme („kumulierte“ Merkmals­ ausprägungen; s n ≠ 0) Die Lorenzkurve des Merkmals y erhält man, indem man die Punkte (0 1 0), ​ 2  ​  1 _ n ​  1  ​  ​s​ 1 ​ _  ​s​ n ​ ​  ​ ​  3 ​, ​ 2  ​  2 _ n ​  1  ​  ​s​ 2 ​ _  ​s​ n ​ ​  ​ ​  3 ​, …, ​ 2  ​  i _  n ​  1  ​  ​s​ i ​ _  ​s​ n ​ ​  ​ ​  3 ​, …, ​ 2  ​  n _ n ​  1  ​  ​s​ n ​ _ ​s​ n ​ ​  ​ ​  3 ​durch Strecken verbindet. Diese Kurve ist der Graph einer Funktion vom Intervall [0; 1] in das Intervall [0; 1], welche Lorenzfunktion des Merkmals heißt. Der Gini-Koeffizient ist das Doppelte der Fläche zwischen der ersten Mediane und der Lorenzkurve. Der Gini-Koeffizient einer integrierbaren Lorenzfunktion L ist 2 ​ :  0 ​  1 ​ (t – L(t)) dt​. Häufigkeiten Zentralmaße Minimum Maximum 1. Quartil Median 3. Quartil Streuungsmaße relativer kumulierter Gehaltsanteil relativer kumulierter Personenanteil 0,2 0 0,4 0,6 1 0,8 0 0,4 0,2 0,6 1 0,8 L Lorenzkurve und Gini-Koeffizient Zusammenfassung: Beschreibende Statistik Nur zu Prüfzwecken – Eigentum des Verlags öbv

RkJQdWJsaXNoZXIy ODE3MDE=