Reichel Mathematik 8, Schulbuch
233 IV Stochastik Eindimensionale Verteilungen 1. Skalierung – diskrete und kontinuierliche Modellierung von Merkmalen Die beschreibende Statistik beschäftigt sich damit, Daten (für gewisse Merkmale) zu sammeln, in Tabel- len anzuordnen bzw. graphisch darzustellen sowie durch geeignete Kennzahlen (wie zB Mittelwert, Streuung, minimaler und maximaler Wert usw.) „in komprimierter Form“ zu beschreiben (vgl. Buch 6. KL. Kap. 5.0). Voraussetzung dafür ist, dass sich die Merkmale irgendwie numerisch – eben als Datum – erfassen und skalieren lassen, wobei wir unter einer Skala ein „geeichtes“ abstraktes mathe matisches „Vergleichsobjekt“ verstehen. Eine so genannte Nominalskala gestattet zu entscheiden, ob zwei Objekte hinsichtlich eines bestimmten Merkmals als gleich anzusehen sind und in die gleiche Objektklasse (Kategorie) gehören oder nicht. In der Mengenlehre (Buch 5. Kl. Kap. 1) finden wir in den Klasseneinteilungen das passende mathe matische Werkzeug. Die Klassen (Merkmalsausprägungen) können durch Zahlen oder durch Namen (daher die Namensgebung „Nominal“) bezeichnet werden. Beispielsweise könnte man dem Merkmal „Augenfarbe“ die Merkmalsausprägungen „braun“, „blau“ und „grün“ als Objektklassen zuordnen. Das Merkmal „Augenfarbe“ ist nominalskaliert . Unzulässig für nominalskalierte Merkmale sind Vergleiche im Sinne von „größer“ (besser, mehr) und „kleiner“ (schlechter, weniger). Die Augenfarbe „braun“ ist nicht schlechter als die Augenfarbe „blau“ – oder? Wenn man – etwa aufgrund einer Umfrage – eine Wertung (im Sinn einer Reihung mit einer gewis- sen mathematischen Ordnungsstruktur als Werkzeug) der Merkmalsausprägungen vornimmt, so ist das Merkmal nicht mehr (nur) nominalskaliert, sondern ordinalskaliert . Allerdings dürfte es i. Allg. schwer sein anzugeben, um wie viel besser eine Ausprägung als eine andere ist. Kurz: Differenzen (und Summen) von Rangplätzen haben bei ordinalskalierten Merkmalen keine Aussagekraft, was das derzeit so beliebte Ranking als viel weniger aussagekräftig ausweist als es uns die Medien weismachen wollen. Erøäutere an- hand des Ergebnisses eines Skirennens, weøche Aussagekraft die bøoße Reihung nach „Sieger“, Zweiter, Dritter usw. hat, wenn man die Laufzeiten(abstände) nicht kennt. Finde anaøoge Beispieøe! Summen- und Differenzenbildung setzt eine Skala voraus, in der die Abstände zwischen aufeinander folgenden Merkmalsausprägungen (Skalenwerten) konstant ist. Eine solche Skala heißt Intervallskala oder auch Einheitenskala und ist dir vom Thermometer geläufig. Temperaturen kann man ja sowohl von kalt nach warm reihen als auch ihre Summe und Differenz sinnvoll bilden. Erøäutere! Das Merkmal „Temperatur“ ist daher einheitenskaliert . Sinnlos ist bei solchen Skalen das Bilden von Verhältnissen: 10 °C sind nicht doppelt so heiß wie 5 °C . Warum ? Für solche Vergleiche braucht man eine absolute Skala, wie sie der übliche Zahlenstrahl als mathematisches Vergleichsobjekt bietet. So ist zB das Merkmal „Einkommen“ absolutskaliert , denn die Aussage, doppelt so viel zu verdienen wie ein anderer, ist (neben der Reihung der Einkommen und der Berechnung von Einkommensdifferenzen) sinnvoll. Warum diese Einleitung? Weil sie entscheidend ist, welche mathematischen Methoden und stochastischen Kennzahlen bei einer konkreten Untersuchung überhaupt zulässig sind! Im Wirkungsbereich von nomi- nalskalierten Merkmalen sind ausschließlich das Zählen von Häufigkeiten und das Darstellen in Vertei- lungstafeln und Histogrammen zulässig. Bei ordinalskalierten Merkmalen sind zusätzlich zB der Median, das Minimum und Maximum und Kastenschaubilder erlaubt, nicht aber das arithmetische Mittel und die Standardabweichung, weil zu deren Berechnung ja Summen und Differenzen gebildet werden müssen. Sie dürfen nur bei einheitenskalierten Merkmalen benutzt werden. Und dagegen wird sehr oft verstoßen . IV.1 A 987 A 988 Nur zu Prüfzwecken – Eigentum des Verlags öbv
Made with FlippingBook
RkJQdWJsaXNoZXIy ODE3MDE=