Mathematik HTL 4/5, Schulbuch

145 3.4 Regression und Korrelation Ich lerne eine Regressionsfunktion zu bestimmen, die den Zusammenhang zwischen gegebenen Merkmalen bestmöglich beschreibt. Ich lerne mithilfe des Korrelationskoeffizienten zu entscheiden, ob die Annahme eines gewissen Zusammenhangs von gegebenen Merkmalen sinnvoll ist. Lineare Regression Eine der wichtigsten statistischen Aufgaben besteht darin, einen Zusammenhang zwischen zwei beobachteten Merkmalen nachzuweisen und dann auch zu beschreiben. Im einfachsten Fall ver- wenden wir eine lineare Funktion, um diesen Zusammenhang zu beschreiben und sprechen dann von linearer Regression . Gegeben ist eine Stichprobe aus paarweisen Beobachtungen (x 1 , y 1 ), …, (x n , y n ) der Merkmale X und Y. Gesucht ist eine lineare Funktion f mit f(x) = ax + b, sodass die Summe der Fehlerquadrate ; i = 1 n (f(x i ) – y i ) 2 minimal wird. Die lineare Funktion f soll also so bestimmt werden, dass der Abstand von (y 1 , …, y n ) zu (f(x 1 ), …, f(x n )) möglichst klein ist. Diese Vorgangsweise nennen wir Methode der kleinsten Quadrate . Geometrisch betrachtet bedeutet das, dass die Summe der Quadrate der vertikalen Abstände der Beobachtungspunkte (x i , y i ) vom Graphen der Funktion f, einer Geraden, möglichst klein sein soll. Man kann zeigen, dass diese Zahlen a und b Lösungen des Systems linearer Gleichungen I) a· ; x i 2 + b· ; x i = ; x i y i II) a· ; x i + b·n = ; y i sind. Als Lösung dieses Gleichungssystem erhalten wir a = ; x i y i – n _ x _ y __ ; x i 2 – n _ x 2 und b = _ y – a _ x , dabei ist _ x = 1 _ n ; x i und _ y = 1 _ n ; y i . Die Funktion f mit f(x) = ax + b nennen wir die lineare Regressionsfunktion , ihr Graph heißt Regressionsgerade . x y 0 2 4 6 8 7 6 5 4 3 2 1 -1 a 1 b Methode der kleinsten Quadrate lineare Regressions- funktion Nur zu Prüfzwecken – Eigentum des Verlags öbv

RkJQdWJsaXNoZXIy ODE3MDE=