Mathematik anwenden HUM 4, Schulbuch

58 2.1 Lineare Regression Ich lerne die lineare Regressionsfunktion, die einen linearen Zusammenhang zwischen gegebenen Merkmalen bestmöglich beschreibt, mit der Methode der kleinsten Quadrate zu bestimmen. Ich lerne mithilfe des Korrelationskoeffizienten zu entscheiden, ob die Annahme eines linearen Zusammenhangs zwischen gegebenen Merkmalen sinnvoll ist. Lineare Regression Ein neues Smartphone wird anfangs um 298€ angeboten. Nach 4 Monaten beträgt der Verkaufspreis nur noch 279€ und nach 8 Monaten 245€. Können wir daraus abschätzen, welchen Preis die­ ses Smartphone ein Jahr nach Markteinführung voraussichtlich hat? Wir setzen im Folgenden vereinfachend voraus, dass der Verfall des Preises annähernd durch eine lineare Funktion beschrieben werden kann. Wir sehen, dass die Punkte A = (0 1 298), B = (4 1 279) und C = (8 1 245), die jeweils für ein Zahlen­ paar (Zeitpunkt 1 Verkaufspreis) stehen, nicht alle gleichzeitig auf einer Geraden liegen können. Aber es gibt beliebig viele Geraden, die den Punkten A, B und C mehr oder weniger nahe kommen. Drei davon zeichnen wir ins Koordinatensystem. Es sind das die Graphen der linearen Funktion f, g und h mit f(x) = ‒ 4,75x + 298, g(x) = ‒ 6,625x + 298 und h(x) = ‒6x + 299. Welche dieser drei Funktionen beschreibt den Zusammenhang zwischen dem Verkaufszeitpunkt x in Monaten und dem Verkaufspreis y in Euro am besten? Wie sollen wir das entscheiden? Es ist üblich, das so zu tun: Wir berechnen die Differenzen der Funktionswerte von f, g und h an den Stellen 0, 4, und 8 und der tatsächlichen Verkaufspreise (in €) 298, 279 und 245. Dann berechnen wir die Summe der Quadrate dieser Differenzen („Summe der quadratischen Abweichungen“) . Zeitpunkt x i in Monaten Preis y i in € f(​x​ i ​) ​(f(​x​ i ​) – ​y​ i ​)​ 2 ​ g(​x​ i ​) ​(g(​x​ i ​) – ​y​ i ​)​ 2 ​ h(​x​ i ​) (h(​x​ i ​) – ​y​ i ​)​ 2 ​ 0 298 298 ​(298 – 298)​ 2 ​= 0 298 0 299   1 4 279 279 ​(279 – 279)​ 2 ​= 0 271,5 56,25 275  4 8 245 260 ​(260 – 245)​ 2 ​= 225 260 0 251 36 Summe der quadratischen Abweichungen: 0 + 0 + 225 = 225 56,25 41 Bei der Funktion h ist die Summe der quadratischen Abweichungen mit 41 am geringsten. Da h(12) = 227 ist, könnten wir nach 12 Monaten mit einem Verkaufspreis von ca. 227€ rechnen. Vielleicht gibt es aber noch eine andere lineare Funktion, deren Summe der quadratischen Abweichungen unter 41 liegt? Diejenige lineare Funktion, bei der die Summe der quadratischen Abweichungen minimal ist, nennt man lineare Regressionsfunktion . Zeit in Monaten Preis in € 0 2 1 4 6 8 10 12 3 5 7 9 11 200 300 250 225 275 f g h A B C Regressionsrechnung Nur zu Prüfzwecken – Eigentum des Verlags öbv

RkJQdWJsaXNoZXIy ODE3MDE=