12. Die Regressionsgerade


wird durch Steigung und Achsenabschnitt bestimmt. Wir wissen schon:
  • geht durch den Punkt P (Mittel von x, Mittel von y)
  • hat die Steigung a = r * SDy/SDx

Regressionsgleichung: y = ax + b

Anmerkung:
(a) lineare Regression von y auf x -> nach y auflösen

(b) lineare Regression von x auf y -> nach x auflösen

Nutzen:
  • Vereinfachung bei häufiger Anwendung
  • manchmal (aber nicht immer) direkte Interpretationsmöglichkeit für a und b (Vorsicht bei Beobachtungsstudien)

Die Methode der kleinsten Quadrate
Ziel: Anpassung einer Geraden an Punkte; Schätzung der Parameter
Idee:

Zur Vorhersage von y aus x: Minimiere die Summe der quadrierten vertikalen Abstände!
-> Minimiere den rms-Fehler!

Lösung:
  • Regressionsgerade von y auf x (Hooke`sches Gesetz)
  • Geschätzt nach der Methode der kleinsten Quadrate ("KQ-Schätzer")

Sinn und Unsinn von Regression
Beispiel:
Fläche und Umfang Rechtecken
20 "typische" Rechtecke

Regressionsgleichung:
  • Fläche = a * Umfang + b
  • ergibt nur scheinbar brauchbaren Zusammenhang, da auf den ersten Blick sich die Überlegung "je größer der Umfang desto größer die Fläche" bewahrheitet, doch die Fläche eines Rechteckes berechnet sich A = a * b

Konsequenz:
  • stets kritisch prüfen
  • Situation beachten
  • Regression ist ein wichtiges, verallgemeinerungsfähiges Hilfsmittel, aber kein Allheilmittel!