Regression zum Mittelwert
In der Natur sind Merkmale meistens über einen beschränkten Wertebereich verteilt. (Siehe z.B. Wallis Moore Folgevorzeichen Iterationstest).
Menschen können beispielsweise nicht beliebig gross (oder klein) werden, oder der Ertrag von Milchkühen kann allerhöchstens zwischen Null und einem Maximalwert schwanken.
Natürlich kann durch gezielte Züchtung der Ertrag langsam gesteigert werden, oder können Menschen allmählich grösser werden, aber eine momentan gültige Obergrenze (und Untergrenze) ist stets gegeben (beide brauchen nicht explizit bekannt zu sein).
Die Folgen daraus sind weitreichend:
Ab einer bestimmten Körpergrösse sind die Nachkommen der entsprechenden Individuen durchschnittlich kleiner als ihre Eltern. Nachfahren der ertragreichsten Kühe haben im Mittel geringere Erträge.
Dieser Sachverhalt lässt sich noch weiter ausdehnen:
Politische Parteien, deren Stimmenanteil in der Vergangenheit geschrumpft ist, werden in der kommenden Wahl an Stimmen rein zufällig eher gewinnen.
Ein seit langem marodes Unternehmen wird sich nach einem Wechsel der Geschäftsleitung eher verbessern als verschlechtern, selbst wenn die Geschäftsleitung gar nichts Wesentliches unternimmt.
Ein Kranker wird eher gesünder, unabhängig davon, ob er Medikamente einnimmt oder nicht.
Nach dem im folgenden Beispiel geschilderten Sachverhalt ist (leider!) das grosse Kapitel "Regression" in die Begriffswelt der Statistik eingegangen.
Beispiel:
Grösse von Vätern und deren Söhne. Es wurde festgestellt, dass die Körpergrössen von Vätern und ihren Söhnen über einen gewissen Bereich zwar korrelieren; ab einer bestimmten Grösse der Väter jedoch sind die Söhne eher kleiner als die Väter. Der Begriff „ Regression“ (lat: „Zurückweichen“) beschreibt dieses Phänomen zwar treffend, allerdings ging er als allgemeine Bezeichnung für die „Anpassung einer Modellgeraden an eine Punktewolke“ in die Welt der Statistik ein.
28.08.2005