Resampling

Resampling Randomisierungstest

Erzeugen von Kombinationen aus den Daten einer Stichprobe,

also die Simulation einer Verteilungsfunktion aus den Daten der Stichprobe, indem man die Daten immer wieder neu zusammensetzt ("Resampling").

Nach jedem Zusammensetzen wird die interessierende Teststatistik berechnet. Schliesslich wird der Anteil der getesteten Möglichkeiten, bei denen die Teststatistik grösser (oder kleiner) ist als die der Ausgangsdaten zur Beurteilung des Vertrauensbereiches herangezogen.

Man tut im Prinzip so, als ob die vorliegende Stichprobe die gesamte Information der Grundgesamtheit beinhaltet und zieht aus der Stichprobe Unterstichproben. Die gezogenen Unterstichproben können je nach Aufgabenstellung durchaus die Grösse der Stichprobe haben, nur sind sie immer wieder anders zusammengesetzt.

Je nachdem, ob man alle denkbaren Möglichkeiten der Stichprobe durchspielt oder nicht spricht man von exakten oder asymptotischen Tests.

Randomisierungstests werden angewandt bei:

Stichproben, die über eine komplexe innere Struktur verfügen, die mit klassischen mathematischen Mitteln kaum handhabbar ist.

Bei hohen Rechnerleistungen eine gangbare Methode.
Sehr knappem Datenmaterial, bei dem man mit klassischen parametrischen und parameterfreien Testmethoden einen zu grossen Fehler riskieren würde.
Datenmaterial, bei dem die Voraussetzungen für klassische Tests nicht erfüllt sind (zB. Unabhängigkeit oder Normalverteilung)

Randomisierungs-Testverfahren lassen sich unterteilen in:

Bootstrap: Häufiges Ziehen aus der Stichprobe mit Zurücklegen, mögliche Kombinationen werden zufällig erzeugt.

Der Name "Bootstrap" bedeutet sinngemäss "Sich am eigenen Schopfe hochziehen" (Münchhausen), weil man so tut, als ob die Stichprobe die Grundgesamtheit sei.
Permutationstest: Häufiges Ziehen aus der Stichprobe ohne Zurücklegen. Alle möglichen Kombinationen werden genau einmal erzeugt.
Jackknife: Zerlegung der Stichprobe in Teilstichproben. Isolierung einer Stichprobe, welche als Validierungsteil der aus den anderen Stichproben gewonnenen Daten dient. (Zyklische) Wiederholung dieser Prozedur für alle Teilstichproben.
Viele nicht-parametrische, exakte Tests sind von der Natur her Permutationstests, da deren Exaktheit ja durch Auffinden und Berechnen aller möglichen Kombinationen erreicht wird.

Beispiele:

Der grundlegende Unterschied zu Monte Carlo Verfahren liegt darin, dass Resampling sich lediglich auf die vorliegende Stichprobe bezieht und nur der Informationsgehalt der Stichprobe genutzt wird.

Bei Monte Carlo Verfahren dagegen werden aus einer Verteilungsfunktion, die die Nullhypothese widerspiegelt, sehr viele Stichproben gezogen. Aus diesen Stichproben werden die Stichprobenkennwerte berechnet.

Datenschutzhinweise