Teilmenge der Grundgesamtheit, die einer genaueren Betrachtung unterzogen wird.
Bei paarigen, verbundenen, parallelisierten oder abhängigen Stichproben gibt es zu jedem Wert aus der einen Stichprobe genau einen Wert aus der anderen Stichprobe. Beide bilden ein logisch zusammenhängendes Paar.
Verbundene Stichproben besitzen mehr Informationsgehalt, aber weniger Freiheitsgrade als unabhängige Stichproben.
Beispiel:
Die selben 10 Teile werden 2 mal vermessen.
Die 10 Werte pro Messreihe sind unter sich unabhängig, hängen jedoch mit den Werten der anderen Messreihe paarweise zusammen.
Man kann unabhängige Stichproben ohne weiteres zu Paaren verbinden. Dadurch wird zwar die Varianz verkleinert, jedoch auch die Anzahl Freiheitsgrade.
Ein weiterer Grund zu Paaren liegt in der Minimierung des Einflusses bekannter Störvariablen.
Die Erweiterung des Paarens auf mehr als 2 Gruppen nennt man Blocking (Blockbildung).
In der Rubrik " Poweranalyse" befindet sich ein Beispiel, welches den Einfluss des Paarens verdeutlicht.
Zufallsstichproben sind solche, bei denen jedes prinzipiell in Frage kommende Element die gleiche Chance hatte, gezogen zu werden. Zufallsstichproben sind hinsichtlich ihres Informationsgehaltes fast nie optimal, wie durch folgendes Gedankenexperiment veranschaulicht wird.
Angenommen, man hat 10 Schachteln mit je 100 Kugeln. Es soll eine Zufallsstichprobe, bestehend aus 20 Kugeln, entnommen werden. Zufall bedeutet hier, dass bei jedem Zug jede Kugel die selbe Chance hat, gezogen zu werden.
Insbesondere wird es mit einer gewissen Wahrscheinlichkeit Schachteln geben, aus denen selbst nach 20 Ziehungen noch keine Kugel entnommen worden ist.
Der Erwartungswert für die Anzahl gezogener Kugeln pro Schachtel liegt bei 20/10 = 2.
Die Anzahl gezogener Kugeln pro Schachtel ist poissonverteilt mit Mittelwert 2.
Mit der Excelfunktion POISSON(0;2;falsch) erhält man für die Wahrscheinlichkeit, dass aus einer bestimmten Schachtel keine Kugel gezogen worden ist den Wert 13,5 %.
Die Wahrscheinlichkeit, dass aus allen 10 Schachteln wenigstens eine Kugel gezogen wurde, liegt bei (1-13,5%)10 = 23,4%.
Diese Zufallsstichprobe lässt also sehr wahrscheinlich wenigstens eine Schachtel unberücksichtigt.
Geschichtete (stratifizierte) Stichproben haben eine höhere Repräsentativität als Zufallsstichproben. Siehe hierzu das Beispiel unter Stratifizierung.
Bezogen auf das vorherige Beispiel bedeutet das, dass man aus jeder Schachtel je genau 2 Kugeln zieht.
Die Standardfehler von geschichteten Stichproben sind genau dann kleiner, wenn es sinnvoll ist, für jede Schicht einen eigenen Mittelwert zu definieren.
Dieser Gedankengang erinnert stark an eine signifikante einfaktorielle ANOVA, bei der ja jeder Gruppe ein eigener Mittelwert zugewiesen wurde und die Streuung innerhalb der Gruppen signifikant kleiner ist als die Gesamtstreuung.
Eine Zwischenstellung nehmen Klumpenstichproben ein.
Bezogen auf das vorherige Beispiel bedeutet das, dass man beispielsweise 2 Schachteln komplett untersuchen würde.
Klumpen sind Einheiten, die auf natürliche Weise gruppiert und leicht zugänglich sind.
Siehe auch Design eines zweiseitigen Stichprobentests als Beispiel
bzw. das Beispiel unter Poweranalyse.