Lügen mit Statistik
Sammelbegriff für alle statistischen "Tricks", die einen in Wirklichkeit nicht nachweisbaren Sachverhalt suggerieren, oder einen nachweisbaren Sachverhalt verbergen.
Dabei handelt es sich oft um unbewusste "Lügen", um Fehler, die auf Unwissen oder mangelnder Erfahrung basieren.
Auch die Aussage "Trau keiner Statistik, die du nicht selbst gefälscht hast" ist so zu verstehen, dass das Fälschen von Statistiken sehr oft aus Unwissenheit oder Unachtsamkeit geschieht. Oft meint man sich dabei sogar selbst.
Über das Fälschen von Statistiken sind ganze Bücher geschrieben worden.
Im Folgenden seien ein paar ausgewählte Gesichtspunkte genannt.
Darstellerische Tricks
Darstellerische Tricks werden meistens bewusst eingesetzt, sind also "Lügen" im eigentlichen Sinne.
Weglassen von Skalierungen
Skalen beginnen nicht beim Nullpunkt
Dehnung oder Stauchung von Diagrammachsen
Skalen sind nichtlinear, oder gar nicht ohne Weiteres ersichtlich.
Farbgebung und Schraffierung von Diagrammbalken sind derart, dass sie den Charakter einer optischen Täuschung haben
Beispielsweise kann der rechte Balken länger als der linke aussehen; in Wahrheit ist es aber anders herum.
Nur ein kleiner Ausschnitt des Verlaufs wird gezeigt.
Beispielsweise wird ein langfristig steigender Trend dadurch verschwiegen, indem man nur die letzten paar Datenpunkte zeigt, die (evtl. sogar rein zufällig) einen (nur kurzfristigen) Abwärtstrend aufzeigen.
Falsches Zusammenfassen von einzelnen Datengruppen oder falsches Zerlegen von Zusammengehörenden Daten
Dies kann bewusst oder unbewusst geschehen
Siehe Simpson'sches Paradoxon.
Auswertungstechnische Fehler
Dies geschieht meistens unbewusst oder aus Unkenntnis
Mathematische Voraussetzungen sind nicht erfüllt.
Normalverteilung wird angenommen, liegt aber nicht vor, oder wird zumindest nicht überprüft.
Hypothesen werden im Nachhinein formuliert und nicht anhand weiteren Datenmaterials verifiziert.
Solange "Herumtesten", bis man irgendeine Signifikanz gefunden hat. Siehe auch multiples Testen.
Der ausgewählte statistische Test ist prinzipiell ungeeignet, kann also von vorne herein die gewünschte Information nicht liefern.
Siehe Validität, Reliabilität, Relevanz.
Zweiseitiges Testen anstelle einseitigem Testen (oft bewusst).
Falsche Basis, ungeeignete Bezugspunkte, siehe z.B. Sicherheit Auto versus Flugzeug
Ganz besonders tückisch sind formal korrekte Verfahren, denen an sich nichts anzulasten ist, die aber nicht die einzige Möglichkeit darstellen, etwas auszuwerten. So kommen dann Ergebnisse ganz im Interesse des Auftraggebers heraus, ohne dabei richtig angreifbar zu sein: "Cui Bono" (lateinisch = wem nützt es).