Überall, wo Daten zusammengefasst oder aufgeschlüsselt werden.
Ziel sollte stets sein, die Daten in übersichtlicher und zusammengefasster Form darzustellen.
Hier spricht man von beschreibender oder deskriptiver Statistik.
Die deskriptive Statistik macht Aussagen nur über jene Objekte, die in die Erhebung der entsprechenden Statistik einbezogen worden sind.
Wesentliche Ursachen dafür, dass im Zusammenhang mit Statistik oft von Lügen oder Fälschen gesprochen wird sind:
Zusammenfassen von Daten auf unzulässige Weise (z.B. Simpson's Paradoxon)
Irreführendes Darstellen der Ergebnisse,
([Un-]bewusstes) Unterschlagen von Information
Bei der schliessenden oder induktiven Statistik dagegen werden nur bestimmte, zufällig ausgewählte Objekte untersucht.
Aus den davon gewonnenen Einsichten werden Schlüsse gezogen, die auf alle (auch nicht untersuchten) Objekte zutreffen sollen, allerdings mit einer begrenzten Aussagesicherheit.
Legitimiert wird das durch den Bayes'schen Wahrscheinlichkeitsbegriff, den man als "Grad des persönlichen Überzeugtseins" umschreiben kann.
Fehlendes Wissen über Aussagesicherheiten, die Anwendung ungeeigneter Methoden und nicht zuletzt das Verwechseln von Korrelation und Kausalität sind weitere Ursachen dafür, dass im Zusammenhang mit Statistik oft von Lügen oder Fälschen gesprochen wird.
Nach Auffassung des Verfassers durchziehen (nicht nur) die zuvor genannten Ungereimtheiten alle (auch wissenschaftlichen) Disziplinen in zum Teil erschreckender Weise.