Überall, wo Daten
zusammengefasst oder aufgeschlüsselt werden.
Ziel sollte stets sein,
die Daten in übersichtlicher und zusammengefasster Form
darzustellen.
Hier spricht man von
beschreibender oder
deskriptiver Statistik.
Die deskriptive
Statistik macht Aussagen nur über jene Objekte, die in die Erhebung
der entsprechenden Statistik einbezogen worden sind.
Wesentliche Ursachen
dafür, dass im Zusammenhang mit Statistik oft von
Lügen oder Fälschen gesprochen
wird sind:
-
Zusammenfassen von
Daten auf unzulässige Weise (z.B.
Simpson's
Paradoxon)
-
Irreführendes
Darstellen der Ergebnisse,
-
([Un-]bewusstes) Unterschlagen von
Information
Bei der schliessenden
oder
induktiven Statistik dagegen
werden nur bestimmte, zufällig ausgewählte Objekte untersucht.
Aus
den davon gewonnenen Einsichten werden Schlüsse gezogen, die
auf alle (auch nicht untersuchten) Objekte zutreffen sollen, allerdings mit einer
begrenzten Aussagesicherheit.
Legitimiert
wird das durch den Bayes'schen
Wahrscheinlichkeitsbegriff,
den man als "Grad des persönlichen Überzeugtseins"
umschreiben kann.
Fehlendes Wissen
über Aussagesicherheiten, die Anwendung ungeeigneter Methoden und
nicht zuletzt das Verwechseln von Korrelation und Kausalität sind weitere Ursachen
dafür, dass im Zusammenhang mit Statistik oft von
Lügen oder Fälschen gesprochen
wird.
Nach Auffassung des
Verfassers
durchziehen (nicht nur)
die zuvor genannten
Ungereimtheiten alle (auch wissenschaftlichen)
Disziplinen in zum Teil erschreckender Weise.