Zur Hauptseite  ..\

zur Glossarseite    Ohne Frames

 Benford's Law, Benfords Gesetz

 

In folgendem Bild wird Benford's Gesetz visualisiert. Erläuterungen folgen weiter unten.

Die x-Achse ist logarithmisch. Die Auftretenswahrscheinlichkeiten der Anfangsziffern haben sägezahnförmige Verläufe.

Man erkennt, dass das Gesetz erst Sinn macht, wenn das zugrunde liegende Zahlenmaterial deutlich mehr als eine Zehnerpotenz umfasst, und damit ist bereits fraglich, ob dieses Gesetz z.B. für Hausnummern und Alter von Menschen (in Jahren) überhaupt praktisch verwendbar ist.
Die Kurven hören bei n = 32.000 auf, weil dies die maximale Anzahl Punkte ist, die in Excel Datenreihen möglich sind.

Benfords Gesetz anschaulich


Das Benfordsche Gesetz besagt folgendes: Die führenden Ziffern von Zufallszahlen unterliegen folgender Häufigkeitsverteilung: 

Benfords Gesetz 

n ist die jeweilige führende Ziffer, lg bedeutet Logarithmus zur Basis 10.


Das Benfordsche Gesetz ist in der Theorie nicht ganz einfach, weshalb hier nur eine qualitative Erklärung versucht wird.

Ausserdem sind die Anforderungen des Benfordschen Gesetzes an das zugrunde liegende Zahlenmaterial recht hoch:

Letzteres bedeutet nicht, dass es sich um Zufallszahlen handeln muss, im Gegenteil: Nicht die Zahlen selbst sind zufällig (dann wären sie ja gleichverteilt), sondern die Prozesse, durch die sie zustandegekommen sind. Solche Prozesse ergeben immer eine Häufung der Zahlen am unteren Ende des möglichen Wertebereiches.

 

In konkreten Werten sieht das Benfordsche Gesetz so aus: 

Führende Ziffer 1 2 3 4 5 6 7 8 9
relative Häufigkeit [%] 30.1 17.6 12.5 9.7 7.9 6.7 5.8 5.1 4.6

 

Zahlenbeispiele

1.5E+2          6.81E 0         2.223E-3             3E-6 

Letztere Zahl könnte man auch 0.3E-5 schreiben, dann wird aber die führende Ziffer (hier 3) nicht deutlich. 

 

Entscheidend ist, dass 

In der Natur sind logarithmische Skalen der Normalfall. Fast die gesamte menschliche Sinneswahrnehmung funktioniert logarithmisch (Sehen, Hören, Fühlen). 

Das Problem ist lediglich, dass dies nicht unserem gewohnten Zahlenweltbild entspricht.

Da unser Zahlensystem die Basis 10 hat, braucht man sich auch nicht zu wundern, dass der für das Benfordsche Gesetz zutreffende Logarithmus ausgerechnet der Zehnerlogarithmus ist.

Betrachtet man z.B. die Zahlen von 1 bis 1000, dann deckt der Bereich von 100 - 199 einen relativen Grössenbereich von Faktor 199/100~2~ 100% ab, der Bereich von 900 -999 dagegen nur einen Faktor von 999/900 ~ 1.11~11% 

Nach dieser anschaulichen Einfachbetrachtung sollte in "natürlichem" Datenmaterial die 1 als führende Ziffer etwa neunmal häufiger vorkommen als die 9, was nach obenstehender Tabelle zumindest nicht ganz falsch ist (30.1/4.6 =6.5). 

 

Anderer Denkansatz: Wenn man die ganzen Zahlen von 1 bis n hochzählt, und bei n aufhört, dann sind die Anfangsziffern für folgende n gleichverteilt: 9, 99, 999, 9999, usw.

Hört man dagegen bei beliebigem n auf zu zählen, dann ist die 1 nie benachteiligt, die 2 nur selten,.... und die 9 immer.

Nochmalige Betrachtung des Benfordschen Gesetzes: 

Die Lösung der Gleichung x=lg(n) lautet für die Ziffern n=1...9:

Ziffer 1 2 3 4 5 6 7 8 9
x = 0 0.301 0.477 0.602 0.699 0.778 0.845 0.903 0.954

 

Die Wahrscheinlichkeit, mit der die 1 als führende Ziffer auftaucht berechnet man zu 0.301-0 =30.1%

Für die Ziffer 2 ergibt sich 0.477-0.301 = 17.6%

usw.

 

Datenschutzhinweise