Ausschlaggebend für die Entdeckung von Benford's Law waren Logarithmentafeln, die auf den vorderen Seiten stärker abgegriffen waren, als auf den hinteren Seiten - so, als hätten sich die Benutzer bevorzugt für die niedrigen Zahlen interessiert.
Werfen wir einen Blick in eine Tageszeitung, treffen wir auf Zahlen aller Art: Benzinpreise, Einkommen von Familien, Unfallstatistiken, Hochwasserstände, Einwohnerzahlen von Städten usw. Soll nun die Wahrscheinlichkeit, dass eine beliebig herausgegriffene Zahl mit einer Eins beginnt, geschätzt werden, so erhält man meist 1/9 als Antwort. Die meisten Leute gehen also von einer Gleichverteilung der Anfangsziffern aus (wir wollen von führenden Nullen absehen).
Doch diese Annahme ist falsch. Analysiert man beispielsweise die Anfangsziffern von Bevölkerungsdichten, Atomgewichten, Flusslängen oder ähnlichen Größen1, stellt man fest: Die Eins als Anfangsziffer liegt immer vorn! In etwa 1/3 aller Fälle fängt die Zahl mit einer Eins an, nur in etwa 1/22 der Fälle mit einer Neun!
Wir wollen nun Benford's Law anhand der Größenverteilung von Dateien überprüfen.
Folgen Sie symbolischen Links nicht, um Endlosschleifen zu vermeiden (konkret: lstat() statt stat()). Reagieren Sie auch robust auf Fehlschläge beim Aufruf der Bibliotheksfunktionen. Zur Kontrolle können Sie für jede gefundene Datei eine Zeile mit zugehörigen Informationen ausgeben.
Die Ausgabe könnte wie folgt aussehen:
Weitere Hintergründe zu Benford's Law, oder wie das Gesetz zur Überprüfung von Steuererklärungen herangezogen werden kann, beschreibt der Artikel ,,Die Welt vom Planeten Zob`` von Jörg Albrecht:
http://www.mathematik.uni-karlsruhe.de/seite/presse/de#Zob
Viel Erfolg!