Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012...
Transcript of Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012...
1 12345678912345678912345678912
34567891234567891234567891234
56789123456789123456789123456
78912345678912345678912345678
91234567891234567891234567891
23456789123456789123456789123
45678912345678912345678912345
67891234567891234567891234567
89123456789123456789123456789
12345678912345678912345678912
34567891234567891234567891234
56789123456789123456789123456
78912345678912345678912345678
91234567891234567891234567891
23456789123456789123456789123
45678912345678912345678912345
67891234567891234567891234567
89123456789123456789123456789
Bachelor-Thesis
Aufdeckung von Bilanzfälschungen durch
Anwendung des Newcomb-Benford-Gesetzes
Zum Erlangen des akademischen Grades
“Bachelor of Science“
Vorgelegt von: Talha Yilmaz Erstprüfer: Prof. Dr. Ulrich Abel Zweitprüfer: Prof. Dr. Oliver Steinkamp
Technische Hochschule Mittelhessen, Bereich Friedberg Fachbereich Mathematik – Naturwissenschaften – Datenverarbeitung
Fachrichtung Wirtschaftsmathematik, Wintersemester 2011
2
3 Erklärung
Erklärung
Ich – Talha Yilmaz, geb. am 16. September 1986, Wohnhaft in 35576 Wetzlar – erkläre hiermit, dass
die vorliegende Arbeit selbstständig und ohne Benutzung anderer, als der angegebenen Hilfsmittel
angefertigt wurde. Die aus fremden Quellen direkt oder indirekt übernommenen Gedanken sind als
solche kenntlich gemacht.
Die Arbeit wurde nach meiner besten Kenntnis bisher in gleicher oder ähnlicher Form keiner anderen
Prüfungsbehörde vorgelegt und auch noch nicht veröffentlicht.
Friedberg, den 09. Januar 2012 Unterschrift
4 Danksagung
Danksagung
An dieser Stelle möchte ich mich bei all denen bedanken, die mir bei der Erstellung dieser Bachelor-
Thesis geholfen haben.
An erster Stelle bedanke ich mich bei meinem Erstprüfer Prof. Dr. Ulrich Abel, der mir bei allen an-
stehenden Problemen ein sehr guter Ratgeber war.
Desweiteren danke ich auch meinem Zweitprüfer Herrn Prof. Dr. Oliver Steinkamp für sein Engage-
ment und Überreichung sämtlicher Daten, die für die Testverfahren notwendig waren.
Außerdem möchte ich meiner Familie und meinen Freunden danken, die mich während dieser Zeit
unterstützt haben.
Friedberg, im Januar
5 Inhaltsverzeichnis
Inhaltsverzeichnis
Erklärung .......................................................................................................................... 3
Danksagung ...................................................................................................................... 4
Abbildungsverzeichnis ...................................................................................................... 7
Tabellenverzeichnis .......................................................................................................... 8
Abkürzungsverzeichnis ...................................................................................................... 9
Vorwort .......................................................................................................................... 10
1. Einführung .................................................................................................................. 11
1.1 Geschichte ................................................................................................................................... 11
1.2 Benford-Verteilte empirische Daten ........................................................................................... 12
2. Begriffe ....................................................................................................................... 14
3. Herleitung ................................................................................................................... 19
3.1 Verteilung der ersten k Ziffern .................................................................................................... 19
3.2 Verteilung der n-ten Ziffern ........................................................................................................ 21
3.3 Grenzwert ................................................................................................................................... 23
4. Testverfahren ............................................................................................................. 30
4.1 Chi-Quadrat-Anpassungstest ...................................................................................................... 30
4.2 Kolmogoroff-Smirnov-Anpassungstestest .................................................................................. 31
4.3 Z-Test........................................................................................................................................... 33
4.4 Mittlere absolute Abweichung ................................................................................................... 33
4.5 Verzerrungsfaktor-Modell .......................................................................................................... 35
6 Inhaltsverzeichnis
5. Applikationen ............................................................................................................. 37
5.1 Bilanz ........................................................................................................................................... 37
5.1.1 Auswertung Geschäftsjahr ................................................................................................. 38
5.1.1.1 Analyse der ersten Ziffer ........................................................................................ 38
5.1.1.2 Analyse der zweiten Ziffer ...................................................................................... 41
5.1.2 Auswertung Vorjahr ........................................................................................................... 44
5.1.2.1 Analyse der ersten Ziffer ........................................................................................ 44
5.1.2.2 Analyse der zweiten Ziffer ...................................................................................... 46
5.2 Schlusskurse der NYSE ................................................................................................................ 48
5.3 Städte und Gemeinden mit mehr als 500 Einwohnern .............................................................. 50
Schlussfolgerung ............................................................................................................. 54
Literaturverzeichnis ........................................................................................................ 56
Inhaltsverzeichnis
7 Abbildungsverzeichnis
Abbildungsverzeichnis
Abbildung 1: Simon Newcomb .............................................................................................................. 11
Abbildung 2: Ausschnitt aus einer Logarithmentafel ............................................................................ 11
Abbildung 3: Abnutzung einer Logarithmentafel .................................................................................. 11
Abbildung 5: Verteilung der ersten Ziffer.............................................................................................. 12
Abbildung 4: Frank Benford................................................................................................................... 12
Abbildung 6: Mb(x) ................................................................................................................................. 19
Abbildung 7: Verteilung der 1. & 2.Ziffer .............................................................................................. 21
Abbildung 8: Verteilung der 2-ten - 4-ten Ziffer .................................................................................... 23
Abbildung 9: Aufteilung des Intervalls [1,2] .......................................................................................... 24
Abbildung 10: Intervall [1, 10) ............................................................................................................... 26
Abbildung 11: Ausschnitt aus einer Bilanz ............................................................................................ 38
Abbildung 12: Vergleich der ersten Ziffer aus dem Geschäftsjahr mit der Benford-Verteilung ........... 39
Abbildung 13: Vergleich der zweiten Ziffer bzgl. Geschäftsjahr mit der Benford-Verteilung ............... 42
Abbildung 14: Vergleich der ersten Ziffer bzgl. Vorjahr mit der Benford-Verteilung ........................... 44
Abbildung 15: Vergleich der zweiten Ziffer bzgl. Vorjahr mit der Benford-Verteilung ......................... 46
Abbildung 16: Vergleich der Schlusskurse mit der Benford-Verteilung ................................................ 49
Abbildung 17: Vergleich der Städte & Gemeinden mit der Benford-Verteilung................................... 52
8 Tabellenverzeichnis
Tabellenverzeichnis
Tabelle 1: Benford-Verteilte empirische Daten..................................................................................... 13
Tabelle 2: Kritische Werte für den χ2-Anpassungstest .......................................................................... 31
Tabelle 3: Kritische Werte für den KSA ................................................................................................. 32
Tabelle 4: Anpassungsschranken der MAD ........................................................................................... 34
Tabelle 5: Auswertung des Geschäftsjahres bzgl. der ersten Ziffer ...................................................... 39
Tabelle 6: Auswertung des Z-Tests für die erste Ziffer bzgl. des Geschäftsjahres ................................ 40
Tabelle 7: Auswertung des Geschäftsjahres bzgl. der zweiten Ziffer .................................................... 41
Tabelle 8: Auswertung des Z-Tests (α=0,05) für die zweite Ziffer bzgl. des Geschäftsjahres ............... 43
Tabelle 9: Auswertung des Z-Tests (α=0,1) für die zweite Ziffer bzgl. des Geschäftsjahres ................. 43
Tabelle 10: Auswertung des Vorjahres bzgl. der ersten Ziffer .............................................................. 44
Tabelle 11: Auswertung des Z-Tests für die erste Ziffer bzgl. des Vorjahres ........................................ 45
Tabelle 12: Auswertung des Vorjahres bzgl. der zweiten Ziffer ............................................................ 46
Tabelle 13: Auswertung des Z-Tests für die zweite Ziffer bzgl. des Vorjahres ...................................... 47
Tabelle 14: Ausschnitt der Schlusskurse an der NYSE ........................................................................... 48
Tabelle 15: Auswertung der 966 Schlusskurse an der NYSE ................................................................. 48
Tabelle 16: Auswertung des Z-Tests für die Schlusskurse ..................................................................... 50
Tabelle 17: Ausschnitt aus den Städten & Gemeinden im Bundesland mit mehr als 500 Einwohnern 51
Tabelle 18: Auswertung der Städte & Gemeinden im Bundesland mit mehr als 500 Einwohnern ...... 51
Tabelle 19: Auswertung des Z-Tests für die Städte & Gemeinden ....................................................... 52
9 Abkürzungsverzeichnis
Abkürzungsverzeichnis
Abb. - Abbildung
allg. - allgemein
b - Basis
bel. - beliebig
bzgl. - bezüglich
BM - beobachteter Mittelwert
Def. - Definition
DF - Verzerrungsfaktor (Distortion Factor)
d - Ziffer (digit)
d.h. - das heißt
EM - erwarteter Mittelwert
KSA - Kolmogoroff-Smirnov-Anpassungstest
MAD - Mittlere absolute Abweichung
MSE - Mittler quadratische Fehler
- Natürliche Zahlen
NBL - Newcomb-Benford’s Law
NYSE - New York Stock Exchange
Π, π - Pi
- Reelle Zahlen
- Positive reelle Zahlen
sig. - signifikant(e)
Tab. - Tabelle
u.v.m. - und viele(s) mehr
VF - Verteilungsfunktion
χ² - Chi-Quadrat
- Ganze Zahlen
z.B. - zum Beispiel
ZV - Zufallsvariable
10 Vorwort
Vorwort
Die Eurokrise ist aktuell das Thema, welches Alle – Parlament, Börse, Nachrichten – beschäftigt,
sowohl in Deutschland, Europa als auch auf der ganzen Welt.
Griechenland steht mit seiner wirtschaftlichen Situation, im Mittelpunkt dieser Debatte. Alle be-
fürchten, dass Griechenland Insolvenz geht und somit der Euro als einheitliche Währung versagt.
Doch wiederum kämpfen alle dafür, dass dies nicht so kommt.
Nun hat ein Wissenschaftlerteam der Technischen Universität Ilmenau anhand eines Jahrhunderte
alten mathematischen Gesetzes nachgewiesen, dass Griechenland seine Wirtschaftsdaten manipu-
liert hat. Griechenland hat über Jahre hinweg seine Bilanzen gefälscht und ist offenbar nur mit Hilfe
dieser Fälschungen im Jahr 2001 in den Euro-Raum aufgenommen worden. Darüber hinaus hat Grie-
chenland mit gefälschten Zahlen eventuell Strafzahlungen vermieden.
Hierbei handelt es sich um das „Newcomb-Benford-Gesetz“, das stammt aus dem Jahre 1881. An-
hand dieses Gesetzes kann man frühzeitig und ohne großen Aufwand verlässliche Indizien für Zahlen-
fälschungen erkennen.
Jetzt stellt man sich zu Recht die Frage, wie man eine Fälschung aufdecken kann, ohne einen Tipp aus
dem engen Kreis der Fälscher bekommen zu haben.
Die Thesis folgt weitgehend der Darstellung des Buches „Ziffernanalyse“ von Peter N. Posch, dabei
wurden einige Ergebnisse allgemein verständlich verallgemeinert (wie z.B. durch Übergang von der
Dezimalbasis 10 zu einer allgemeinen Basis b) und die Literatur stellenweise vereinfacht.
11 1. Einführung
Abbildung 2: Ausschnitt aus einer Logarithmentafel
1. Einführung
1.1 Geschichte
Das Benfordsche Gesetz oder auch als Newcomb-Benford’s Law (NBL) be-
kannt, wurde 1881 vom dem kanadischen Astronomen und Mathematiker
Simon Newcomb1 entdeckt.
Die Idee hat er im „American Journal of Mathematics“ unter dem Titel „the
law of probability of the occurrence of numbers is such that all mantisse of
their logarithms are equally probable2 “publiziert.
Auf das Phänomen ist Newcomb anhand der Logarithmentafel3 gekommen. Die Logarithmentafeln
erlauben es, die Multiplikation und Division von Zahlen auf die einfachere Addition und Subtraktion
zurückzuführen. Dadurch erleichterte man sich das Rechnen ungemein. Deshalb waren sie zur Zeiten
ohne Taschenrechner und Computer unverzichtbare Begleiter.
Beim Beobachten seiner Logarithmentafel bemerkte Newcomb, dass
die vorderen Seiten weitaus gebrauchter4 waren als die hinteren, denn
die ersten Seiten waren viel schmutziger als die hinteren. Er fragte sich
sofort nach dem Grund und begann der Frage nachzugehen.
1 Quelle: http://www.nndb.com/people/473/000103164/simon-newcomb-1-sized.jpg
2 Vgl. Newcomb (1881)
3 Quelle: http://zahlwort.blogger.de/static/antville/zahlwort/images/logarithmus-2.jpg
4 Quelle: http://www.wdr.de/tv/quarks/sendungsbeitraege/2006/1017/img/kap9_1_.jpg
Abbildung 1: Simon Newcomb
Abbildung 3: Abnutzung einer Logarithmentafel
12 1.2 Benford-Verteilte empirische Daten
Seine Untersuchung lieferte – wenn auch zu Beginn nicht direkt ersichtlich – für die erste Ziffer die
Häufigkeit von
Etwa ein halbes Jahrhundert blieb seine Beobachtung unbeachtet, bis 1938
der amerikanische Elektroingenieur und Physiker Frank Albert Benford5 auf
die gleiche Schlussfolgerung kam.
Benford beschränkte seine Untersuchung nicht nur auf die Logarithmentafel,
sondern untersuchte eine Vielzahl verschiedener Tabellen. Dabei zählte er
insgesamt über 20.000 erste Ziffern und fand die gleiche Häufigkeit wie New-
comb heraus. Die Häufigkeit der ersten signifikanten Ziffer nahm von der Eins mit 30,10% bis hin zu
Neun mit 4,58% ab (siehe Abb. 5).
Er nannte seine Entdeckung „law of anomalous numbers6“, da er eine Gesetzmäßigkeit vermutete,
wobei er auch bemerkte, dass es sich hierbei um eine Verteilung von Ereignissen handelt.
Abbildung 5: Verteilung der ersten Ziffer
1.2 Benford-Verteilte empirische Daten
Wir Menschen verwenden Zahlen in vielen Arten und für viele Dinge, doch viele dieser Zahlen sind
Benford-verteilt.
5 Quelle: http://ssrsbstaff.ednet.ns.ca/jcroft2/benford.jpg
6 Vgl. Benford (1938)
30,10%
17,61%
12,49% 9,69%
7,92% 6,69% 5,80% 5,12% 4,58%
1 2 3 4 5 6 7 8 9
Erste Ziffer
Abbildung 4: Frank Benford
13 1.2 Benford-Verteilte empirische Daten
Das beste Beispiel sind die Hausnummern. Jede Straße besteht aus mind. einem Haus und somit ist
die Eins immer vergeben, aber nicht jede Straße ist so lang, dass die Hausnummer 90 existiert. Des-
halb ist die Wahrscheinlichkeit, dass die Eins auftritt, größer als, dass die Neun auftritt. Deshalb sind
auch die Hausnummern Benford-verteilt.
Weitere Beispiele sind:
die Einwohnerzahlen der 3141 US-Bezirke
die Größe der Dateien auf einer beliebigen Computerfestplatte
die Anzahl der Aktien, die täglich an der New Yorker Börse umgesetzt werden
u.v.m. (siehe Tabelle 1)
Titel 1 2 3 4 5 6 7 8 9 Anzahl
Rivers, length 31,0 16,4 10,7 11,3 7,2 8,6 5,5 4,2 5,1 335
Population 33,9 20,4 14,2 8,1 7,2 6,2 4,1 3,7 2,2 3259
Constants 41,3 14,4 4,8 8,6 10,6 5,8 1,0 2,9 10,6 104
Newspapers 30,0 18,0 12,0 10,0 8,0 6,0 6,0 5,0 5,0 100
Specific heat 24,0 18,4 16,2 14,6 10,6 4,1 3,2 4,8 4,1 1389
Pressure 29,6 18,3 12,8 9,8 8,3 6,4 5,7 4,4 4,7 703
H.P. lost 30,0 18,4 11,9 10,8 8,1 7,0 5,1 5,1 3,6 690
Molecular weight 26,7 25,2 15,4 10,8 6,7 5,1 4,1 2,8 3,2 1800
Drainage 27,1 23,9 13,8 12,6 8,2 5,0 5,0 2,5 1,9 159
Atomic weight 47,2 18,7 5,5 4,4 6,6 4,4 3,3 4,4 5,5 91
n-1, n1/2 25,7 20,3 9,7 6,8 6,6 6,8 7,2 8,0 8,9 5000
Design 26,8 14,8 14,3 7,5 8,3 8,4 7,0 7,3 5,6 560
Reader´s Digest 33,4 18,5 12,4 7,5 7,1 6,5 5,5 4,9 4,2 308
Cost data 32,4 18,8 10,1 10,1 9,8 5,5 4,7 5,5 3,1 741
X-ray volts 27,9 17,5 14,4 9,0 8,1 7,4 5,1 5,8 4,8 707
Am. League 32,7 17,6 12,6 9,8 7,4 6,4 4,9 5,6 3,0 1458
Blackbody 31,0 17,3 14,1 8,7 6,6 7,0 5,2 4,7 5,4 1165
Adresses 28,9 19,2 12,6 8,8 8,5 6,4 5,6 5,0 5,0 342
n1, n2, …, n! 25,3 16,0 12,0 10,0 8,5 8,8 6,8 7,1 5,5 900
Death rate 27,0 18,6 15,7 9,4 6,7 6,5 7,2 4,8 4,1 418
Fibonacci 30,1 17,6 12,5 9,7 7,9 6,7 5,8 5,1 4,6 2000000
Erste Ziffer (%)
Tabelle 1: Benford-Verteilte empirische Daten7
Man kann nicht bei allen Daten die Benford-Verteilung erwarten, wie z.B. ISBN-, Kreditkarten- oder
Bankleitzahlen, da diese Ziffern aus codierten Ziffernfolgen bestehen. Außerdem gilt auch, dass die
Datensätze nicht von oben und unten beschränkt sein dürfen.
7 Vgl. J. Torres (2007, L20)
14 2. Begriffe
2. Begriffe
Bevor wir mit der mathematischen Untersuchung beginnen, müssen wir vorerst einmal einige Defini-
tionen festlegen respektive Merkmale definieren.
Definition 2.18: Mb bezeichnet die Mantissenfunktion zur Basis b
wobei für ein bestimmtes gilt.
Bemerkung: ohne Subskript bezeichnet .
Beispiel: M(π M 0 3 4 5 M 3 4 5 M 3 4 5 π
Jetzt fragt man zu Recht, ob dieses Gesetz nur für positive Zahlen gilt, da in einer Bilanz auch negati-
ve Zahlen auftauchen können. Natürlich gilt das Gesetz auch für negative Zahlen. Die Beschränkung
auf kann nach dem amerikanischen Mathematiker Theodor Hill aufgehoben werden.
Definition 2.29: Man setzt 0 0 und .
Definition 2.310: Die Funktion der signifikanten Ziffern zur Basis b ist gegeben durch
0 3
wobei
die eindeutig bestimmte Folge bezeichnet, für die
3 ,
0 3 für und
gilt.
Bemerkung: ohne Superskript bezeichnet
.
Beispiel: D3 π D3 0 3 4 5 D3 3 4 5 D3 3 4 5 D3 3 4 5 4
8 Nach Peter N. Posch (Ziffernanalyse, S. 6)
9 Nach T. Hill (1995, S. 889)
10 Nach T. Hill (1995, S. 890)
15 2. Begriffe
Definition 2.411: Sofern nicht anders angegeben, bezeichnet fortan X eine beliebige Zufallsvariable
(ZV), Mb diejenige ZV, welche die Mantisse zur Basis b repräsentiert, das ist
Mb := Mb(X ) und
die ZV, welche die k -te signifikante (sig.) Ziffer von X zur Ba-
sis b angibt, das ist
.
Korollar 2.512: (i) Die logarithmische (diskrete) Dichtefunktion für die erste Ziffer ist gegeben durch:
(ii) Die zugehörige Verteilungsfunktion (VF) lautet entsprechend:
Die VF ist sehr leicht nachvollziehbar respektive herleitbar:
3
4
3
Nach Theodor Hill sind die Positionen der sig. Ziffern einer Zahl gleich den Positionen der Ziffern ihrer
Mantisse. Deshalb kann für die Verteilung der Ziffern eine stetige VF der Mantisse angeben werden.
Dadurch kann man eine Verallgemeinerung der Newcomb-Benford-Vermutung, auf die Verteilung
der weiteren Ziffern aufstellen.
Lemma 2.613: Logarithmische Mantissenverteilung
Die logarithmische VF der Mantissen zur Basis b wird für alle gegeben
durch
11
Nach Peter N. Posch (Ziffernanalyse, S. 7) 12
Nach Jamain (2001, S. 13) 13
Nach Jamain (2001, S. 14) & Peter N. Posch (Ziffernanalyse, S. 53)
(1)
(2)
(3)
16 2. Begriffe
Beweis: Wir beweisen (3) zunächst den speziellen Fall , d.h. dass die Mantisse nur aus einer
sig. Ziffer besteht. Dann gilt nämlich
0
Nun beweisen wir den allg. Fall, dass die Matisse aus mehreren sig. Ziffern besteht, dann gilt
für
, wobei 0 für gilt.
(Nach der Anwendung von Korollar 2.5 (ii))
17 2. Begriffe
(Analog zu der Herleitung von Definition 2.5 (ii))
18 2. Begriffe
Bemerkung: Diese Herleitung beweist (3) auch dann, wenn in der Mantisse nach der führen-
den Stelle eine oder mehrere Nullen vorkommen.
Gilt 0 für ein , so ist
0
und für den zugehörigen Summanden gilt
0
0
19 3. Herleitung
3. Herleitung
3.1 Verteilung der ersten k Ziffern
Die Verteilung der ersten k Ziffern ist gegeben durch den nachfolgenden Satz von T. Hill14.
Satz 3.1: Die logarithmische Verteilung der ersten k Ziffern (k є ) ist gegeben durch
Dabei gilt für die Ziffern 0 für , wobei 0 gilt, da führende Nullen an
der ersten Stelle ignoriert werden.
Bsp.: Wir betrachten die ersten drei Ziffern von π.
d1=3, d2=1, d3=4
Mb(x) := x •, • • •••
d1 d2 d3 …
3,14 ≤ Mb(x) < 3,15
3
≤ Mb(x) < 3
3b0+1b-1+4b-2 ≤ Mb(x) < 3b0+1b-1+(4+1)b-2
Allgemein gilt:
14
Nach T. Hill (1995, S. 890) & Peter N. Posch (Ziffernanalyse, S. 7)
Abbildung 6: Mb(x)
(4)
20 3.1 Verteilung der ersten k Ziffern
Beweis zu Satz 3.115: Hier gilt auch wie im Beweis von Lemma 2.6
. Außerdem wissen
wir auch aus dem Beispiel , dass im allg. für die Mantisse
gilt.
(nach Lemma 2.6 gilt)
Für die erste Ziffer, d.h. , bekommen wir die Vermutung von Newcomb,
15
Vgl. Jamain (2001, S. 16)
21 3.2 Verteilung der n-ten Ziffern
Die Verteilung für die ersten beiden Ziffer, d.h. von 10 bis 99, kann man anhand der nächsten Abbil-
dung sehen.
Abbildung 7: Verteilung der 1. & 2.Ziffer
3.2 Verteilung der n-ten Ziffern
Nun fragt man sich, ob das Gesetz nur für die ersten Ziffer gilt. Das Gesetz kann man natürlich für die
n-ten Ziffern verallgemeinern.
0,000%
0,500%
1,000%
1,500%
2,000%
2,500%
3,000%
3,500%
4,000%
4,500%
10 20 30 40 50 60 70 80 90
Verteilung der 1. & 2. Ziffer
22 3.2 Verteilung der n-ten Ziffern
Satz 3.2: Nach Feldstein16 gilt für die n-ten sig. Ziffer folgende logarithmische Verteilung
Die Verteilung der n-ten Ziffern gilt für ,wobei und 0 ist.
Da uns die Originalarbeit von Feldstein nicht zugänglich ist, geben wir nachstehend einen eigenen
Beweis.
Beweis: Wir können nun anhand von Satzes 3.1 die Verteilung der n-ten Ziffern wie folgt herleiten.
(laufen jeweils von „0“ bis „b-1“ bzw. d1 von „1“ bis „b-1“)
(alle Zahlen von „bn-2“ bis „bn-2-1+(b-1)bn-2 = bn-2-1+bn-1- bn-1 = bn-1-1“ )
Die Berechnung der Wahrscheinlichkeit ab der zweiten Ziffer läuft etwas komplizierter ab. Die Sum-
me läuft für jede einzelne Ziffer, d.h. von Null bis Neun und von Eins bis Neun. Natürlich unter der
Voraussetzung das für die Basis 10 gilt. Für die dritte Ziffer geht die Summe von 10 bis 99 und für die
vierte Ziffer von 100 bis 999.
Deshalb braucht man für die Berechnung ein Programm, wie z.B. ein EXCEL-Sheet.
16
Nach Feldstein (1976) & Peter N. Posch (Ziffernanalyse, S. 8)
(5)
23 3.3 Grenzwert
Für 0 und 3 4 sieht die Verteilung wie folgt aus:
Abbildung 8: Verteilung der 2-ten - 4-ten Ziffer
Anhand der Abbildung kann man sehr gut erkennen, dass bereits an der vierten Stelle der Mantisse
sämtliche Ziffern annähernd gleich wahrscheinlich sind.
Im nächsten Abschnitt zeigen wir, dass das Gesetz an der n-ten Stelle der Mantisse, für n gegen un-
endlich gleichverteilt ist.
3.3 Grenzwert
Die benfordsche Ziffernverteilung konvergiert, wie schon anhand der Abb.8 vermutet hat, gegen die
Gleichverteilung.
Satz 3.3: Für jede feste Basis und sei eine beliebige ZV mit stetiger Dichte dann gilt,
Anhand dieses Resultates beschränkt man sich bei der praktische Anwendung, wie z.B. Bilanzfäl-
schung, auf die ersten vier Stellen einer Zahl im Dezimalsystem.
0,00%
2,00%
4,00%
6,00%
8,00%
10,00%
12,00%
14,00%
0 1 2 3 4 5 6 7 8 9
Verteilung der 2-ten - 4-ten Ziffer
2-te Ziffer 3-te Ziffer 4-te Ziffer
(6)
24 3.3 Grenzwert
Beweis: Wir betrachten zunächst einen speziellen Fall und aufbauend auf den speziellen Fall verall-
gemeinern wir den Grenzwert.
Spezial Fall17
Wir betrachten zunächst speziell das Binärsystem mit und dem Intervall . Sei
nun eine ZV mit stetiger Dichte die außerhalb des Intervalls verschwindet.
Nach binärer Notation wird das Intervall
von , wie folgt notiert
.
Daraus folgt, dass unter allen reellen Zah-
len aus dem Intervall , die mit einer
binären Null an zweiter Stelle zwischen
1.00 und 1.10 liegen. Im dezimal System
liegen sie zwischen 1 und 1.5.
Eine binäre Null an dritter Stelle liegt zum
einem zwischen 1.00 und 1.01 und zum anderem zwischen 1.10 und 1.11, im dezimalen
liegt sie zwischen 1 und 1.25 und zwischen 1.5 und 1.75. Anhand der Abb. 9 kann man dies
nochmal grafisch besser veranschaulichen.
Für Null gilt allgemein
und für Eins
.
Wir betrachten uns die ganze Sache an der Stelle , dann gilt für die Ziffer Null:
0
Für die Ziffer Eins gilt analog:
17
Vgl. Peter N. Posch (Ziffernanalyse, S. 57 ff)
Abbildung 9: Aufteilung des Intervalls [1,2]
25 3.3 Grenzwert
Trivialerweise gilt:
0
Wir zeigen:
0
0
Denn:
0
Aus der Stetigkeit von auf dem abgeschlossenem Intervall folgt die gleichmäßige
Stetigkeit auf diesem Intervall. D.h. 0 dann 0 derart, dass für alle
gilt: .
Wählen wir so groß, dass
gilt, dann folgt
für .
Daher gilt für :
0
0
Da beliebig klein werden kann, folgt daraus die obige Behauptung, dass die Differenz
gegen Null strebt.
26 3.3 Grenzwert
Desweiteren gilt:
0 0
Allgemeiner Fall
Im allgemeinem Fall ist das Intervall
. Außerdem spielt auch die
Eins an erster Stelle wie oben, z.B.
, keine Rolle
mehr. Da die erste Stelle die Werte
von Eins bis Neun annehmen kann.
Für sieht die Aufteilung wie in Abb. 10 aus. Für 3 geht die Aufteilung über
und für 4 über
.
Allgemein gilt:
Für eine beliebige Ziffer gilt:
Abbildung 10: Intervall [1, 10)
27 3.3 Grenzwert
Analog gilt für eine Ziffer :
Trivial gilt:
Ferner gilt auch:
0
Denn:
Aus der Stetigkeit von auf dem abgeschlossenen Interval l folgt die gleichmäßige
Stetigkeit auf diesem Intervall. D.h. 0 dann 0 derart, dass für alle
gilt: .
Wählen wir so groß, dass
gilt, dann folgt
für .
Daher gilt für :
28 3.3 Grenzwert
Daraus folgt,
0
da
beliebig klein werden kann.
Wir wissen,
0
0
0 0
3
3
3 4
3
4
0 0
+ …
0
Daraus folgt,
Also gilt,
Außerdem wissen wir auch
0
29 3.3 Grenzwert
Bemerkung: Der Grenzwert gilt für positive ZV. Aber aufgrund der Def. 2.2, , gilt
der Grenzwert auch für alle reellen ZV.
Wir bezeichnen mit die negativen ZV und mit die positiven ZV.
Unter der Bedingung, dass stetig und 0 ist gilt,
Da,
0
0
wobei und 0 strebt.
Deshalb gilt,
Außerdem setzen wir,
Dadurch erhalten wir,
30 4. Testverfahren
4. Testverfahren
Damit wir überhaupt einen Datensatz auf die Benford-Verteilung respektive eine Bilanz auf Fälschung
überprüfen können, brauchen wir gewisse Testverfahren. Anhand dieser Testverfahren können wir
anschließend Rücksclüsse auf Manipulation hinsichtlich der Bilanz treffen.
4.1 Chi-Quadrat-Anpassungstest
Der χ²-Anpassungstest18 überprüft den Grad der Übereinstimmung zwischen einer Stichprobe vom
Umfang mit einer unbekannten empirischen VF und einer voll spezialisierten VF . In unserem
Fall ist die Benford-Verteilung.
Die Voraussetzung für die Anwendung des χ²-Anpassungstests ist die Unabhängigkeit der einzelnen
Beobachtungen. Deshalb ist es zu empfehlen, vor der Anwendung Überlegungen hinsichtlich der
Abhängigkeit der beobachteten Stichprobe anzustellen respektive gezielte Tests auf Unabhängigkeit,
z.B. χ²-Unabhängigkeitstest, durchzuführen. Außerdem ist der χ²-Anpassungstest für „große“ Stich-
proben geeignet.
Die Nullhypothese und Alternativhypothese lauten
Hierbei ist zu beachten, dass die Nullhypothese für alle gilt und die Alternativhypothese für
mind. ein gilt.
Der Ablauf des χ²-Anpassungstest sieht wie folgt aus:
1.Schritt: Wir bestimmen die Prüfgröße
18
Vgl. Peter N. Posch (Ziffernanalyse S. 30) & J. Hartung (Statistik S. 182)
(7)
31 4.2 Kolmogoroff-Smirnov-Anpassungstestest
dabei handelt es sich bei um die beobachtete relative Häufigkeit der Ziffer und bei
analog um die erwartete Benford-Häufigkeit.
Außerdem ist zu beachten, dass die Summe ab der zweiten Ziffer von 0 bis 9 läuft.
2.Schritt: Wir bestimmen den kritischen Wert
der χ²-Verteilung mit Freiheitsgraden und einem Signifikanzniveau von .
0,1 0,05 0,01
1. χ82 13,36156614 15,50731306 20,09023503
2. χ92 14,68365662 16,91897762 21,66599433
3. χ892 106,46889944 112,02198593 122,94220699
4. χ8992 953,75165366 969,86483294 1000,57472714
Testdα
Tabelle 2: Kritische Werte für den χ2-Anpassungstest
3.Schritt: Wenn nun
,
wird die Nullhypothese zum Signifikanzniveau verworfen. In der Praxis heißt dies, dass
die Bilanz mit einer Sicherheit von 1-α gefälscht ist.
4.2 Kolmogoroff-Smirnov-Anpassungstestest
Der Kolmogoroff-Smirnov-Anpassungstest19 (KSA) überprüft, wie der χ²-Anpassungstest, ob die unbe-
kannte VF der betrachteten Grundgesamtheit mit einer hypothetischen VF übereinstimmt. In
unserem Fall handelt es sich bei um die Benford-Verteilung. Der KSA ist für „kleine“ Stichproben-
umfänge besser geeignet als der χ²-Anpassungstest.
19
Vgl. Peter N. Posch (Ziffernanalyse S. 31) & J. Hartung (Statistik S. 183)
32 4.2 Kolmogoroff-Smirnov-Anpassungstestest
Die Voraussetzung für die Anwendung des KSA ist die Stetigkeit von . Da die Benford-Verteilung
diskret ist, ist der Test daher konservativ und von geringer Güte.
Die Nullhypothese und Alternativhypothese lauten wieder
Der Ablauf des KSA sieht wie folgt aus:
1.Schritt: Wir bestimmen unsere Prüfgröße
wobei
und die empirische Verteilungsfunktion der Beobachtungen bezeichnet.
2.Schritt: Den kritische Wert
können wir anhand der unteren Tabelle bestimmen.
n 5 8 10 20 40 >40
dn;0,80 1,00 1,01 1,02 1,04 1,05 1,08
dn;0,90 1,14 1,16 1,17 1,19 1,20 1,23
dn;0,95 1,26 1,28 1,29 1,31 1,33 1,36
dn;0,98 1,40 1,43 1,45 1,47 1,49 1,52
dn;0,99 1,50 1,53 1,55 1,57 1,59 1,63
Tabelle 3: Kritische Werte20
für den KSA
Ist das vorliegende nicht in der Tabelle zu finden, so nimmt man das nächst größere.
20
Vgl. J. Hartung (Statistik, S. 184)
(8)
33 4.3 Z-Test
3.Schritt: Die Nullhypothese wird zum Signifikanzniveau verworfen, wenn
gilt. In der Praxis heißt dies, wie schon im χ²-Anpassungstest, dass die Bilanz mit einer Si-
cherheit von 1-α gefälscht ist.
4.3 Z-Test
Der Z-Tests21, auch Gauß-Test genannt, berechnet die Signifikanz der Abweichung
für jede
Ziffer .
Überschreitet der Z-Wert22 6 bei einem Signifikanzniveau von 0 05 oder 64bei einem von
0 0 , dann liegt eine sig. Abweichung mit einer Sicherheit von 1-α vor.
Bemerkung: Der Term
wird nur dann subtrahiert, wenn
ist.
4.4 Mittlere absolute Abweichung
Die Mittlere absolute Abweichung23, kurz MAD (engl. Mean Absolute Deviation), kann neben den χ²-
und KS-Anpassungstests als ein weiteres Gütekriterium genutzt werden. MAD gibt an, wie weit im
Mittel die beobachtete Stichprobe von der theoretischen Häufigkeit, d.h. von der Benford-Verteilung,
abweicht.
21
Vgl. Peter N. Posch (Ziffernanalyse, S. 31) 22
Vgl. Durtschi (2004, S. 25 ff) 23
Vgl. Peter N. Posch (Ziffernanalyse, S. 32)
(9)
34 4.4 Mittlere absolute Abweichung
Wir berechnen
Das Problem beim MAD liegt dabei, dass kein kritischer Wert existiert. Doch Nigrini hat durch prakti-
sche Testerfahrungen eine Anpassungsschranke für die erste, zweite und für die ersten beiden Zif-
fern festgelegt (siehe Tab.4).
Anpassungsgüte
Erste Ziffern eng
akzeptabel
marginal akzeptabel
keine Übereinstimmung
Zweite Ziffern eng
akzeptabel
marginal akzeptabel
keine Übereinstimmung
Erste beide Ziffern eng
akzeptabel
marginal akzeptabel
keine Übereinstimmung
[0 ; 0,008)
MAD
[0 ; 0,004)
[0,004 ; 0,008)
[0,008 ; 0,012)
≥ 0,012
≥ 0,0018
[0,008 ; 0,0012)
[0,0012 ; 0,016)
≥ 0,016
[0 ; 0,0006)
[0,0006 ; 0,0012)
[0,0012 ; 0,0018)
Tabelle 4: Anpassungsschranken24
der MAD
Bemerkung: Der mittlere quadratische Fehler,
kurz MSE (engl. Mean Squared Error), hat den Vorteil gegenüber dem MDA, dass auf-
grund der Quadrierung größere Abweichungen stärker gewichtet werden als kleinere.
Doch für den MSE existiert weder ein kritischer Wert noch Richtlinien wie beim MDA.
Deshalb können wir die Prüfgröße von MSE nicht einordnen.
24
Vgl. Peter N. Posch (Ziffernanalyse, S. 84)
(10)
(11)
35 4.5 Verzerrungsfaktor-Modell
4.5 Verzerrungsfaktor-Modell
Das Verzerrungsfaktor-Modell25 ist ein Prüfverfahren, was von Nigrini entwickelt wurde. Heute soll
nach Angaben von Nigrini, dieses Prüfverfahren von den fünf größten Wirtschaftsprüfungsunter-
nehmen sowie von einigen Steuerbehörden zur Aufspürung manipulierter respektive gefälschter
Bilanzen und Steuererklärungen genutzt werden.
Dieses Prüfverfahren basiert im wesentlichen auf dem Vergleich zweier Mittelwerte. Zum einem des
beobachteten Mittelwertes (BM) und zum anderen des erwartenden Mittelwertes (EM). Nigrini ist
der Behauptung, dass die Fälschung nur innerhalb der gleichen Größenordnung des wahren Eintrages
stattfindet und ferner nimmt er an, dass der Manipulationsgrad über alle Größenordnung hinweg
gleich hoch ist. Deshalb werden alle Einträge respektive Werte im Stichprobenumfang, die kleiner als
10 sind herausgestrichen. Deshalb werden die Werte in den Bereich 0 00 skaliert.
Doch in diesem Punkt vertritt Posch nicht die Meinung von Nigrini. Da es ist nicht ersichtlich, warum
eine Restriktion der Werte auf den Bereich 0 00 in Kauf genommen werden soll. Durch die Be-
rechnung des Mittelwertes entsteht schon ein Informationsverlust.
Posch erweitert das Modell und berechnet den Mittelwert der Mantisse eines Datensatzes und ver-
gleicht diesen mit dem Referenzmittelwert im Bereich 0 00 .
Die Berechnung des Verzerrungsfaktors läuft folgendermaßen ab,
1.Schritt: Wir bestimmen BM
2.Schritt: Wir bestimmen EM
25
Vgl. Nigrini (1996, S. 75 ff) & Peter N. Posch (Ziffernanalyse, S. 36 & 86 ff)
(13)
(12)
36 4.5 Verzerrungsfaktor-Modell
3.Schritt: Wir berechnen den Verzerrungsfaktor
4.Schritt: Wenn nun der ermittelte Verzerrungsfaktor im folgenden Wertebereich liegt,
so liegt dann keine Manipulation respektive Fälschung in der Bilanz vor.
Bemerkung: Nach Nigrini26 kann man bei mehr als 500 Stichproben, für EM ungefähr von einem Wert
von 3,904 ausgehen.
26
Vgl. Nigrini (1996, S. 76)
(14)
37 5. Applikationen
5. Applikationen
Das wir das Gesetz zur Lösung praktischer Probleme anwenden können, haben wir zum einem dem
US-amerikanischen Mathematiker Theodor Hill und zum anderem dem US-Wissenschaftler Mark
Nigrini zu verdanken.
Die Überprüfung der Daten auf die Benford-Verteilung erfolgt in zwei Schritten:
Zuerst ermitteln wir aus unserem Stichprobenumfang die relative Häufigkeit, für die
erste Ziffer von Eins bis Neun und ab der zweiten Ziffer von Null bis Neun.
Anschließend überprüfen wir anhand der Anpassungstests die Übereinstimmung mit
der Benford-Verteilung.
Außerdem ist zu beachten, dass bei der Untersuchung nur die ersten vier Ziffern für die Untersu-
chung relevant sind.
5.1 Bilanz
Wir untersuchen nun eine Bilanz auf die Richtigkeit. Dabei betrachten wir uns eine Bilanz aus dem
Dienstleistungsbereich. Es handelt sich hierbei um ein Taxiunternehmen.
Bei der Untersuchung ist zu beachten, dass die Position wie z.B. der Jahresüberschuss nicht mitge-
zählt werden. Der Jahresüberschuss respektive Jahresfehlschuss wird über die Gewinn- und Verlust-
rechnung ermittelt, d.h. dass die Gewinn- und Verlustrechnung separat mit in die Untersuchung ein-
fließt. Des Weiteren ist auch zu beachten, dass die Summen auch nicht mit in den Stichprobenum-
fang einfließen, da die zum einen abhängig sind und zum anderen nicht manipulierbar sind.
Die Bilanz wird sowohl für das Geschäftsjahr als auch für das Vorjahr separat untersucht. Das Ge-
schäftsjahr besteht aus 108 Einträgen und das Vorjahr besteht aus 92 Einträgen.
An dieser Stelle kann man bereits sehen, dass bei der Durchführung der Testverfahren der Stichpro-
benumfang Einfluss hat. Der χ²-Anpassungstest ist für größere Stichproben geeignet und der KSA ist
von geringer Güte, deshalb hängt die Entscheidung von den anderen drei Testverfahren ab.
38 5.1.1 Auswertung Geschäftsjahr
Abbildung 11: Ausschnitt aus einer Bilanz
5.1.1 Auswertung Geschäftsjahr
5.1.1.1 Analyse der ersten Ziffer
Wir betrachten uns vorerst das Geschäftsjahr hinsichtlich der ersten Ziffer. Anhand der Tab.5 können
wir die relativen und absoluten Häufigkeit im Vergleich zu der Benford-Verteilung sehen.
39 5.1.1.1 Analyse der ersten Ziffer
Relative Absolute
1 30,10% 27,78% 30
2 17,61% 9,26% 10
3 12,49% 12,96% 14
4 9,69% 14,81% 16
5 7,92% 9,26% 10
6 6,69% 8,33% 9
7 5,80% 8,33% 9
8 5,12% 4,63% 5
9 4,58% 4,63% 5
Erste Ziffer
d BenfordHäufigkeit
Tabelle 5: Auswertung des Geschäftsjahres bzgl. der ersten Ziffer
Anhand der unteren Abbildung kann man sehr gut erkennen, dass die Daten sich der Benford-
Verteilung auf gewisse Weise anpasst.
Abbildung 12: Vergleich der ersten Ziffer aus dem Geschäftsjahr mit der Benford-Verteilung
Man kann aber auch sehr gut erkennen, dass die Ziffern zwei und vier sig. sich von der Benford-
Verteilung unterscheiden.
Bei der Durchführung der Testverfahren erhalten wir hinsichtlich der ersten Ziffer folgende Resultate:
1. χ²-Anpassungstest
Beim χ²-Anpassungstest liegt die Prüfgröße bei 9,340. Bei einem Signifikanzniveau von 0,05 und
einem Freiheitsgrad von 8 liegt der kritische Wert bei 15,507.
Daraus können wir schlussfolgern, dass die Daten d.h. die Bilanz mit einer 95%iger Sicherheit
0,000%
5,000%
10,000%
15,000%
20,000%
25,000%
30,000%
35,000%
1 2 3 4 5 6 7 8 9
Erste Ziffer
Relative
Benford
40 5.1.1.1 Analyse der ersten Ziffer
Benford-verteilt sind, da die Prüfgröße kleiner als der kritische Wert ist. Dies heißt wiederum, dass
die Bilanz nicht gefälscht sein kann.
2. Kolmogoroff-Smirnov-Anpassungstest
Beim KSA erhalten wir für die Prüfgröße einen Wert von 9,917. Bei einem Signifikanzniveau von
0,05 liegt der kritische Wert bei 1,36.
Folglich sind die Daten, also die Bilanz mit einer 95%iger Sicherheit nicht Benford-verteilt, da die
Prüfgröße größer als der kritische Wert ist. Also ist nach dem KSA die Bilanz gefälscht, wobei man
aber nicht vergessen sollte, dass der KSA von geringer Güte ist.
3. Z-Test
Nach dem Z-Test liegt eine sig. Abweichung bei der Ziffer Zwei vor (siehe Tab.6). Dies gilt sowohl
bei einem Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.
d 1 2 3 4 5 6 7 8 9
Zd 0,422 2,152 0,002 1,637 0,338 0,489 0,921 0,011 0,027
Tabelle 6: Auswertung des Z-Tests für die erste Ziffer bzgl. des Geschäftsjahres
Bemerkenswert ist der Wert bei der Ziffer vier, da der Wert gleich dem kritischen Wert ist, ist sie
noch akzeptabel.
4. Mittlere Absolute Abweichung
Für unsere Stichprobe erhalten wir eine MAD von 0,0248. Nach Nigrinis Anpassungsschranken
liegt dieser Wert über 0,012 und somit liegt keine Übereinstimmung vor. Daraus folgt, dass die Bi-
lanz manipuliert ist.
5. Verzerrungsfaktor-Modell
Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,778 und für den erwarten-
den Mittelwert 3,867. Folglich ergibt sich als Prüfgröße -0,02316, da dieser Wert innerhalb des
Wertebereiches liegt, ist demzufolge die Bilanz nicht gefälscht.
Nun stellt sich die Frage, ob die Bilanz gefälscht ist oder nicht. Wie schon bemerkt wurde sind die
ersten beiden Testverfahren – χ²-Anpassungstest und KSA – nicht in der Entscheidung zu berücksich-
tigen. Nachdem Verzerrungsfaktor-Modell liegt in der Bilanz keine Manipulation vor, aber nach MAD
liegt wiederum eine Manipulation in der Bilanz vor.
41 5.1.1.2 Analyse der zweiten Ziffer
Nach Angaben von Nigrini, wird das Verzerrungsfaktor-Modell von den fünf größten Wirtschaftsprü-
fungsunternehmen sowie von einigen Steuerbehörden zur Aufspürung manipulierter Bilanzen ver-
wendet, deshalb würde ich in dieser Situation davon ausgehen, dass die Bilanz hinsichtlich des Ge-
schäftsjahres nicht gefälscht ist.
In Folge der nicht einstimmigen Testverfahren hinsichtlich der ersten Ziffer, betrachten wir uns im
nächsten Kapitel die Analyse der zweiten Ziffer hinsichtlich einer Manipulation.
5.1.1.2 Analyse der zweiten Ziffer
Nun betrachten wir uns das Geschäftsjahr hinsichtlich der zweiten Ziffer. Die Auswertung zeigt uns
die nachfolgende Tabelle.
Relative Absolute
0 11,97% 18,52% 20
1 11,39% 8,33% 9
2 10,88% 10,19% 11
3 10,43% 11,11% 12
4 10,03% 8,33% 9
5 9,67% 7,41% 8
6 9,34% 13,89% 15
7 9,04% 9,26% 10
8 8,76% 6,48% 7
9 8,50% 6,48% 7
Zweite Ziffer
d BenfordHäufigkeit
Tabelle 7: Auswertung des Geschäftsjahres bzgl. der zweiten Ziffer
Die zweite Ziffer sieht auf dem ersten Blick, im Vergleich zu der ersten Ziffer nicht besser aus (siehe
Abb.13).
42 5.1.1.2 Analyse der zweiten Ziffer
Abbildung 13: Vergleich der zweiten Ziffer bzgl. Geschäftsjahr mit der Benford-Verteilung
Anhand der oberen Abbildung kann man sehr gut erkennen, dass die Daten nicht mehr einstimmig
mit Benford-Verteilung sind.
Die Auswertung der Testverfahren bringt uns hinsichtlich der zweiten Ziffer folgende Resultate:
1. χ²-Anpassungstest
Die Prüfgröße liegt bei der zweiten Ziffer bei 9,293. Bei einem Signifikanzniveau von 0,05 und ei-
nem Freiheitsgrad von 9 liegt der kritische Wert bei 16,919.
Wir können mit einer 95%iger Sicherheit davon ausgehen, dass die Daten nicht Benford-verteilt
sind, da die Prüfgröße kleiner als der kritische Wert ist. Daher ist also die Bilanz nicht gefälscht.
2. Kolmogoroff-Smirnov-Anpassungstest
Beim KSA liegt die Prüfgröße bei 9,509. Bei einem Signifikanzniveau von 0,05, liegt der kritische
Wert bei 1,36.
Folglich sind die Daten, d.h. die Bilanz mit einer 95%iger Sicherheit nicht Benford-verteilt, da die
Prüfgröße größer als der kritische Wert ist. Also ist nach dem KSA die Bilanz gefälscht, wobei man
aber nicht vergessen sollte, dass der KSA von geringer Güte ist.
3. Z-Test
Nach dem Z-Test liegt keine sig. Abweichung , bei einem Signifikanzniveau von 0,05 vor (siehe
Tab.8).
0,000%
5,000%
10,000%
15,000%
20,000%
1 2 3 4 5 6 7 8 9 10
Zweite Ziffer
Relative
Benford
43 5.1.1.2 Analyse der zweiten Ziffer
d 0 1 2 3 4 5 6 7 8 9
Zd 1,949 0,848 0,078 0,073 0,427 0,632 1,460 0,081 0,666 0,580
Tabelle 8: Auswertung des Z-Tests (α=0,05) für die zweite Ziffer bzgl. des Geschäftsjahres
Bei einem Signifikanzniveau von 0,1 liegt eine sig. Abweichung bei der Ziffer Null vor (siehe
Tab.9).
d 0 1 2 3 4 5 6 7 8 9
Zd 1,949 0,848 0,078 0,073 0,427 0,632 1,460 0,081 0,666 0,580
Tabelle 9: Auswertung des Z-Tests (α=0,1) für die zweite Ziffer bzgl. des Geschäftsjahres
Auch im Hinblick auf die zweite Ziffer liegen keine großen sig. Abweichungen vor, bis auf die Null
bei einem Signifikanzniveau von 0,1.
4. Mittlere Absolute Abweichung
Für die Stichprobe der zweiten Ziffer erhalten wir eine MAD von 0,0240. Nach Nigrinis Anpas-
sungsschranken liegt dieser Wert über 0,016 und somit liegt wieder keine Übereinstimmung vor.
Daraus folgt, dass die Bilanz manipuliert ist.
5. Verzerrungsfaktor-Modell
Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,907 und für den erwarten-
den Mittelwert 3,867. Folglich ergibt sich als Prüfgröße -0,01041, da dieser Wert innerhalb des
Wertebereiches liegt, ist daher die Bilanz nicht gefälscht.
Auch nach der Analyse der zweiten Ziffer, kommen wir zum Schluss, dass die Bilanz im Geschäftsjahr
nicht manipuliert wurde.
Im nächsten Kapitel analysieren wir das Vorjahr hinsichtlich einer Manipulation, dabei untersuchen
wir sowohl die erste als auch die zweite Ziffer separat.
44 5.1.2 Auswertung Vorjahr
5.1.2 Auswertung Vorjahr
5.1.2.1 Analyse der ersten Ziffer
Die Auswertung des Vorjahres erfolgt hier auch in zwei Abschnitten, wir analysieren zuerst die erste
Ziffer und anschließend die zweite Ziffer.
Die Auswertung hinsichtlich der Ersten Ziffer zeigt uns folgende Tabelle,
Relative Absolute
1 30,10% 32,61% 30
2 17,61% 18,48% 17
3 12,49% 15,22% 14
4 9,69% 4,35% 4
5 7,92% 7,61% 7
6 6,69% 4,35% 4
7 5,80% 9,78% 9
8 5,12% 3,26% 3
9 4,58% 4,35% 4
Erste Ziffer
d BenfordHäufigkeit
Tabelle 10: Auswertung des Vorjahres bzgl. der ersten Ziffer
Das Vorjahr sieht im Vergleich zum Geschäftsjahr etwas besser aus (siehe Abb.14).
Abbildung 14: Vergleich der ersten Ziffer bzgl. Vorjahr mit der Benford-Verteilung
0,000%
5,000%
10,000%
15,000%
20,000%
25,000%
30,000%
35,000%
1 2 3 4 5 6 7 8 9
Erste Ziffer
Relative
Benford
45 5.1.2.1 Analyse der ersten Ziffer
Bei der Durchführung der Testverfahren erhalten wir hinsichtlich der ersten Ziffer im Vorjahr folgen-
de Resultate:
1. χ²-Anpassungstest
Beim χ²-Anpassungstest erhalten wir für die Prüfgröße einen Wert von 7,402. Bei einem
Signifikanzniveau von 0,05 und einem Freiheitsgrad von 8 liegt der kritische Wert bei 15,507.
Daraus können wir schlussfolgern, dass die Daten d.h. die Bilanz mit einer 95%iger Sicherheit
Benford-verteilt sind, da die Prüfgröße kleiner als der kritische Wert ist. Auch für das Vorjahr heißt
es, dass die Bilanz im Vorjahr nicht gefälscht war.
2. Kolmogoroff-Smirnov-Anpassungstest
Beim KSA erhalten wir für die Prüfgröße einen Wert von 9,153. Bei einem Signifikanzniveau von
0,05 liegt der kritische Wert bei 1,36.
Folglich sind die Daten, d.h. die Bilanz mit einer 95%iger Sicherheit nicht Benford-verteilt, da die
Prüfgröße größer als der kritische Wert ist. Also war die Bilanz schon im Vorjahr gefälscht. Aber
sollte auch hier nicht vergessen, dass der KSA von geringer Güte ist.
3. Z-Test
Nach dem Z-Test liegen keine sig. Abweichungen vor (siehe Tab.11). Dies gilt sowohl bei einem
Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.
d 1 2 3 4 5 6 7 8 9
Zd 0,41 0,082 0,632 1,556 0,11 0,692 1,412 0,571 0,105
Tabelle 11: Auswertung des Z-Tests für die erste Ziffer bzgl. des Vorjahres
4. Mittlere Absolute Abweichung
Für das Vorjahr erhalten wir eine MAD von 0,0224. Nach Nigrinis Anpassungsschranken liegt die-
ser Wert über 0,012 und somit liegt keine Übereinstimmung vor. Daraus folgt, dass die Bilanz im
Vorjahr manipuliert ist.
5. Verzerrungsfaktor-Modell
Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,304 und für den erwarten-
den Mittelwert 3,860. Folglich ergibt sich als Prüfgröße -0,1439, da dieser Wert innerhalb des
Wertebereiches liegt, ist die Bilanz nicht gefälscht.
46 5.1.2.2 Analyse der zweiten Ziffer
Auch hier stellt sich wieder die Frage, ob die Bilanz gefälscht ist oder nicht. Aber für das Vorjahr kön-
nen wir mit einer größeren Wahrscheinlichkeit davon ausgehen, dass die Bilanz nicht gefälscht ist, da
unter anderem auch keine sig. Abweichungen vorliegen. Wir betrachten uns aber dennoch wie im
Geschäftsjahr die zweite Ziffer hinsichtlich einer Manipulation.
5.1.2.2 Analyse der zweiten Ziffer
Die Auswertung im Hinblick auf die zweite Ziffer zeigt uns die nachfolgende Tabelle.
Relative Absolute
0 11,97% 17,39% 16
1 11,39% 10,87% 10
2 10,88% 9,78% 9
3 10,43% 7,61% 7
4 10,03% 7,61% 7
5 9,67% 9,78% 9
6 9,34% 7,61% 7
7 9,04% 7,61% 7
8 8,76% 13,04% 12
9 8,50% 8,70% 8
Zweite Ziffer
d BenfordHäufigkeit
Tabelle 12: Auswertung des Vorjahres bzgl. der zweiten Ziffer
Anhand der unteren Abbildung kann man grafisch sehr gut erkennen, inwieweit sich die Daten der
Benford-Verteilung angepasst haben.
Abbildung 15: Vergleich der zweiten Ziffer bzgl. Vorjahr mit der Benford-Verteilung
0,000%
5,000%
10,000%
15,000%
20,000%
1 2 3 4 5 6 7 8 9 10
Zweite Ziffer
Relative
Benford
47 5.1.2.2 Analyse der zweiten Ziffer
Anhand der Testverfahren erhalten wir hinsichtlich der zweiten Ziffer im Vorjahr folgende Resultate:
1. χ²-Anpassungstest
Die Prüfgröße liegt bei der zweiten Ziffer bei 6,064. Bei einem Signifikanzniveau von 0,05 und ei-
nem Freiheitsgrad von 9 liegt der kritische Wert bei 16,919.
Wir können mit einer 95%iger Sicherheit davon ausgehen, dass die Daten nicht Benford-verteilt
sind, da die Prüfgröße kleiner als der kritische Wert ist. Daher ist also die Bilanz nicht gefälscht.
2. Kolmogoroff-Smirnov-Anpassungstest
Beim KSA liegt die Prüfgröße bei 8,776. Bei einem Signifikanzniveau von 0,05, liegt der kritische
Wert bei 1,36.
Folglich sind die Daten, also die Bilanz mit einer 95%iger Sicherheit nicht Benford-verteilt, da die
Prüfgröße größer als der kritische Wert ist. Also ist nach dem KSA die Bilanz gefälscht, wobei man
aber nicht vergessen sollte, dass der KSA von geringer Güte ist.
3. Z-Test
Nach dem Z-Test liegt keine sig. Abweichung vor (siehe Tab.13). Dies gilt sowohl bei einem
Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.
d 0 1 2 3 4 5 6 7 8 9
Zd 1,442 0,157 0,171 0,716 0,600 0,037 0,391 0,295 1,270 0,067
Tabelle 13: Auswertung des Z-Tests für die zweite Ziffer bzgl. des Vorjahres
4. Mittlere Absolute Abweichung
Für die Stichprobe der zweiten Ziffer erhalten wir eine MAD von 0,02004. Nach Nigrinis Anpas-
sungsschranken liegt dieser Wert über 0,016 und somit liegt wieder keine Übereinstimmung vor.
Daraus folgt, dass die Bilanz manipuliert ist.
5. Verzerrungsfaktor-Modell
Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 4,141 und für den erwarten-
den Mittelwert 3,860. Folglich ergibt sich als Prüfgröße -0,07289, da dieser Wert innerhalb des
Wertebereiches liegt, ist daher die Bilanz nicht gefälscht.
Allgemein können wir über die Bilanz einen Fazit ziehen und sagen, dass die Bilanz mit einer großen
Sicherheit, sowohl im Geschäftsjahr als auch im Vorjahr, nicht manipuliert wurde.
48 5.2 Schlusskurse der NYSE
5.2 Schlusskurse der NYSE
Nun untersuchen wir von 966 Unternehmen die Schlusskurse (Stand: 3. August 2011, 22:00 Uhr) an
der New York Stock Exchange (NYSE), auf die Benford-Verteilung.
Die NYSE ist die größte Wertpapierbörse der Welt und gehört zur der NYSE Euronext-Gruppe. Die
NYSE ist auch eher unter dem Namen „Wall Street“ bekannt27.
Anhand der Tab. 14 sehen einen Ausschnitt der Schlusskurse von den 966 Unternehmen.
Symbol Name Letzter Kurs
A Agilent Technologies, Inc. Comm 39,20
AA Alcoa Inc. Common Stock 14,26
AAN Aaron's, Inc. Common Stock 24,46
AAP Advance Auto Parts Inc Advance 54,35
ABB ABB Ltd Common Stock 23,13
ABC AmerisourceBergen Corporation 38,16
ABT Abbott Laboratories Common Stoc 50,29
ABV-C Companhia de Bebidas das Americ 25,05
ABX Barrick Gold Corporation Common 49,12
ACC American Campus Communities Inc 36,13 Tabelle 14: Ausschnitt der Schlusskurse an der NYSE
Die Auswertung der 966 Schlusskurse hinsichtlich der Ersten Ziffer, zeigt uns die untere Tabelle
Häufigkeit
d Absolute Relative Benford
1 171 17,70% 30,10%
2 180 18,63% 17,61%
3 174 18,01% 12,49%
4 126 13,04% 9,69%
5 115 11,90% 7,92%
6 76 7,87% 6,69%
7 57 5,90% 5,80%
8 41 4,24% 5,12%
9 26 2,69% 4,58% Tabelle 15: Auswertung der 966 Schlusskurse an der NYSE
27
Quelle: http://de.wikipedia.org/wiki/New_York_Stock_Exchange
49 5.2 Schlusskurse der NYSE
Wenn wir nun die relative Häufigkeit mit der Benford-Verteilung vergleichen (siehe Abb.16),
Abbildung 16: Vergleich der Schlusskurse mit der Benford-Verteilung
können wir sehr gut erkennen, dass die Schlusskurse nicht Benford-verteilt sind. Sig. Abweichungen
sind ersichtlich bei den Ziffern eins, drei, vier, fünf und neun.
Doch nun stellt sich die Frage was uns die einzelnen Testverfahren für ein Resultat liefern. Des Weite-
ren ist jetzt auch der χ²-Anpassungstest für die Stichprobe aussagekräftiger, da die Stichprobe aus
966 Daten besteht.
1. χ²-Anpassungstest
Beim χ²-Anpassungstest erhalten wir für die Prüfgröße einen Wert von 114,995. Bei einem
Signifikanzniveau von 0,05 und einem Freiheitsgrad von 8 liegt der kritische Wert bei 15,507.
Daraus können wir schlussfolgern, wie schon vermutet, dass die Schlusskurse mit einer 95%iger
Sicherheit nicht Benford-verteilt sind, da die Prüfgröße größer als der kritische Wert ist.
2. Kolmogoroff-Smirnov-Anpassungstest
Beim KSA erhalten wir für die Prüfgröße einen Wert von 30,361. Bei einem Signifikanzniveau von
0,05 liegt der kritische Wert bei 1,36.
Daraus können wir schlussfolgern, dass die Schlusskurse mit einer 95%iger Sicherheit nicht
Benford-verteilt sind, da die Prüfgröße größer als der kritische Wert ist.
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
1 2 3 4 5 6 7 8 9
Schlusskurse
Relative
Benford
50 5.3 Städte und Gemeinden mit mehr als 500 Einwohnern
3. Z-Test
Nach dem Z-Test liegen einige sig. Abweichungen vor (siehe Tab. 16). Dies gilt sowohl bei einem
Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.
d 1 2 3 4 5 6 7 8 9
Zd 8,368 0,794 5,139 3,468 4,529 1,394 0,066 1,156 2,726
Tabelle 16: Auswertung des Z-Tests für die Schlusskurse
Die sig. Abweichungen liegen bei den schon vermuteten Ziffern vor.
4. Abstandsmaß
Beim Abstandsmaß erhalten wir für unsere Stichprobe eine MAD von 0,03368. Nach Nigrinis An-
passungsschranken liegt der Wert über 0,012 und somit liegt auch nach diesem Testverfahren
keine Übereinstimmung vor.
5. Verzerrungsfaktor-Modell
Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,674 und für den erwarten-
den Mittelwert 3,904. Folglich ergibt sich als Prüfgröße -0,0589, da dieser Wert innerhalb des
Wertebereiches liegt, sind die Einträge, also die Schlusskurse Benford-verteilt.
Nun stellt sich die Frage, ob die Schlusskurse Benford-verteilt sind oder nicht. Vier der fünf Testver-
fahren sind der Meinung, dass die Daten nicht Benford-verteilt sind. Wenn wir aber davon ausgehen,
dass unsere Stichprobe aus 966 Daten besteht und somit der χ²-Anpassungstest aussagekräftiger ist,
können wir schlussfolgern, dass die Schlusskurse mit einer 95%iger Sicherheit nicht Benford-verteilt
sind. Des Weiteren ist auch in diesem Beispiel die Analyse der zweiten Ziffer nicht mehr nötig, da die
Testverfahren bis auf einen alle einstimmig waren.
5.3 Städte und Gemeinden mit mehr als 500 Einwohnern
Als letztes Anwendungsbeispiel betrachten wir uns alle Städte und Gemeinden in der Bundesrepublik
Deutschland mit mehr als 500 Einwohnern.
Dabei handelt es sich um 9422 Städte und Gemeinden.
51 5.3 Städte und Gemeinden mit mehr als 500 Einwohnern
Bundesland Name Status Kreis Einwohner
Baden-Württemberg Aach Stadt Konstanz 2.178 Baden-Württemberg Aalen
Große Kreis-stadt Ostalbkreis 66.196
Baden-Württemberg Abstatt Gemeinde Heilbronn 4.507 Baden-Württemberg Abtsgmünd Gemeinde Ostalbkreis 7.421 Baden-Württemberg Achberg Gemeinde Ravensburg 1.657 Baden-Württemberg Achern
Große Kreis-stadt Ortenaukreis 24.947
Baden-Württemberg Achstetten Gemeinde Biberach 4.130
Tabelle 17: Ausschnitt aus den Städten & Gemeinden im Bundesland mit mehr als 500 Einwohnern28
Die Auswertung der 9422 Daten hinsichtlich der ersten Ziffer, zeigt uns die nachfolgende Tabelle.
Häufigkeit
d Absolute Relative Benford
1 2994 31,78% 30,10%
2 1435 15,23% 17,61%
3 883 9,37% 12,49%
4 586 6,22% 9,69%
5 934 9,91% 7,92%
6 809 8,59% 6,69%
7 676 7,17% 5,80%
8 575 6,10% 5,12%
9 530 5,63% 4,58% Tabelle 18: Auswertung der Städte & Gemeinden im Bundesland mit mehr als 500 Einwohnern
Anhand der Abb.17, kann man jetzt schon sehr gut erkennen, dass die Stichprobe nicht Benford-
verteilt ist.
28
Quelle: http://www.citypopulation.de/Deutschland_d.html
52 5.3 Städte und Gemeinden mit mehr als 500 Einwohnern
Abbildung 17: Vergleich der Städte & Gemeinden mit der Benford-Verteilung
Doch was liefern uns jetzt die einzelnen Testverfahren für ein Ergebnis. Außerdem ist jetzt auch hier
der χ²-Anpassungstest für die Stichprobe noch aussagekräftiger, da die Stichprobe aus 9422 Daten
besteht.
1. χ²-Anpassungstest
Beim χ²-Anpassungstest erhalten wir für die Prüfgröße einen Wert von 398,815. Bei einem
Signifikanzniveau von 0,05 und einem Freiheitsgrad von 8 liegt der kritische Wert bei 15,507.
Daraus können wir schlussfolgern, dass die Daten mit einer 95%iger Sicherheit nicht Benford-
verteilt sind, da die Prüfgröße größer als der kritische Wert ist.
2. Kolmogoroff-Smirnov-Anpassungstest
Beim KSA erhalten wir für die Prüfgröße einen Wert von 92,625. Bei einem Signifikanzniveau von
0,05 liegt der kritische Wert bei 1,36.
Folglich sind die Daten nach KSA mit einer 95%iger Sicherheit nicht Benford-verteilt, da die Prüf-
größe größer als der kritische Wert ist.
3. Z-Test
Nach dem Z-Test liegen sig. Abweichungen bei allen Ziffern vor (siehe Tab. 19). Dies gilt sowohl
sowohl bei einem Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.
d 1 2 3 4 5 6 7 8 9
Zd 3,530 6,049 9,150 11,373 7,152 7,326 5,690 4,327 4,850
Tabelle 19: Auswertung des Z-Tests für die Städte & Gemeinden
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
1 2 3 4 5 6 7 8 9
Städte & Gemeinden
Relative
Benford
53 5.3 Städte und Gemeinden mit mehr als 500 Einwohnern
4. Abstandsmaß
Beim Abstandsmaß erhalten wir für unsere Stichprobe eine MAD von 0,01994. Nach Nigrinis An-
passungsschranken liegt der Wert über 0,012 und somit liegt keine Übereinstimmung vor.
5. Verzerrungsfaktor-Modell
Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,660 und für den erwarten-
den Mittelwert 3,908. Folglich ergibt sich als Prüfgröße -0,06354. Dieser Wert liegt innerhalb des
Wertebereiches und somit sind die Daten Benford-verteilt.
Wir können mit einer 95%iger Wahrscheinlichkeit davon ausgehen, dass die Städte und Gemeinden
mit mehr als 500 Einwohnern nicht Benford-verteilt sind. Wobei das Verzerrungsfaktor-Modell der
Behauptung ist, dass die Daten Benford-verteilt sind. Aber sowohl in diesem als auch beim vorheri-
gen Beispiel ist das Verzerrungsfaktor-Modell nicht sehr geeignet. Der Grund dafür ist, weil das Ver-
zerrungsfaktor-Modell speziell für die Überprüfung der Bilanz entwickelt wurde.
54 Schlussfolgerung
Schlussfolgerung
Das Phänomen Newcomb-Benford-Law, haben wir sowohl mathematisch nachgewiesen als auch
anhand von Daten, wie z.B. die Überprüfung einer Bilanz auf Manipulation, angewendet.
Das Gesetz spielt in vielen Gebieten unseren Lebens eine wichtige Rolle. Wie z.B. dass die
Hausnummern
Länge der Flüsse
Einwohnerzahlen der 3141 US-Bezirke
u.v.m. Benford-verteilt sind.
Ein weiteres Beispiel ist, mit dem sich heutzutage jeder Mensch beschäftigt, die Recherche in Such-
maschinen (z.B. Google). Wie oft wird die zweite Seite oder die Seite neuen bei einer Suche aufgeru-
fen? Folglich sind die Aufrufe bei Suchmaschinen nach Benford-verteilt.
Das faszinierende am Gesetz ist überhaupt, wie auch das Ziel dieser Arbeit ist, die Überprüfung von
Bilanzen auf Manipulation. Anhand des Beispiels aus Kapitel fünf haben wir sehen können, wie die
Vorgehensweise dabei ist.
Die untersuchte Bilanz wurde nach der Durchführung der Testverfahren als nicht gefälscht bewertet.
Dabei muss man aber beachten, dass der Stichprobenumfang nicht sehr groß war und dadurch Test-
verfahren wie der χ²-Anpassungstest in seiner Anwendung eingeschränkt sind.
Bei der Überprüfung einer Bilanz auf Manipulation sollte man folgendes nicht falsch interpretieren.
Falls nach der Analyse, die Bilanz als nicht gefälscht bewertet wird, wie in unserem Beispiel, heißt
dies nicht automatisch, dass das Unternehmen als profitabel eingestuft wird.
Des Weiteren konnten wir aber auch sehen, dass die Schlusskurse an der NYSE und die Städte und
Gemeinden im Bundesland mit mehr als 500 Einwohner nicht Benford-verteilt sind. Da die Stichpro-
benumfänge hier recht groß waren, im Vergleich zum vorherigem Beispiel, war die Entscheidung
umso einfacher.
Das Gesetz findet nicht nur in der Wirtschaft seine Anwendung, sondern auch z.B. in der Wissen-
schaft oder Wettspiele u.v.m.
Ein Beispiel für die Wettspiele ist das Lottospiel. Wenn man nun sich jetzt fragt, ob sich anhand des
Gesetzes im Lottospiel die Gewinnchance erhöht? Die Antwort lautet natürlich nein! Der Gewinn
55 Schlussfolgerung
erhöht sich aber, wenn er denn überhaupt eintritt . Wenn wir davon ausgehen, dass die meisten
Leute unbewusst kleine Zahlen als führende Ziffer präferieren, dann sollte man beim Tippen selbst
diese Zahlen meiden, damit beim Gewinn die Gewinnsumme mit weniger Mitgewinnern teilen zu
müssen.
Anhand der Beispiele konnte man aber auch sehen, dass das Gesetz in seiner Anwendung hinsichtlich
der Testverfahren noch nicht ausgereift ist. D.h. dass es noch kein spezielles Testverfahren aus-
schließlich für die Benford-Verteilung gibt.
Der χ²-Anpassungstest ist nur für große Stichproben geeignet und des Weiteren müssen die Daten
unabhängig sein.
Der KSA ist für kleine Stichproben besser geeignet. Da die Voraussetzung jedoch für die Anwendung
die Stetigkeit von ist, ist der KSA konservativ und von geringer Güte.
Der Z-Test ist im Vergleich zu den vorherigen Testverfahren besser, aber anhand von ihm kann nicht
das gesamte Paket bewerten.
Die letzten zwei Testverfahren – MAD und Verzerrungsfaktor-Modell – beruhen auf Beobachtungen
von Nigrini. Das Verzerrungsfaktor-Modell macht im Vergleich zum MAD einen besseren Eindruck.
Aus diesem Grund sind die Testverfahren hinsichtlich des Newcomb-Benford-Gesetzes noch nicht
ausgereift und deshalb noch ausbau fähig.
Was in dieser Arbeit nicht untersucht respektive nicht nachgewiesen wurde und außerdem in der
Regel auch in vielen anderen Arbeiten vernachlässigt wird, ist der Beweis hinsichtlich des Logarith-
mus. D.h. warum lautet es überhaupt
und nicht vielleicht
?
56 Literaturverzeichnis
Literaturverzeichnis
Benford 1938 BENFORD, Frank: The Law of anomalous Numbers. In: Proceedings of the American
Philosphical Society 78 (1938), S. 551-572
Brähler 2011 BRÄHLER, G. ; BENSMANN, M. ; JAKOBI, H.R.: Das Benfordsche Gesetz und seine An-
wendbarkeit bei der digitalen Prüfung von Fahrtenbüchern. proWiWi e.V. Ilmenau, 2011
Buck u. a. 1993 Buck, B. ; Merchant, A.C. ; Perez, S.M.: An illustration of Benford’s first digit law
using alpha decay half lives. In: European Journal of Physics 14 (1993), S. 59–63
De Ceuster u. a. 1998 DE CEUSTER, Marc J. ; DHAENE, Geert ; SCHATTEMAN,Tom: On the hypothe-
sis of psychological barriers in stock markets and Benford’s Law. In: Journal of Empirical Finance 5
(1998), S. 263–279
Diaconis 1977 DIACONIS, Persi: The Distribution of leading Digits and uniform Distribution Mod 1.
In: The Annals of Probability 5 (1977), Nr. 1, S. 72–81
Durtschi u.a. 2004 DURTSCHI, Cindy ; HILLISON, William ; PACINI, Carl: The Effective Use of Ben-
ford’s Law to Assist in Detecting Fraud in Accounting Data. In: Journal of Forensic Accounting 5
(2004), S. 17-34
Feldstein 1976 FELDSTEIN, Alan ; GOODMAN, Richard: Convergence Estimates for the Distributions
of Trailing Digits. In: Journal of the Association for Computing Machinery 23 (1976), April, S. 287–297
Goto 1992 GOTO, Kazuo: Some examples of Benford Sequences. In: Math. Journal Okayama Univ.
34 (1992), S. 225–232
Gottwald und Nicol 2002 GOTTWALD, Georg A. ; NICOL, Matthew: On the nature of Benford’s
Law. In: Physica A 303 (2002), S. 387–396
Hartung u.a. 2009 HARTUNG, J ; ELPELT, B ; KLÖSENER, K.H.: Statistik Lehr- und Handbuch der
angewandten Statistik. 15., überarbeitete und wesentliche erweiterte Auflage. Oldenbourg Mün-
chen, 2009
57 Literaturverzeichnis
Hill 1995 HILL, Theodore P.: Base-Invariance Implies Benford’s Law. In: Proceedings of the American
Mathematical Society 123 (1995), S. 887–895
Hill 1996 HILL, Theodore P.: A Statistical Derivation of the Significant-Digit Law. In: Statistical
Science 10 (1996), Nr. 4, S. 354–363
Hill 1999 HILL, Theodore P.: The difficulty of faking data. In: Chance 26 (1999),S. 8–13
Hoyle u. a. 2002 HOYLE, David C. ; RATTRAY, Magnus ; JUPP, Ray ; BRASS, Andrew: Making sense of
microarray data distributions. In: Bioinformatics 18 (2002), Nr. 4, S. 576–584
Jamain 2001 JAMAIN, Adrien: Benford’s Law. 2001. Unpublished Dissertation Report, Department
of Mathematics, Imperial College, London.
Kenneth 2011 KENNETH, A. Ross: Benford’s Law, A Growth Industry. In: The Mathematical Associa-
tion of America Monthly 118 (2011), S. 574-583
Ley und Varian 1994 LEY, E. ; VARIAN, H.R.: Are there Psychological Barriers in the Dow-Jones In-
dex? In: Applied Financial Economics 4 (1994), S. 217–224
Newcomb 1881 NEWCOMB Simon: Note on the Frequency of Use of the Different Digits in Natural
Numbers. In: American Journal of Mathematics 4 (1881), S. 39-40
Nigrini 1996 NIGRINI, Mark J.: A taxpayer compliance application of Benford’s law. In: Journal of
the American Taxation Association 18 (1996), S. 72–91
Pinkham 1961 PINKHAM, Roger S.: On the distribution of first significant digits. In: Annals of
Mathematical Statistics 32 (1961), S. 1223–1230
Posch 2010 POSCH N. Peter: Ziffernanalyse. 2.Auflage, Europäische Wirtschaft München, 2010
Schatte 1988b SCHATTE, Peter: On the Almost Sure Convergence of Floating-Point Mantissas and
Benford’s Law. In: Mathematische Nachrichten 135 (1988), S. 79–83
58 Literaturverzeichnis
Schatte 1989 SCHATTE, Peter: On Measures of Uniformly Distributed Sequences and Benford’s Law.
In: Monatshefte Mathematik 107 (1989), S. 245–256
Schatte 1998 SCHATTE, Peter: On Benford´s Law to Variable Base. In: Statistics & Probability Let-
ters 37 (1998), S. 391–397
Torres u.a. 2007 TORRES, J. ; FERNÀNDEZ, S. ; GAMERO, A. ; SOLA, A.: How do numbers begin?
(The first digit law). In: European Journal of Physics 28 (2007), S.17-25
Weyl 1916 WEYL, Hermann: Über die Gleichverteilung von Zahlen modulo Eins. In: Mathematische
Annalen 77 (1916), S. 313–352