Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012...

58
12345678912345678912345678912 34567891234567891234567891234 56789123456789123456789123456 78912345678912345678912345678 91234567891234567891234567891 23456789123456789123456789123 45678912345678912345678912345 67891234567891234567891234567 89123456789123456789123456789 12345678912345678912345678912 34567891234567891234567891234 56789123456789123456789123456 78912345678912345678912345678 91234567891234567891234567891 23456789123456789123456789123 45678912345678912345678912345 67891234567891234567891234567 89123456789123456789123456789 Bachelor-Thesis Aufdeckung von Bilanzfälschungen durch Anwendung des Newcomb-Benford-Gesetzes Zum Erlangen des akademischen Grades “Bachelor of Science“ Vorgelegt von: Talha Yilmaz Erstprüfer: Prof. Dr. Ulrich Abel Zweitprüfer: Prof. Dr. Oliver Steinkamp Technische Hochschule Mittelhessen, Bereich Friedberg Fachbereich Mathematik Naturwissenschaften Datenverarbeitung Fachrichtung Wirtschaftsmathematik, Wintersemester 2011

Transcript of Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012...

Page 1: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

1 12345678912345678912345678912

34567891234567891234567891234

56789123456789123456789123456

78912345678912345678912345678

91234567891234567891234567891

23456789123456789123456789123

45678912345678912345678912345

67891234567891234567891234567

89123456789123456789123456789

12345678912345678912345678912

34567891234567891234567891234

56789123456789123456789123456

78912345678912345678912345678

91234567891234567891234567891

23456789123456789123456789123

45678912345678912345678912345

67891234567891234567891234567

89123456789123456789123456789

Bachelor-Thesis

Aufdeckung von Bilanzfälschungen durch

Anwendung des Newcomb-Benford-Gesetzes

Zum Erlangen des akademischen Grades

“Bachelor of Science“

Vorgelegt von: Talha Yilmaz Erstprüfer: Prof. Dr. Ulrich Abel Zweitprüfer: Prof. Dr. Oliver Steinkamp

Technische Hochschule Mittelhessen, Bereich Friedberg Fachbereich Mathematik – Naturwissenschaften – Datenverarbeitung

Fachrichtung Wirtschaftsmathematik, Wintersemester 2011

Page 2: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

2

Page 3: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

3 Erklärung

Erklärung

Ich – Talha Yilmaz, geb. am 16. September 1986, Wohnhaft in 35576 Wetzlar – erkläre hiermit, dass

die vorliegende Arbeit selbstständig und ohne Benutzung anderer, als der angegebenen Hilfsmittel

angefertigt wurde. Die aus fremden Quellen direkt oder indirekt übernommenen Gedanken sind als

solche kenntlich gemacht.

Die Arbeit wurde nach meiner besten Kenntnis bisher in gleicher oder ähnlicher Form keiner anderen

Prüfungsbehörde vorgelegt und auch noch nicht veröffentlicht.

Friedberg, den 09. Januar 2012 Unterschrift

Page 4: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

4 Danksagung

Danksagung

An dieser Stelle möchte ich mich bei all denen bedanken, die mir bei der Erstellung dieser Bachelor-

Thesis geholfen haben.

An erster Stelle bedanke ich mich bei meinem Erstprüfer Prof. Dr. Ulrich Abel, der mir bei allen an-

stehenden Problemen ein sehr guter Ratgeber war.

Desweiteren danke ich auch meinem Zweitprüfer Herrn Prof. Dr. Oliver Steinkamp für sein Engage-

ment und Überreichung sämtlicher Daten, die für die Testverfahren notwendig waren.

Außerdem möchte ich meiner Familie und meinen Freunden danken, die mich während dieser Zeit

unterstützt haben.

Friedberg, im Januar

Page 5: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

5 Inhaltsverzeichnis

Inhaltsverzeichnis

Erklärung .......................................................................................................................... 3

Danksagung ...................................................................................................................... 4

Abbildungsverzeichnis ...................................................................................................... 7

Tabellenverzeichnis .......................................................................................................... 8

Abkürzungsverzeichnis ...................................................................................................... 9

Vorwort .......................................................................................................................... 10

1. Einführung .................................................................................................................. 11

1.1 Geschichte ................................................................................................................................... 11

1.2 Benford-Verteilte empirische Daten ........................................................................................... 12

2. Begriffe ....................................................................................................................... 14

3. Herleitung ................................................................................................................... 19

3.1 Verteilung der ersten k Ziffern .................................................................................................... 19

3.2 Verteilung der n-ten Ziffern ........................................................................................................ 21

3.3 Grenzwert ................................................................................................................................... 23

4. Testverfahren ............................................................................................................. 30

4.1 Chi-Quadrat-Anpassungstest ...................................................................................................... 30

4.2 Kolmogoroff-Smirnov-Anpassungstestest .................................................................................. 31

4.3 Z-Test........................................................................................................................................... 33

4.4 Mittlere absolute Abweichung ................................................................................................... 33

4.5 Verzerrungsfaktor-Modell .......................................................................................................... 35

Page 6: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

6 Inhaltsverzeichnis

5. Applikationen ............................................................................................................. 37

5.1 Bilanz ........................................................................................................................................... 37

5.1.1 Auswertung Geschäftsjahr ................................................................................................. 38

5.1.1.1 Analyse der ersten Ziffer ........................................................................................ 38

5.1.1.2 Analyse der zweiten Ziffer ...................................................................................... 41

5.1.2 Auswertung Vorjahr ........................................................................................................... 44

5.1.2.1 Analyse der ersten Ziffer ........................................................................................ 44

5.1.2.2 Analyse der zweiten Ziffer ...................................................................................... 46

5.2 Schlusskurse der NYSE ................................................................................................................ 48

5.3 Städte und Gemeinden mit mehr als 500 Einwohnern .............................................................. 50

Schlussfolgerung ............................................................................................................. 54

Literaturverzeichnis ........................................................................................................ 56

Inhaltsverzeichnis

Page 7: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

7 Abbildungsverzeichnis

Abbildungsverzeichnis

Abbildung 1: Simon Newcomb .............................................................................................................. 11

Abbildung 2: Ausschnitt aus einer Logarithmentafel ............................................................................ 11

Abbildung 3: Abnutzung einer Logarithmentafel .................................................................................. 11

Abbildung 5: Verteilung der ersten Ziffer.............................................................................................. 12

Abbildung 4: Frank Benford................................................................................................................... 12

Abbildung 6: Mb(x) ................................................................................................................................. 19

Abbildung 7: Verteilung der 1. & 2.Ziffer .............................................................................................. 21

Abbildung 8: Verteilung der 2-ten - 4-ten Ziffer .................................................................................... 23

Abbildung 9: Aufteilung des Intervalls [1,2] .......................................................................................... 24

Abbildung 10: Intervall [1, 10) ............................................................................................................... 26

Abbildung 11: Ausschnitt aus einer Bilanz ............................................................................................ 38

Abbildung 12: Vergleich der ersten Ziffer aus dem Geschäftsjahr mit der Benford-Verteilung ........... 39

Abbildung 13: Vergleich der zweiten Ziffer bzgl. Geschäftsjahr mit der Benford-Verteilung ............... 42

Abbildung 14: Vergleich der ersten Ziffer bzgl. Vorjahr mit der Benford-Verteilung ........................... 44

Abbildung 15: Vergleich der zweiten Ziffer bzgl. Vorjahr mit der Benford-Verteilung ......................... 46

Abbildung 16: Vergleich der Schlusskurse mit der Benford-Verteilung ................................................ 49

Abbildung 17: Vergleich der Städte & Gemeinden mit der Benford-Verteilung................................... 52

Page 8: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

8 Tabellenverzeichnis

Tabellenverzeichnis

Tabelle 1: Benford-Verteilte empirische Daten..................................................................................... 13

Tabelle 2: Kritische Werte für den χ2-Anpassungstest .......................................................................... 31

Tabelle 3: Kritische Werte für den KSA ................................................................................................. 32

Tabelle 4: Anpassungsschranken der MAD ........................................................................................... 34

Tabelle 5: Auswertung des Geschäftsjahres bzgl. der ersten Ziffer ...................................................... 39

Tabelle 6: Auswertung des Z-Tests für die erste Ziffer bzgl. des Geschäftsjahres ................................ 40

Tabelle 7: Auswertung des Geschäftsjahres bzgl. der zweiten Ziffer .................................................... 41

Tabelle 8: Auswertung des Z-Tests (α=0,05) für die zweite Ziffer bzgl. des Geschäftsjahres ............... 43

Tabelle 9: Auswertung des Z-Tests (α=0,1) für die zweite Ziffer bzgl. des Geschäftsjahres ................. 43

Tabelle 10: Auswertung des Vorjahres bzgl. der ersten Ziffer .............................................................. 44

Tabelle 11: Auswertung des Z-Tests für die erste Ziffer bzgl. des Vorjahres ........................................ 45

Tabelle 12: Auswertung des Vorjahres bzgl. der zweiten Ziffer ............................................................ 46

Tabelle 13: Auswertung des Z-Tests für die zweite Ziffer bzgl. des Vorjahres ...................................... 47

Tabelle 14: Ausschnitt der Schlusskurse an der NYSE ........................................................................... 48

Tabelle 15: Auswertung der 966 Schlusskurse an der NYSE ................................................................. 48

Tabelle 16: Auswertung des Z-Tests für die Schlusskurse ..................................................................... 50

Tabelle 17: Ausschnitt aus den Städten & Gemeinden im Bundesland mit mehr als 500 Einwohnern 51

Tabelle 18: Auswertung der Städte & Gemeinden im Bundesland mit mehr als 500 Einwohnern ...... 51

Tabelle 19: Auswertung des Z-Tests für die Städte & Gemeinden ....................................................... 52

Page 9: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

9 Abkürzungsverzeichnis

Abkürzungsverzeichnis

Abb. - Abbildung

allg. - allgemein

b - Basis

bel. - beliebig

bzgl. - bezüglich

BM - beobachteter Mittelwert

Def. - Definition

DF - Verzerrungsfaktor (Distortion Factor)

d - Ziffer (digit)

d.h. - das heißt

EM - erwarteter Mittelwert

KSA - Kolmogoroff-Smirnov-Anpassungstest

MAD - Mittlere absolute Abweichung

MSE - Mittler quadratische Fehler

- Natürliche Zahlen

NBL - Newcomb-Benford’s Law

NYSE - New York Stock Exchange

Π, π - Pi

- Reelle Zahlen

- Positive reelle Zahlen

sig. - signifikant(e)

Tab. - Tabelle

u.v.m. - und viele(s) mehr

VF - Verteilungsfunktion

χ² - Chi-Quadrat

- Ganze Zahlen

z.B. - zum Beispiel

ZV - Zufallsvariable

Page 10: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

10 Vorwort

Vorwort

Die Eurokrise ist aktuell das Thema, welches Alle – Parlament, Börse, Nachrichten – beschäftigt,

sowohl in Deutschland, Europa als auch auf der ganzen Welt.

Griechenland steht mit seiner wirtschaftlichen Situation, im Mittelpunkt dieser Debatte. Alle be-

fürchten, dass Griechenland Insolvenz geht und somit der Euro als einheitliche Währung versagt.

Doch wiederum kämpfen alle dafür, dass dies nicht so kommt.

Nun hat ein Wissenschaftlerteam der Technischen Universität Ilmenau anhand eines Jahrhunderte

alten mathematischen Gesetzes nachgewiesen, dass Griechenland seine Wirtschaftsdaten manipu-

liert hat. Griechenland hat über Jahre hinweg seine Bilanzen gefälscht und ist offenbar nur mit Hilfe

dieser Fälschungen im Jahr 2001 in den Euro-Raum aufgenommen worden. Darüber hinaus hat Grie-

chenland mit gefälschten Zahlen eventuell Strafzahlungen vermieden.

Hierbei handelt es sich um das „Newcomb-Benford-Gesetz“, das stammt aus dem Jahre 1881. An-

hand dieses Gesetzes kann man frühzeitig und ohne großen Aufwand verlässliche Indizien für Zahlen-

fälschungen erkennen.

Jetzt stellt man sich zu Recht die Frage, wie man eine Fälschung aufdecken kann, ohne einen Tipp aus

dem engen Kreis der Fälscher bekommen zu haben.

Die Thesis folgt weitgehend der Darstellung des Buches „Ziffernanalyse“ von Peter N. Posch, dabei

wurden einige Ergebnisse allgemein verständlich verallgemeinert (wie z.B. durch Übergang von der

Dezimalbasis 10 zu einer allgemeinen Basis b) und die Literatur stellenweise vereinfacht.

Page 11: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

11 1. Einführung

Abbildung 2: Ausschnitt aus einer Logarithmentafel

1. Einführung

1.1 Geschichte

Das Benfordsche Gesetz oder auch als Newcomb-Benford’s Law (NBL) be-

kannt, wurde 1881 vom dem kanadischen Astronomen und Mathematiker

Simon Newcomb1 entdeckt.

Die Idee hat er im „American Journal of Mathematics“ unter dem Titel „the

law of probability of the occurrence of numbers is such that all mantisse of

their logarithms are equally probable2 “publiziert.

Auf das Phänomen ist Newcomb anhand der Logarithmentafel3 gekommen. Die Logarithmentafeln

erlauben es, die Multiplikation und Division von Zahlen auf die einfachere Addition und Subtraktion

zurückzuführen. Dadurch erleichterte man sich das Rechnen ungemein. Deshalb waren sie zur Zeiten

ohne Taschenrechner und Computer unverzichtbare Begleiter.

Beim Beobachten seiner Logarithmentafel bemerkte Newcomb, dass

die vorderen Seiten weitaus gebrauchter4 waren als die hinteren, denn

die ersten Seiten waren viel schmutziger als die hinteren. Er fragte sich

sofort nach dem Grund und begann der Frage nachzugehen.

1 Quelle: http://www.nndb.com/people/473/000103164/simon-newcomb-1-sized.jpg

2 Vgl. Newcomb (1881)

3 Quelle: http://zahlwort.blogger.de/static/antville/zahlwort/images/logarithmus-2.jpg

4 Quelle: http://www.wdr.de/tv/quarks/sendungsbeitraege/2006/1017/img/kap9_1_.jpg

Abbildung 1: Simon Newcomb

Abbildung 3: Abnutzung einer Logarithmentafel

Page 12: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

12 1.2 Benford-Verteilte empirische Daten

Seine Untersuchung lieferte – wenn auch zu Beginn nicht direkt ersichtlich – für die erste Ziffer die

Häufigkeit von

Etwa ein halbes Jahrhundert blieb seine Beobachtung unbeachtet, bis 1938

der amerikanische Elektroingenieur und Physiker Frank Albert Benford5 auf

die gleiche Schlussfolgerung kam.

Benford beschränkte seine Untersuchung nicht nur auf die Logarithmentafel,

sondern untersuchte eine Vielzahl verschiedener Tabellen. Dabei zählte er

insgesamt über 20.000 erste Ziffern und fand die gleiche Häufigkeit wie New-

comb heraus. Die Häufigkeit der ersten signifikanten Ziffer nahm von der Eins mit 30,10% bis hin zu

Neun mit 4,58% ab (siehe Abb. 5).

Er nannte seine Entdeckung „law of anomalous numbers6“, da er eine Gesetzmäßigkeit vermutete,

wobei er auch bemerkte, dass es sich hierbei um eine Verteilung von Ereignissen handelt.

Abbildung 5: Verteilung der ersten Ziffer

1.2 Benford-Verteilte empirische Daten

Wir Menschen verwenden Zahlen in vielen Arten und für viele Dinge, doch viele dieser Zahlen sind

Benford-verteilt.

5 Quelle: http://ssrsbstaff.ednet.ns.ca/jcroft2/benford.jpg

6 Vgl. Benford (1938)

30,10%

17,61%

12,49% 9,69%

7,92% 6,69% 5,80% 5,12% 4,58%

1 2 3 4 5 6 7 8 9

Erste Ziffer

Abbildung 4: Frank Benford

Page 13: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

13 1.2 Benford-Verteilte empirische Daten

Das beste Beispiel sind die Hausnummern. Jede Straße besteht aus mind. einem Haus und somit ist

die Eins immer vergeben, aber nicht jede Straße ist so lang, dass die Hausnummer 90 existiert. Des-

halb ist die Wahrscheinlichkeit, dass die Eins auftritt, größer als, dass die Neun auftritt. Deshalb sind

auch die Hausnummern Benford-verteilt.

Weitere Beispiele sind:

die Einwohnerzahlen der 3141 US-Bezirke

die Größe der Dateien auf einer beliebigen Computerfestplatte

die Anzahl der Aktien, die täglich an der New Yorker Börse umgesetzt werden

u.v.m. (siehe Tabelle 1)

Titel 1 2 3 4 5 6 7 8 9 Anzahl

Rivers, length 31,0 16,4 10,7 11,3 7,2 8,6 5,5 4,2 5,1 335

Population 33,9 20,4 14,2 8,1 7,2 6,2 4,1 3,7 2,2 3259

Constants 41,3 14,4 4,8 8,6 10,6 5,8 1,0 2,9 10,6 104

Newspapers 30,0 18,0 12,0 10,0 8,0 6,0 6,0 5,0 5,0 100

Specific heat 24,0 18,4 16,2 14,6 10,6 4,1 3,2 4,8 4,1 1389

Pressure 29,6 18,3 12,8 9,8 8,3 6,4 5,7 4,4 4,7 703

H.P. lost 30,0 18,4 11,9 10,8 8,1 7,0 5,1 5,1 3,6 690

Molecular weight 26,7 25,2 15,4 10,8 6,7 5,1 4,1 2,8 3,2 1800

Drainage 27,1 23,9 13,8 12,6 8,2 5,0 5,0 2,5 1,9 159

Atomic weight 47,2 18,7 5,5 4,4 6,6 4,4 3,3 4,4 5,5 91

n-1, n1/2 25,7 20,3 9,7 6,8 6,6 6,8 7,2 8,0 8,9 5000

Design 26,8 14,8 14,3 7,5 8,3 8,4 7,0 7,3 5,6 560

Reader´s Digest 33,4 18,5 12,4 7,5 7,1 6,5 5,5 4,9 4,2 308

Cost data 32,4 18,8 10,1 10,1 9,8 5,5 4,7 5,5 3,1 741

X-ray volts 27,9 17,5 14,4 9,0 8,1 7,4 5,1 5,8 4,8 707

Am. League 32,7 17,6 12,6 9,8 7,4 6,4 4,9 5,6 3,0 1458

Blackbody 31,0 17,3 14,1 8,7 6,6 7,0 5,2 4,7 5,4 1165

Adresses 28,9 19,2 12,6 8,8 8,5 6,4 5,6 5,0 5,0 342

n1, n2, …, n! 25,3 16,0 12,0 10,0 8,5 8,8 6,8 7,1 5,5 900

Death rate 27,0 18,6 15,7 9,4 6,7 6,5 7,2 4,8 4,1 418

Fibonacci 30,1 17,6 12,5 9,7 7,9 6,7 5,8 5,1 4,6 2000000

Erste Ziffer (%)

Tabelle 1: Benford-Verteilte empirische Daten7

Man kann nicht bei allen Daten die Benford-Verteilung erwarten, wie z.B. ISBN-, Kreditkarten- oder

Bankleitzahlen, da diese Ziffern aus codierten Ziffernfolgen bestehen. Außerdem gilt auch, dass die

Datensätze nicht von oben und unten beschränkt sein dürfen.

7 Vgl. J. Torres (2007, L20)

Page 14: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

14 2. Begriffe

2. Begriffe

Bevor wir mit der mathematischen Untersuchung beginnen, müssen wir vorerst einmal einige Defini-

tionen festlegen respektive Merkmale definieren.

Definition 2.18: Mb bezeichnet die Mantissenfunktion zur Basis b

wobei für ein bestimmtes gilt.

Bemerkung: ohne Subskript bezeichnet .

Beispiel: M(π M 0 3 4 5 M 3 4 5 M 3 4 5 π

Jetzt fragt man zu Recht, ob dieses Gesetz nur für positive Zahlen gilt, da in einer Bilanz auch negati-

ve Zahlen auftauchen können. Natürlich gilt das Gesetz auch für negative Zahlen. Die Beschränkung

auf kann nach dem amerikanischen Mathematiker Theodor Hill aufgehoben werden.

Definition 2.29: Man setzt 0 0 und .

Definition 2.310: Die Funktion der signifikanten Ziffern zur Basis b ist gegeben durch

0 3

wobei

die eindeutig bestimmte Folge bezeichnet, für die

3 ,

0 3 für und

gilt.

Bemerkung: ohne Superskript bezeichnet

.

Beispiel: D3 π D3 0 3 4 5 D3 3 4 5 D3 3 4 5 D3 3 4 5 4

8 Nach Peter N. Posch (Ziffernanalyse, S. 6)

9 Nach T. Hill (1995, S. 889)

10 Nach T. Hill (1995, S. 890)

Page 15: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

15 2. Begriffe

Definition 2.411: Sofern nicht anders angegeben, bezeichnet fortan X eine beliebige Zufallsvariable

(ZV), Mb diejenige ZV, welche die Mantisse zur Basis b repräsentiert, das ist

Mb := Mb(X ) und

die ZV, welche die k -te signifikante (sig.) Ziffer von X zur Ba-

sis b angibt, das ist

.

Korollar 2.512: (i) Die logarithmische (diskrete) Dichtefunktion für die erste Ziffer ist gegeben durch:

(ii) Die zugehörige Verteilungsfunktion (VF) lautet entsprechend:

Die VF ist sehr leicht nachvollziehbar respektive herleitbar:

3

4

3

Nach Theodor Hill sind die Positionen der sig. Ziffern einer Zahl gleich den Positionen der Ziffern ihrer

Mantisse. Deshalb kann für die Verteilung der Ziffern eine stetige VF der Mantisse angeben werden.

Dadurch kann man eine Verallgemeinerung der Newcomb-Benford-Vermutung, auf die Verteilung

der weiteren Ziffern aufstellen.

Lemma 2.613: Logarithmische Mantissenverteilung

Die logarithmische VF der Mantissen zur Basis b wird für alle gegeben

durch

11

Nach Peter N. Posch (Ziffernanalyse, S. 7) 12

Nach Jamain (2001, S. 13) 13

Nach Jamain (2001, S. 14) & Peter N. Posch (Ziffernanalyse, S. 53)

(1)

(2)

(3)

Page 16: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

16 2. Begriffe

Beweis: Wir beweisen (3) zunächst den speziellen Fall , d.h. dass die Mantisse nur aus einer

sig. Ziffer besteht. Dann gilt nämlich

0

Nun beweisen wir den allg. Fall, dass die Matisse aus mehreren sig. Ziffern besteht, dann gilt

für

, wobei 0 für gilt.

(Nach der Anwendung von Korollar 2.5 (ii))

Page 17: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

17 2. Begriffe

(Analog zu der Herleitung von Definition 2.5 (ii))

Page 18: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

18 2. Begriffe

Bemerkung: Diese Herleitung beweist (3) auch dann, wenn in der Mantisse nach der führen-

den Stelle eine oder mehrere Nullen vorkommen.

Gilt 0 für ein , so ist

0

und für den zugehörigen Summanden gilt

0

0

Page 19: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

19 3. Herleitung

3. Herleitung

3.1 Verteilung der ersten k Ziffern

Die Verteilung der ersten k Ziffern ist gegeben durch den nachfolgenden Satz von T. Hill14.

Satz 3.1: Die logarithmische Verteilung der ersten k Ziffern (k є ) ist gegeben durch

Dabei gilt für die Ziffern 0 für , wobei 0 gilt, da führende Nullen an

der ersten Stelle ignoriert werden.

Bsp.: Wir betrachten die ersten drei Ziffern von π.

d1=3, d2=1, d3=4

Mb(x) := x •, • • •••

d1 d2 d3 …

3,14 ≤ Mb(x) < 3,15

3

≤ Mb(x) < 3

3b0+1b-1+4b-2 ≤ Mb(x) < 3b0+1b-1+(4+1)b-2

Allgemein gilt:

14

Nach T. Hill (1995, S. 890) & Peter N. Posch (Ziffernanalyse, S. 7)

Abbildung 6: Mb(x)

(4)

Page 20: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

20 3.1 Verteilung der ersten k Ziffern

Beweis zu Satz 3.115: Hier gilt auch wie im Beweis von Lemma 2.6

. Außerdem wissen

wir auch aus dem Beispiel , dass im allg. für die Mantisse

gilt.

(nach Lemma 2.6 gilt)

Für die erste Ziffer, d.h. , bekommen wir die Vermutung von Newcomb,

15

Vgl. Jamain (2001, S. 16)

Page 21: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

21 3.2 Verteilung der n-ten Ziffern

Die Verteilung für die ersten beiden Ziffer, d.h. von 10 bis 99, kann man anhand der nächsten Abbil-

dung sehen.

Abbildung 7: Verteilung der 1. & 2.Ziffer

3.2 Verteilung der n-ten Ziffern

Nun fragt man sich, ob das Gesetz nur für die ersten Ziffer gilt. Das Gesetz kann man natürlich für die

n-ten Ziffern verallgemeinern.

0,000%

0,500%

1,000%

1,500%

2,000%

2,500%

3,000%

3,500%

4,000%

4,500%

10 20 30 40 50 60 70 80 90

Verteilung der 1. & 2. Ziffer

Page 22: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

22 3.2 Verteilung der n-ten Ziffern

Satz 3.2: Nach Feldstein16 gilt für die n-ten sig. Ziffer folgende logarithmische Verteilung

Die Verteilung der n-ten Ziffern gilt für ,wobei und 0 ist.

Da uns die Originalarbeit von Feldstein nicht zugänglich ist, geben wir nachstehend einen eigenen

Beweis.

Beweis: Wir können nun anhand von Satzes 3.1 die Verteilung der n-ten Ziffern wie folgt herleiten.

(laufen jeweils von „0“ bis „b-1“ bzw. d1 von „1“ bis „b-1“)

(alle Zahlen von „bn-2“ bis „bn-2-1+(b-1)bn-2 = bn-2-1+bn-1- bn-1 = bn-1-1“ )

Die Berechnung der Wahrscheinlichkeit ab der zweiten Ziffer läuft etwas komplizierter ab. Die Sum-

me läuft für jede einzelne Ziffer, d.h. von Null bis Neun und von Eins bis Neun. Natürlich unter der

Voraussetzung das für die Basis 10 gilt. Für die dritte Ziffer geht die Summe von 10 bis 99 und für die

vierte Ziffer von 100 bis 999.

Deshalb braucht man für die Berechnung ein Programm, wie z.B. ein EXCEL-Sheet.

16

Nach Feldstein (1976) & Peter N. Posch (Ziffernanalyse, S. 8)

(5)

Page 23: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

23 3.3 Grenzwert

Für 0 und 3 4 sieht die Verteilung wie folgt aus:

Abbildung 8: Verteilung der 2-ten - 4-ten Ziffer

Anhand der Abbildung kann man sehr gut erkennen, dass bereits an der vierten Stelle der Mantisse

sämtliche Ziffern annähernd gleich wahrscheinlich sind.

Im nächsten Abschnitt zeigen wir, dass das Gesetz an der n-ten Stelle der Mantisse, für n gegen un-

endlich gleichverteilt ist.

3.3 Grenzwert

Die benfordsche Ziffernverteilung konvergiert, wie schon anhand der Abb.8 vermutet hat, gegen die

Gleichverteilung.

Satz 3.3: Für jede feste Basis und sei eine beliebige ZV mit stetiger Dichte dann gilt,

Anhand dieses Resultates beschränkt man sich bei der praktische Anwendung, wie z.B. Bilanzfäl-

schung, auf die ersten vier Stellen einer Zahl im Dezimalsystem.

0,00%

2,00%

4,00%

6,00%

8,00%

10,00%

12,00%

14,00%

0 1 2 3 4 5 6 7 8 9

Verteilung der 2-ten - 4-ten Ziffer

2-te Ziffer 3-te Ziffer 4-te Ziffer

(6)

Page 24: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

24 3.3 Grenzwert

Beweis: Wir betrachten zunächst einen speziellen Fall und aufbauend auf den speziellen Fall verall-

gemeinern wir den Grenzwert.

Spezial Fall17

Wir betrachten zunächst speziell das Binärsystem mit und dem Intervall . Sei

nun eine ZV mit stetiger Dichte die außerhalb des Intervalls verschwindet.

Nach binärer Notation wird das Intervall

von , wie folgt notiert

.

Daraus folgt, dass unter allen reellen Zah-

len aus dem Intervall , die mit einer

binären Null an zweiter Stelle zwischen

1.00 und 1.10 liegen. Im dezimal System

liegen sie zwischen 1 und 1.5.

Eine binäre Null an dritter Stelle liegt zum

einem zwischen 1.00 und 1.01 und zum anderem zwischen 1.10 und 1.11, im dezimalen

liegt sie zwischen 1 und 1.25 und zwischen 1.5 und 1.75. Anhand der Abb. 9 kann man dies

nochmal grafisch besser veranschaulichen.

Für Null gilt allgemein

und für Eins

.

Wir betrachten uns die ganze Sache an der Stelle , dann gilt für die Ziffer Null:

0

Für die Ziffer Eins gilt analog:

17

Vgl. Peter N. Posch (Ziffernanalyse, S. 57 ff)

Abbildung 9: Aufteilung des Intervalls [1,2]

Page 25: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

25 3.3 Grenzwert

Trivialerweise gilt:

0

Wir zeigen:

0

0

Denn:

0

Aus der Stetigkeit von auf dem abgeschlossenem Intervall folgt die gleichmäßige

Stetigkeit auf diesem Intervall. D.h. 0 dann 0 derart, dass für alle

gilt: .

Wählen wir so groß, dass

gilt, dann folgt

für .

Daher gilt für :

0

0

Da beliebig klein werden kann, folgt daraus die obige Behauptung, dass die Differenz

gegen Null strebt.

Page 26: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

26 3.3 Grenzwert

Desweiteren gilt:

0 0

Allgemeiner Fall

Im allgemeinem Fall ist das Intervall

. Außerdem spielt auch die

Eins an erster Stelle wie oben, z.B.

, keine Rolle

mehr. Da die erste Stelle die Werte

von Eins bis Neun annehmen kann.

Für sieht die Aufteilung wie in Abb. 10 aus. Für 3 geht die Aufteilung über

und für 4 über

.

Allgemein gilt:

Für eine beliebige Ziffer gilt:

Abbildung 10: Intervall [1, 10)

Page 27: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

27 3.3 Grenzwert

Analog gilt für eine Ziffer :

Trivial gilt:

Ferner gilt auch:

0

Denn:

Aus der Stetigkeit von auf dem abgeschlossenen Interval l folgt die gleichmäßige

Stetigkeit auf diesem Intervall. D.h. 0 dann 0 derart, dass für alle

gilt: .

Wählen wir so groß, dass

gilt, dann folgt

für .

Daher gilt für :

Page 28: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

28 3.3 Grenzwert

Daraus folgt,

0

da

beliebig klein werden kann.

Wir wissen,

0

0

0 0

3

3

3 4

3

4

0 0

+ …

0

Daraus folgt,

Also gilt,

Außerdem wissen wir auch

0

Page 29: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

29 3.3 Grenzwert

Bemerkung: Der Grenzwert gilt für positive ZV. Aber aufgrund der Def. 2.2, , gilt

der Grenzwert auch für alle reellen ZV.

Wir bezeichnen mit die negativen ZV und mit die positiven ZV.

Unter der Bedingung, dass stetig und 0 ist gilt,

Da,

0

0

wobei und 0 strebt.

Deshalb gilt,

Außerdem setzen wir,

Dadurch erhalten wir,

Page 30: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

30 4. Testverfahren

4. Testverfahren

Damit wir überhaupt einen Datensatz auf die Benford-Verteilung respektive eine Bilanz auf Fälschung

überprüfen können, brauchen wir gewisse Testverfahren. Anhand dieser Testverfahren können wir

anschließend Rücksclüsse auf Manipulation hinsichtlich der Bilanz treffen.

4.1 Chi-Quadrat-Anpassungstest

Der χ²-Anpassungstest18 überprüft den Grad der Übereinstimmung zwischen einer Stichprobe vom

Umfang mit einer unbekannten empirischen VF und einer voll spezialisierten VF . In unserem

Fall ist die Benford-Verteilung.

Die Voraussetzung für die Anwendung des χ²-Anpassungstests ist die Unabhängigkeit der einzelnen

Beobachtungen. Deshalb ist es zu empfehlen, vor der Anwendung Überlegungen hinsichtlich der

Abhängigkeit der beobachteten Stichprobe anzustellen respektive gezielte Tests auf Unabhängigkeit,

z.B. χ²-Unabhängigkeitstest, durchzuführen. Außerdem ist der χ²-Anpassungstest für „große“ Stich-

proben geeignet.

Die Nullhypothese und Alternativhypothese lauten

Hierbei ist zu beachten, dass die Nullhypothese für alle gilt und die Alternativhypothese für

mind. ein gilt.

Der Ablauf des χ²-Anpassungstest sieht wie folgt aus:

1.Schritt: Wir bestimmen die Prüfgröße

18

Vgl. Peter N. Posch (Ziffernanalyse S. 30) & J. Hartung (Statistik S. 182)

(7)

Page 31: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

31 4.2 Kolmogoroff-Smirnov-Anpassungstestest

dabei handelt es sich bei um die beobachtete relative Häufigkeit der Ziffer und bei

analog um die erwartete Benford-Häufigkeit.

Außerdem ist zu beachten, dass die Summe ab der zweiten Ziffer von 0 bis 9 läuft.

2.Schritt: Wir bestimmen den kritischen Wert

der χ²-Verteilung mit Freiheitsgraden und einem Signifikanzniveau von .

0,1 0,05 0,01

1. χ82 13,36156614 15,50731306 20,09023503

2. χ92 14,68365662 16,91897762 21,66599433

3. χ892 106,46889944 112,02198593 122,94220699

4. χ8992 953,75165366 969,86483294 1000,57472714

Testdα

Tabelle 2: Kritische Werte für den χ2-Anpassungstest

3.Schritt: Wenn nun

,

wird die Nullhypothese zum Signifikanzniveau verworfen. In der Praxis heißt dies, dass

die Bilanz mit einer Sicherheit von 1-α gefälscht ist.

4.2 Kolmogoroff-Smirnov-Anpassungstestest

Der Kolmogoroff-Smirnov-Anpassungstest19 (KSA) überprüft, wie der χ²-Anpassungstest, ob die unbe-

kannte VF der betrachteten Grundgesamtheit mit einer hypothetischen VF übereinstimmt. In

unserem Fall handelt es sich bei um die Benford-Verteilung. Der KSA ist für „kleine“ Stichproben-

umfänge besser geeignet als der χ²-Anpassungstest.

19

Vgl. Peter N. Posch (Ziffernanalyse S. 31) & J. Hartung (Statistik S. 183)

Page 32: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

32 4.2 Kolmogoroff-Smirnov-Anpassungstestest

Die Voraussetzung für die Anwendung des KSA ist die Stetigkeit von . Da die Benford-Verteilung

diskret ist, ist der Test daher konservativ und von geringer Güte.

Die Nullhypothese und Alternativhypothese lauten wieder

Der Ablauf des KSA sieht wie folgt aus:

1.Schritt: Wir bestimmen unsere Prüfgröße

wobei

und die empirische Verteilungsfunktion der Beobachtungen bezeichnet.

2.Schritt: Den kritische Wert

können wir anhand der unteren Tabelle bestimmen.

n 5 8 10 20 40 >40

dn;0,80 1,00 1,01 1,02 1,04 1,05 1,08

dn;0,90 1,14 1,16 1,17 1,19 1,20 1,23

dn;0,95 1,26 1,28 1,29 1,31 1,33 1,36

dn;0,98 1,40 1,43 1,45 1,47 1,49 1,52

dn;0,99 1,50 1,53 1,55 1,57 1,59 1,63

Tabelle 3: Kritische Werte20

für den KSA

Ist das vorliegende nicht in der Tabelle zu finden, so nimmt man das nächst größere.

20

Vgl. J. Hartung (Statistik, S. 184)

(8)

Page 33: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

33 4.3 Z-Test

3.Schritt: Die Nullhypothese wird zum Signifikanzniveau verworfen, wenn

gilt. In der Praxis heißt dies, wie schon im χ²-Anpassungstest, dass die Bilanz mit einer Si-

cherheit von 1-α gefälscht ist.

4.3 Z-Test

Der Z-Tests21, auch Gauß-Test genannt, berechnet die Signifikanz der Abweichung

für jede

Ziffer .

Überschreitet der Z-Wert22 6 bei einem Signifikanzniveau von 0 05 oder 64bei einem von

0 0 , dann liegt eine sig. Abweichung mit einer Sicherheit von 1-α vor.

Bemerkung: Der Term

wird nur dann subtrahiert, wenn

ist.

4.4 Mittlere absolute Abweichung

Die Mittlere absolute Abweichung23, kurz MAD (engl. Mean Absolute Deviation), kann neben den χ²-

und KS-Anpassungstests als ein weiteres Gütekriterium genutzt werden. MAD gibt an, wie weit im

Mittel die beobachtete Stichprobe von der theoretischen Häufigkeit, d.h. von der Benford-Verteilung,

abweicht.

21

Vgl. Peter N. Posch (Ziffernanalyse, S. 31) 22

Vgl. Durtschi (2004, S. 25 ff) 23

Vgl. Peter N. Posch (Ziffernanalyse, S. 32)

(9)

Page 34: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

34 4.4 Mittlere absolute Abweichung

Wir berechnen

Das Problem beim MAD liegt dabei, dass kein kritischer Wert existiert. Doch Nigrini hat durch prakti-

sche Testerfahrungen eine Anpassungsschranke für die erste, zweite und für die ersten beiden Zif-

fern festgelegt (siehe Tab.4).

Anpassungsgüte

Erste Ziffern eng

akzeptabel

marginal akzeptabel

keine Übereinstimmung

Zweite Ziffern eng

akzeptabel

marginal akzeptabel

keine Übereinstimmung

Erste beide Ziffern eng

akzeptabel

marginal akzeptabel

keine Übereinstimmung

[0 ; 0,008)

MAD

[0 ; 0,004)

[0,004 ; 0,008)

[0,008 ; 0,012)

≥ 0,012

≥ 0,0018

[0,008 ; 0,0012)

[0,0012 ; 0,016)

≥ 0,016

[0 ; 0,0006)

[0,0006 ; 0,0012)

[0,0012 ; 0,0018)

Tabelle 4: Anpassungsschranken24

der MAD

Bemerkung: Der mittlere quadratische Fehler,

kurz MSE (engl. Mean Squared Error), hat den Vorteil gegenüber dem MDA, dass auf-

grund der Quadrierung größere Abweichungen stärker gewichtet werden als kleinere.

Doch für den MSE existiert weder ein kritischer Wert noch Richtlinien wie beim MDA.

Deshalb können wir die Prüfgröße von MSE nicht einordnen.

24

Vgl. Peter N. Posch (Ziffernanalyse, S. 84)

(10)

(11)

Page 35: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

35 4.5 Verzerrungsfaktor-Modell

4.5 Verzerrungsfaktor-Modell

Das Verzerrungsfaktor-Modell25 ist ein Prüfverfahren, was von Nigrini entwickelt wurde. Heute soll

nach Angaben von Nigrini, dieses Prüfverfahren von den fünf größten Wirtschaftsprüfungsunter-

nehmen sowie von einigen Steuerbehörden zur Aufspürung manipulierter respektive gefälschter

Bilanzen und Steuererklärungen genutzt werden.

Dieses Prüfverfahren basiert im wesentlichen auf dem Vergleich zweier Mittelwerte. Zum einem des

beobachteten Mittelwertes (BM) und zum anderen des erwartenden Mittelwertes (EM). Nigrini ist

der Behauptung, dass die Fälschung nur innerhalb der gleichen Größenordnung des wahren Eintrages

stattfindet und ferner nimmt er an, dass der Manipulationsgrad über alle Größenordnung hinweg

gleich hoch ist. Deshalb werden alle Einträge respektive Werte im Stichprobenumfang, die kleiner als

10 sind herausgestrichen. Deshalb werden die Werte in den Bereich 0 00 skaliert.

Doch in diesem Punkt vertritt Posch nicht die Meinung von Nigrini. Da es ist nicht ersichtlich, warum

eine Restriktion der Werte auf den Bereich 0 00 in Kauf genommen werden soll. Durch die Be-

rechnung des Mittelwertes entsteht schon ein Informationsverlust.

Posch erweitert das Modell und berechnet den Mittelwert der Mantisse eines Datensatzes und ver-

gleicht diesen mit dem Referenzmittelwert im Bereich 0 00 .

Die Berechnung des Verzerrungsfaktors läuft folgendermaßen ab,

1.Schritt: Wir bestimmen BM

2.Schritt: Wir bestimmen EM

25

Vgl. Nigrini (1996, S. 75 ff) & Peter N. Posch (Ziffernanalyse, S. 36 & 86 ff)

(13)

(12)

Page 36: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

36 4.5 Verzerrungsfaktor-Modell

3.Schritt: Wir berechnen den Verzerrungsfaktor

4.Schritt: Wenn nun der ermittelte Verzerrungsfaktor im folgenden Wertebereich liegt,

so liegt dann keine Manipulation respektive Fälschung in der Bilanz vor.

Bemerkung: Nach Nigrini26 kann man bei mehr als 500 Stichproben, für EM ungefähr von einem Wert

von 3,904 ausgehen.

26

Vgl. Nigrini (1996, S. 76)

(14)

Page 37: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

37 5. Applikationen

5. Applikationen

Das wir das Gesetz zur Lösung praktischer Probleme anwenden können, haben wir zum einem dem

US-amerikanischen Mathematiker Theodor Hill und zum anderem dem US-Wissenschaftler Mark

Nigrini zu verdanken.

Die Überprüfung der Daten auf die Benford-Verteilung erfolgt in zwei Schritten:

Zuerst ermitteln wir aus unserem Stichprobenumfang die relative Häufigkeit, für die

erste Ziffer von Eins bis Neun und ab der zweiten Ziffer von Null bis Neun.

Anschließend überprüfen wir anhand der Anpassungstests die Übereinstimmung mit

der Benford-Verteilung.

Außerdem ist zu beachten, dass bei der Untersuchung nur die ersten vier Ziffern für die Untersu-

chung relevant sind.

5.1 Bilanz

Wir untersuchen nun eine Bilanz auf die Richtigkeit. Dabei betrachten wir uns eine Bilanz aus dem

Dienstleistungsbereich. Es handelt sich hierbei um ein Taxiunternehmen.

Bei der Untersuchung ist zu beachten, dass die Position wie z.B. der Jahresüberschuss nicht mitge-

zählt werden. Der Jahresüberschuss respektive Jahresfehlschuss wird über die Gewinn- und Verlust-

rechnung ermittelt, d.h. dass die Gewinn- und Verlustrechnung separat mit in die Untersuchung ein-

fließt. Des Weiteren ist auch zu beachten, dass die Summen auch nicht mit in den Stichprobenum-

fang einfließen, da die zum einen abhängig sind und zum anderen nicht manipulierbar sind.

Die Bilanz wird sowohl für das Geschäftsjahr als auch für das Vorjahr separat untersucht. Das Ge-

schäftsjahr besteht aus 108 Einträgen und das Vorjahr besteht aus 92 Einträgen.

An dieser Stelle kann man bereits sehen, dass bei der Durchführung der Testverfahren der Stichpro-

benumfang Einfluss hat. Der χ²-Anpassungstest ist für größere Stichproben geeignet und der KSA ist

von geringer Güte, deshalb hängt die Entscheidung von den anderen drei Testverfahren ab.

Page 38: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

38 5.1.1 Auswertung Geschäftsjahr

Abbildung 11: Ausschnitt aus einer Bilanz

5.1.1 Auswertung Geschäftsjahr

5.1.1.1 Analyse der ersten Ziffer

Wir betrachten uns vorerst das Geschäftsjahr hinsichtlich der ersten Ziffer. Anhand der Tab.5 können

wir die relativen und absoluten Häufigkeit im Vergleich zu der Benford-Verteilung sehen.

Page 39: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

39 5.1.1.1 Analyse der ersten Ziffer

Relative Absolute

1 30,10% 27,78% 30

2 17,61% 9,26% 10

3 12,49% 12,96% 14

4 9,69% 14,81% 16

5 7,92% 9,26% 10

6 6,69% 8,33% 9

7 5,80% 8,33% 9

8 5,12% 4,63% 5

9 4,58% 4,63% 5

Erste Ziffer

d BenfordHäufigkeit

Tabelle 5: Auswertung des Geschäftsjahres bzgl. der ersten Ziffer

Anhand der unteren Abbildung kann man sehr gut erkennen, dass die Daten sich der Benford-

Verteilung auf gewisse Weise anpasst.

Abbildung 12: Vergleich der ersten Ziffer aus dem Geschäftsjahr mit der Benford-Verteilung

Man kann aber auch sehr gut erkennen, dass die Ziffern zwei und vier sig. sich von der Benford-

Verteilung unterscheiden.

Bei der Durchführung der Testverfahren erhalten wir hinsichtlich der ersten Ziffer folgende Resultate:

1. χ²-Anpassungstest

Beim χ²-Anpassungstest liegt die Prüfgröße bei 9,340. Bei einem Signifikanzniveau von 0,05 und

einem Freiheitsgrad von 8 liegt der kritische Wert bei 15,507.

Daraus können wir schlussfolgern, dass die Daten d.h. die Bilanz mit einer 95%iger Sicherheit

0,000%

5,000%

10,000%

15,000%

20,000%

25,000%

30,000%

35,000%

1 2 3 4 5 6 7 8 9

Erste Ziffer

Relative

Benford

Page 40: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

40 5.1.1.1 Analyse der ersten Ziffer

Benford-verteilt sind, da die Prüfgröße kleiner als der kritische Wert ist. Dies heißt wiederum, dass

die Bilanz nicht gefälscht sein kann.

2. Kolmogoroff-Smirnov-Anpassungstest

Beim KSA erhalten wir für die Prüfgröße einen Wert von 9,917. Bei einem Signifikanzniveau von

0,05 liegt der kritische Wert bei 1,36.

Folglich sind die Daten, also die Bilanz mit einer 95%iger Sicherheit nicht Benford-verteilt, da die

Prüfgröße größer als der kritische Wert ist. Also ist nach dem KSA die Bilanz gefälscht, wobei man

aber nicht vergessen sollte, dass der KSA von geringer Güte ist.

3. Z-Test

Nach dem Z-Test liegt eine sig. Abweichung bei der Ziffer Zwei vor (siehe Tab.6). Dies gilt sowohl

bei einem Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.

d 1 2 3 4 5 6 7 8 9

Zd 0,422 2,152 0,002 1,637 0,338 0,489 0,921 0,011 0,027

Tabelle 6: Auswertung des Z-Tests für die erste Ziffer bzgl. des Geschäftsjahres

Bemerkenswert ist der Wert bei der Ziffer vier, da der Wert gleich dem kritischen Wert ist, ist sie

noch akzeptabel.

4. Mittlere Absolute Abweichung

Für unsere Stichprobe erhalten wir eine MAD von 0,0248. Nach Nigrinis Anpassungsschranken

liegt dieser Wert über 0,012 und somit liegt keine Übereinstimmung vor. Daraus folgt, dass die Bi-

lanz manipuliert ist.

5. Verzerrungsfaktor-Modell

Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,778 und für den erwarten-

den Mittelwert 3,867. Folglich ergibt sich als Prüfgröße -0,02316, da dieser Wert innerhalb des

Wertebereiches liegt, ist demzufolge die Bilanz nicht gefälscht.

Nun stellt sich die Frage, ob die Bilanz gefälscht ist oder nicht. Wie schon bemerkt wurde sind die

ersten beiden Testverfahren – χ²-Anpassungstest und KSA – nicht in der Entscheidung zu berücksich-

tigen. Nachdem Verzerrungsfaktor-Modell liegt in der Bilanz keine Manipulation vor, aber nach MAD

liegt wiederum eine Manipulation in der Bilanz vor.

Page 41: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

41 5.1.1.2 Analyse der zweiten Ziffer

Nach Angaben von Nigrini, wird das Verzerrungsfaktor-Modell von den fünf größten Wirtschaftsprü-

fungsunternehmen sowie von einigen Steuerbehörden zur Aufspürung manipulierter Bilanzen ver-

wendet, deshalb würde ich in dieser Situation davon ausgehen, dass die Bilanz hinsichtlich des Ge-

schäftsjahres nicht gefälscht ist.

In Folge der nicht einstimmigen Testverfahren hinsichtlich der ersten Ziffer, betrachten wir uns im

nächsten Kapitel die Analyse der zweiten Ziffer hinsichtlich einer Manipulation.

5.1.1.2 Analyse der zweiten Ziffer

Nun betrachten wir uns das Geschäftsjahr hinsichtlich der zweiten Ziffer. Die Auswertung zeigt uns

die nachfolgende Tabelle.

Relative Absolute

0 11,97% 18,52% 20

1 11,39% 8,33% 9

2 10,88% 10,19% 11

3 10,43% 11,11% 12

4 10,03% 8,33% 9

5 9,67% 7,41% 8

6 9,34% 13,89% 15

7 9,04% 9,26% 10

8 8,76% 6,48% 7

9 8,50% 6,48% 7

Zweite Ziffer

d BenfordHäufigkeit

Tabelle 7: Auswertung des Geschäftsjahres bzgl. der zweiten Ziffer

Die zweite Ziffer sieht auf dem ersten Blick, im Vergleich zu der ersten Ziffer nicht besser aus (siehe

Abb.13).

Page 42: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

42 5.1.1.2 Analyse der zweiten Ziffer

Abbildung 13: Vergleich der zweiten Ziffer bzgl. Geschäftsjahr mit der Benford-Verteilung

Anhand der oberen Abbildung kann man sehr gut erkennen, dass die Daten nicht mehr einstimmig

mit Benford-Verteilung sind.

Die Auswertung der Testverfahren bringt uns hinsichtlich der zweiten Ziffer folgende Resultate:

1. χ²-Anpassungstest

Die Prüfgröße liegt bei der zweiten Ziffer bei 9,293. Bei einem Signifikanzniveau von 0,05 und ei-

nem Freiheitsgrad von 9 liegt der kritische Wert bei 16,919.

Wir können mit einer 95%iger Sicherheit davon ausgehen, dass die Daten nicht Benford-verteilt

sind, da die Prüfgröße kleiner als der kritische Wert ist. Daher ist also die Bilanz nicht gefälscht.

2. Kolmogoroff-Smirnov-Anpassungstest

Beim KSA liegt die Prüfgröße bei 9,509. Bei einem Signifikanzniveau von 0,05, liegt der kritische

Wert bei 1,36.

Folglich sind die Daten, d.h. die Bilanz mit einer 95%iger Sicherheit nicht Benford-verteilt, da die

Prüfgröße größer als der kritische Wert ist. Also ist nach dem KSA die Bilanz gefälscht, wobei man

aber nicht vergessen sollte, dass der KSA von geringer Güte ist.

3. Z-Test

Nach dem Z-Test liegt keine sig. Abweichung , bei einem Signifikanzniveau von 0,05 vor (siehe

Tab.8).

0,000%

5,000%

10,000%

15,000%

20,000%

1 2 3 4 5 6 7 8 9 10

Zweite Ziffer

Relative

Benford

Page 43: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

43 5.1.1.2 Analyse der zweiten Ziffer

d 0 1 2 3 4 5 6 7 8 9

Zd 1,949 0,848 0,078 0,073 0,427 0,632 1,460 0,081 0,666 0,580

Tabelle 8: Auswertung des Z-Tests (α=0,05) für die zweite Ziffer bzgl. des Geschäftsjahres

Bei einem Signifikanzniveau von 0,1 liegt eine sig. Abweichung bei der Ziffer Null vor (siehe

Tab.9).

d 0 1 2 3 4 5 6 7 8 9

Zd 1,949 0,848 0,078 0,073 0,427 0,632 1,460 0,081 0,666 0,580

Tabelle 9: Auswertung des Z-Tests (α=0,1) für die zweite Ziffer bzgl. des Geschäftsjahres

Auch im Hinblick auf die zweite Ziffer liegen keine großen sig. Abweichungen vor, bis auf die Null

bei einem Signifikanzniveau von 0,1.

4. Mittlere Absolute Abweichung

Für die Stichprobe der zweiten Ziffer erhalten wir eine MAD von 0,0240. Nach Nigrinis Anpas-

sungsschranken liegt dieser Wert über 0,016 und somit liegt wieder keine Übereinstimmung vor.

Daraus folgt, dass die Bilanz manipuliert ist.

5. Verzerrungsfaktor-Modell

Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,907 und für den erwarten-

den Mittelwert 3,867. Folglich ergibt sich als Prüfgröße -0,01041, da dieser Wert innerhalb des

Wertebereiches liegt, ist daher die Bilanz nicht gefälscht.

Auch nach der Analyse der zweiten Ziffer, kommen wir zum Schluss, dass die Bilanz im Geschäftsjahr

nicht manipuliert wurde.

Im nächsten Kapitel analysieren wir das Vorjahr hinsichtlich einer Manipulation, dabei untersuchen

wir sowohl die erste als auch die zweite Ziffer separat.

Page 44: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

44 5.1.2 Auswertung Vorjahr

5.1.2 Auswertung Vorjahr

5.1.2.1 Analyse der ersten Ziffer

Die Auswertung des Vorjahres erfolgt hier auch in zwei Abschnitten, wir analysieren zuerst die erste

Ziffer und anschließend die zweite Ziffer.

Die Auswertung hinsichtlich der Ersten Ziffer zeigt uns folgende Tabelle,

Relative Absolute

1 30,10% 32,61% 30

2 17,61% 18,48% 17

3 12,49% 15,22% 14

4 9,69% 4,35% 4

5 7,92% 7,61% 7

6 6,69% 4,35% 4

7 5,80% 9,78% 9

8 5,12% 3,26% 3

9 4,58% 4,35% 4

Erste Ziffer

d BenfordHäufigkeit

Tabelle 10: Auswertung des Vorjahres bzgl. der ersten Ziffer

Das Vorjahr sieht im Vergleich zum Geschäftsjahr etwas besser aus (siehe Abb.14).

Abbildung 14: Vergleich der ersten Ziffer bzgl. Vorjahr mit der Benford-Verteilung

0,000%

5,000%

10,000%

15,000%

20,000%

25,000%

30,000%

35,000%

1 2 3 4 5 6 7 8 9

Erste Ziffer

Relative

Benford

Page 45: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

45 5.1.2.1 Analyse der ersten Ziffer

Bei der Durchführung der Testverfahren erhalten wir hinsichtlich der ersten Ziffer im Vorjahr folgen-

de Resultate:

1. χ²-Anpassungstest

Beim χ²-Anpassungstest erhalten wir für die Prüfgröße einen Wert von 7,402. Bei einem

Signifikanzniveau von 0,05 und einem Freiheitsgrad von 8 liegt der kritische Wert bei 15,507.

Daraus können wir schlussfolgern, dass die Daten d.h. die Bilanz mit einer 95%iger Sicherheit

Benford-verteilt sind, da die Prüfgröße kleiner als der kritische Wert ist. Auch für das Vorjahr heißt

es, dass die Bilanz im Vorjahr nicht gefälscht war.

2. Kolmogoroff-Smirnov-Anpassungstest

Beim KSA erhalten wir für die Prüfgröße einen Wert von 9,153. Bei einem Signifikanzniveau von

0,05 liegt der kritische Wert bei 1,36.

Folglich sind die Daten, d.h. die Bilanz mit einer 95%iger Sicherheit nicht Benford-verteilt, da die

Prüfgröße größer als der kritische Wert ist. Also war die Bilanz schon im Vorjahr gefälscht. Aber

sollte auch hier nicht vergessen, dass der KSA von geringer Güte ist.

3. Z-Test

Nach dem Z-Test liegen keine sig. Abweichungen vor (siehe Tab.11). Dies gilt sowohl bei einem

Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.

d 1 2 3 4 5 6 7 8 9

Zd 0,41 0,082 0,632 1,556 0,11 0,692 1,412 0,571 0,105

Tabelle 11: Auswertung des Z-Tests für die erste Ziffer bzgl. des Vorjahres

4. Mittlere Absolute Abweichung

Für das Vorjahr erhalten wir eine MAD von 0,0224. Nach Nigrinis Anpassungsschranken liegt die-

ser Wert über 0,012 und somit liegt keine Übereinstimmung vor. Daraus folgt, dass die Bilanz im

Vorjahr manipuliert ist.

5. Verzerrungsfaktor-Modell

Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,304 und für den erwarten-

den Mittelwert 3,860. Folglich ergibt sich als Prüfgröße -0,1439, da dieser Wert innerhalb des

Wertebereiches liegt, ist die Bilanz nicht gefälscht.

Page 46: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

46 5.1.2.2 Analyse der zweiten Ziffer

Auch hier stellt sich wieder die Frage, ob die Bilanz gefälscht ist oder nicht. Aber für das Vorjahr kön-

nen wir mit einer größeren Wahrscheinlichkeit davon ausgehen, dass die Bilanz nicht gefälscht ist, da

unter anderem auch keine sig. Abweichungen vorliegen. Wir betrachten uns aber dennoch wie im

Geschäftsjahr die zweite Ziffer hinsichtlich einer Manipulation.

5.1.2.2 Analyse der zweiten Ziffer

Die Auswertung im Hinblick auf die zweite Ziffer zeigt uns die nachfolgende Tabelle.

Relative Absolute

0 11,97% 17,39% 16

1 11,39% 10,87% 10

2 10,88% 9,78% 9

3 10,43% 7,61% 7

4 10,03% 7,61% 7

5 9,67% 9,78% 9

6 9,34% 7,61% 7

7 9,04% 7,61% 7

8 8,76% 13,04% 12

9 8,50% 8,70% 8

Zweite Ziffer

d BenfordHäufigkeit

Tabelle 12: Auswertung des Vorjahres bzgl. der zweiten Ziffer

Anhand der unteren Abbildung kann man grafisch sehr gut erkennen, inwieweit sich die Daten der

Benford-Verteilung angepasst haben.

Abbildung 15: Vergleich der zweiten Ziffer bzgl. Vorjahr mit der Benford-Verteilung

0,000%

5,000%

10,000%

15,000%

20,000%

1 2 3 4 5 6 7 8 9 10

Zweite Ziffer

Relative

Benford

Page 47: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

47 5.1.2.2 Analyse der zweiten Ziffer

Anhand der Testverfahren erhalten wir hinsichtlich der zweiten Ziffer im Vorjahr folgende Resultate:

1. χ²-Anpassungstest

Die Prüfgröße liegt bei der zweiten Ziffer bei 6,064. Bei einem Signifikanzniveau von 0,05 und ei-

nem Freiheitsgrad von 9 liegt der kritische Wert bei 16,919.

Wir können mit einer 95%iger Sicherheit davon ausgehen, dass die Daten nicht Benford-verteilt

sind, da die Prüfgröße kleiner als der kritische Wert ist. Daher ist also die Bilanz nicht gefälscht.

2. Kolmogoroff-Smirnov-Anpassungstest

Beim KSA liegt die Prüfgröße bei 8,776. Bei einem Signifikanzniveau von 0,05, liegt der kritische

Wert bei 1,36.

Folglich sind die Daten, also die Bilanz mit einer 95%iger Sicherheit nicht Benford-verteilt, da die

Prüfgröße größer als der kritische Wert ist. Also ist nach dem KSA die Bilanz gefälscht, wobei man

aber nicht vergessen sollte, dass der KSA von geringer Güte ist.

3. Z-Test

Nach dem Z-Test liegt keine sig. Abweichung vor (siehe Tab.13). Dies gilt sowohl bei einem

Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.

d 0 1 2 3 4 5 6 7 8 9

Zd 1,442 0,157 0,171 0,716 0,600 0,037 0,391 0,295 1,270 0,067

Tabelle 13: Auswertung des Z-Tests für die zweite Ziffer bzgl. des Vorjahres

4. Mittlere Absolute Abweichung

Für die Stichprobe der zweiten Ziffer erhalten wir eine MAD von 0,02004. Nach Nigrinis Anpas-

sungsschranken liegt dieser Wert über 0,016 und somit liegt wieder keine Übereinstimmung vor.

Daraus folgt, dass die Bilanz manipuliert ist.

5. Verzerrungsfaktor-Modell

Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 4,141 und für den erwarten-

den Mittelwert 3,860. Folglich ergibt sich als Prüfgröße -0,07289, da dieser Wert innerhalb des

Wertebereiches liegt, ist daher die Bilanz nicht gefälscht.

Allgemein können wir über die Bilanz einen Fazit ziehen und sagen, dass die Bilanz mit einer großen

Sicherheit, sowohl im Geschäftsjahr als auch im Vorjahr, nicht manipuliert wurde.

Page 48: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

48 5.2 Schlusskurse der NYSE

5.2 Schlusskurse der NYSE

Nun untersuchen wir von 966 Unternehmen die Schlusskurse (Stand: 3. August 2011, 22:00 Uhr) an

der New York Stock Exchange (NYSE), auf die Benford-Verteilung.

Die NYSE ist die größte Wertpapierbörse der Welt und gehört zur der NYSE Euronext-Gruppe. Die

NYSE ist auch eher unter dem Namen „Wall Street“ bekannt27.

Anhand der Tab. 14 sehen einen Ausschnitt der Schlusskurse von den 966 Unternehmen.

Symbol Name Letzter Kurs

A Agilent Technologies, Inc. Comm 39,20

AA Alcoa Inc. Common Stock 14,26

AAN Aaron's, Inc. Common Stock 24,46

AAP Advance Auto Parts Inc Advance 54,35

ABB ABB Ltd Common Stock 23,13

ABC AmerisourceBergen Corporation 38,16

ABT Abbott Laboratories Common Stoc 50,29

ABV-C Companhia de Bebidas das Americ 25,05

ABX Barrick Gold Corporation Common 49,12

ACC American Campus Communities Inc 36,13 Tabelle 14: Ausschnitt der Schlusskurse an der NYSE

Die Auswertung der 966 Schlusskurse hinsichtlich der Ersten Ziffer, zeigt uns die untere Tabelle

Häufigkeit

d Absolute Relative Benford

1 171 17,70% 30,10%

2 180 18,63% 17,61%

3 174 18,01% 12,49%

4 126 13,04% 9,69%

5 115 11,90% 7,92%

6 76 7,87% 6,69%

7 57 5,90% 5,80%

8 41 4,24% 5,12%

9 26 2,69% 4,58% Tabelle 15: Auswertung der 966 Schlusskurse an der NYSE

27

Quelle: http://de.wikipedia.org/wiki/New_York_Stock_Exchange

Page 49: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

49 5.2 Schlusskurse der NYSE

Wenn wir nun die relative Häufigkeit mit der Benford-Verteilung vergleichen (siehe Abb.16),

Abbildung 16: Vergleich der Schlusskurse mit der Benford-Verteilung

können wir sehr gut erkennen, dass die Schlusskurse nicht Benford-verteilt sind. Sig. Abweichungen

sind ersichtlich bei den Ziffern eins, drei, vier, fünf und neun.

Doch nun stellt sich die Frage was uns die einzelnen Testverfahren für ein Resultat liefern. Des Weite-

ren ist jetzt auch der χ²-Anpassungstest für die Stichprobe aussagekräftiger, da die Stichprobe aus

966 Daten besteht.

1. χ²-Anpassungstest

Beim χ²-Anpassungstest erhalten wir für die Prüfgröße einen Wert von 114,995. Bei einem

Signifikanzniveau von 0,05 und einem Freiheitsgrad von 8 liegt der kritische Wert bei 15,507.

Daraus können wir schlussfolgern, wie schon vermutet, dass die Schlusskurse mit einer 95%iger

Sicherheit nicht Benford-verteilt sind, da die Prüfgröße größer als der kritische Wert ist.

2. Kolmogoroff-Smirnov-Anpassungstest

Beim KSA erhalten wir für die Prüfgröße einen Wert von 30,361. Bei einem Signifikanzniveau von

0,05 liegt der kritische Wert bei 1,36.

Daraus können wir schlussfolgern, dass die Schlusskurse mit einer 95%iger Sicherheit nicht

Benford-verteilt sind, da die Prüfgröße größer als der kritische Wert ist.

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

1 2 3 4 5 6 7 8 9

Schlusskurse

Relative

Benford

Page 50: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

50 5.3 Städte und Gemeinden mit mehr als 500 Einwohnern

3. Z-Test

Nach dem Z-Test liegen einige sig. Abweichungen vor (siehe Tab. 16). Dies gilt sowohl bei einem

Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.

d 1 2 3 4 5 6 7 8 9

Zd 8,368 0,794 5,139 3,468 4,529 1,394 0,066 1,156 2,726

Tabelle 16: Auswertung des Z-Tests für die Schlusskurse

Die sig. Abweichungen liegen bei den schon vermuteten Ziffern vor.

4. Abstandsmaß

Beim Abstandsmaß erhalten wir für unsere Stichprobe eine MAD von 0,03368. Nach Nigrinis An-

passungsschranken liegt der Wert über 0,012 und somit liegt auch nach diesem Testverfahren

keine Übereinstimmung vor.

5. Verzerrungsfaktor-Modell

Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,674 und für den erwarten-

den Mittelwert 3,904. Folglich ergibt sich als Prüfgröße -0,0589, da dieser Wert innerhalb des

Wertebereiches liegt, sind die Einträge, also die Schlusskurse Benford-verteilt.

Nun stellt sich die Frage, ob die Schlusskurse Benford-verteilt sind oder nicht. Vier der fünf Testver-

fahren sind der Meinung, dass die Daten nicht Benford-verteilt sind. Wenn wir aber davon ausgehen,

dass unsere Stichprobe aus 966 Daten besteht und somit der χ²-Anpassungstest aussagekräftiger ist,

können wir schlussfolgern, dass die Schlusskurse mit einer 95%iger Sicherheit nicht Benford-verteilt

sind. Des Weiteren ist auch in diesem Beispiel die Analyse der zweiten Ziffer nicht mehr nötig, da die

Testverfahren bis auf einen alle einstimmig waren.

5.3 Städte und Gemeinden mit mehr als 500 Einwohnern

Als letztes Anwendungsbeispiel betrachten wir uns alle Städte und Gemeinden in der Bundesrepublik

Deutschland mit mehr als 500 Einwohnern.

Dabei handelt es sich um 9422 Städte und Gemeinden.

Page 51: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

51 5.3 Städte und Gemeinden mit mehr als 500 Einwohnern

Bundesland Name Status Kreis Einwohner

Baden-Württemberg Aach Stadt Konstanz 2.178 Baden-Württemberg Aalen

Große Kreis-stadt Ostalbkreis 66.196

Baden-Württemberg Abstatt Gemeinde Heilbronn 4.507 Baden-Württemberg Abtsgmünd Gemeinde Ostalbkreis 7.421 Baden-Württemberg Achberg Gemeinde Ravensburg 1.657 Baden-Württemberg Achern

Große Kreis-stadt Ortenaukreis 24.947

Baden-Württemberg Achstetten Gemeinde Biberach 4.130

Tabelle 17: Ausschnitt aus den Städten & Gemeinden im Bundesland mit mehr als 500 Einwohnern28

Die Auswertung der 9422 Daten hinsichtlich der ersten Ziffer, zeigt uns die nachfolgende Tabelle.

Häufigkeit

d Absolute Relative Benford

1 2994 31,78% 30,10%

2 1435 15,23% 17,61%

3 883 9,37% 12,49%

4 586 6,22% 9,69%

5 934 9,91% 7,92%

6 809 8,59% 6,69%

7 676 7,17% 5,80%

8 575 6,10% 5,12%

9 530 5,63% 4,58% Tabelle 18: Auswertung der Städte & Gemeinden im Bundesland mit mehr als 500 Einwohnern

Anhand der Abb.17, kann man jetzt schon sehr gut erkennen, dass die Stichprobe nicht Benford-

verteilt ist.

28

Quelle: http://www.citypopulation.de/Deutschland_d.html

Page 52: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

52 5.3 Städte und Gemeinden mit mehr als 500 Einwohnern

Abbildung 17: Vergleich der Städte & Gemeinden mit der Benford-Verteilung

Doch was liefern uns jetzt die einzelnen Testverfahren für ein Ergebnis. Außerdem ist jetzt auch hier

der χ²-Anpassungstest für die Stichprobe noch aussagekräftiger, da die Stichprobe aus 9422 Daten

besteht.

1. χ²-Anpassungstest

Beim χ²-Anpassungstest erhalten wir für die Prüfgröße einen Wert von 398,815. Bei einem

Signifikanzniveau von 0,05 und einem Freiheitsgrad von 8 liegt der kritische Wert bei 15,507.

Daraus können wir schlussfolgern, dass die Daten mit einer 95%iger Sicherheit nicht Benford-

verteilt sind, da die Prüfgröße größer als der kritische Wert ist.

2. Kolmogoroff-Smirnov-Anpassungstest

Beim KSA erhalten wir für die Prüfgröße einen Wert von 92,625. Bei einem Signifikanzniveau von

0,05 liegt der kritische Wert bei 1,36.

Folglich sind die Daten nach KSA mit einer 95%iger Sicherheit nicht Benford-verteilt, da die Prüf-

größe größer als der kritische Wert ist.

3. Z-Test

Nach dem Z-Test liegen sig. Abweichungen bei allen Ziffern vor (siehe Tab. 19). Dies gilt sowohl

sowohl bei einem Signifikanzniveau von 0,05, als auch bei einem Signifikanzniveau von 0,1.

d 1 2 3 4 5 6 7 8 9

Zd 3,530 6,049 9,150 11,373 7,152 7,326 5,690 4,327 4,850

Tabelle 19: Auswertung des Z-Tests für die Städte & Gemeinden

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

1 2 3 4 5 6 7 8 9

Städte & Gemeinden

Relative

Benford

Page 53: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

53 5.3 Städte und Gemeinden mit mehr als 500 Einwohnern

4. Abstandsmaß

Beim Abstandsmaß erhalten wir für unsere Stichprobe eine MAD von 0,01994. Nach Nigrinis An-

passungsschranken liegt der Wert über 0,012 und somit liegt keine Übereinstimmung vor.

5. Verzerrungsfaktor-Modell

Für den Verzerrungsfaktor erhalten wir als beobachteten Mittelwert 3,660 und für den erwarten-

den Mittelwert 3,908. Folglich ergibt sich als Prüfgröße -0,06354. Dieser Wert liegt innerhalb des

Wertebereiches und somit sind die Daten Benford-verteilt.

Wir können mit einer 95%iger Wahrscheinlichkeit davon ausgehen, dass die Städte und Gemeinden

mit mehr als 500 Einwohnern nicht Benford-verteilt sind. Wobei das Verzerrungsfaktor-Modell der

Behauptung ist, dass die Daten Benford-verteilt sind. Aber sowohl in diesem als auch beim vorheri-

gen Beispiel ist das Verzerrungsfaktor-Modell nicht sehr geeignet. Der Grund dafür ist, weil das Ver-

zerrungsfaktor-Modell speziell für die Überprüfung der Bilanz entwickelt wurde.

Page 54: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

54 Schlussfolgerung

Schlussfolgerung

Das Phänomen Newcomb-Benford-Law, haben wir sowohl mathematisch nachgewiesen als auch

anhand von Daten, wie z.B. die Überprüfung einer Bilanz auf Manipulation, angewendet.

Das Gesetz spielt in vielen Gebieten unseren Lebens eine wichtige Rolle. Wie z.B. dass die

Hausnummern

Länge der Flüsse

Einwohnerzahlen der 3141 US-Bezirke

u.v.m. Benford-verteilt sind.

Ein weiteres Beispiel ist, mit dem sich heutzutage jeder Mensch beschäftigt, die Recherche in Such-

maschinen (z.B. Google). Wie oft wird die zweite Seite oder die Seite neuen bei einer Suche aufgeru-

fen? Folglich sind die Aufrufe bei Suchmaschinen nach Benford-verteilt.

Das faszinierende am Gesetz ist überhaupt, wie auch das Ziel dieser Arbeit ist, die Überprüfung von

Bilanzen auf Manipulation. Anhand des Beispiels aus Kapitel fünf haben wir sehen können, wie die

Vorgehensweise dabei ist.

Die untersuchte Bilanz wurde nach der Durchführung der Testverfahren als nicht gefälscht bewertet.

Dabei muss man aber beachten, dass der Stichprobenumfang nicht sehr groß war und dadurch Test-

verfahren wie der χ²-Anpassungstest in seiner Anwendung eingeschränkt sind.

Bei der Überprüfung einer Bilanz auf Manipulation sollte man folgendes nicht falsch interpretieren.

Falls nach der Analyse, die Bilanz als nicht gefälscht bewertet wird, wie in unserem Beispiel, heißt

dies nicht automatisch, dass das Unternehmen als profitabel eingestuft wird.

Des Weiteren konnten wir aber auch sehen, dass die Schlusskurse an der NYSE und die Städte und

Gemeinden im Bundesland mit mehr als 500 Einwohner nicht Benford-verteilt sind. Da die Stichpro-

benumfänge hier recht groß waren, im Vergleich zum vorherigem Beispiel, war die Entscheidung

umso einfacher.

Das Gesetz findet nicht nur in der Wirtschaft seine Anwendung, sondern auch z.B. in der Wissen-

schaft oder Wettspiele u.v.m.

Ein Beispiel für die Wettspiele ist das Lottospiel. Wenn man nun sich jetzt fragt, ob sich anhand des

Gesetzes im Lottospiel die Gewinnchance erhöht? Die Antwort lautet natürlich nein! Der Gewinn

Page 55: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

55 Schlussfolgerung

erhöht sich aber, wenn er denn überhaupt eintritt . Wenn wir davon ausgehen, dass die meisten

Leute unbewusst kleine Zahlen als führende Ziffer präferieren, dann sollte man beim Tippen selbst

diese Zahlen meiden, damit beim Gewinn die Gewinnsumme mit weniger Mitgewinnern teilen zu

müssen.

Anhand der Beispiele konnte man aber auch sehen, dass das Gesetz in seiner Anwendung hinsichtlich

der Testverfahren noch nicht ausgereift ist. D.h. dass es noch kein spezielles Testverfahren aus-

schließlich für die Benford-Verteilung gibt.

Der χ²-Anpassungstest ist nur für große Stichproben geeignet und des Weiteren müssen die Daten

unabhängig sein.

Der KSA ist für kleine Stichproben besser geeignet. Da die Voraussetzung jedoch für die Anwendung

die Stetigkeit von ist, ist der KSA konservativ und von geringer Güte.

Der Z-Test ist im Vergleich zu den vorherigen Testverfahren besser, aber anhand von ihm kann nicht

das gesamte Paket bewerten.

Die letzten zwei Testverfahren – MAD und Verzerrungsfaktor-Modell – beruhen auf Beobachtungen

von Nigrini. Das Verzerrungsfaktor-Modell macht im Vergleich zum MAD einen besseren Eindruck.

Aus diesem Grund sind die Testverfahren hinsichtlich des Newcomb-Benford-Gesetzes noch nicht

ausgereift und deshalb noch ausbau fähig.

Was in dieser Arbeit nicht untersucht respektive nicht nachgewiesen wurde und außerdem in der

Regel auch in vielen anderen Arbeiten vernachlässigt wird, ist der Beweis hinsichtlich des Logarith-

mus. D.h. warum lautet es überhaupt

und nicht vielleicht

?

Page 56: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

56 Literaturverzeichnis

Literaturverzeichnis

Benford 1938 BENFORD, Frank: The Law of anomalous Numbers. In: Proceedings of the American

Philosphical Society 78 (1938), S. 551-572

Brähler 2011 BRÄHLER, G. ; BENSMANN, M. ; JAKOBI, H.R.: Das Benfordsche Gesetz und seine An-

wendbarkeit bei der digitalen Prüfung von Fahrtenbüchern. proWiWi e.V. Ilmenau, 2011

Buck u. a. 1993 Buck, B. ; Merchant, A.C. ; Perez, S.M.: An illustration of Benford’s first digit law

using alpha decay half lives. In: European Journal of Physics 14 (1993), S. 59–63

De Ceuster u. a. 1998 DE CEUSTER, Marc J. ; DHAENE, Geert ; SCHATTEMAN,Tom: On the hypothe-

sis of psychological barriers in stock markets and Benford’s Law. In: Journal of Empirical Finance 5

(1998), S. 263–279

Diaconis 1977 DIACONIS, Persi: The Distribution of leading Digits and uniform Distribution Mod 1.

In: The Annals of Probability 5 (1977), Nr. 1, S. 72–81

Durtschi u.a. 2004 DURTSCHI, Cindy ; HILLISON, William ; PACINI, Carl: The Effective Use of Ben-

ford’s Law to Assist in Detecting Fraud in Accounting Data. In: Journal of Forensic Accounting 5

(2004), S. 17-34

Feldstein 1976 FELDSTEIN, Alan ; GOODMAN, Richard: Convergence Estimates for the Distributions

of Trailing Digits. In: Journal of the Association for Computing Machinery 23 (1976), April, S. 287–297

Goto 1992 GOTO, Kazuo: Some examples of Benford Sequences. In: Math. Journal Okayama Univ.

34 (1992), S. 225–232

Gottwald und Nicol 2002 GOTTWALD, Georg A. ; NICOL, Matthew: On the nature of Benford’s

Law. In: Physica A 303 (2002), S. 387–396

Hartung u.a. 2009 HARTUNG, J ; ELPELT, B ; KLÖSENER, K.H.: Statistik Lehr- und Handbuch der

angewandten Statistik. 15., überarbeitete und wesentliche erweiterte Auflage. Oldenbourg Mün-

chen, 2009

Page 57: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

57 Literaturverzeichnis

Hill 1995 HILL, Theodore P.: Base-Invariance Implies Benford’s Law. In: Proceedings of the American

Mathematical Society 123 (1995), S. 887–895

Hill 1996 HILL, Theodore P.: A Statistical Derivation of the Significant-Digit Law. In: Statistical

Science 10 (1996), Nr. 4, S. 354–363

Hill 1999 HILL, Theodore P.: The difficulty of faking data. In: Chance 26 (1999),S. 8–13

Hoyle u. a. 2002 HOYLE, David C. ; RATTRAY, Magnus ; JUPP, Ray ; BRASS, Andrew: Making sense of

microarray data distributions. In: Bioinformatics 18 (2002), Nr. 4, S. 576–584

Jamain 2001 JAMAIN, Adrien: Benford’s Law. 2001. Unpublished Dissertation Report, Department

of Mathematics, Imperial College, London.

Kenneth 2011 KENNETH, A. Ross: Benford’s Law, A Growth Industry. In: The Mathematical Associa-

tion of America Monthly 118 (2011), S. 574-583

Ley und Varian 1994 LEY, E. ; VARIAN, H.R.: Are there Psychological Barriers in the Dow-Jones In-

dex? In: Applied Financial Economics 4 (1994), S. 217–224

Newcomb 1881 NEWCOMB Simon: Note on the Frequency of Use of the Different Digits in Natural

Numbers. In: American Journal of Mathematics 4 (1881), S. 39-40

Nigrini 1996 NIGRINI, Mark J.: A taxpayer compliance application of Benford’s law. In: Journal of

the American Taxation Association 18 (1996), S. 72–91

Pinkham 1961 PINKHAM, Roger S.: On the distribution of first significant digits. In: Annals of

Mathematical Statistics 32 (1961), S. 1223–1230

Posch 2010 POSCH N. Peter: Ziffernanalyse. 2.Auflage, Europäische Wirtschaft München, 2010

Schatte 1988b SCHATTE, Peter: On the Almost Sure Convergence of Floating-Point Mantissas and

Benford’s Law. In: Mathematische Nachrichten 135 (1988), S. 79–83

Page 58: Bachelor-Thesisdigdok.bib.thm.de/volltexte/2012/4357/pdf/Newcomb_Benford_Geset… · Januar 2012 Unterschrift . Danksagung 4 Danksagung An dieser Stelle möchte ich mich bei all denen

58 Literaturverzeichnis

Schatte 1989 SCHATTE, Peter: On Measures of Uniformly Distributed Sequences and Benford’s Law.

In: Monatshefte Mathematik 107 (1989), S. 245–256

Schatte 1998 SCHATTE, Peter: On Benford´s Law to Variable Base. In: Statistics & Probability Let-

ters 37 (1998), S. 391–397

Torres u.a. 2007 TORRES, J. ; FERNÀNDEZ, S. ; GAMERO, A. ; SOLA, A.: How do numbers begin?

(The first digit law). In: European Journal of Physics 28 (2007), S.17-25

Weyl 1916 WEYL, Hermann: Über die Gleichverteilung von Zahlen modulo Eins. In: Mathematische

Annalen 77 (1916), S. 313–352