M it Z ahlen l gen - Westdeutscher Rundfunk

16
Script zur wdr-Sendereihe Quarks & Co Mit Zahlen lügen Westdeutscher Rundfunk Köln Appellhofplatz 1 50667 Köln Tel.: (0221) 2 20-36 82 Fax: (0221) 2 20-86 76 E-mail: [email protected] www.quarks.de

Transcript of M it Z ahlen l gen - Westdeutscher Rundfunk

Page 1: M it Z ahlen l gen - Westdeutscher Rundfunk

Script zur wdr-Sendereihe Quarks&Co

Mit Zahlen lügenWestdeutscher Rundfunk Köln

Appellhofplatz 150667 Köln

Tel.: (0221) 2 20-36 82Fax: (0221) 2 20-86 76

E-mail: [email protected]

www.quarks.de

Page 2: M it Z ahlen l gen - Westdeutscher Rundfunk

Text: Axel Bach, Reinhard Brüning, Katrin Krieft, Hilmar Liebsch, Martin Rosenberg;Kooperation: Der Einleitungstext entstand in Kooperation mit dem Lehrstuhl fürWissenschaftsjournalismus in Dortmund. Autorin: Jennifer Dacqué; Redaktion:Tilman Wolff; Copyright: wdr, Oktober 2006; Gestaltung: Designbureau Kremer &Mahler, Köln

Bildnachweis: alle Bilder Freeze wdr 2006 außer S. 6: Nature November 2006

Bereits vor dem Frühstück geht es los: Das Etikett des Shampoos verspricht 70 Prozentweniger Haarausfall, die Zahnpasta dreimal weißere Zähne als fünf Vergleichsprodukte undim Radio verkündet der Sprecher die neuen Arbeitslosenzahlen. Statistiken begleiten unsvon morgens bis abends, denn nahezu alles wird heute in Zahlenreihen erfasst, ausgewer-tet und verglichen.

Glauben wir Zahlen eher als Worten? Eine Aussage gestützt durch eine Statistik klingtschließlich gleich viel seriöser. Doch ist sie das auch immer?

„Ich glaube nur der Statistik, die ich selbst gefälscht habe.“ Diesen Satz hängte die Nazi-propaganda einst dem britischen Premierminister Winston Churchill an, um den Kriegs-gegner unglaubwürdig zu machen. Dabei ist der Satz an sich richtig: Mit kleinen Tricks lässtsich fast jede Statistik so frisieren, dass sie praktisch jede Aussage untermauert. Beispielegibt es genug. Einige haben wir hier für Sie zusammengestellt.

Viel Spaß beim Lesen wünscht das Quarks-Team!

4 Die Intelligenz der Masse

5 Früher war alles billiger! Die gefühlte Statistik

7 Das Jobangebot

10 Tödliche Zahlen: Medizinstatistiken

13 Was macht eigentlich das Statistische Bundesamt?

16 Werden die Menschen wirklich immer älter?

18 Eine Frau gegen die Statistik – der Fall Sally Clark

20 Auf Verbrecherjagd mit Benford

22 Der Umfrage-Test

24 Die schlechtesten Grafiken der Welt

Weitere Informationen, Link- und Lesetipps finden Sie unter: www.quarks.de

InhaltInhalt

Mit Zahlen lügenMit Zahlen lügen

Page 3: M it Z ahlen l gen - Westdeutscher Rundfunk

Wenn viele Leute gemeinsam auf das richtige Er-gebnis kommen, dann nennen die Wissenschaft-ler das die Intelligenz der Masse. Darauf ge-stoßen ist vor 100 Jahren der englische GelehrteFrancis Galton und zwar als er eigentlich dasGegenteil beweisen wollte – nämlich, dass dieMasse dumm ist.

1906 besuchte er die westenglische Nutztier-messe in der Nähe von Plymouth. Dort gab eseinen Schätzwettbewerb: Für sechs Pence

durfte man auf das Gewicht eines Ochsen wet-ten. Wer am nächsten dran lag, konnte gewin-nen.

Nachdem Galton die Schätzungen ausgewertethatte, muss er ziemlich verblüfft gewesen sein:Der Mittelwert der 787 Einzelschätzungen wichnur um ein Pfund vom tatsächlichen Gewicht desOchsen ab. Und – was noch erstaunlicher war –kein Einzel-Tipp (auch nicht der eines Experten)war genauer als der Mittelwert der großen Masse.

Ob das Experiment, das Galton 1907 in der Zeit-schrift Nature beschrieben hat, auch mit ande-ren Schätzaufgaben funktioniert, haben wir mitIhnen zusammen getestet und waren selbst über-rascht über das Ergebnis.

Unter www.quarks.de zeigten wir einen Behälter,in dem genau 5.780 Liebesperlen enthaltenwaren. Wieviele es waren, sollten Sie schätzen.Hier das Ergebnis Ihrer Schätzungen:

Anzahl Liebesperlen: 5.780

Durchschnittlicher Schätzwert: 5.714

Abweichung: -1,14 %

Anzahl der Schätzungen: 15.885

Genaue Treffer: 0,47 %

54

Die Intelligenz der MassenDie Intelligenz der Massen

3.5003.0002.5002.0001.000

5000

-100% - -80%

-79% - -60%

-59% - -40%

-39% - -20%

-19% - 0%

1 - 20%

21% - 40%

41% - 60%

61% - 80%

81% - 100%

Abgegebene Schätzungen

Abweichung in %

Auf die Intelligenz der Masse stieß vor über hundertJahren der englische Gelehrte Francis Galton

Im Internet sollten die Quarks & Co Zuschauerdie Anzahl der Liebesperlen in diesem Becherglasschätzen

Page 4: M it Z ahlen l gen - Westdeutscher Rundfunk

Preisexplosion, und der Euro ist schuld

Seit 2002 der Euro eingeführt wurde, wird allesteurer – oder? Die Debatte darüber, ob der Euroein Teuro ist, flammte sofort nach der Umstel-lung auf und ließ sich auch von den Zahlen desStatistischen Bundesamtes nicht aus der Weltschaffen. Dessen abschließende Studie zeigte:in den letzten zweieinhalb Jahren der D-Mark wardie Inflation sogar ein Prozent höher als in denersten beiden Euro-Jahren – die Preissteigerungging mit dem Euro also wieder etwas zurück.Diese Zahlen sind unanfechtbar. Aber bei denMenschen blieb das Teuro-Gefühl bestehen.

Die Mutter gab den Anstoß

Ein Deutscher, der an der Universität von Fribourgin der Schweiz Statistik lehrte, hätte von alledemnichts mitbekommen, wenn er nicht von Zeit zuZeit in seine alte Heimat nach München gefahrenwäre. Dort war seine Mutter empört über dieErgebnisse des Statistischen Bundesamtes: Dassei Schrott, was seine Kollegen da ausrechnen! Sieforderte den Sohn beim Frühstück auf, sich aufdem Tisch umzuschauen: Alles sei teurer gewor-den! Prof. Hans Wolfgang Brachinger ist zwar Spe-

zialist für die Statistik von Preisen, doch er konnteseiner Mutter nicht gleich antworten – aber ernahm ihre Empörung ernst und kam ins Grübeln.Beim Nachdenken über die subjektive Empfindungder Kunden erinnerte er sich an psychologischeEntscheidungstheorien. Dort taucht ein Faktor auf,der in Statistiken meist unberücksichtigt bleibt:nämlich die Häufigkeit, mit der etwas gekauft wird.Ein Auto kauft man zum Beispiel eher selten. Des-halb nimmt der Verbraucher hier einen Preisan-stieg nur schwach wahr. Lebensmittel oder Kleidungkaufen die Menschen dagegen häufig. Und wenndie teurer werden, empfinden sie das deutlich.

Schnäppchen vergisst man schnell

Hans Wolfgang Brachinger schlug weiter bei denPsychologen nach und entdeckte noch etwas:Jeder Kauf läuft offenbar nach einem starrenSchema ab. Der Kunde erinnert sich an einen soge-nannten Referenzpreis für das Produkt. Mit demPreis, den er in Erinnerung hat, vergleicht er denaktuellen Kaufpreis. Ist der neue Preis günstiger,wertet das der Kunde als Gewinn. Ist der erinnerteReferenzpreis dagegen niedriger als der aktuelleKaufpreis, wird das als Verlust bewertet. Darüberhinaus haben die Psychologen herausgefunden,

76

Fie gefühlte StatistikFrüher war alles billiger! Die gefühlte Statistik

Quarks & Co bei Nature

Dieses Ergebnis hat auch die Herausgeber derrenommierten Wissenschafts-Zeitschrift Natureso überrascht, daß sie das Quarks-Liebesperlen-Experiment in der Ausgabe vom 2. November 2006veröffentlichten.

Der Quarks & Co Liebesperlentest war der Wissenschafts-Zeitschrift Nature eineVeröffentlichung wert

Page 5: M it Z ahlen l gen - Westdeutscher Rundfunk

dass hohe Preise doppelt so stark wahrgenommenwerden wie die Preise von Schnäppchen – und ent-sprechend stark und negativ in Erinnerung bleiben.

Die gefühlte Inflation wird gemessen

Mit diesen Erkenntnissen entwickelte HansWolfgang Brachinger einen Preisindex für das, waser gefühlte Inflation nennt. Dafür arbeitete er engmit dem Statistischen Bundesamt zusammen.Nach einigen Monaten konnte er seinen neuen,gefühlten Preisindex zum ersten Mal berechnen.Und der Professor war zufrieden, denn die Kurvezeigte tatsächlich einen drastischen Anstieg direktvor der Währungsumstellung! Kurz bevor der Eurokam, hatten die Preise also stark angezogen – derUnmut der Menschen ging also tatsächlich aufempirische Ursachen zurück. Das schien plausibel. Nur eines war merkwürdig: Die Kurve normalisier-te sich wieder, aber das Gefühl der erhöhten Preise,das war ja geblieben! Hans Wolfgang Brachingerwar fasziniert von diesem Phänomen – warum hal-ten Menschen so an ihrem schlechten Eindruckfest? Wieder gab die Mutter den Hinweis auf dasProblem, denn beim gemeinsamen Einkaufen warBrachinger etwas an seiner Mutter aufgefallen: Sierechnete alle Preise immer noch auf D-Mark um

und verglich sie mit den alten Mark-Preisen vondamals, vor 2002. Sie hatte also einen längst ver-alteten Referenzpreis, der seit der Währungsum-stellung nicht gestiegen ist. Dieser Effekt hat fürdie gefühlte Inflation dramatische Folgen: Siesteigt mehr und mehr und ist heute bei etwa 16Prozent angelangt.

Wer nicht umrechnet, ist realistischer

Einige rechnen immer noch um, für die meistenwird der letzte D-Mark-Preis aber nach und nachunwichtiger, sie vergleichen immer mehr mit denEuro-Preisen der letzten Zeit. Das hat der Statistik-professor auch in seine Zahlen einbezogen. SeineErgebnisse besagen, dass das Teuerungsgefühlheute bei etwa sieben Prozent im Vergleich zu realvorhandenen zwei Prozent liegt. Also ist diegefühlte Inflation und Teuerung immer noch deut-lich höher als die reale. Das Teuro-Gefühl ist durchHans Wolfgang Brachingers Arbeiten jetzt wissen-schaftlich erklärt. Er kann zeigen, dass die Unzu-friedenheit der Menschen auf eine empirischeGrundlage zurückgeht. Seine Ergebnisse stehenim Einklang zu denen des Statistischen Bundes-amtes, denn gefühlte und wirtschaftlich berechne-te Inflation sind eben nicht dasselbe.

Blanke Zahlen und Gefühl sind zwei völlig verschie-dene Welten und häufig führt uns unser Gefühlaufs Glatteis, selbst wenn es um lebenswichtigeZahlen geht, wie beispielsweise das Gehalt.Schließlich will jeder von uns doch gut bezahlt wer-den für seine Arbeit. Nehmen Sie an, Ihnen wird einJobangebot gemacht: Sie bekommen ein Jahres-gehalt von 10.000,- Euro. Außerdem bietet Ihnender Arbeitgeber eine regelmäßige Gehaltsstei-gerung an. Sie dürfen wählen ob Sie entweder:

Variante A nach jedem Jahr, das Sie gearbei-tet haben, 1000,- Euro mehr bekommen, oder

Variante B nach jedem halben Jahr, das Sie gearbeitet haben, 250,- Euro mehr be-kommen.

Also halbjährlich 250,- Euro oder jährlich 1.000,-Euro Gehaltssteigerung.

Das Angebot ist vom Arbeitgeber clever gewählt,denn die meisten Menschen würden sich für dieVariante A entscheiden, für die 1.000,- Euro Ge-haltssteigerung auf das Jahresgehalt. Das klingtnach mehr – doch ein Geschäft machen bei dieserVariante nicht Sie, sondern das Geschäft machtder Arbeitgeber. Wenn man die beiden Angebotenämlich einmal ausrechnet und vergleicht, ergibtsich, daß Sie mit Variante B, also den 250,- EuroGehaltssteigerung aufs Halbahresgehalt deutlichbesser abschneiden.

Wenn Sie sich für Variante B entschieden hätten,wäre jedes Jahr mehr in Ihrem Geldbeutel als bei

98

140

120

100

80

50

40

20

00

-20JAN 98 JAN 99 JAN 00 JAN 01 JAN 02 JAN 03 JAN 04 JAN 05

Die von Hans Wolfgang Brachinger berechnete gefühlteInflation (rot) liegt bis heute etwa fünf Prozent über dervom Statistischen Bundesamt berechneten Inflation (blau)

Das JobangebotDas JobangebotDie gefühlte Statistik

Jahresgehalt Grundgehalt 10.000,- Euro plus die Gehaltssteigerung:

1. Jahr 2. Jahr 3. Jahr 4.Jahr 5. Jahr 6.Jahr

Variante A: 1.000,- Euro mehr

nach jedem Jahr 1 10.000,- 1 11.000,- 1 12.000,- 1 13.000,- 1 14.000,- 1 15.000,-

Variante B: 250,- Euro mehr

nach jedem Halbjahr 1 10.250,- 1 11.250,- 1 12.250,- 1 13.250,- 1 14.250,- 1 15.250,-

Page 6: M it Z ahlen l gen - Westdeutscher Rundfunk

1110

Das JobangebotVariante A. Wie kommt das? Dafür muß man einbisschen rechnen und die richtigen Grundlagendafür wählen:

Wenn Sie mal nicht aufs ganze Jahr rechnen, son-dern wie es bei Variante B ja angeboten wird aufshalbe Jahr, dann sieht die Rechnung so aus: Imersten Jahr gibt es das Jahresgehalt von 10.000,-Euro, also 5.000,- pro Halbjahr:

nach einem Jahr die erste Gehaltssteigerung von1 1.000-, insgesamt bekommen Sie jetzt 1 11.000,- ,also 5.500,- pro Halbjahr:

nach dem zweiten Jahr wieder 1 1.000,- mehr, alsoinsgesamt 1 12.000,- und aufs Halbjahr gerechnet6000,- pro Halbjahr:

Wenn Sie dieselbe Rechnung für Variante B aufma-chen, dann sehen Sie schnell die Abweichungen.Hier ist ja eine Gehaltssteigerung bereits nach einemhalben Jahr versprochen und das sieht dann so aus:

Das Grundgehalt sind die 1 10.000,-, also eben-falls 5000,- pro Halbjahr. Aber bereits nach einemhalben Jahr bekommen Sie bei dieser Varianteeine Steigerung von 1 250,-

So bekommen Sie bereits im ersten Jahr bei dieserVariante 1 250,- mehr, also insgesamt 1 10.250,-. Imdarauffolgenden Halbjahr bekommen Sie jetztschon wieder eine Steigerung von 1 250,- und nacheinem weiteren Halbjahr wieder 250,- mehr:

Genauso geht es dann weiter:

Und wenn Sie beide Varianten in dieser detaillier-ten Rechnung vergleichen, sehen Sie sofort, dassVariante B die bessere ist – für Sie:

Unser Fazit: bei entscheidenden Zahlen, wie demGehalt, aber auch bei Krediten und allen anderenGeschäften mit Banken und Versicherungen, beimPreisvergleich und besonders, wenn es ums Geldgeht, sollte man sich die Zeit nehmen und mitZettel, Bleistift und Taschenrechner nachrechnen.Denn: nicht die Zahlen lügen, sondern wir fallenauf uns selbst herein, wenn wir die Zahlen falschinterpretieren...

Jahresgehalt Grundgehalt 10.000,- Euro plus die Gehaltssteigerung:

1. Halbjahr 2. Halbjahr 3. Halbjahr 4. Halbjahr 5. Halbjahr 6. Halbjahr

Variante A: 1000,- Euro mehr nach jedem Jahr

aufs Halbjahr gerechnet 1 5.000,- 1 5.000,- 1 5.500,- 1 5.500,- 1 6.000,- 1 6.000,-

Variante B: 250,- Euro mehr nach jedem Halbjahr

aufs Halbjahr gerechnet 1 5.000,- 1 5.250,- 1 5.500,- 1 5.750,- 1 6.000,- 1 6.250,-

Ihr Gewinn bei Variante B + 1 250,- + 1 250,- + 1 250,-

Variante A:

1000,- Euro mehr nach jedem Jahr 1. Halbjahr 2. Halbjahr

aufs Halbjahr gerechnet 1 5.000,- 1 5.000,-

Variante B: 250,- Euro mehr

nach jedem Halbjahr 1. Halbjahr 2. Halbjahr

aufs Halbjahr gerechnet 1 5.000,- 1 5.250,-

Variante B: 250,- Euro mehr

nach jedem Jahr 3. Halbjahr 4. Halbjahr

aufs Halbjahr gerechnet 1 5.500,- 1 5.750,-

Variante A: 1000,- Euro mehr

nach jedem Jahr 3. Halbjahr 4. Halbjahr

aufs Halbjahr gerechnet 1 5.500,- 1 5.500,-

Variante A: 1000,- Euro mehr

nach jedem Jahr 5. Halbjahr 6. Halbjahr

aufs Halbjahr gerechnet 1 6.000,- 1 6.000,-

Variante B: 250,- Euro mehr

nach jedem Jahr 5. Halbjahr 6. Halbjahr

aufs Halbjahr gerechnet 1 6.000,- 1 6.250,-

Page 7: M it Z ahlen l gen - Westdeutscher Rundfunk

Links:In den Universitätsbibliotheken finden sich mehr fehlerhafte Studien als man denken würde

Mitte:Wenn der Arzt in diesen Röntgenbildern Brustkrebs findet, hilft das nur einer Frau von 1.000

Rechts:Manche Fehler in Medizinstatistiken gehen regelrecht ans Herz

Tödliche Zahlen: MedizinstatistikenMit Zahlen jonglieren – Beispiel Brustkrebs

Jedes Jahr erscheinen rund zwei Millionen Artikelin den rund 10.000 medizinischen Fachzeitschrif-ten. Hier geht es um die Wirksamkeit eines neuenMedikaments, dort um den Heilerfolg einer Be-handlungsmethode. Fehler in solchen Studienkönnen verheerende Folgen haben. Und sie sindgar nicht so selten, wie man vielleicht denkenwürde. So wurde in den 1990er Jahren in diversenStudien untersucht, wie sinnvoll Vorsorgeunter-suchungen zur Früherkennung von Brustkrebssind. Dabei wird bei allen Frauen ab 50 regelmäßigmit Röntgenstrahlen nach Hinweisen auf Brust-krebs gesucht, das so genannte Mammografie-Screening. Eine schwedische Forschergruppe fandheraus, dass durch eine solche Reihenunter-suchung das Brustkrebsrisiko um gut 30 Prozentsinkt. Das ist zwar richtig – wenn man sich aller-dings die absoluten Zahlen ansieht, sind dieErgebnisse nicht ganz so beeindruckend: DreiFrauen von 1.000 sterben an Brustkrebs, wennkeine Reihenuntersuchung gemacht wird. Mit derReihenuntersuchung sind es nur zwei. Das bedeu-tet: Nur eine Frau von 1.000 überlebt, weil sie ander Untersuchung teilgenommen hat. Eindrucks-voller ist natürlich die Risikoberechnung mit 30

Prozent geretteten Patientinnen, obwohl auch diezweite Zahl stimmt – nur eine von tausend profi-tiert von der Voruntersuchung. Daher beziehensich Aufklärungsbroschüren und Internetseiten,die das Brustkrebs-Screening propagieren, fastimmer auf die 30 Prozent. Auf der anderen Seiteaber steht die Belastung mit Röntgenstrahlung,die letztlich ebenfalls Krebs hervorrufen kann. EinRisiko, das allein die Frauen tragen müssen und indieser Statistik nicht vorkommt.

Falsches Studienziel bei Herzrhythmus-störungen

Dass ein neues Medikament durch Nachlässig-keiten tödliche Folgen haben kann, zeigt einBeispiel aus den 1980er Jahren. Der in den 1970erJahren entwickelte Wirkstoff Flecainid zur Be-handlung von Herzrhythmusstörungen kam nacherfolgreichen Tests auf den Markt. Eine großeStudie hatte bewiesen, dass eine bestimmte Artvon Rhythmusstörung seltener auftrat, für die dasMittel entwickelt worden war. Ein folgenschwererFehler: Es stellte sich nämlich heraus, dassFlecainid in einigen Fällen eine ganz andere Artvon Rhythmusstörungen überhaupt erst auslös-

te. Mehrere Patienten starben daran. Von Beginnan hätte man in der Studie eine andere Fragestellen müssen, nämlich die, ob Flecainid beiden Herzpatienten allgemein die Sterblichkeitsenken kann. Nur dann wäre aufgefallen, dassdas Medikament tödliche Nebenwirkungen hat.

Solche Nachlässigkeiten geschehen in medizini-schen Studien häufig. Insbesondere um dieRechenkünste der Mediziner scheint es nichtgut bestellt zu sein. Eine Untersuchung zeigte,dass es in medizinischen Studien von Rechen-fehlern nur so wimmelt: Zahlen werden falschgerundet (aus 0,92 wird so schnell eine 1 stattder 0,90. Oder Ergebnisse werden durch simpleTippfehler um eine ganze Kommastelle verän-dert (etwa aus 0,0014 wird 0,014).

Nur die Hälfte der Zahlen veröffentlicht

Auf einem Auge blind waren die britischen For-scher, die eine neue Bestrahlungsmethodegegen Kopf-Hals-Tumoren testeten. In den ers-ten 40 Monaten des Studienverlaufs war dieneue Methode tatsächlich besser als die alte.Danach verlor sich der Effekt. Doch die Forscher

veröffentlichten nur die Daten, die den Erfolgbelegten – kein Einzelfall bei medizinischenStudien. Rund zwei Drittel aller Ergebnisse überNebenwirkungen werden nur unvollständigveröffentlicht. Und nicht immer scheint Nach-lässigkeit der Grund für die Fehler zu sein: 80Prozent der industriefinanzierten Studien kom-men zu positiven Ergebnissen, was die Wirk-samkeit neuer Medikamente oder Verfahrenangeht. Bei den unabhängigen Studien sind esnur 50 Prozent.

Nebenwirkungen verschwiegen

Auch im Fall Vioxx, dem wohl größten Medika-menten-Skandal der letzten Jahre, sind dieForscher nicht über jeden Verdacht erhaben.Vioxx wurde 1999 als Super-Aspirin mit einemungeheuren Werbeaufwand eingeführt. 2005,nur sechs Jahre später, nahm Hersteller Merckdas Mittel freiwillig wieder vom Markt. Grundwaren die Ergebnisse einer internen Studie, dieein erhöhtes Risiko für Gefäßerkrankungenzeigte. In diesen Tests stieg nach 18 Monatendas Herzinfarkt- und Schlaganfall-Risiko in derVioxx-Gruppe an, nicht aber bei den Probanden,

1312

Tödliche Zahlen: Medizinstatistiken

Page 8: M it Z ahlen l gen - Westdeutscher Rundfunk

1514

Ob eine neue Bestrahlungsmethode wirklich besser ist,kann man nur beurteilen, wenn man die gesamtenStudienergebnisse kennt

Tödliche Zahlendie ein Plazebo geschluckt hatten. Neu schiendieser Effekt der Firma Merck aber nicht zu sein:Bereits in einer Studie aus dem Jahr 2000, alsodirekt nachdem Vioxx in den Handel kam, wardiese gefährliche Nebenwirkung aufgefallen.Drei Herzinfarkte seien nicht in der Publikationder Fachzeitschrift berücksichtigt worden,obwohl sie den Autoren bekannt gewesen seien.Das sagte später Gregory Curfman, Chefredakteurdes New England Journal of Medicine, einer aner-kannten Medizinzeitschrift, die ebenfalls dieVioxx-Studie veröffentlicht hatte. Außerdemseien noch zwei Tage vor Einreichen der Arbeitwichtige Daten zu den Nebenwirkungen voneiner Diskette gelöscht worden. Die Firma Mercksieht sich nun einer Flut von Klagen der geschä-digten Patienten ausgesetzt.

Plazebo

Ein Plazebo ist ein wirkungsloses Medikament. Es wird zurÜberprüfung von Behandlungen eingesetzt, um die spezielleWirkung eines Medikamentes von unspezifischen Effekten einerBehandlung zu trennen

Der Phantasie freien Lauf lassen – der Fall Sudbø

Man kann es allerdings noch bunter treiben.Anfang 2006 ist ein norwegischer Forscher aufge-flogen. Er hatte alle seine 1.000 Studienteilneh-mer frei erfunden. Aufgefallen ist er nur, weil 250seiner fiktiven Probanden dasselbe Geburts-datum hatten…

Was macht eigentlich...

Lange Flure - zahllose Büros: 2.800 Mitarbeiter bearbeitenjährlich 390 verschiedene Statistiken

Was macht eigentlich das Statistische Bundesamt?

Kein Selbstzweck

Das Statistische Bundesamt entscheidet nichtselbst, was gezählt wird, sondern erhält seineAufträge vom Bundestag oder der EU. Für jedeStatistik wird also eigens ein Gesetz erlassen.So soll dafür gesorgt werden, dass die Statis-tiken immer auch eine gesellschaftlich relevanteFrage behandeln. Nur dann treten die amtlichenZahlenexperten in Aktion.

Anfänge nach dem Krieg

Den Anstoß zur Gründung einer Statistikbehör-de gaben die Militärregierungen der westlichenBesatzungszonen gleich nach dem Ersten Welt-krieg. 1950 wird daraus das Statistische Bun-desamt, 1954 bekommt die junge Behörde inWiesbaden ein eigenes Gebäude. Nur drei Jahrespäter kommt die erste Statistik zu Bevölkerungund Erwerbsleben heraus, der Mikrozensus.1987 geriet das Statistische Bundesamt mona-telang in die Schlagzeilen: Die Volkszählung er-hitzte die Gemüter. Seit 1991 wird eine gesamt-deutsche Statistik geführt und seit 1996 ist dasStatistische Bundesamt im Internet vertreten.

Zahlen, bitte!

Wenn es darum geht, zu erfahren, wie vieleMenschen in Deutschland leben, welche Warenimportiert und exportiert werden oder wie sichdie Preise entwickelt haben, dann ist eineBehörde immer mit im Spiel: das StatistischeBundesamt. Rund 2.800 Zahlenexperten verfas-sen hier jedes Jahr rund 390 verschiedene Sta-tistiken zu Wirtschaft, Gesellschaft und Umwelt.Hier werden so wichtige Fragen beantwortetwie:

Auf wie vielen Quadratmetern leben die Deutschen im Durchschnitt?

Wieso kann sich Deutschland Exportweltmeister nennen?

Wie viele Erwerbstätige gibt es hierzulande?

Wohin reisen die Deutschen im Urlaub?

Wie viele Jahre habe ich zu leben?

Page 9: M it Z ahlen l gen - Westdeutscher Rundfunk

1716

AUSSENHANDELSÜBERSCHUSS AUS- UND EINFUHRBILANZ CHINA

1950 1960 1970 1980 1990 2000

160.000140.000120.000100.00080.00060.00040.00020.000

Mio. EUR1950 1960 1970 1980 1990 2000

0

-5.000

-10.000

-15.000

Mio. EUR

Links:Immer noch kommt ein Teil der Daten auf Papier. Sie werden dann eingescannt

Mitte:Seit 1950 geht es in Deutschland stetig aufwärts: Die Außenhandelsbilanz

Rechts:Erschreckende Talfahrt

Im Jahr 2006 hat das Amt immer noch seinenHauptsitz in Wiesbaden, mit zwei Nebenstellenin Bonn und Berlin. Die Daten werden mittler-weile fast vollständig digital verarbeitet, nurnoch ein kleiner Teil kommt auf Papier an undwird dann eingescannt.

Vieles ist freiwillig, doch nicht alles

Der Großteil der Zahlen stammt aus den einzel-nen Bundesländern, in denen die StatistischenLandesämter ihre eigenen, länderspezifischenDaten erheben. So werden etwa die Verbrau-cherpreise oder Wohnraumdaten erst auf Län-derebene erfasst und dann an das StatistischeBundesamt weitergeleitet. Die Ergebnisse dür-fen nicht davon abhängig sein, ob die Befragtenfreiwillig mitmachen, daher gibt es bei vielenErhebungen eine Auskunftspflicht. Unterneh-men und Gewerbebetriebe müssen zum Beispielihre Angestelltenzahlen oder ihren Umsatz offenlegen. Und auch Privatmenschen müssen demAmt gelegentlich Rede und Antwort stehen: sobei der Volkszählung 1987, die viel Widerstandhervorrief. Drücken ging nicht – es war eineVollerhebung, alle deutschen Haushalte wurden

befragt. In der Regel macht das StatistischeBundesamt aber nur Stichproben. Es ist alsoeher Zufall, wenn ein Fragebogen des Statisti-schen Bundesamtes ins Haus segelt. Wenn mandabei zum Beispiel angeben soll, wie lange manschläft und womit man seine Zeit verbringt,dann handelt es sich um die Zeitbudgeter-fassung. Die wird etwa alle zehn Jahren durch-geführt und dient z. B. Medizinern als Grundla-ge, wenn sie z. B. beurteilen wollen, ob jemandbesonders kurz schläft, oder ob er im Schnittliegt. Die Antworten auf die Zeitbudgeterhe-bung sind allerdings freiwillig.

Rein und raus

Die größte Einzelstatistik, die das StatistischeBundesamt führt, ist die Außenhandelsstatistik.Sie gibt an, wie viele Waren ein- oder ausführtwerden. An ihr erkennt man welche Rolle Deutsch-land als Exportnation spielt. Alle ein- und aus-geführten Waren ab einem Wert von 1000,- 1

werden darin erfasst. Der Warenverkehr mit EU-Staaten wird getrennt vom Warenverkehr mitNicht-EU-Staaten aufgenommen. Etwa 15 Millio-nen Datensätze kommen so zusammen. Zieht

Was macht eigentlich das statistische Bundesamt?man die eingeführten Warenwerte von denexportierten Warenwerten ab, so erhält man dieAußenhandelsbilanz. Die Grafik oben linkszeigt, dass Deutschland eine positive Außen-handelsbilanz hat: Deutschland ist Export-weltmeister. Interessant ist im Vergleich dazudie Bilanz zwischen Deutschland und China inder Abbildung daneben: Es ist klar zu sehen,dass China in den letzten zehn Jahren deutlichmehr Waren nach Deutschland exportiert hat,Tendenz steigend. Die Kurve sieht beeindruc-kend aus – wenn man jedoch auf die absolutenWarenwerte schaut, dann wird klar, dass derHandel mit China nur ein Zehntel des Gesamt-warenverkehrs ausmacht. Dass also ausgerech-net chinesische Kleider und Stoffe die deutscheWirtschaft ruinieren, braucht man nicht zubefürchten.

Daten für alle

Die Zahlen und Statistiken des StatistischenBundesamtes verschwinden nicht im Orkus – siesind für jedermann zugänglich. Statistiken undVeröffentlichungen können zum Beispiel überdas Internet abgerufen werden. Es ist aber auch

möglich, Fachleute des Statistischen Bundes-amtes im Datenbestand recherchieren zu lassen.Wer also wissen möchte, ob seine Wohnung imSchnitt liegt, seine Freizeitbeschäftigung normalist oder ob er mehr verdient als der Durch-schnittsdeutsche, der kann in Wiesbaden dieVergleichsdaten erfragen, per Mail oder per Tele-fon. Übrigens sind die Daten anonym. Wer alsowissen möchte, was der Nachbar verdient, istbeim Statistischen Bundesamt falsch. Die web-Adresse des Statistischen Bundesamtes lautethttp://www.destatis.de.

Page 10: M it Z ahlen l gen - Westdeutscher Rundfunk

1918

Irgendwann stirbt jeder. Todesursache und Sterbealterwerden in der amtlichen Sterbestatistik erfasst

Werden die Menschen wirklich immer älter?

Leben nach Zahlen

Jeder weiß es: Die Römer lebten nicht länger als 35Jahre, dafür steigt heute rasant die Zahl der rüsti-gen Rentner, und es gibt Inseln wie Kreta oderLandstriche wie den Kaukasus, die geradezu alsHort der Hundertjährigen bekannt sind. Doch alldas sind eigentlich Zahlenspielereien mit derStatistik, genauer: mit der Art und Weise, wie mandas durchschnittliche Lebensalter, Sterbedatenund Lebenserwartung berechnet.

Hier ein kleiner Dschungelführer:

Das Durchschnittsalter eines Landes berechnenExperten, indem sie das Alter aller Bewohnerdurch die Anzahl aller Bewohner teilen. Gibt esalso viele Kinder, ist das Durchschnittsalterniedrig; überwiegen ältere Menschen, so ist dasDurchschnittsalter hoch. So hat Monacos Bevöl-kerung mit 45,4 das höchste; Uganda mit 15Jahren das niedrigste Durchschnittsalter. DasDurchschnittsalter in Deutschland beträgt übri-gens 42,6 Jahre.

Das mittlere Sterbealter einer Bevölkerung be-zeichnet das durchschnittliche Alter zum Zeitpunktdes Todes. In der Medizin wird auch das mittlere

Sterbealter bei bestimmten Krankheiten verwen-det. So ist das mittlere Sterbealter von Krebs-kranken höher als das mittlere Sterbealter vonMenschen mit Herz- und Kreislauferkrankungen.

Die Lebenserwartung ist definiert als die erwarte-te Zeitspanne, die einem Lebewesen ab einembestimmten Zeitpunkt noch bis zum Tode bleibt.Im allgemeinen Sprachgebrauch versteht manunter der Lebenserwartung die durchschnittlicheLebensspanne bei der Geburt. Sie entspricht danndem mittleren zu erwartendem Sterbealter derNeugeborenen. Während das mittlere Sterbealterauf einen tatsächlich gemessenen Wert beruht –die Todesdaten werden empirisch ausgezählt – istdie Lebenserwartung also eine reine Vorhersage,eine Hochrechnung aus der Statistik.

Im Mittelalter nur 35 Jahre im Durchschnitt

Die Werte der mittleren Lebenserwartung sind erstin den vergangen 160 Jahren deutlich angestiegen.Noch 1840 wurden schwedische Frauen mit 40Jahren im Schnitt am ältesten. Heute sind es dieJapanerinnen, die mit 86 Jahren den Rekord hal-ten. Dazwischen verläuft der Anstieg der Lebens-erwartung konstant: Jedes Jahr kommen dreiMonate hinzu. Die Ursache für diesen Anstieg liegt

vor allem in der besseren Gesundheitsversor-gung, Ernährung und Hygiene. Das war vor Mittedes 19. Jahrhunderts noch ganz anders, weil manüber Infektionskrankheiten wenig wusste. In die-ser Zeit war die Säuglings- und Kindersterblich-keit besonders hoch. Hatten die Menschen aberdie Risiken der Jugendjahre überstanden, konn-ten sie auch damals ein hohes Alter erreichen.Wenn also davon die Rede ist, dass im Mittelalterdie Lebenserwartung nur 35 Jahre betrug, heißtdas ganz und gar nicht, dass die Mehrheit mitMitte Dreißig starb. In der Statistik ziehen die vie-len an Krankheiten gestorbenen Kinder, die imKindbett gestorbenen jungen Frauen sowie diejungen Männer, die in den Kriegen umkamen, denWert nach unten.

Gutes Leben – hohes Alter

Wer sich aber einen geruhsamen Alltag, Ärzte undeine gute Ernährung leisten konnte – das traf vorallem für Gebildete, Adlige und Geistliche zu – derlebte schon damals viel länger als es die mittlereLebenserwartung vorhersagte: Die antiken Philo-sophen Aristoteles und Seneca wurden über 60Jahre alt, Karl der Große ebenso. Die mittelalterli-che Äbtissin Hildegard von Bingen starb mit 81,Goethe wurde 83 und Isaac Newton 84 Jahre alt.

Auch heute noch gilt, dass der Lebensstil undUmweltfaktoren zu zwei Dritteln die Lebens-erwartung bestimmen. Das haben Vergleichezwischen Zwillingen ergeben. Wie alt man alsowird, ist weniger durch das Erbgut bestimmt, alsdurch die Umwelt und das Verhalten.

Wie alt werden wir?

Um etwas über die zukünftige Lebenserwartungzu sagen, muss man bestimmte Vorrausset-zungen mit einbeziehen: Bleiben die Umweltbe-dingungen gleich? Wie entwickeln sich dieGesundheitsversorgung und die Ernährungssitua-tion? Obwohl diese Faktoren natürlich nichtgenau festliegen, können Experten Rahmenbedin-gungen für die Berechnung der Lebenserwartungstecken: Zum Beispiel erwarten sie, dass Gesund-heitsversorgung und Medizin Fortschritte machen.Deshalb gehen die meisten Prognosen von einemweiteren Anstieg der Lebenserwartung aus. Damitdie Lebenserwartung allerdings in dem Tempo an-steigt wie bisher, müssen auch ähnliche medizini-sche Revolutionen stattfinden wie in der Vergan-genheit.

Werden die Menschen wirklich immer älter?

Wie alt wird Nils?

Page 11: M it Z ahlen l gen - Westdeutscher Rundfunk

Zwei tote Babys in einem Jahr

Manipulationen und falsche verstandene Statis-tiken können einfach nur ärgerlich sein – aber siekönnen auch gravierende Folgen haben. InEngland musste eine Frau ins Gefängnis, weil einSachverständiger grundlegende Regeln der Wahr-scheinlichkeitsrechnung außer Acht ließ und dasGericht ihm glaubte.

Der Fall Sally Clark beginnt mit dem plötzlichen Todihres ersten Kindes: Die Rechtsanwältin ausManchester bekommt 1996 ihren ersten SohnChristopher, ein gesundes Kind. Doch nach 11Wochen ist er tot – plötzlichen Kindstod, diagnosti-zieren die Ärzte. Tragisch für die junge Mutter, dochnicht so ungewöhnlich: Das Schicksal trifft jedesJahr einen von rund 2.000 gesund geborenenSäuglingen, die genauen Ursachen kennt man nicht.

Die Ärzte raten Sally Clark dazu, bald wiederschwanger zu werden. Dann könne sie das schreck-liche Erlebnis psychisch besser verarbeiten. EinJahr später, am 29.11.1997 kommt der zweite SohnHarry auf die Welt.

Aber auch Harry stirbt im Alter von acht Wochen– jetzt werden die Behörden misstrauisch. SallyClark wird angeklagt wegen zweifachen Mordes.

Schuldig durch falsche Wahrscheinlichkeit?

Neben undurchsichtigen und widersprüchlichenGutachten der Pathologen ist es vor allem dieStellungnahme eines Mannes, die das Gerichtüberzeugt: Der Kinderarzt Professor Roy Meadowhält es für äußerst unwahrscheinlich, dass in einerFamilie zweimal hintereinander der plötzlicheKindstod auftritt. Meadow führt schon länger einenKampf gegen diese Diagnose, denn seiner Meinungnach verbirgt sich dahinter meistens Mord durchdie Eltern. Meadows rechnet vor: In einer von 8.500Familien, deren Situation mit der von Sally Clarkvergleichbar ist, stirbt ein Säugling zufällig anplötzlichem Kindstod, also besteht dafür eineWahrscheinlichkeit von 1 : 8.500. Für das zweiteKind besteht eine genauso große Wahrschein-lichkeit, zu sterben. Meadows multipliziert also dieWahrscheinlichkeiten und kommt auf eine Zahl von1 : 72.250.000 Soll heißen: Nur in einer von 72Millionen Familien würde das Schicksal tatsächlichzweimal auf so grausame Weise zuschlagen. InEngland wäre das alle hundert Jahre einmal derFall. Meadows interpretiert sein Ergebnis alsWahrscheinlichkeit für Sally Clarks Unschuld – diedamit also äußerst gering wäre. Diesem Argumentfolgt das Gericht, und Sally Clark wird im November1999 wegen zweifachen Mordes zu zweimallebenslänglich verurteilt.

2120

Eine Frau gegen die Statistik – der Fall Sally Clark

Anklage wegen zweifachen Mordes: Sally Clark

Eine Frau gegen die Statistik – der Fall Sally Clark

Widerspruch von Statistik-Experten

Die Königliche Statistische Gesellschaft protes-tiert gegen den Missbrauch von Statistik vorGericht: Zunächst einmal ist es rein statistischüberhaupt nicht zulässig, die Zahl von 8.500 ein-fach zu multiplizieren. Das käme nur in Frage,wenn die beiden Todesfälle völlig unabhängigvoneinander wären. Man vermutet aber geradebeim plötzlichen Kindstod, dass es noch unbe-kannte Ursachen in den Genen oder in derUmwelt gibt, die solche Todesfälle zur Folgehaben. Die Wahrscheinlichkeit, dass in einerFamilie zwei Kinder sterben, ist also deutlichhöher, als Meadows berechnet hat.

Wie klein ist klein genug?

Es gibt aber noch ein weiteres Problem beiMeadows’ Argumentation, unter Statistikernbekannt als prosecutor's fallacy, was man etwaals Trugschluss des Anklägers übersetzenkönnte. Angenommen, die Wahrscheinlichkeitfür den plötzlichen Kindstod sei mit 1 : 72,25Millionen korrekt berechnet – die Zahl alleinesagt überhaupt noch nichts aus. Der Staats-anwalt interpretiert sie aber als Wahrschein-lichkeit für Unschuld und legt nahe: „Weil die

Zahl klein ist, muss die Wahrscheinlichkeit fürSchuld groß sein.“ Korrekterweise müsste erjedoch die Wahrscheinlichkeit für Schuld unab-hängig davon ermitteln, und dann die beidenZahlen gegenüberstellen. Man müsste alsoüberschlagen, wie viele Mütter ihre beidenKinder töten: Macht so etwas eine von 100Millionen oder eine von einer Milliarde? Erstdurch den Vergleich dieser beiden Zahlen könn-te man überhaupt eine Aussage treffen, aberman sieht auch sofort, wie absurd so eine Aus-sage wäre.

Freispruch nach drei Jahren

Sally Clark bleibt noch bis Januar 2003 inhaftiert.Ihr drittes Kind wird zu Pflegeeltern gegeben. IhrLeben ist zerstört, weil ein Medizin-Professor mitZahlen jongliert hat. Erst nach drei Jahrenerreicht ihr Mann eine Wiederaufnahme des Ver-fahrens. Und diesmal wird sie freigesprochen,allerdings aus anderen Gründen: Die Anklagehatte im ersten Prozess verschwiegen, dass derkleine Harry eine starke Bakterien-Infektionhatte.

Wie oft kommt der plötzliche Kindstod in einer Familiewirklich vor?

Page 12: M it Z ahlen l gen - Westdeutscher Rundfunk

Kann man mit bloßer Ziffern-Analyse Verbrechernauf die Schliche kommen? Diese Frage scheint aufden ersten Blick absurd. Aber die Antwort lautet:man kann. Der amerikanische Professor desBuchhaltungswesens Mark Nigrini hat sich durchBenfords Gesetz inspirieren lassen: Er schrieb eineinfaches Computer-Programm, mit dem mangroße Zahlenmengen auf ihre Verteilung nachBenford analysieren kann. Seine Idee war: WennZahlen in der Buchhaltung eines Betriebs von derBenford-Verteilung statistisch signifikant abwei-chen, könnten dahinter eventuell betrügerischeMitarbeiter stecken.

Quarks & Co wollte genauer wissen, was mitsolch einer Ziffern-Analyse herauszufinden istund bat die Mitarbeiter der Revisionsabteilungdes WDR um Hilfe. Aus dem WDR-System ludensie die Rechnungen der letzten zwei Monate her-unter: 12.372 Posten. Eine Überprüfung nachBenford ergab: Die Zahlen sind nicht auffällig.Mit ihnen war also alles OK. Nun manipuliertenwir die (anonymisierten) Zahlen dreimal aufunterschiedliche Art und Weise und ließen sievon Wirtschaftsprüfern untersuchen. Würden sieherausfinden, was mit den Zahlen passiert ist?Drei Fälle haben wir nachgestellt:

Erster Fall: Die Unterschriftengrenze

Ein Mitarbeiter im Einkauf bevorzugt einenbestimmten Lieferanten, obwohl der nicht dergünstigste ist. Solange die Bestellungen aber5.000 Euro nicht überschreiten, merkt das nie-mand. Seinen Chef muss er nämlich erst bei größe-ren Anschaffungen informieren. Die Lieferfirmazeigt sich erkenntlich und spendiert hin und wiedereinen Kurzurlaub ...

Für diesen ersten Fall veränderten wir die ursprüng-lichen Rechnungsdaten: Bei 63 Rechnungen einesLieferanten gingen wir auf Beträge knapp unter dergedachten Unterschriftengrenze von 5.000 Euro.Wir waren gespannt: Würden die 63 geändertenRechnungen unter den 12.372 anderen auffallen?Hier die Analyse der Experten von Ernst & Young:„Bei der Untersuchung dieser Daten haben wir beimErste-Ziffer-Test Auffälligkeiten bei der Vier gefun-den. Daraufhin sind wir auf einen Lieferanten ge-kommen, der eine vermehrte Häufigkeit bei dieserZiffer Vier aufweist. Bei genauerem Hinsehenerkannten wir, dass diese Beträge mit der Vier als1. Ziffer alle knapp unter 5.000 Euro liegen. Dafürkann es mehrere Gründe geben: zum Beispiel eineUnterschriftenregelung oder Ähnliches im Unter-nehmen.“

2322

Links:Betrügerische Mitarbeiter können ein Unternehmenim Extremfall in den Ruin treiben

Mitte:Verdächtig ist es, wenn oft Beträge knapp unterhalbder Bagatellegrenze gebucht werden

Rechts:Am schwersten zu entdecken: Mitarbeiter steckt mitLieferant unter einer Decke und zeichnet falscheRechnungen ab

Zweiter Fall: Die Bagatellegrenze

Ein schönes Ritual: Jeden Tag überweist einMitarbeiter Geld auf sein eigenes Konto. Das fälltnicht auf, weil es in der Firma eine Bagatellegrenzegibt: Kleinbeträge werden nicht überprüft. AufsJahr gerechnet kommt dabei aber einiges zusam-men ...

In unserer Datei mit den ungefälschten Datenerfanden wir einen neuen Lieferanten und fügtenfür jede Woche fünf Überweisungen ein. AlleBeträge lagen zwischen 70 und 80 Euro. Wiederwaren die Wirtschaftsprüfer an der Reihe. DiesesMal waren aber noch weniger Zahlen geändert.Aber trotzdem wurden sie fündig:

„Bei der Ziffer Sieben haben wir eine Auffälligkeitfestgestellt. Wir haben uns diese Beträge näherangeschaut und sind auf einen Lieferanten auf-merksam geworden, der bestimmte Rechnungs-beträge zwischen 70 und knapp unter 80 Eurohatte. Es könnte sein, dass es in diesem Unter-nehmen eine Bagatellegrenze gibt, unter der dieseBeträge liegen. Es könnte aber auch ein System-fehler sein, weil die Beträge immer werktagsgebucht wurden.“

Auf Verbrecherjagd mit BenfordDritter Fall: Erfundene Rechnungen

Ein Händler stellt neben den normalen Rech-nungen noch weitere aus. In der belieferten Firmazeichnet sie ein Mitarbeiter ab, obwohl dafür garkeine Leistungen erbracht wurden. Am Monats-ende machen die beiden halbe-halbe ...

In unserer Originaldatei erfanden wir bei einemLieferanten für jede echte Rechnung noch einezusätzliche gefälschte. Dieser Test war besondersschwierig: Insgesamt fügten wir nämlich nur 20Rechnungsposten ein. Und tatsächlich: In der gro-ßen Datenmenge waren diese 20 zufällig ausge-dachten Rechnungssummen nicht mehr auffällig.Fazit: Immerhin zwei der drei Betrüger wärenschon mit der einfachen Benford-Analyse aufge-flogen.

Auf Verbrecherjagd mit Benford

Page 13: M it Z ahlen l gen - Westdeutscher Rundfunk

2524

Links:Anteil von Frauen und Männern bei der Befragung

Mitte:Vergleich der Untersuchungsergebnisse von Forsaund Infratest dimap

Rechts:Vergleich der Untersuchungsergebnisse von Forsaund Infratest dimap in Bezug auf das Alter derBefragten

nummern wurden bei beiden Instituten zufälligausgewählt – es wurden also von Forsa andereMenschen befragt als von Infratest dimap. Wieunterscheiden sich die Ergebnisse der beidenInstitute? Drei Beispiele:

Erster Test

Wenn tausend Befragte für die gesamte Bevöl-kerung stehen, dann muss auch der Anteil derangerufenen Frauen und Männern im richtigenVerhältnis sein: 52 Prozent Frauen und 48 ProzentMänner. Forsa liegt um zwei Prozentpunkte dane-ben, Infratest um drei; solche Abweichungen sindganz normal und werden bei den Berechnungender Ergebnisse mit einbezogen: Wurden wenigerMänner befragt als es ihrem Anteil an der Bevöl-kerung entspricht, dann gehen deren Antwortenzum Ausgleich etwas stärker in das Endergebnisein als die der Frauen.

Zweiter Test

Wie stark unterscheiden sich die Antwortenauf unsere Testfrage? Wir fragten: „In letzter Zeitgab es einfach zu viele Umfragen.“ Bei Forsastimmte eine knappe Mehrheit dieser Aussage zu

Auf den Zahn gefühlt – wie genau sind Telefon-Umfragen wirklich?

Ob für Zeitung, Radio oder Fernsehen: Was dieMenschen in Deutschland wählen, denken oderessen – Meinungsforschungsinstitute versuchen,das herauszufinden. Für jede Umfrage werden min-destens 1.000 Menschen angerufen, die zuvor perZufallsauswahl festgelegt wurden. Solche Umfra-gen sollen repräsentativ für die deutsche oderdeutschsprachige Bevölkerung sein. Das bedeutet,dass die Ergebnisse der Umfrage unter den 1000Befragten dem Ergebnis entsprechen sollen, dasman bekäme, wenn man nicht 1000, sondern alledeutschen oder deutschsprachigen Menschenbefragen würde. Wir wollten wissen: Wie genausind solche Ergebnisse von Telefonumfragen wirk-lich? Um das zu testen, haben wir selber eineUmfrage in Auftrag gegeben – bei zwei verschiede-nen Instituten: Forsa und Infratest dimap.

Thema der Test-Umfrage: Wir wollten wissen, wasSie von Meinungsumfragen halten. Eine derFragen lautete: „In letzter Zeit gab es einfach zuviele Meinungsumfragen. Inwieweit stimmen Siedieser Aussage zu?“ An zwei Tagen im Mai telefo-nierten die beiden Forschungsinstitute mit 1.000beziehungsweise 1.009 Menschen und stelltenunter anderem unsere Quarks-Fragen. Die Telefon-

(49 gegen 45 %). Anders bei Infratest: Hier sieht'sgenau umgekehrt aus: Eine knappe Mehrheitstimmte mit nein (48 %), (ja meinten 46 %). Istdas ein Widerspruch? Die Forschungsinstitutegeben eine Fehlertoleranz an; je nach Institutmaximal plus-minus 3,1 Prozentpunkte: Konkretbedeutet das, dass das echte Ergebnis nach derForsa-Umfrage zwischen 46 und 52 % liegen kann.Für Infratest dimap liegt dieser Bereich zwischen43 und 49 %. Diese beiden Intervalle überschnei-den sich. Und das bedeutet, dass sich die Werteder beiden Institute – zumindest statistisch ge-sehen – nicht widersprechen. Die Forschungs-institute schränken ihre Zahlenangaben nochweiter ein: Die ermittelten Werte liegen nur mit95-prozentiger Wahrscheinlichkeit innerhalb derangegeben Fehlertoleranz. Das heißt, dass –zumindest theoretisch – eine Umfrage auch völligdaneben liegen kann.

Dritter Test

Wirkt sich das Alter der Befragten auf die Antwortaus? Forsa findet heraus: „Wenn man jetzt etwasgenauer in die Daten blickt, kann man zum Beispielbei den Altersgruppen erkennen, dass die älterenBundesbürger Umfragen etwas skeptischer ge-genüber stehen als jüngere Bundesbürger.“

Stimmt das so auch für die Umfrage, die wir beiInfratest dimap in Auftrag gegeben haben? Auf denersten Blick gibt es große Unterschiede. Bei denÄlteren weicht der Wert um sieben Prozentpunkteab – mehr als die Institute zugestehen. Aber: DerFehlerbereich (das so genannten Vertrauensinter-vall) ist jetzt größer: plus-minus sechs bis achtProzentpunkte. Denn in den einzelnen Altersgrup-pen sind viel weniger Befragte: nur noch zwei- bisdreihundert. Das Zentrum für Umfragen, Methodenund Analysen hat für uns alle Werte getestet. DasErgebnis: „In keinem der getesteten Fälle lässt sichbei fünf Prozent Irrtumswahrscheinlichkeit dieNullhypothese zurückweisen, dass sich die Alters-verteilungen der den Items Zustimmenden nichtunterscheiden.“ Das ist die exakte statistischeFormulierung, die schlicht bedeutet: Offenbar sinddie Verteilungen beider Untersuchungen gleich,obwohl sich die Ergebnisse um bis zu sieben Pro-zentpunkte (bei der Altersgruppe der Über-Sechzig-Jährigen) unterscheiden.

Fazit unseres Quarks-Test

Man kann sich auf die Ergebnisse von Meinungs-umfragen verlassen. Mit weitergehenden Inter-pretationen sollte man aber vorsichtig sein.

Der Umfrage TestDer Umfrage-Test

Page 14: M it Z ahlen l gen - Westdeutscher Rundfunk

Wenn man statistische Sachverhalte in Diagram-me einträgt, erlebt man oft eine Enttäuschung: dasWachstum ist gar nicht so dramatisch, wie man esgerne darstellen möchte oder die Differenzen sindgar nicht so groß. Also muss der Grafiker ein biss-chen nachhelfen: er lässt ein paar Teile weg undbiegt andere passend zurecht. Das sieht zwar bes-ser aus – aber korrekt ist die Darstellung dannnicht mehr. Die Längen- und Flächenverhältnisseentsprechen dann nicht mehr den wirklichenGrößenverhältnissen und die Grafik hat jede Aus-sagekraft verloren.

Hier sind einige Grafiken dargestellt, wie sie täg-lich in Zeitungen, Zeitschriften und anderen Medienzu finden sind. Wir haben die Darstellungen je-weils so angepasst, dass sie die echten Größen-verhältnisse repräsentieren.

Geschäftsbericht

Einen erfreulichen Geschäftsverlauf wollte diepsd-Bank Rhein-Ruhr in ihrem Geschäftsbericht2004 darstellen. Rapide aufwärts muss es mit derBilanzsumme gegangen sein, wenn man sich die

dazugehörige Grafik ansieht. Als Ausdruck derpositiven Entwicklung der Bank stehen dort vierSäulen; jede deutlich größer als die links danebenstehende. (Grafik G1)

Doch ein näheres Hinsehen zeigt: Wachstum ja,aber kaum so drastisch, wie die Bank es wohlgerne hätte. Die Grafik ist geschummelt: Horizon-tale Linien in gleichem Abstand spiegeln eine line-are Skala vor: doppelt so hohe Säulen würden füreine doppelt so hohe Bilanzsumme stehen. Aberweit gefehlt: Die Linien unter der 2.000 haben je-weils einen Abstand von 500 Einheiten, aber darü-ber geht es nur im Hunderter-Abstand weiter. Aufden ersten Blick fällt das kaum auf. Das Wachstumwirkt dadurch beträchtlich.

Weniger beeindruckend wirken die Zahlen, wennman sie maßstabsgerecht einträgt. Der Werteab-stand muss natürlich bei allen horizontalenLinien gleich sein, nämlich jeweils 500 Einheiten.Und so sieht das Ergebnis in Wirklichkeit aus wiein Grafik G2.

Mit freundlichem Dank an Prof. Dr. Walter Krämer,

Institut für Wirtschafts- und Sozialstatistik, Universität Dortmund

2726

5.5005.0004.5004.0003.5003.0002.5002.0001.5001.000

5000

2001 2002 2003 2004

2.280 2.428 2.515 2.633

ENTWICKLUNG BILANZSUMME

2.6002.5002.4002.3002.2002.1002.0001.5001.000

5000

2001 2002 2003 2004

(in Mio. Euro)

2.280

2.4282.515

2.633

G1 G2

Aufwärtstrend

„Die deutsche Messewirtschaft hat sich leichterholt“ schreibt der Focus zu einer Grafik, aufder drei Säulen nebeneinander gen Himmelstreben. Für den flüchtigen Beobachter ist klar:hier geht es aufwärts. Vom dunklen Schwarzüber ein neutrales Blau zum Sonnenscheingelb– die dritte Säule ist gut doppelt so hoch wiedie erste (Grafik A1).

Doch bei näherem Hinsehen zeigt sich: die dreiZahlenwerte über den Säulen haben überhauptnichts miteinander zu tun. Die erste Säule zeigtdie Aussteller in Tausend, die zweite die vermie-tete Fläche in Mio. m2, die dritte die Besucher inMio. Es gibt also keinen Grund dafür, die Säulenunterschiedlich hoch darzustellen. Was sollteauch ein Vergleich aussagen, der zum Inhalt hatDie Anzahl der Besucher ist ungefähr eineinhalbmal so groß wie die vermietete Fläche? Der in derÜberschrift angesprochene Aufwärtstrend zeigtsich nur in den Sahnehäubchen über den Säu-len: zwei grüne Pfeile, die aufwärts zeigen, undein roter nach unten. Sie verdeutlichen die Ver-änderung gegenüber irgendeinem Zeitpunkt in

der Vergangenheit. (Welcher das ist, erschließtsich weder aus der Grafik noch aus demBegleittext – vermutlich ist das Vorjahr gemeint).

Realistischer – aber auch weniger spektakulär –wird die Darstellung, wenn man für alle Zahlenein gleiches Niveau in der Vergangenheit zugrun-de legt und das entsprechende Wachstum relativzu diesem Niveau in einer zweiten Säule darstellt(Grafik A2). Der grafische Unterschied in derHöhe der Säulen – bei gleichbleibender Breite –stellt dann anschaulich die Veränderung dar.Allerdings sollte man dann doch noch mal überdie Überschrift nachdenken: Aufwärtstrend?

Quelle: Focus, Nr. 20/2006, S. 187

Kindergeld

In der Broschüre Antworten zur agenda 2010 woll-te das Finanzministerium unter der rot-grünenRegierung darstellen, wie stark zwischen 1998 und2002 das Kindergeld erhöht wurde. Kinderwagenin unterschiedlicher Größe symbolisieren denscheinbar enormen Anstieg.

AUFWÄRTSTREND (Entwicklung deutscher Messestände)

Ausstellerin Tausend

158.060

+2,6 %

vermietete Flächein Mio. m2

6,2

+0,6 %

Besucherin Mio.

9,6

-2,2 %

Die schlechtesten Grafiken der Welt

Ausstellerin Tausend

158.060

+2,6 %

vermietete Flächein Mio. m2

6,2

+0,6 %

Besucherin Mio.

9,6

-2,2 %

A1 A1

Die schlechtesten Grafiken der Welt

Page 15: M it Z ahlen l gen - Westdeutscher Rundfunk

Damit der Anstieg richtig zur Geltung kommt, hatder Grafiker den lästigen Teil unter 100 Euro weg-gelassen, die Skala geht von 100 bis 160. Genau-genommen müsste die Überschrift statt Entwick-lung des Kindergeldanteils... also lauten:Entwicklung des Kindergeldanteils über 100Euro... Wollte man die Entwicklung maßstabge-recht darstellen, müsste man zumindest dieSkala ändern. Das sähe zunächst wie in derGrafik K2 aus. Aber hier fehlt noch das schöneBild von den Kinderwagen. Denn wenn man dievergrößert, vergrößert man sie nicht nur in derHöhe, sondern auch in der Breite. Die Verän-derung des Kindergeldes spiegelt sich für denBetrachter in der Veränderung des Flächen-inhaltes wider. Wenn man davon ausgeht, dassdie Fläche des ersten Kinderwagen für 112,48Euro steht, ergeben sich daraus im Verhältnis dieFlächen für 2000 und 2002 wie in der Grafik K3.

Quelle: Presse- und Informationsamt der Bundesregierung:

Antworten zur agenda 2010, (November 2003) S. 45

Klinsmann-Torte

Am 12.3.2006, 3 Monate vor der WM ist die Kam-pagne der Bild-Zeitung gegen den damaligenBundestrainer Jürgen Klinsmann noch in vollemGange. Auf der Online-Ausgabe bild.de kannman es nachlesen: Die Sonntags-Frage zur WM.Und es ist kein Wunder, dass Klinsmann schlech-te Noten bekommt: Nur fünf Prozent sind sehrzufrieden mit Klinsmann. Ganz abgesehendavon, dass aber nur 11% überhaupt nichtzufrieden sind und der ganze große Rest sichalso zu 84% auf zufrieden, weniger zufriedenund mir egal / weiß nicht aufteilt, gibt auch dieillustrierende Grafik (KL1) Rätsel auf.

Wenn man die abgegebenen Stimmen zusam-menzählt, kommt man erstaunlicherweise nurauf 72%. Denn alle weiß-nicht-Antworten hat Bildeinfach unter den Tisch fallen lassen. Richtigwäre eine Darstellung wie KL2 gewesen:

Nachdem Bildblog.de darauf aufmerksam ge-macht hat, wird die Grafik nicht etwa korrigiert –die neue Version sieht jetzt einfach so aus (KL3).

2928

ENTWICKLUNG DES KINDERGELDES FÜR DAS ERSTE UND ZWEITE KIND

160

150

140

130

120

110

100

1998 2000 2002

160,20

133,50

106,80

80,10

53,40

26,70

0

1998 2000 2002

600

500

400

300

200

100

0

1998 2000 2002

112,48

138,05154,00

K1 K2 K3

Das ist natürlich Blödsinn, denn der Sinn einerTortengrafik liegt ja darin, eine räumliche Vor-stellung von den unterschiedlichen Anteilen zuvermitteln. Und das geht nur, wenn die ganzeTorte 100 % entspricht. Oder, wie Bildblogschreibt: „Sinn und Zweck einer Tortengrafik istes, Teilwerte eines Ganzen wie Kuchenstückeaussehen und dadurch anschaulich werden zulassen. Und das funktioniert natürlich nur, wennder Zuckerbäcker nicht irgendwelche Teigklum-pen unter den Tisch fallen lässt.“

Woher die Grafik ursprünglich stammte, merkteein aufmerksamer Leser übrigens später. Schonvor dem Länderspiel am 22.3. gegen die USA hatteBild.de gefragt Gewinnt Deutschland den Testgegen die USA? (Grafik KL4) Die Überraschung: Bisauf die Zahlen sind die beiden Torten identisch.

Mit freundlichem Dank an Christoph Schultheis und Bildblog.de,

Quelle: http://www.bildblog.de/?p=1225).

DIE KLINSMANN-TORTE

22% 5%11% 34% 24% 9%21% 46%22% 5%11% 34% 22% 5%11% 34%

sehr zufriedenzufriedenweniger zufriedenüberhaupt nicht zufrieden

sehr zufriedenzufriedenweniger zufriedenüberhaupt nicht zufrieden

sehr zufriedenzufriedenweniger zufriedenüberhaupt nicht zufrieden

Sieg für DeutschlandUnentschiedenNiederlageWeiß nicht

GEWINNT DEUTSCHLAND DENTEST GEGEN DIE USA?

Die restlichen 28%der Befragten gabenweiß nicht als Ant-wort anKL1 KL2 KL3 KL4

Die schlechtesten Grafiken der Welt

Page 16: M it Z ahlen l gen - Westdeutscher Rundfunk

3130

ZU: TÖDLICHE ZAHLEN: MEDIZINSTATISTIKEN

Statistik verstehen – Eine GebrauchsanweisungAutor: Walter Krämer Verlagsangaben: Campus Verlag 1998, ISBN: 3-593-36149-3

Gutes Übersichtswerk, das die häufigsten Begriffe der Sta-tistik erklärt und mögliche Quellen für Missverständnisseund Fehlinterpretationen aufzeigt.

Der Hund, der Eier legtAutoren: Hans-Peter Beck-Bornholdt,

Hans-Hermann DubbenVerlagsangaben: Rororo 2001ISBN: 3-499-61154-6

Unterhaltsames Buch, das fragwürdige Gebräuche undSkandale aus der Wissenschaftsstatistik aufdeckt.

Der Schein der WeisenAutoren: Hans-Peter Beck-Bornholdt,

Hans-Hermann DubbenVerlagsangaben: Hoffmann und Campe 2002, ISBN: 3-455-09340-x

Nachfolgeband von Der Hund der Eier legt.

WISSENSCHAFTLICHE LITERATUR ZU: TÖDLICHE ZAHLEN: MEDIZINSTATISTIKENFür diejenigen, die sich die Originalstudien ansehen wollen.Leider gibt es hier keine direkten Links. Zudem sind dieStudien ausschließlich in englischer Sprache und sehr fach-spezifisch verfasst, also nur für wissenschaftlich vorgebil-dete Leser geeignet.

Die großen SkandaleBrustkrebs-Reihenuntersuchungen Nystrom, Rutquist, Wall, Lindgren: Breast cancer scree-ning with mammography: overview of Swedish randomi-sed trials, Lancet 1993 Apr.17; 341 (8851): 973-8

Die CAST-Sudie zum Medikament FlecainidWard, Garratt, Camm: Cardiac arrhythmia suppression trialand flecainide, Lancet 1989 Jun 3;1(8649):1267-8

Die Vioxx-Skandal-StudienBombardier und andere: Comparison of Upper Gastroin-testinal Toxicity of Rofexicib and Naporxen in Patients withRheumatoid Arthritis – VIGOR, NEJM Volume 343 Number21 (2000): 1520-8

Bresalier und andere: Cardiovascular events associatedwith rofecoxib in a colorectal adenoma chemopreventiontrial – Approve, NEJM 2005 Mar 17;352(11):1092-102. Epub2005 Feb 15.

Bestrahlung von Kopf-Hals-TumorenSaunders und andere: Experience with CHART. Continuous,hyperfractionated accelerated radiotherapy, IntJRadiatOncolBiolPhys, 1991 Aug; 21(3): 871-8

Die Original-Veröffentlichung des kreativen norwegischen ForschersSudbø und andere: DANN Content as a prognostic markerin patients with oral leukoplakia, NEJM Volume 344Number 17 (2001): 1270-8

Studien über Medizin-StudienAn-Wen Chan: Empirical Evidence for Selective Reportingof Outcomes in Randomized Trials, JAMA 2004; 291; 2457-2465Die Autoren haben 102 Studien, aus denen 122 Artikelpubliziert wurden, untersucht. 50 Prozent der Ergebnissezur Wirksamkeit und 65 Prozent der Nebenwirkungs-Ergebnisse wurden nur inkomplett veröffentlicht.

Gross und andere: Scope and Impact of FinancialConflicts of Interest in Biomedical Research: A SystematicReview, Jama 2003;289;454-465Gross und Kollegen haben über 100 Studien untersucht.80 Prozent der industrie-finanzierten, aber nur 50 Prozentder unabhängigen Studien kommen zu positiven Ergeb-nissen.

Garcìa-Berthou und andere: Incongruence between teststatistics and p values in medical papers, BMC MedicalResearch Methodology 2004;4;13Die Autoren haben Artikel aus Nature und dem BritishMedical Journal untersucht und festgestellt, daß in etwa12 Prozent der Publikationen Rechenfehler waren.

Juhl Jørgensen und andere: Presentation on websites ofpossible benefits and harms from screening for breastcancer: cross sectional study, BMJ 2004;328:148-154Die Autoren haben verschiedene Internetseiten danachuntersucht, wie Vor- und Nachteile des Brustkrebs-Screenings dargestellt werden.Zu: Eine Frau gegen dieStatistik – der Fall Sally Clark

ZU: EINE FRAU GEGEN DIE STATISTIK – DER FALL SALLY CLARK

Mit an Wahrscheinlichkeit grenzender Sicherheit.Logisches Denken und ZufallAutoren: Hans-Hermann Dubben,

Hans-Peter Beck-BornholdtVerlagsangaben: rororo science,

Reinbek bei Hamburg, 2005, ISBN: 3-499-61902-4Sonstiges: Preis 8,90 Euro.

Nach Der Hund, der Eier legt und Der Schein der Weisendas dritte Buch der beiden Wissenschaftler, in dem sieFehlschlüsse und Denkfallen aus der Welt der Wahr-scheinlichkeiten aufgreifen. Unter anderem auch mit einernäheren Analyse des Falles Sally Clark.

ZU: DER UMFRAGE-TEST

Statistik für DummiesAutor: Deborah RumseyTitel: Statistik für DummiesVerlagsangaben: Wiley-VCH-Verlag, ISBN: 3-527-70108-7Sonstiges: 356 Seiten, Preis: 19,95 Euro

Wer an anderen Statistik-Büchern gescheitert ist, kannhier einen erneuten Anlauf nehmen. Dabei spart das Buchauch harte Themen wie Konfidenzintervalle und -koeffi-zienten sowie Hypothesentest nicht aus.

LesetippsLesetipps