Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf ·...

30
Statistik für Biologen K. Diederichs Wintersemester 2019/20

Transcript of Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf ·...

Page 1: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

Statistik für Biologen

K. DiederichsWintersemester 2019/20

Page 2: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

Fünf von vier Menschen haben ein Problem mit Mathematik

Page 3: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

3

Vorlesung Donnerstag, 10:00-11:30 Uhr M629

Übungen Mo 18:45-20:15 M630 Bianca Buratti 47Di 18:45-20:15 L602 Kim-Isabelle Mayer 80Mi 17:00-18:30 P603 Kathy Su 69Mi 18:45-20:15 M627 Nikolas Buchenau 68

Klausur Montag, 17.2.20, 8:00 – 9:30 Uhr, R512/R513 Nachklausur Dienstag, 31.3.20, 11:00 – 12:30 Uhr, A701

Literaturempfehlung ("KSV"): Köhler, Schachtel, Voleske: Biostatistik (ab 3. Auflage)Springer, € 24,95 (Kindle 16€) ; <80 Exemplare in der Lehrbuchsammlung; elektronische Version (zuhause über VPN)Folien: http://strucbio.biologie.uni-konstanz.de/~dikay/statistik

Page 4: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

4

• 3 ECTS-Punkte bei Bestehen der Klausur (ggf. Nachklausur).

• Für 3.-Semester ist die wöchentliche Teilnahme sowie das Vorzeigen eigenhändig verfaßter Lösungen (bzw Lösungsversuche) der Übungsaufgaben am Anfang des Tutoriums Pflicht. Wer in mehr als 2 Wochen ohne ärztliches Attest das Tutorium verpasst bzw die Lösungen nicht vorzeigen kann, wird nicht zur Klausur zugelassen. 5.-Semester: Zulassung gemäß Vorjahresregelung.

• bei Klausur zugelassene Hilfsmittel sind 1 Statistikbuch oder Formelsammlung, Vorlesungsmitschrift/ausdruck+Übungsaufgaben+z,t,F, χ2,-Tabellen (d.h. alles sonstige Schriftliche) in einem schmalen Ordner, Taschenrechner, aber nicht Handy/Notebook. Studentenausweis/ Perso mitbringen! Kein Rücktritt nach der Klausur – Durchstreichen aller Seiten vor Abgabe ergibt 0 Punkte.

• für Studenten, die nicht im 3. Semester sind: für die Klausur /Nachklausur muss man sich bis 2 Wochen vor dem Erst-Klausurtermin bei Frau Bucifal (Fachbereichs -Sekretariat, M605) verbindlich anmelden (evtl STUDIS/ZEuS).

• bei Nichtbestehen der Klausuren kann eine mündliche Prüfung abgelegt werden. Falls diese auch nicht bestanden wird, gibt es keine weitere Möglichkeit, den Schein zu erwerben.

Schein "Statistik"

Page 5: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

5

• Übungsaufgaben sind Beispiele für Klausuraufgaben; sie werden in der Vorlesung angesagt und in der Folgewoche in Tutorien besprochen.

• Es kann jede Woche ein beliebiges Tutorium besucht werden.

• 3.-Semester: Wer bei den Tutorien eine Aufgabe richtig vorrechnet, bekommt einen Sonderpunkt. Bis zu zwei Sonderpunkte werden bei folgender Haupt- und Nachklausur (aber später nicht mehr!) hinzugerechnet, falls die Punktezahl unter 16 (von 40) liegt.

• 5.-Semester: es gelten die Regelungen des Vorjahres

Übungsaufgaben und Tutorien

Page 6: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

6

• Die Vorlesung besuchen! Die Stunden bauen auf ein- ander auf. Nicht Faktenwissen zählt, sondern Verständnis.

• Nicht erst zwei Wochen vor der Klausur anfangen zu lernen und nur anhand der früheren Klausuren üben, sondern von der ersten Woche an die Übungsaufgaben selbständig lösen und in den Tutorien vertiefen.

• Übungsaufgaben und frühere Klausuren: zunächst eine Aufgabe 15 Minuten lang versuchen, selbständig zu lösen. Dann erst den ersten Schritt der Lösung anschauen!

• In der Klausur zunächst die leichteren Aufgaben, und erst danach die schweren Aufgaben bearbeiten.

Wie arbeitet man erfolgreich?

Page 7: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

7

Zitate und Interpretationen

„Traue keiner Statistik, die du nicht selber gefälscht hast.“ Von der Nazipropaganda im Zweiten Weltkrieg erfunden und Winston Churchill zugeschrieben.

“There are three kinds of lies: Lies, Damned Lies and Statistics.” (Mark Twain) Deutsche Übersetzung: „Lüge, Meineid, Statistik“

„Probability Theory - the Logic of Science“ ist der Titel eines Buches von E.T. Jaynes.

Page 8: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

8

Sampling errors: Aristotle's suspect statistical skillsTaner Z. SenNature 513, 315 (18 September 2014)

In his review of Armand Marie Leroi's book The Lagoon (Nature 512, 250–251; 2014), Roberto Lo Presti rightly praises Aristotle's observational skills. But the philosopher may not have been as adroit in numeracy as he was in biology.Aristotle famously declared that “males have more teeth than females in the case of men, sheep, goats, and swine” (see his History of Animals, Book 2, Part 3). This was an obvious sampling mistake, which bears out the importance today of a strong statistical foundation for biological curricula.

Page 9: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

9

Heavy use of equations impedes communication among biologistsTim W. Fawcett and Andrew D. Higginson

AbstractMost research in biology is empirical, yet empirical studies rely fundamentally on theoretical work for generating testable predictions and interpreting observations. Despite this interdependence, many empirical studies build largely on other empirical studies with little direct reference to relevant theory, suggesting a failure of communication that may hinder scientific progress. To investigate the extent of this problem, we analyzed how the use of mathematical equations affects the scientific impact of studies in ecology and evolution. The density of equations in an article has a significant negative impact on citation rates, with papers receiving 28% fewer citations overall for each additional equation per page in the main text. Long, equation-dense papers tend to be more frequently cited by other theoretical papers, but this increase is outweighed by a sharp drop in citations from nontheoretical papers (35% fewer citations for each additional equation per page in the main text). In contrast, equations presented in an accompanying appendix do not lessen a paper’s impact. Our analysis suggests possible strategies for enhancing the presentation of mathematical models to facilitate progress in disciplines that rely on the tight integration of theoretical and empirical work.

PNAS July 17, 2012 vol. 109 no. 29 11735-11739

Page 10: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

10

Mathematical illiteracy impedes progress in biologyNakul Chitnis and Thomas A. Smith

Fawcett and Higginson (1) have shown that citation rates of biology papers with equations in the main text are lower than those of papers without equations. They claim that this implies “heavy use of equations impedes communication among biologists” and recommend that equations be moved to appendixes to improve citation rates. We suggest that a better interpretation of their results would be “mathematical illiteracy impedes progress in biology.”

PNAS November 6, 2012 vol. 109, E3055

Page 11: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

11

Lehrbücher:

(KSV): Köhler, Schachtel, Voleske: Biostatistik (Springer, Buch und e-Book)

Selbststudium: Kuckartz Rädiker Ebert Schehl: Statistik - eine verständliche Einführung (Springer, e-Book)

Empfehlenswert: Beck-Bornholdt , Hans-Peter; Dubben , Hans-Hermann: Der Schein der Weisen. Irrtümer und Fehlurteile im täglichen Denken. 2003, Rowohlt TB. EUR 8,90 Beck-Bornholdt, Hans-Peter; Dubben, Hans-Hermann: Der Hund, der Eier legt. Erkennen von Fehlinformation durch Querdenken. (rororo sachbuch; rororo science) 2001, Rowohlt TB. EUR 9,90

Gero von Randow: Das Ziegenproblem - Denken in Wahrscheinlichkeiten. Rowohlt TB 2004. EUR 7,90

Englische Zeitschriftenartikel: z.B. “Systems Biology - How Information Theory handles cell signaling and uncertainty”. Science 338 (2012), 334-335 (Entropie, bedingte Wahrscheinlichkeit)

„Points of Significance“ (diverse Themen) Nature Methods monatlich seit 2013

Page 12: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

12

Im Internet zu finden

https://de.wikibooks.org/wiki/Statistik

Statistics Online Computational Resources (SOCR) - Sammlung statistischer Methoden zur Online Datenanalyse u.v.m. (http://socr.stat.ucla.edu/) (engl.)

Hilfsmittel beim Rechnen der Übungsaufgaben (nicht für Klausur!):

http://statpages.org: Web Pages that Perform Statistical Calculations Über 600 Links, davon 380 Seiten mit Kalkulationsprogrammen (engl.)

http://integrals.wolfram.com : Online Integrator (z.B. x^3 Sin[x] )http://mathworld.wolfram.com : The web‘s most extensive math resourcehttp://www.wolframalpha.com : mathematisch orientierte Such- und Rechenmaschine

Excel / Oocalc / Libreoffice auf dem PC

Page 13: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

13

http://www.j3l7h.de/videos.html - Jörn Loviscach (U Bielefeld): Informatik, Mathe, ... (Deutsch; auch als YouTube-Kanal zu finden) z.B. Mathe 1 Teil 2, Winter 2010/2011

https://www.coursera.org/ - Take the World's Best Courses, Online, For Free (33 Universitäten, 206 Kurse, 2 Mio Teilnehmer): Passion Driven Statistics; Statistics 1; Mathematical Biostatistics Boot Camp („just sign up“)

https://www.udacity.com/course/intro-to-statistics--st101 - „Intro to Statistics“

https://www.edx.org - The Future of Online Education (MIT, Harvard, Berkeley, U of Texas, ...)

Video-Vorlesungen

Page 14: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

14

Statistik

aus Wikipedia, der freien Enzyklopädie (http://de.wikipedia.org/wiki/Statistik)

Als eine Statistik bezeichnet man:

1. namengebend (von lateinisch status - Staat, Zustand mit griechischer Endung) die (vergleichende) Staatsbeschreibung (eingeführt wurde der Begriff vom Göttinger Kameralisten Gottfried Achenwall um 1749);

2. die heute als amtliche Statistik fortlebt;

3. davon verallgemeinernd quantitative Erhebungen aller Art, wie zum Beispiel für Markt- und Meinungsforschung;

4. deren Ergebnisse, deren Darstellung u.a. die deskriptive Statistik besorgt;

5. die mathematische Statistik;

6. gewisse Zufallsvariablen, z.B. eine »Teststatistik«;

7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung, Fermi-Dirac-Statistik, Bose-Einstein-Statistik

Page 15: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

15

Wikipedia: Übersicht und Einteilung (bezieht sich auf Punkt 4 u. 5)

• deskriptive Statistik (beschreibende Statistik, empirische Statistik), mit der vorliegende Daten in geeigneter Weise beschrieben und zusammengefasst werden. Mit ihren Methoden verdichtet man quantitative Daten zu Tabellen, graphischen Darstellungen und Kennzahlen.

• induktive Statistik (schließende Statistik, mathematische Statistik), mit der man aus vorliegenden Daten, die als Stichprobe erhoben worden sind, auf eine zu Grunde liegende verborgene Struktur schließt. Die Wahrscheinlichkeitstheorie liefert die Grundlagen für die erforderlichen Schätz- und Testverfahren.

Induktive Statistik und Wahrscheinlichkeitstheorie werden unter dem Oberbegriff Stochastik zusammengefasst.

Während sich die univariate Statistik mit der Beschreibung der Verteilung eines Untersuchungsmerkmals beschäftigt, wird in der multivariaten Statistik die gemeinsame Verteilung von mehreren Untersuchungsmerkmalen betrachtet.

Page 16: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

16

Stryer: Biochemistry (3.Auflage)

Page 17: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

17

Drei Beispiele aus

Knippers: Molekulare Genetik, 8. Aufl. (Thieme)

Page 18: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

18

Page 19: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

19

Page 20: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

20Plattner, H. und Hentschel, J.: Zellbiologie (3. Aufl., Thieme)

Page 21: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

21

Mathematik

Chemie

Sozialwissenschaften

Physik

Genetik(Alignments)

Molekular-biologie(Kolonien)

(Bio-)Statistik

Evolution(Stammbäume)

Struktur-biologie(Datenanalyse)

Ökologie(math. Modelle für Zusammenhänge)

Biologie

Page 22: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

22

- welche Daten soll man ermitteln? (Kap. A)- wieviele Daten soll man ermitteln? (Kap. A)- auf welche Weise soll man seine Untersuchungsdaten ermitteln? (Kap. A)- auf welche Art soll man das Untersuchungsmaterial auswerten? (Kap. A)- wie sollen die Daten beschrieben und übersichtlich angeordnet werden? (Kap.B)- welche Schlüsse lassen sich ziehen? (Kap. C)- wie zuverlässig sind die Aussagen, die getroffen werden? (Kap. C)- welche weiterführenden Fragestellungen werfen die Ergebnisse auf?

Fragen, die die Statistik bearbeitet

Page 23: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

23

A.

Einführung:

1. Versuchsplanung

2. Merkmalsauswahl

3. Skalenniveaus

4. Durchführung

B.

Beschreibende (deskriptive) Statistik

C.

Schließende Statistik

Fehler 1. und 2. Art

Testverfahren

Regressionsanalyse

Varianzanalyse

(Bayes-Statistik)

W.1. Wahrscheinlichkeitsrechnung

Grundlagen der Zufallsereignisse

W.2. Kombinatorik

Wahrscheinlichkeits-verteilungen

(Binomial, Poisson, Normal)

W.3. Prüfverteilungen

(Normal, t, F, χ2)

Verwenden von Tabellen

Gliederung der Vorlesung

Page 24: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

24

Beispiel* (aus KSV): Wirkung von DDT auf Fliegen

Page 25: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

25

A.1. Versuchsplanung (vor Versuch!)

•Fragestellung unter Berücksichtigung der Literatur aufarbeiten

(Beispiel: Wirkung von DDT auf Fliegen untersuchen)

•Modell mit entsprechenden Hypothesen formulieren (Beispiel: zeit-

und mengenabhängige Sterblichkeit)

•Untersuchungsmethode zur Überprüfung der Hypothesen vorschlagen

(Beispiel: Verabreichung von einmalig 300μg DDT (Quelle), 100

Drosophila, Alter: 1 Woche)

•Merkmale festlegen, die gemessen oder beobachtet werden sollen.

Methode dafür festlegen. Zeitrahmen festlegen. (Beispiel: tote

Fliegen zählen über 24h)

Page 26: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

26

A.2. Merkmalsauswahl

Merkmal: etwas, was man zur Untersuchung einer Fragestellung zählt/misst

Objektivität: Unabhängigkeit vom Experimentator

Zuverlässigkeit/Reliabilität : Unabhängigkeit von der Auswahl des Messobjektes

(beide Kriterien bedeuten: Reproduzierbarkeit)

Aussagekraft / Validität (auch: "Gültigkeit") : Messung misst das, was die Frage beantworten kann

Merkmale haben diese Eigenschaften nur im Hinblick auf die Fragestellungen, die in der Versuchsplanung festgelegt wurden!

Page 27: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

27

Skalenniveau zugehörige Daten

Maßzahlen und Tests

Nominal-Skala Häufigkeiten ?

Ordinal-Skala Rangplätze ?

Intervall-Skala Messwerte Mittelwert

Verhältnis-Skala Messwerte

A.3 Skalenniveaus

Page 28: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

28

A.4. Ablauf ("Datenerhebung") eines Experimentes

• Nebeneinflüsse

• Reproduzierbarkeit

• Selbstschutz

• Dokumentation

• Eigentliche Durchführung

• Daten aufschreiben / speichern

• Datenverarbeitungtabellarisch / graphisch Hypothesen/Modell überprüfen / verifizieren / ablehnen

• Interpretation

• (Präsentation / Publikation)

Page 29: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

29

Kumulative Sterbehäufigkeit von Drosophila nach Behandlung mit DDT

Stunden nach Behandlungsbeginn 1 2 3 4 5 6 7 8 9

Tote Fliegen 1 12 58 84 95 98 98 99 100

010

203040

5060

708090

100

1 2 3 4 5 6 7 8 9

tote Fliegen (gesamt)

tote Fliegen(neu)

Page 30: Statistik für Biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf · 2019-10-24 · 7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung,

30

Präzision (precision) – wie unterschiedlich sind die Messwerte?Wahrheitsnähe (accuracy) – wie weit sind die Messwerte vom wahren Wert entfernt?

A.5 „Qualität“ und „Genauigkeit“ von Messungen