Termin 1 Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie theotoppe@gmail.com...

Post on 05-Apr-2015

107 views 0 download

Transcript of Termin 1 Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie theotoppe@gmail.com...

Termin 1

Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie

theotoppe@gmail.comrau.ricky@gmail.com

1

Termin 1

In Kleingruppen• Kurze Vorstellung• Was erwarten wir von dem Fach Statistik?• Was erwarten wir vom Tutorat?• Warum brauchen Psychologen Statistik?

• Schätzt euch individuell auf einer Skala von 1 (gar nicht) bis 5 (völlig zutreffend) ein und berichtet den Mittelwert (arithmetisches Mittel).▫ Ich freue mich auf die Methodenausbildung.▫Der Gedanke an die Prüfungen macht mir Angst.▫Statistik wird mir schwerer fallen als andere

Fächer.

2

3

Statistik?

4

Statistik?

Termin 1

Warum Statistik?

• Voraussetzung, um Forschung kritisch zu betrachten und um ihre Denklogik zu verstehen

• Zur Beurteilung, wann welche Methoden für eigene Untersuchungen geeignet sind

• Zur Anwendung und Auswertung psychologischer Tests

• Um den Bachelor zu erlangen uvm.

5

Termin 1

Lernziele

Wissen,…

• wie Objekte zu statistisch auswertbaren Daten werden.

• was Skalenniveaus sind und wovon sie abhängen.

• welche Transformationen verlustfrei gerechnet werden können.

• welche große Grauzone in puncto Skalenniveaus existiert.

6

Termin 1

Was ist deskriptive Statistik?

Der Bereich der Statistik, der eine Menge von

erhobenen Daten summarisch (und damit

überschaubar) darstellt bzw. beschreibt.

Die Veranschaulichung kann grafisch oder rein

numerisch erfolgen.

Wortwörtlich: Beschreibende Statistik.

7

Termin 1

Daten als Balkendiagramm

Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg. 

8

Termin 1

Was ist Inferenzstatistik?

Inferenzstatistik bedeutet, aus

Stichproben einer Population

Rückschlüsse auf die Gesamtpopulation

zu ziehen.

Wortwörtlich: Schließende Statistik.

9

Termin 1

Die Verbindung

Die Verfahren der Inferenzstatistik verwenden

als Datengrundlage ihrer Berechnungen die

mittels deskriptiver Statistik erhobenen

Kennwerte.

Die mathematische Grundlage der

Inferenzstatistik bildet die

Wahrscheinlichkeitsrechnung oder –theorie.

10

Termin 1

Der große Rahmen

WahrscheinlichkeitsrechnungWahrscheinlichkeitsrechnung

Statistik

deskriptiv inferentiell

Statistik

deskriptiv inferentiell

StochastikStochastik

11

Termin 1

Datenerhebung• Bevor wir Daten deskriptiv beschreiben (und

später eventuell inferentiell auswerten) können, müssen selbige Daten zunächst erhoben werden.

• In einem ersten Schritt werden die Merkmale der untersuchten Personen/Objekte zunächst klassifiziert.

• In einem zweiten Schritt werden die nun klassifizierten Merkmale in Zahlen überführt.

12

Termin 1

Klassifikationskriterium I

Qualitativ vs. Quantitativ

• Qualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie.

Beispiele: Studienfach, Geschlecht

• Quantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum.

Beispiele: Extraversion, Zeit, Anzahl

13

Termin 1

Klassifikationskriterium IIManifest vs. Latent

• Manifeste Merkmale können direkt beobachtet oder gemessen werden.

• Latente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen.

• Wie sind unsere Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen?

Manifest: Haarfarbe, Nationalität, KörpergrößeLatent: Extraversion, Mut, Intelligenz

14

Termin 1

Überblick: Klassifikation von Merkmalen

15

Termin 1

Vom Merkmal zur Variable• In Schritt 2 der Datenerhebung müssen

wir die nun klassifizierten Merkmale in Zahlen überführen. Dies geschieht durch eine Operationalisierung.

• Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals in Zahlen übertragen (=kodiert) werden.

• Man spricht nun von einer Variable.

16

Termin 1

Beispiele für Operationalisierungen

•Die Variable „Haar“ soll die Haarfarbe erfassen. Es wird der Wert 1 für blond, der Wert 2 für schwarz und der Wert 3 für rot verwendet.

•Die Variable „Größe“ soll die Körpergröße der untersuchten Personen in cm erfassen.

•Die Variable „extr“ soll die mittels Fragebogen selbst eingeschätzte Extraversion auf einer Skala von 0 (maximal introvertiert) bis 10 (maximal extravertiert) erfassen.

17

Termin 1

Definition „Messung“

Messen ist eine Zuordnung von Zahlen zu

Objekten oder Ereignissen, sofern diese

Zuordnung eine homomorphe Abbildung

eines empirischen Relativs in ein

numerisches Relativ ist (Ort, 1983).

18

Termin 1

Tutorat Deskriptive Statistik

19

Empirisches Relativ

Numerisches Relativ

Termin 1

Tutorat Deskriptive Statistik

20

Termin 1

Klassifikation von Variablen

Analog zu Merkmalen werden auch Variablen klassifiziert.

• Manifest vs. latent: entspricht dem zugrunde liegenden Merkmal

• Diskret vs. kontinuierlich (→ qualitativ vs. quantitativ)

21

Termin 1

Diskrete vs. kontinuierliche Variablen

Diskret• Die Anzahl der möglichen Werte ist endlich

und damit genau abzählbar.Beispiel: Anzahl Personen in einem

Tutorat

Kontinuierlich / Stetig• Die Variable kann auf einem beliebig

genauem Kontinuum beschrieben werden, d.h. ihre Anzahl geht potentiell gegen unendlich.

Beispiel: Temperatur, Körpergröße

22

Termin 1

Diskrete vs. kontinuierliche Variablen

Diskret oder kontinuierlich? • Beruf (Bezeichnung)• diskret

• Reaktionszeit (in ms) • kontinuierlich

• Parteizugehörigkeit • diskret

• Tierart • diskret

• Gewicht (in kg)• kontinuierlich

23

Termin 1

qualitativ quantitativ diskret kontinuierlich

latent/manifest

Operationalisierung

Schaubild Merkmal & Variable

Merkmal Variable

24

Termin 1

Variable und Skalenniveau• In der Statistik ordnet man Variablen ein

so genanntes Skalenniveau zu.• Diese Skalenniveau hat folgende

Konsequenzen:1. Es bestimmt, welche mathematischen

Operationen (Tests) mit einer Variable durchgeführt werden können.

2. Welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken).

3. Welche Aussagen meine Daten zulassen.

25

Termin 1

Transformationen•Man rechnet alle Daten mit einer

bestimmten Formel um. Beispiel: Sekunden in Millisekunden

umrechnen.

•Jedes Skalenniveau erlaubt bestimmte verlustfreie Transformationen !

26

Termin 1

Die 4 SkalenniveausMan unterscheidet 4 Skalenniveaus:

1. Die Nominalskala

2. Die Ordinalskala

3. Die Intervallskala (metrisch)

4. Die Verhältnisskala (metrisch)

27

Termin 1

Die 4 Skalenniveaus

• Dabei steigt die Messgenauigkeit bzw. Aussagekraft der Daten von 1 nach 4 an.

• Viele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus.

Daten auf einem möglichst hohem Skalenniveau erfassen!

28

Termin 1

Wovon hängt das Skalenniveau ab?I. Vom untersuchten Merkmal selbst:

Geschlecht kann z.B. nur auf Nominalskalenniveau erhoben werden.

II. Von der Operationalisierung des Merkmals: Schulleistung in Note oder in „sitzen geblieben“ vs. „nicht sitzen geblieben“

29

Termin 1

Welches Skalenniveau?

Drei Arten der Erfassung des Merkmals „Depressivität“

• Typologie: 0 = keine Störung1 = Störung nominal

• Abgestufte Typologie: 0 = nicht beeinträchtigt1 = wenig beeinträchtigt2 = eher beeinträchtigt3 = klinisch relevante Beeinträchtigung ordinal

• Kontinuierliche (dimensionale) Erfassung:Testergebnis in einem klinischen Interview (z.B. BDI 0-63) metrisch

30

Termin 1

Die Nominalskala

Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung

vergeben.

Beispiel: Geschlecht („m“ / „w“); in SPSS wird dann eingegeben m=1, w=2

Zwei Annahmen müssen berücksichtigt werden:

Exklusivität:

Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen

zugeordnet.

Exhaustivität:

Jeder beobachteten Merkmalsausprägung wird eine Zahl zugeordnet.

31

Termin 1

Die Nominalskala

Aussagekraft von Variablenwerten:Information über Gleichheit / Verschiedenheit der Merkmalsausprägung (Keine Aussagen zu größer/kleiner Relationen).

Mögliche Transformationen:Es sind alle eineindeutigen Transformationen erlaubt:weiblich = 1; männlich = 2

oder weiblich = 2; männlich = 1oder weiblich = 100; männlich = 200

32

Termin 1

Eineindeutig?

Bochum

Heidelberg

Ulm

„1“

„2“

„3“

Eindeutig: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden.

Eineindeutig: Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden.

Merkmal „Herkunft“ (Menge A)

Variable „stadt“ (Menge B)

Kassel „4“

33

Termin 1

Die Ordinalskala

Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals.

Beispiel: Schulabschluss ▫ 0 = kein SA▫ 1 = Hauptschule ▫ 2 = Realschule▫ 3 = Gymnasium

Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung.

34

Termin 1

Die Ordinalskala

Aussagekraft von Variablenwerten:• Information über Gleichheit / Verschiedenheit

der Merkmalsausprägung,• Größer / Kleiner Relationen

Mögliche Transformationen:Erlaubt sind nur noch alle monotonen

Transformationen.Beispiele:

y = x + 3y = 2xy = log(x)

35

Termin 1

Monotone Funktion A

36

Termin 1

Monotone Funktion B

37

Termin 1

Nicht-monotone Funktion A

38

Termin 1

Transformationeny =x², monoton oder nicht monoton? Antwort: Kommt darauf an. Nur wenn für unseren Definitionsbereich gilt x ≥ 0.

Wer nicht sattelfest in Algebra ist, braucht sich keine Sorgen machen. Es werden keine fiesen Transformationen abgefragt und eure eigenen dürft ihr so einfach (und so auswendig) wie nötig gestalten.

39

Termin 1

Die Intervallskala

Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen.

Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 → Differenz 15 Punkte

Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

40

Termin 1

Die Intervallskala

Aussagekraft von Variablenwerten:• Information über Gleichheit / Verschiedenheit der

Merkmalsausprägung,• Größer / Kleiner Relationen• Größe von Unterschieden

Mögliche Transformationen:Erlaubt sind nur noch lineare Transformationen (y = ax+b).Beispiele:

y = x -100y = 0.1 x

41

Termin 1

Die Verhältnisskala

Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden.

Beispiel: Reaktionszeit (ms).

Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

42

Termin 1

Die VerhältnisskalaAussagekraft von Variablenwerten:

• Information über Gleichheit / Verschiedenheit der Merkmalsausprägung

• Größer / Kleiner Relationen • Größe von Unterschieden• Verhältnis von Merkmalsausprägungen (z.B. doppelte

Reaktionszeit)

Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax).Beispiele:y = 0.001 ∙ x (Umrechnung von Millisekunden in Sekunden)y = 24 ∙ x (Umrechnung von Jahren in Monate)→ Transformationen können z.B. dazu dienen, Daten aus verschiedenen Studien zusammenzuführen.

43

Termin 1

Überblick Skalenniveaus

44

Termin 1

Skalenniveaus und Informationsgewinn

45

Termin 1

Die große Grauzone• Oft ist nicht eindeutig, ob eine Variable als

ordinal- oder als intervallskaliert zu betrachten ist.

• Die Grauzone beginnt dort, wo die Variable mehr Information als „Größer/Kleiner“ Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist.

• Letzteres muss in jedem Einzelfall theoretisch begründet werden.

46

Termin 1

Lernziele

Wissen,…

• wie Objekte zu statistisch auswertbaren Daten werden.

• was Skalenniveaus sind und wovon sie abhängen.

• welche Transformationen verlustfrei gerechnet werden können.

• welche große Grauzone in puncto Skalenniveaus existiert.

47

Termin 1

Arbeitsblatt Aufgabe 1.148

Termin 1

Arbeitsblatt Aufgabe 1.2

49

Termin 1

Arbeitsblatt Aufgabe 1.3

50

Termin 1

Arbeitsblatt Aufgabe 1.4

51

Termin 1

Arbeitsblatt Aufgabe 1.5

52

Termin 1

Arbeitsblatt Aufgabe 1.6

53

Termin 1

Vielen Dank für eure Aufmerksamkeit!

Bis nächste Woche

Fragen an rau.ricky@gmail.comtheotoppe@gmail.com

54