Statistiktutorat Sitzung 1: Grundbegriffe der Statistik [email protected].

47
Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@ web.de

Transcript of Statistiktutorat Sitzung 1: Grundbegriffe der Statistik [email protected].

Page 1: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Statistiktutorat Sitzung 1: Grundbegriffe der Statistik

[email protected]

Page 2: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Euer Rating

Schätzt auf einer Skala von 1 (voll und ganz) bis 5 (im Gegenteil) folgende Frage ein: „Ich erwarte, das Statistik mir mehr Schwierigkeiten machen wird, als andere Fächer im Psychologiestudium“.

Der Wert 3 würde also die Erwartung ausdrücken, dass Statistik für euch durchschnittlich schwierig wird; ein kleinerer Wert hieße schwieriger, ein größerer Wert weniger schwierig.

Page 3: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Was ist deskriptive Statistik?

Der Bereich der Statistik, der eine Menge von erhobenen Daten summarisch (und damit überschaubar) darstellt bzw. beschreibt. Die Veranschaulichung kann grafisch oder rein numerisch erfolgen.

Wortwörtlich: Beschreibende Statistik.

Page 4: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Daten als Balkendiagramm

Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg. 

Page 5: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Was ist Inferenzstatistik

Inferenzstatistik bedeutet, aus Stichproben einer Population Rückschlüsse auf die Gesamtpopulation zu ziehen.

Wortwörtlich: Schließende Statistik.

Page 6: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Verbindung

Die Verfahren der Inferenzstatistik verwenden als Datengrundlage ihrer Berechnungen die mittels deskriptiver Statistik erhobenen Kennwerte.

Die mathematische Grundlage der Inferenzstatistik bildet die Wahrscheinlichkeitsrechnung oder –theorie.

Page 7: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Der große Rahmen

WahrscheinlichkeitsrechnungWahrscheinlichkeitsrechnung

Statistik

deskriptiv inferentiell

Statistik

deskriptiv inferentiell

StochastikStochastik

Page 8: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Datenerhebung

o Bevor wir Daten deskriptiv beschreiben (und später eventuell inferentiell auswerten) können, müssen selbige Daten zunächst erhoben werden.

o In Schritt 1 werden die Merkmale der untersuchten Personen/Objekte zunächst klassifiziert.

Page 9: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Klassifikationskriterium I

Qualitativ vs. Quantitativ

o Qualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie.

Beispiele: Haarfarbe, Nationalität

o Quantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum.

Beispiele: Extraversion, Körpergröße

Page 10: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Manifest vs. Latent

o Manifeste Merkmale können direkt beobachtet oder gemessen werden.

o Latente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen.

o Wie sind unserer Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen?

Manifest: Haarfarbe, Nationalität, Körpergröße Latent: Extraversion

Klassifikationskriterium II

Page 11: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Überblick: Klassifikation von Merkmalen

Page 12: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Vom Merkmal zur Variable

o In Schritt 2 der Datenerhebung müssen wir die nun klassifizierten Merkmale in Zahlen überführen. Dies geschieht durch eine Operationalisierung (synonym: Messvorschrift).

o Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals in Zahlen übertragen (=kodiert) werden.

o Man spricht nun von einer Variable.

Page 13: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Definition „Messung“

Wir haben nun zwei Schritte zur Datenerhebung unternommen. Datenerhebung ist synonym für Messung – wir können also nun auch den Begriff Messung definieren.

o Messung: Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung.

o Mit anderen Worten: kodieren von Merkmalen bzw. Überführung von Merkmalen in Variablen.

Page 14: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Beispiele für Operationalisierungen

oDie Variable „Haar“ soll die Haarfarbe erfassen. Es wird der Wert 1 für blond, der Wert 2 für schwarz und der Wert 3 für rot verwendet.

oDie Variable „Größe“ soll die Körpergröße der untersuchten Personen in cm erfassen.

oDie Variable „extr“ soll die mittels Fragebogen selbst eingeschätzte Extraversion auf einer Skala von 0 (maximal introvertiert) bis +10 (maximal extravertiert) erfassen.

Page 15: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Klassifikation von Variablen

Analog zu Merkmalen werden auch Variablen klassifiziert.

o Manifest vs. latent: entspricht dem zugrunde liegenden Merkmal.

o Diskret vs. kontinuierlich (→ qualitativ vs. quantitativ)

Page 16: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Diskrete vs. kontinuierliche Variablen

Diskreto Die Anzahl der möglichen Werte (auch

wenn sehr hoch) ist endlich und damit genau abzählbar.Kontinuierlich

o Die Variable kann auf einem beliebig genauem Kontinuum beschrieben werden, d.h. ihre Anzahl geht potentiell gegen unendlich.

Page 17: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Diskret (d) oder kontinuierlich (k)? o Beruf (Bezeichnung) (d)o Reaktionszeit (in ms) (k)o Parteizugehörigkeit (d)o Tierart (d)o Gewicht (in kg) (k)

Diskrete vs. kontinuierliche Variablen

Page 18: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

qualitativ quantitativ diskret kontinuierlich

latent/manifest

Operationalisierung

Schaubild Merkmal & Variable

Merkmal Variable

Page 19: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

o In der Statistik ordnet man Variablen ein so genanntes Skalenniveau zu.

o Diese Skalenniveau hat folgende Konsequenzen:1. Es bestimmt, welche mathematischen

Operationen (Tests) mit einer Variable durchgeführt werden können.

2. Welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken).

3. Welche Aussagen meine Daten zulassen.

Variable und Skalenniveau

Page 20: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die 4 Skalenniveaus

Man unterscheidet 4 Skalenniveaus: 1. Die Nominalskala 2. Die Ordinalskala 3. Die Intervallskala (metrisch)4. Die Verhältnisskala (metrisch)

o Dabei steigt die Messgenauigkeit bzw. Aussagekraft der Daten von 1 nach 4 an .

o Es sollte daher immer versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen.

o Viele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus.

o Zu beachten ist aber: Je höher das Skalenniveau, desto „vorsichtiger“ muss ich mit meinen Daten umgehen.

Page 21: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Wovon hängt das Skaleniveau ab?

I. Vom untersuchten Merkmal selbst: Geschlecht kann z.B. (heute) nur auf Nominalskalenniveau erhoben werden.

II. Von der Operationalisierung des Merkmals: Die Schulleistung lässt sich mindestens ordinalskaliert erheben, doch die Operationalisierung „sitzen geblieben“ vs. „nicht sitzen geblieben“ wäre ebenfalls nur nominalskaliert .

Page 22: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Welches Skalenniveau?3 Arten der Erfassung von psychischen Störungen

o Typologie: 0 = keine Störung1 = Störung

nominal

o Abgestufte Typologie: 0 = nicht beeinträchtigt1 = wenig beeinträchtigt2 = eher beeinträchtigt3 = klinisch relevante Beeinträchtigung

ordinal

o Kontinuierliche (dimensionale) Erfassung:Testergebnis in einem klinischen Interview (z.B. 0-100)

metrisch

Page 23: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Nominalskala

Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung vergeben.

Beispiel: Geschlecht („m“ / „w“); in SPSS wird dann eingegeben m=1, w=2

Zwei Annahmen müssen berücksichtigt werden:Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet.Exhaustivität: Jeder beobachteten Merkmalsausprägung eine Zahl zugeordnet.

Page 24: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Nominalskala

Aussagekraft von Variablenwerten:Information über Gleichheit / Verschiedenheit der Merkmalsausprägung (Keine Aussagen zu größer/kleiner Relationen).

Mögliche Transformationen:Es sind alle eineindeutigen Transformationen erlaubt:weiblich = 1; männlich = 2

oder weiblich = 2; männlich = 1oder weiblich = 100; männlich = 200

Page 25: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Eineindeutig?

Peer

Jeanette

Maria„1“

„2“

„3“

Eindeutig: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden.

Eineindeutig: Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden.Merkmal (Menge A) Variable (Menge B)

Maria „2“

?

?

Page 26: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Ordinalskala

Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals.

Beispiel: Schulabschluss – 0 = kein SA– 1 = Hauptschule – 2 = Realschule– 3 = Gymnasium

Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung.

Page 27: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Ordinalskala

Aussagekraft von Variablenwerten:- Information über Gleichheit / Verschiedenheit der

Merkmalsausprägung,- Größer / Kleiner Relationen

Mögliche Transformationen:Erlaubt sind nur noch alle monotonen Transformationen.Beispiele:y = x + 3y = 2xy = log(x)

Page 28: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Monotone Funktion A

Page 29: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Monotone Funktion B

Page 30: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Nicht-monotone Funktion A

Page 31: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Nicht-monotone Funktion B

Page 32: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Transformationen

y =x², monoton oder nicht monoton? Antwort: Kommt darauf an. Nur wenn für unseren Definitionsbereich gilt x ≥ 0.

Wer nicht sattelfest in Algebra ist, braucht sich keine Sorgen machen. Es werden keine fiesen Transformationen abgefragt und eure eigenen dürft ihr so einfach (und so auswendig) wie nötig gestalten.

Page 33: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Intervallskala

Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen.

Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 → Differenz 15 Punkte

Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

Page 34: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Intervallskala

Aussagekraft von Variablenwerten:

- Information über Gleichheit / Verschiedenheit der Merkmalsausprägung,

- Größer / Kleiner Relationen

- Größe von Unterschieden

Mögliche Transformationen:

Erlaubt sind nur noch lineare Transformationen (y = ax+b).

Beispiele:

y = x -100

y = 0.1 x

Page 35: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Verhältnisskala

Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden.

Beispiel: Reaktionszeit (ms).

Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

Page 36: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Verhältnisskala

Aussagekraft von Variablenwerten:- Information über Gleichheit / Verschiedenheit der

Merkmalsausprägung- Größer / Kleiner Relationen - Größe von Unterschieden- Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit)

Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax).Beispiele:y = 0.001 ∙ x (Umrechnung von Millisekunden in Sekunden)y = 24 ∙ x (Umrechnung von Jahren in Monate)→ Transformationen können z.B. dazu dienen, Daten aus verschiedenen Studien zusammenzuführen.

Page 37: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Überblick Skalenniveaus

Page 38: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Skalenniveaus und Informationsgewinn

Page 39: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die große Grauzone

o Oft ist nicht eindeutig, ob eine Variable als ordinal- oder als intervallskalliert zu betrachten ist.

o Die Grauzone beginnt dort, wo die Variable mehr Information als „Größer/Kleiner“ Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist.

o Letzteres muss in jedem Einzelfall theoretisch begründet werden.

Page 40: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Lernziele

o Wie Objekte zu statistisch auswertbaren Daten werden.

o Was Skalenniveaus sind und wovon sie abhängen.

o Welche große Grauzone in puncto Skalenniveaus existiert.

Page 41: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Arbeitsblatt Aufgabe 1.1

Page 42: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Arbeitsblatt Aufgabe 1.2

Page 43: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Arbeitsblatt Aufgabe 1.3

Page 44: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Arbeitsblatt Aufgabe 1.4

Page 45: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Arbeitsblatt Aufgabe 1.5

Page 46: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Arbeitsblatt Aufgabe 1.6

Page 47: Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de.

Vielen Dank für eure Aufmerksamkeit!