Statistiktutorat Thema 1: Grundbegriffe der Statistik [email protected].

40
Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@ web.de

Transcript of Statistiktutorat Thema 1: Grundbegriffe der Statistik [email protected].

Page 1: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Statistiktutorat Thema 1: Grundbegriffe der Statistik

[email protected]

Page 2: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

ZitateStatistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden. Der Satz: „Mit Statistik kann man alles beweisen“ gilt nur für die Bequemen, die keine Lust haben, genau hinzusehen (Elisabeth Noelle-Neumann, Gründerin von Allensbach ).

Wenn man mündige Bürger haben will, muss man ihnen drei Dinge beibringen: Lesen, Schreiben und statistisches Denken (Gerd Gigerenzer, Direktor des MPI für Bildungsforschung).

Statistiken sind wie Bikinis, sie enthüllen eine ganze Menge, verbergen aber das Wichtigste (anonym).

Page 3: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Struktur meines Tutorats

Wiederholung (ca. 15 min)

Theorieteil (30 – 45 min)

Rechnen in Gruppen (30 – 45 min)

Page 4: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Gliederung Thema I

I. Der rote Faden für dieses Semester

II. Wirklichkeit mathematisch abbilden: Messung & Operationalisierung

III. Skalenniveaus und ihre Eigenschaften

Page 5: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

I. Der Rote Faden für dieses Semester

Page 6: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Der große Rahmen

WahrscheinlichkeitsrechnungWahrscheinlichkeitsrechnung

Statistik

deskriptiv inferentiell

Statistik

deskriptiv inferentiell

StochastikStochastik

Page 7: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Was ist deskriptive Statistik?

Der Bereich der Statistik, der eine Menge von erhobenen Daten summarisch (und damit überschaubar) darstellt bzw. beschreibt. Die Veranschaulichung kann grafisch oder rein numerisch erfolgen.

Wortwörtlich: Beschreibende Statistik.

Page 8: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Daten als Balkendiagramm

Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg. 

Page 9: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Was ist Inferenzstatistik

Inferenzstatistik bedeutet, aus Stichproben einer Population Rückschlüsse auf die Gesamtpopulation zu ziehen.

Wortwörtlich: Schließende Statistik.

Page 10: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Verbindung

Die Verfahren der Inferenzstatistik verwenden als Datengrundlage ihrer Berechnungen die mittels deskriptiver Statistik erhobenen Kennwerte.

Die mathematische Grundlage der Inferenzstatistik bildet die Wahrscheinlichkeitsrechnung.

Page 11: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

II. Wirklichkeit mathematisch abbilden:

Messung & Operationalisierung

Page 12: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Datenerhebung

o Bevor wir Daten deskriptiv beschreiben (und später eventuell inferentiell auswerten) können, müssen die Daten erhoben werden.

o Dazu werden zunächst die Merkmale der untersuchten Personen/Objekte klassifiziert.

Page 13: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Klassifikationskriterium I

Qualitativ vs. Quantitativ

o Qualitative Merkmale beschreiben die Zugehörigkeit einer Person/eines Objektes zu einer von mehreren Kategorien.

Beispiele: Haarfarbe, Nationalität

o Quantitative Merkmale beschreiben die Ausprägung einer Person/eines Objekts bezüglich eines Merkmals.

Beispiele: Extraversion, Körpergröße

Page 14: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Manifest vs. Latent

o Manifeste Merkmale sind direkt beobacht- und damit messbar

o Latente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen.

o Wie sind unserer Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen?

Manifest: Haarfarbe, Nationalität, Körpergröße Latent: Extraversion

Klassifikationskriterium II

Page 15: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Überblick: Klassifikation von Merkmalen

Page 16: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Vom Merkmal zur Variable

o Nach der Klassifikation erfolgt die Überführung der Merkmale in Zahlen. Dies geschieht nach den Regeln einer Operationalisierung (synonym: Messvorschrift).

o Messung: Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung.

Page 17: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Abstrakte Definition „Messung“

Zuordnung von Zahlen zu Objekten oder Ereignissen, sofern dieser Zuordnung eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ ist.

o Empirisches Relativ: Menge von Objekten, die sich anhand eines Merkmals vergleichen lassen.

o Numerisches Relativ: Menge von Zahlen die sich anhand von Zahlen in Relation bringen lassen.

o Homomorphe Abbildung: eindeutige Abbildung.

Page 18: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

isomorph vs. homomorph

blond

brünettdunkel

„1“„2“

„3“

Homomorphe Zuordnung: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden.

Isomorphe Zuordnung : Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden.

Merkmal (Menge A) Variable (Menge B)

dunkel „2“

?

?

Page 19: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Klassifikation von Variablen

o Diskret: Die Anzahl der möglichen Werte (auch wenn sehr hoch) ist endlich und damit genau abzählbar.

o Kontinuierlich: Die Variable kann auf einem beliebig genauem Kontinuum beschrieben werden, d.h. die Anzahl der möglichen Werte geht gegen unendlich.

o → qualitativ vs. quantitativ.

Page 20: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

qualitativ quantitativ diskret kontinuierlich

latent/manifest

Operationalisierung

Schaubild Merkmal & Variable

Merkmal Variable

Page 21: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

III. Skalenniveaus und ihre Eigenschaften

Page 22: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

o In der Statistik ordnet man Variablen ein so genanntes Skalenniveau zu.

o Diese Skalenniveau hat folgende zentrale Konsequenzen:

1. Es bestimmt, welche mathematischen Operationen (Tests) mit einer Variable durchgeführt werden können und damit die Präzision der möglichen Schlussfolgerungen.

2. Es bestimmt, welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken)

Variable und Skalenniveau

Page 23: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Transformationen

Unter einer Transformation wird eine Umwandlung von Variablenwerten durch eine mathematische Funktion verstanden, welche die ursprünglichen Werte in jeweils neue Werte überführt.

Beispiel: f (x) = 3 · x

Zweck: Daten aus verschiedenen Studien zusammen führen oder bestimmte Verteilungsformen herstellen, die Voraussetzung für viele Tests sind.

Page 24: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die 4 Skalenniveaus

Man unterscheidet 4 Skalenniveaus: 1. Die Nominalskala 2. Die Ordinalskala 3. Die Intervallskala (metrisch)4. Die Verhältnisskala (metrisch)

o Viele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus.

o Daher immer versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen.

Page 25: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Wovon hängt das Skaleniveau ab?

I. Vom untersuchten Merkmal selbst: Geschlecht kann z.B. nur auf Nominalskalenniveau erhoben werden – entweder Mann oder Frau.

II. Von der Operationalisierung des Merkmals: Körpergewicht lässt sich verhältnisskaliert erheben, doch die Operationalisierung >70 kg = schwer, <70 kg = leicht wäre lediglich ordinalskaliert

Page 26: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Nominalskala

o Bei der Nominalskala geben die Variablenwerte Auskunft über die Zugehörigkeit zu einer Kategorie:

Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung vergeben.

o Beispiel: Geschlecht („m“ / „w“); in SPSS wird dann eingegeben m=1, w=2

o Aussagekraft: Gleichheit/Verschiedenheit der Merkmalsausprägungeno Mögliche Transformationen:

Es sind alle eineindeutigen Transformationen erlaubt:

weiblich = 1; männlich = 2

oder weiblich = 2; männlich = 1

oder weiblich = 100; männlich = 200

Page 27: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Ordinalskala

Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals.

Beispiel: Schulabschluss – 0 = kein SA– 1 = Hauptschule – 2 = Realschule– 3 = Gymnasium

Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung.

Page 28: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Ordinalskala

Aussagekraft von Variablenwerten:- Information über Gleichheit / Verschiedenheit der

Merkmalsausprägung,- Größer / Kleiner Relationen

Mögliche Transformationen:Erlaubt sind nur noch alle monotonen Transformationen.Beispiele:y = x + 3y = 2xy = log(x)

Page 29: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Monotone Funktion A

Page 30: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Monotone Funktion B

Page 31: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Nicht-monotone Funktion A

Page 32: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Nicht-monotone Funktion B

Page 33: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Intervallskala

Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen.

Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 → Differenz 15 Punkte

Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

Page 34: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Intervallskala

Aussagekraft von Variablenwerten:

- Information über Gleichheit / Verschiedenheit der Merkmalsausprägung,

- Größer / Kleiner Relationen

- Größe von Unterschieden

Mögliche Transformationen:

Erlaubt sind nur noch lineare Transformationen (y = ax+b).

Beispiele:

y = x -100

y = 0.1 x

Page 35: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die Verhältnisskala

Die Verhältnisskala erlaubt Aussagen über das Verhältnis von Merkmalsausprägungen. Sie kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden.

Beispiel: Reaktionszeit (ms).

Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

Page 36: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Die VerhältnisskalaAussagekraft von Variablenwerten:

- Information über Gleichheit / Verschiedenheit der Merkmalsausprägung

- Größer / Kleiner Relationen - Größe von Unterschieden- Verhältnis von Merkmalsausprägungen (z.B. doppelte

Reaktionszeit)

Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax).Beispiele:y = 0.001 ∙ x (Umrechnung von Millisekunden in Sekunden)y = 24 ∙ x (Umrechnung von Jahren in Monate)

Page 37: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Überblick Skalenniveaus

Page 38: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Skalenniveaus und Informationsgewinn

Page 39: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Grauzone bei Skalenniveaus

o Oft ist nicht eindeutig, ob eine Variable als ordinal- oder als intervallskalliert gelten kann.

o Die Grauzone beginnt dort, wo die Variable mehr Information als „Größer/Kleiner“ Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist.

o Ob Gleichheit der Intervalle gegeben ist, muss in jedem Einzelfall theoretisch und/oder statistisch geprüft werden.

Page 40: Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de.

Vielen Dank für eure Aufmerksamkeit!