Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik...

98
Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte 1 Gliederung Deskriptive Statistik • Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus – Fragebogenformate Datensätze in SPSS • Kennwerte – Häufigkeiten Maße der zentralen Tendenz Maße der Dispersion

Transcript of Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik...

Page 1: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Grundbegriffe und Kennwerte

02_grundbegriffe_kennwerte 1

Gliederung• Deskriptive Statistik• Grundbegriffe

– Merkmale– Variable– Operationalisierung– Skalenniveaus– Fragebogenformate

• Datensätze in SPSS• Kennwerte

– Häufigkeiten– Maße der zentralen Tendenz– Maße der Dispersion

Page 2: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Deskriptive Statistik

02_grundbegriffe_kennwerte 2

• Definition:

„Unter deskriptiver Statistik versteht man ein Gruppe statistischer Methoden zur Beschreibung statistischer Daten anhand statistischer Kennwerte, Graphiken, Diagrammen oder Tabellen.“ (Leonhart, 2004)

• Deskriptive Statistik bezieht sich immer auf eine Stichprobe, d.h. auf die Personen, die tatsächlich untersucht bzw. beobachtet wurden.

• Die Inferenzstatistik zieht dagegen aus den in einer Stichprobe erhobenen Daten Schlüsse auf die zugrunde liegende Population.

Page 3: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Grundbegriffe der Datenerhebung

02_grundbegriffe_kennwerte 3

• Bei einer Datenerhebung geht es darum, bestimmte Merkmalsausprägungen der untersuchten Einheiten zu messen.

• Was sind Merkmale?

• Was sind Einheiten?

• Was ist eine Messung?

Page 4: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Deskriptive Statistik

02_grundbegriffe_kennwerte 4

Beispiel 1: Merkmale von Psychologiestudierenden:

• Geschlecht

• Alter

• Größe

• Wohnort

• Ängstlichkeit

• Extravertiertheit

• Statistikkenntnisse

Page 5: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Merkmale

02_grundbegriffe_kennwerte 5

Beispiel 2: Merkmale von Therapiemaßnahmen:

• Anzahl der therapeutischen Sitzungen (25 vs. 100)

• Therapeutisches „Setting“ (z.B. Einzel- vs. Gruppentherapie)

• Eingesetzte therapeutische Methoden (z.B. Gesprächsterapie vs. Verhaltenstherapie)

• Motivation des Klienten

• Motivation des Therapeuten

• …

Eine statistische Erhebung von Merkmalen muss nicht auf Basis von Personen erfolgen.

Page 6: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Merkmale

02_grundbegriffe_kennwerte 6

Qualitative vs. Quantitative Merkmale • Qualitative Merkmale beschreiben die Zugehörigkeit einer

Person oder eines Objektes zu einer Kategorie.• Quantitative Merkmale beschreiben die Ausprägung eines

Merkmals auf einem Kontinuum.

• Beispiele …– Qualitativ: Geschlecht, Wohnort– Quantitativ: Alter, Ängstlichkeit

Page 7: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Merkmale

02_grundbegriffe_kennwerte 7

Manifeste vs. Latente Merkmale • Manifeste Merkmale können (im Prinzip) direkt beobachtet oder

gemessen werden.• Latente Merkmale können nur indirekt zu erfasst werden. Diese

Merkmale sind meist nur unzureichend operational definiert, so dass ihre Messung indirekt durch korrespondierender manifeste Merkmale geschieht.

• Beispiele …– Manifest: Geschlecht, Körpergröße– Latent: Persönlichkeitseigenschaften

Page 8: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Deskriptive Statistik

02_grundbegriffe_kennwerte 8

Klassifikation von Merkmalen:

Manifest Latent

Qualitativ • Geschlecht• Wohnort• …

• Persönlichkeitstypus(z.B. „Choleriker“)

• …Quantitativ • Alter

• Gewicht• …

• Persönlichkeitseigenschaft(z.B. Extraversion)

• …

Page 9: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Messung

02_grundbegriffe_kennwerte 9

Vom Merkmal zur Variable

• Um ein Merkmal exakt zu erfassen, muss eine präzise Operationalisierung (Messvorschrift) vorliegen.

• Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals erfasst (kodiert) werden

• Die Kodierung der Merkmalsausprägungen erfolgt in der Regel in Zahlen.

• Man spricht nun von einer Variable, die die Information enthält.

• Ein Messung ist also eine Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung.

Page 10: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Operationalisierung

02_grundbegriffe_kennwerte 10

Beispiele für Operationalisierungen

• Die Variable „sex“ soll das Geschlecht erfassen. Es wird für Frauen der Wert 1 und für Männer der Wert 2 verwendet.

• Die Variable „alter“ soll das Alter der untersuchten Personen in Jahren erfassen.

• Die Variable „alter“ soll das Alter von Säuglingen in Monaten erfassen.

• Die Variable „opt“ soll den selbst eingeschätzten Optimismus auf einer Skala von -2 (überhaupt nicht optimistisch) bis +2 (extrem optimistisch) erfassen.

• Die Variable „angst“ soll die Ängstlichkeit erfassen. Diese wird gemessen als die Zeitdauer in Sekunden, bis eine Spinne angefasst wird.

Page 11: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Variablen

02_grundbegriffe_kennwerte 11

Klassifikation von Variablen: Diskret vs. Kontinuierlich

• Diskrete Variablen: Die Anzahl der möglichen Werte ist abzählbar.

• Kontinuierliche Variablen: Die möglichen Werte liegen auf einem Kontinuum.

• Beispiele …

Page 12: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Merkmale und Variablen

02_grundbegriffe_kennwerte 12

Merkmal qualitativ oder quantitativ ?

manifestoder latent ?

diskret oder kontinuierlich

Geschlecht qualitativ manifest diskretAlter quantitativ manifest ?Wohnort qualitativ manifest diskretOptimismus(Rating 1 bis 5)

quantitativ latent diskret

Ängstlichkeit(Zeit bis zur Handlung)

quantitativ latent kontinuierlich

Page 13: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Möglichkeiten, das Konstrukt „Ängstlichkeit“ zu operationalisieren:• „Mutprobe“ (z.B. bungee jump)

– Erfolg: angst=„0“– Misserfolg: angst=„1“

• „Experten-Rating“ (Einschätzung)– nicht ängstlich („0“)– wenig ängstlich („1“)– eher ängstlich („2“)– klinisch relevante Angststörung („3“)

• Ergebnis eines Ängstlichkeitsfragebogens– Werte von 0-40

• „Mutprobe“– Zeit bis zur erfolgreichen Handlung (0 bis ? Sekunden)

02_grundbegriffe_kennwerte 13

Die Art der Operationalisierung beeinflusst das Skalenniveau und damit die Möglichkeiten der statistischen Auswertung!

Page 14: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Vier Skalenniveaus:(1) Nominalskala(2) Ordinalskala(3) Intervallskala(4) Verhältnisskala

• Die Messgenauigkeit und Aussagekraft der Daten steigt mit dem Skalenniveau.

• Es sollte daher versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen.

02_grundbegriffe_kennwerte 14

Page 15: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Die Nominalskala• Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung

vergeben.• Beispiel: Geschlecht („m“ / „w“)• Zwei Annahmen müssen berücksichtigt werden:

1. Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet.

2. Exhaustivität: Jeder beobachteten Merkmalsausprägung eine Zahl zugeordnet.

• Man spricht von einer homomorphen Abbildung, d.h. aus der Variablen kann immer auf das Merkmal zurückgeschlossen werden.

02_grundbegriffe_kennwerte 15

Page 16: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Die Nominalskala• Aussagekraft von Variablenwerten:

– Information über Gleichheit / Verschiedenheit der Merkmalsausprägung(Keine Aussagen zu größer/kleiner Relationen möglich!)

• Mögliche Transformationen:– Die Variablenwerte können willkürlich vorgegeben und auch nachträglich

geändert werden.– Es sind alle eineindeutigen Transformationen erlaubt– Beispiel:

weiblich = 1; männlich = 2oder weiblich = 2; männlich = 1oder weiblich = 100; männlich = 200;

02_grundbegriffe_kennwerte 16

Page 17: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Die Ordinalskala• Bei der Ordinalskala (Rangskala) geben die Variablenwerte

Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals

• Beispiel: Schulabschluss„0“=kein SA, „1“=Haupts., „2“=Reals., „3“=Gymnasium)

• Zusätzliche Annahme für die Operationalisierung:3. Die zugeordneten Zahlen repräsentieren eine Rangreihe der

Merkmalsausprägung.

02_grundbegriffe_kennwerte 17

Page 18: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Die Ordinalskala• Aussagekraft von Variablenwerten:

– Information über Gleichheit / Verschiedenheit der Merkmalsausprägung– Größer / Kleiner Relationen

• Mögliche Transformationen:– Erlaubt sind nur noch alle monotonen Transformationen.– Beispiele

• y = x + 3• y = 2x• y = log(x)

02_grundbegriffe_kennwerte 18

Page 19: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Die Intervallskala• Bei der Intervallskala geben die Variablenwerte Aufschluss über

die Abstände zwischen Merkmalsausprägungen.• Beispiel: Ergebnisse eines Intelligenztests

(IQ (Peter) = 115; IQ(Anne) = 130 Differenz 15 Punkte )• Zusätzliche Annahme für die Operationalisierung:

4. Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

02_grundbegriffe_kennwerte 19

Page 20: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Die Intervallskala• Aussagekraft von Variablenwerten:

– Information über Gleichheit / Verschiedenheit der Merkmalsausprägung– Größer / Kleiner Relationen– Größe von Unterschieden

• Mögliche Transformationen:– Erlaubt sind nur noch alle linearen Transformationen (y = ax+b).– Beispiele

• y = x - 100• y = 0.1 x

02_grundbegriffe_kennwerte 20

Page 21: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Die Verhältnisskala• Die Verhältnisskala kann vor allem bei der Messung

physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden.

• Beispiel: Reaktionszeit (ms)• Zusätzliche Annahme für die Operationalisierung:

5. Die Skala hat einen definierten Null-Punkt.

02_grundbegriffe_kennwerte 21

Page 22: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Die Verhältnisskala• Aussagekraft von Variablenwerten:

– Information über Gleichheit / Verschiedenheit der Merkmalsausprägung– Größer / Kleiner Relationen – Größe von Unterschieden– Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit)

• Mögliche Transformationen:– Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax).– Beispiele

• y = 0.001 x (Umrechnung von Millisekunden in Sekunden)∙• y = 24 x (Umrechnung von Jahren in Monate)∙

02_grundbegriffe_kennwerte 22

Page 23: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Skalenniveau Beispiele Mögliche Aussagen

Erlaubte Trans-formationen

Nominalskala Geschlecht,Diagnosen

Gleichheit / Verschiedenheit

Eineindeutige Transformationen

Ordinalskala Schulbildung,Ratings

Größer / Kleiner Relationen

Monotone Trans-formationen

Intervallskala IQ, Persönlichkeits-merkmale

Gleichheit von Differenzen

Lineare Trans-formationen

Verhältnisskala Alter,Reaktionszeit

Gleichheit von Verhältnissen

MultiplikativeTransformationen

02_grundbegriffe_kennwerte 23

Page 24: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

• Das Skalenniveau hängt ab:1. Von dem erhobenen Merkmal2. Von der Operationalisierung der Messung

• Beispiele: Geschlecht ist immer Nominalskaliert, da das Merkmal an sich keine

Rangreihe oder Intervalle definiert. Ängstlichkeit kann jedoch nominal-, ordinal-, oder intervallskaliert

erhoben werden (s.o.)

• Durch die Art der Messung kann das Skalenniveau sinken.

02_grundbegriffe_kennwerte 24

Page 25: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Niveau eines Merkmals vs. Niveau der Variablen• Beispiel 1: Zeit bis zum Anfassen der Spinne

– Peter: 10 Sekunden; Martin: 20 Sekunden– Also: „Martin hat doppelt so lange gezögert wie Peter.“ (Zeit ist verhältnis-

skaliert)– Also: „Martin ist doppelt so ängstlich wie Peter“– Das ergibt keinen Sinn– Ängstlichkeit kann vermutlich nicht auf Verhältnisskalenniveau gemessen

werden.

• Für (latente) psychologische Konstrukte wird in aller Regel nur Intervallskalenniveau angenommen.

02_grundbegriffe_kennwerte 25

Page 26: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Niveau eines Merkmals vs. Niveau der Variablen• Beispiel 2: Reaktionszeit

– Viele psychologische Studien beruhen auf Reaktionszeiten– Die Zeit ist verhältnisskaliert– Aber: Unterschiede zwischen 500 ms und 600 ms sind „psychologisch

bedeutsamer“ als Unterschiede zwischen 1500 ms und 1600 ms– Daher werden Reaktionszeiten vor der Auswertung manchmal

logarithmiert– Nun gilt:

• ln(600) - ln(500) = 6.40 – 6.22 = 0.18• ln(1600) - ln(1500) = 7.38 – 7.31 = 0.07

– Eine Logarithmierung ist eigentlich nur für ordinalskalierte Variablen zulässig.

– Dennoch wird angenommen, dass die logarithmierten Zeiten besser das intervallskalierte Konstrukt (z.B. Aufmerksamkeit) abbilden.

02_grundbegriffe_kennwerte 26

Page 27: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Skalenniveaus

Das Skalenniveau von Fragebogen• Oft ist das Skalenniveau umstritten:

– z.B. Schulnoten (ordinal oder intervall?)– z.B. „Ratings“ (ordinal oder intervall?)

• Für einzelne Fragebogenitems kann man nur von einem Ordinalskalennieveau ausgehen

• Bei einer Aggregation von vielen „Items“ (Summenbildung) wird meist von einem Intervallskalenniveau ausgegangen.

• Für psychologische Untersuchungen ist das Intervallskalenniveau von besonderer Bedeutung, da viele statistische Verfahren nur bei intervallskalierten Daten eingesetzt werden können.

02_grundbegriffe_kennwerte 27

Page 28: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Unterschiedliche Fragebogenformate

02_grundbegriffe_kennwerte 28

Trifft zu

Trifft nicht zu

Bei allem sehe ich stets die positive Seite. 1 0

Ich blicke immer mit Zuversicht in die Zukunft 1 0

Auch in unsicheren Zeiten rechne ich im allgemeinen damit, dass sich alles zum Besten wendet.

1 0

Alles in allem erwarte ich, dass mir mehr gute als schlechte Dinge widerfahren.

1 0

Zweistufige Antworten

Page 29: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Unterschiedliche Fragebogenformate

02_grundbegriffe_kennwerte 29

Trifft

gar

nicht zu

Trifft

eher

nicht zu

Unbestimmt

Trifft

eher zu

Trifft

voll und

ganz zu

Bei allem sehe ich stets die positive Seite. -2 -1 0 1 2

Ich blicke immer mit Zuversicht in die Zukunft -2 -1 0 1 2

Auch in unsicheren Zeiten rechne ich im allgemeinen damit, dass sich alles zum Besten wendet.

-2 -1 0 1 2

Alles in allem erwarte ich, dass mir mehr gute als schlechte Dinge widerfahren.

-2 -1 0 1 2

Mehrstufige Ratingskalen

Page 30: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Unterschiedliche Fragebogenformate

02_grundbegriffe_kennwerte 30

Zufrieden 2 1 0 1 2 Ärgerlich

Gut 2 1 0 1 2 Schlecht

Ausgeruht 2 1 0 1 2 Schlapp

Gelassen 2 1 0 1 2 Angespannt

Ruhig 2 1 0 1 2 Unruhig

Bipolare Ratingskalen

Page 31: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Zusammenfassung Grundbegriffe

02_grundbegriffe_kennwerte 31

• Die deskriptive Statistik dient der Beschreibung einer Stichprobe.• Grundlage jeder Statistik ist ein Datensatz. Dieser entsteht durch

die Messung von Merkmalen der Mitglieder dieser Stichprobe.• Dabei spielt die Operationalisierung der Merkmale eine

entscheidende Rolle.• Die Daten können auf unterschiedlichen Skalenniveaus vorliegen:

– Noninalskala, Ordinalskala, Intervallskala, Verhältnisskala

• Grundsätzlich sollte versucht werden, bei einer Messung ein möglichst hohes Skalenniveau zu erreichen.

• Bei der Erfassung vieler psychologischer Merkmale kann ein Intervallskalenniveau erreicht werden.

Page 32: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Datensätze in SPSS

02_grundbegriffe_kennwerte 32

Page 33: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Datensätze in SPSS

02_grundbegriffe_kennwerte 33

Page 34: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Datensätze in SPSS

Erstellen eines neuen Datensatzes• Definieren der Variablen (Variablenansicht)

– Name (kurzer Bezeichner)– Typ (meist: Numerisch = Zahl oder String = Text)– evtl.: Variablenlable und Wertelable– wichtig: Wert für missings (fehlende Werte) definieren!– Messniveau (Skalenniveau): Nominal, ordinal, oder Metrisch

• Eingabe der Daten (Datenansicht)– Jede Zeile ist ein Fall (eine Versuchsperson)– Bei fehlenden Angaben immer den Wert für missings eintragen!

02_grundbegriffe_kennwerte 34

Page 35: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Statistische Kennwerte

02_grundbegriffe_kennwerte 35

• Daten können auf viele unterschiedliche Arten dargestellt werden.

• Es gehört zu den Kompetenzen eines Statistikers zu entscheiden, welche Art der Darstellung geeignet ist.

• Sinnvoll ist immer eine Zusammenfassung des ursprünglichen Datensatzes.

• Gleichzeitig soll aber auch möglichst viel Information über das erhobene Merkmal erhalten bleiben.

• Dies erfolgt z.B. durch die Darstellung von– Häufigkeiten– Maßen der Zentrale Tendenz– Maßen der Dispersion

Page 36: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Häufigkeiten

• Eine Urliste enthält alle Werte einer Stichprobe• Beispiel Geschlecht: (w, w, w, m, m, w, w, w, w, m, w, m, …)• Zur Darstellung der Geschlechterverteilung fasst man diese

Urliste zusammen:

• Berechnung der Prozente:

02_grundbegriffe_kennwerte 36

Geschlecht Anzahl Prozent

w 7521.4%

m 21 76.5 %

gesamt 96100.0 %

100Prozent GesamtAnz

KategorieAnz

Page 37: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Häufigkeiten in SPSS

Befehle in SPSS• Grundsätzlich gibt es zwei Möglichkeiten, Befehle aufzurufen

(1) Das Menu• Vorteil: Einfache Bedienung, wenn man sich nicht gut auskennt• Nachteil: Wenn man das Ergebnis nochmal braucht, muss man alles von neuem

anklicken.(2) Das Syntaxfenster

• Öffnen mit Datei > Neu > Syntax• Dann können Befehle direkt eingetippt werden.• Vorteil: Man kann die Syntax speichern, und alle Berechnungen später erneut

ausführen• Nachteil: Man muss die Befehle kennen• Sie müssen den Syntax nicht für die Klausur lernen.• ABER: Ich empfehle jedem regelmäßigem SPSS Nutzer, sich mit der SPSS Syntax

vertraut zu machen.

02_grundbegriffe_kennwerte 37

Page 38: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Häufigkeiten in SPSS

Häufigkeiten über das Menu berechnen• Analysieren > Deskriptive Statistik > Häufigkeiten

02_grundbegriffe_kennwerte 38

Page 39: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Häufigkeiten in SPSS

Häufigkeiten über das Menu berechnen• Die interessierenden Variablen aus der Liste (links) in das

Auswahlfeld (rechts) schieben

• … und OK anklicken

02_grundbegriffe_kennwerte 39

Page 40: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Häufigkeiten in SPSS

Häufigkeiten über den Syntax berechnen• Ein Syntaxfester öffnen• Den Befehl eingeben:

– frequency sex.– fre sex.

• Den Befehl ausführen:– Strg. R („run“)– oder den blauen Pfeil

anklicken

02_grundbegriffe_kennwerte 40

Page 41: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Häufigkeiten in SPSS

Häufigkeiten – SPSS Ausgabe

02_grundbegriffe_kennwerte 41

Page 42: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Häufigkeiten in SPSS

Häufigkeiten – SPSS Ausgabe

02_grundbegriffe_kennwerte 42

Page 43: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Häufigkeiten in SPSS

Häufigkeiten – SPSS Ausgabe

02_grundbegriffe_kennwerte 43

Bundesland

Häufigkeit ProzentGültige

ProzenteKumulierte Prozente

Gültig Baden-Württemberg 53 54,1 56,4 56,4Bayern 7 7,1 7,4 63,8Hessen 8 8,2 8,5 72,3Saarland 2 2,0 2,1 74,5Nordrhein-Westfalen 7 7,1 7,4 81,9Rheinland-Pfalz 3 3,1 3,2 85,1Niedersachsen 3 3,1 3,2 88,3Berlin 2 2,0 2,1 90,4Thüringen 2 2,0 2,1 92,6Mecklenburg-Vorpommern 2 2,0 2,1 94,7Bremen 1 1,0 1,1 95,7außerhalb Deutschlands 4 4,1 4,3 100,0Gesamt 94 95,9 100,0

Fehlend -1 4 4,1Gesamt 98 100,0

Page 44: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Kategorisierung

• Oft hat ein Merkmal zu viele Ausprägungen, um für jede einzelne die Häufigkeit anzugeben.

• In diesem Fall kann es sinnvoll sein, Kategorien zu bilden.• Regeln für die Bildung von Kategorien:

– Kategorien sind disjunkt (keine Überlappung)– Kategorien sind direkt benachbart (keine Lücken)– An den Rändern sind „offene“ Kategorien erlaubt– Alle geschlossenen Kategorien sind gleich breit– Je größer eine Stichprobe, desto mehr und desto schmalere Kategorien

werden gebildet, in der Regel nicht mehr als 20.– Faustregel für die Anzahl der Kategorien (Leonhard, 2004):

• Bei N Probanden: m = 1 + 3.32 · log (N)• Bei 20 Probanden: m = 1 + 3.32 · log (20) = 1 + 3.32 · 1.3 ≈ 4• Bei 100 Probanden: m = 1 + 3.32 · log (100) = 1 + 3.32 · 2.0 ≈ 8• Bei 1000 Probanden: m = 1 + 3.32 · log (100) = 1 + 3.32 · 3.0 ≈ 10

02_grundbegriffe_kennwerte 44

Page 45: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Kategorisierung

02_grundbegriffe_kennwerte 45

Kenntnisse in der Statistik

Häufigkeit ProzentGültige

ProzenteKumulierte Prozente

Gültig 0 8 8,2 8,2 8,20.1 1 1,0 1,0 9,22 2 2,0 2,0 11,25 7 7,1 7,1 18,410 17 17,3 17,3 35,715 6 6,1 6,1 41,820 12 12,2 12,2 54,123 1 1,0 1,0 55,125 2 2,0 2,0 57,130 12 12,2 12,2 69,435 1 1,0 1,0 70,436 1 1,0 1,0 71,440 10 10,2 10,2 81,650 10 10,2 10,2 91,855 1 1,0 1,0 92,960 1 1,0 1,0 93,962 1 1,0 1,0 94,965 1 1,0 1,0 95,970 2 2,0 2,0 98,080 2 2,0 2,0 100,0Gesamt 98 100,0 100,0

Page 46: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Kategorisierung

Kategorie Prozent Kumuliert

0 ≤ x < 10 18.40% 18.40%

10 ≤ x < 20 23.40% 41.80%

20 ≤ x < 30 15.30% 57.10%

30 ≤ x < 40 14.30% 71.40%

40 ≤ x < 50 10.20% 81.60%

50 ≤ x < 60 11.30% 92.90%

60 ≤ x 7.10% 100.00%

02_grundbegriffe_kennwerte 46

Selbsteinschätzung der Statistikkenntnisse (Kategorisiert)

Page 47: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Maße der Zentralen Tendenz

02_grundbegriffe_kennwerte 47

• Maße der zentralen Tendenz geben an, wie ein Merkmal bei den meisten Mitgliedern einer Stichprobe bzw. in dieser Stichprobe im Durchschnitt ausgeprägt ist.

• Es gibt dafür unterschiedliche Maße der zentralen Tendenz– Modalwert (für alle Skalentypen)– Median (für mindestens ordinalskalierte Daten)– Mittelwert (für mindestens intervallskalierte Daten).

Page 48: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Modalwert

02_grundbegriffe_kennwerte 48

• Der Modalwert (Modus, Mo) ist derjenige Wert aus einer Verteilung, welcher am häufigsten besetzt ist.

• Es kann auch mehrere Modalwerte geben.– SPSS gibt dann nur den kleinsten Wert aus.

• Bei kategorisierten Daten wird die Mitte der am häufigsten besetzten Kategorie angegeben.

• Die Angabe des Modalwertes ist besonders bei nominalskalierten Daten sinnvoll.

Page 49: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Modalwert

02_grundbegriffe_kennwerte 49

Kategorie Prozent

0 ≤ x < 10 18.40%10 ≤ x < 20 23.40%20 ≤ x < 30 15.30%30 ≤ x < 40 14.30%40 ≤ x < 50 10.20%50 ≤ x < 60 11.30%60 ≤ x 7.10%

Beispiele: Wert Häufigkeit0 8

0.1 12 25 7

10 1715 620 1223 125 230 1235 136 140 1050 1055 160 162 165 170 280 2

Page 50: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Modalwert in SPSS

02_grundbegriffe_kennwerte 50

Den Modalwert über das Menu berechnen• Analysieren > Deskriptive Statistiken > Häufigkeiten…• Auswahl „Statistiken …“• Auswahl „Modalwert“

Page 51: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Modalwert in SPSS

02_grundbegriffe_kennwerte 51

Den Modalwert über den Syntax berechnen

• Ergänzende Unterbefehle in der Syntax werden immer mit einem „/“ eingeleitet.

• Ganz am Ende des Kommandos steht ein Punkt.• „/format notable“ unterdrückt die normale Häufigkeitstabelle• „/statistics modus” gibt den Modalwert aus.

frequencies age /format notable /statistics modus.

Page 52: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Modalwert in SPSS

02_grundbegriffe_kennwerte 52

Modalwert – SPSS Ausgabe

Page 53: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Median

02_grundbegriffe_kennwerte 53

Der Median• Der Median (Md) ist derjenige Wert, der die geordnete Reihe der

Messwerte in die oberen und die unteren 50 Prozent aufteilt. Somit ist die Anzahl der Messwerte über und unter dem Median gleich.

• Man benötigt ordinalskalierte Daten, um eine „geordnete Reihe“ bilden zu können.

Page 54: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Median

02_grundbegriffe_kennwerte 54

Der Median – Berechnung• Für ungerade N nimmt man den Wert in der Mitte der

geordneten Liste:– Liste: 20, 21, 23, 27, 35– Md = 23– Allgemein:

• Für gerade N nimmt man den Mittelwert der beiden in der Mitte stehenden Werte:– Liste: 20, 21, 23, 27, 35, 36– Md = (23+27) / 2 = 25

– Allgemein:

2

1 NxMd

2

122

NN xx

Md

Page 55: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Median

02_grundbegriffe_kennwerte 55

Beispiel:

Page 56: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Median in SPSS

02_grundbegriffe_kennwerte 56

Den Median über das Menu berechnen• Analysieren > Deskriptive Statistiken > Häufigkeiten• Auswahl „Statistiken …“• Auswahl „Median“

Page 57: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Median in SPSS

02_grundbegriffe_kennwerte 57

Den Median über den Syntax berechnen

• Ergänzende Unterbefehle in der Syntax werden immer mit einem „/“ eingeleitet.

• Ganz am Ende des Kommandos steht ein Punkt.• „/format notable“ unterdrückt die normale Häufigkeitstabelle• „/statistics median” gibt den Median aus.• Man kann auch Kennwerte kombinieren:

– “/statistics median, modus.”

frequencies age /format notable /statistics median.

Page 58: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Median in SPSS

02_grundbegriffe_kennwerte 58

Median – SPSS Ausgabe

Page 59: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Median

Der Median bei kategorisierten Daten• Bei kategorisierten Daten wird berücksichtigt, wie viel Prozent

der Stichprobe oberhalb und unterhalb der Kategorie mit dem Median liegen.

• Berechnung:

– uG: Untere Grenze der Kategorie, in der der Median liegt.– KB Breite der Kategorie– fk Häufigkeit in der Kategorie k, in der der Median liegt– cum fk-1: kumulierte Häufigkeit der Kategorie k-1, d.h. die Summe

derHäufigkeiten aller Kategorien unter dem Median.

02_grundbegriffe_kennwerte 59

KBf

fcumNuGMd

k

k

15.0

Page 60: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Der Median

Berechnung

02_grundbegriffe_kennwerte 60

KBf

fcumNuGMd

k

k

15.0

Kategorie f cumf

0 ≤ x < 10 18 18

10 ≤ x < 20 24 42

20 ≤ x < 30 15 57

30 ≤ x < 40 14 71

40 ≤ x < 50 11 82

50 ≤ x < 60 11 93

60 ≤ x 7 100

7.24

7.420

1047.020

1015

42985.020

Md

Page 61: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Das arithmetische Mittel

02_grundbegriffe_kennwerte 61

Das arithmetische Mittel• Der arithmetische Mittel (Mittelwert, „Durchschnitt“, ) ist das

häufigste Maß der zentralen Tendenz.• Das arithmetische Mittel darf nur für intervallskalierte Daten

berechnet werden.

x

Page 62: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Das arithmetische Mittel

02_grundbegriffe_kennwerte 62

Das arithmetische Mittel – Berechnung• Das arithmetische Mittel ist die Summe aller Messwerte geteilt

durch deren Anzahl N.

N

xx

N

i i 1 Zum Rechnen mit dem Summenzeichen siehe auch Leonhart (2004, S. 421f)

Page 63: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Das arithmetische Mittel

02_grundbegriffe_kennwerte 63

Beispiel:Vp lot

1 16

2 23

3 12

4 19

5 25

195

95x

Page 64: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Das arithmetische Mittel in SPSS

02_grundbegriffe_kennwerte 64

Das arithmetische Mittel über das Menu berechnen• Analysieren > Deskriptive Statistiken > Deskriptive Statistik… • Variable auswählen• OK

Page 65: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Das arithmetische Mittel in SPSS

02_grundbegriffe_kennwerte 65

Das arithmetische Mittel über den Syntax berechnen

oder

oder

oder

descriptives lot.

descriptives lot /statistic mean.

descriptives age, lot, stat_k /statistic mean.

frequency age, lot, stat_k /format notable /statistic mean.

Page 66: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Das arithmetische Mittel in SPSS

02_grundbegriffe_kennwerte 66

Das arithmetische Mittel– SPSS Ausgabe

descriptives age, stat_k, lot /statistic mean.

frequency age, stat_k, lot /format notable /statistic mean.

Page 67: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Vergleich der Maße der Zentralen Tendenz

02_grundbegriffe_kennwerte 67

frequencies age, freiburg /format notable /statistics modus median mean.

• Alter: Mittelwert > Median > Modus• Einstellung zu Freiburg: Modus > Median > Mittelwert• Warum?

Page 68: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Vergleich der Maße der Zentralen Tendenz

02_grundbegriffe_kennwerte 68

Page 69: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Vergleich der Maße der Zentralen Tendenz

02_grundbegriffe_kennwerte 69

Symmetrische Verteilung

Modus Median AM

Modus Median AM

Rechtssteile Verteilung Linkssteile Verteilung

Modus Median AM

Page 70: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Das gewichtete arithmetische Mittel (GAM)

02_grundbegriffe_kennwerte 70

Das gewichtete arithmetische Mittel (GAM)• Problem: Wie berechnet man das arithmetische Mittel, wenn

man nur Mittelwerte aus verschiedenen Gruppen kennt?• Beispiel: Die Studienmotivation von Psychologiestudierenden des

1.Semesters soll bestimmt werden. Ein Fragebogen wird in den drei Tutorien vorgegeben. Die Tutorinnen melden folgende Ergebnisse zurück:– Gruppe 1: M = 12– Gruppe 2: M = 10– Gruppe 3: M = 8

• Wichtig: Die Gruppengrößen müssen beachtet werden!

Page 71: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Das gewichtete arithmetische Mittel (GAM)

02_grundbegriffe_kennwerte 71

Berechnung:

Gruppe 1: M=12; N=50Gruppe 2: M=10; N=20;Gruppe 3: M=8; N=10;

k

i i

k

i ii

n

xnGAM

1

1

1180

88080

80200600102050

81010201250321

332211

nnn

xnxnxnGAM

Page 72: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Zusammenfassung: Maße der zentralen Tendenz

02_grundbegriffe_kennwerte 72

• Eine einfache Form der Zusammenfassung ist die Darstellung der Häufigkeiten oder Prozente.

• Der Modalwert ist der Wert einer Verteilung, der am häufigsten vorkommt.

• Der Median ist der Wert, der eine Stichprobe in die oberen 50% und unteren 50% aufteilt.

• Der Mittelwert ist die Summe aller Werte geteilt durch die Anzahl der Werte.

• Die Maße der zentralen Tendenz lassen auch Rückschlüsse auf die Verteilungsform zu.

• Sollen Mittelwerte aus Mittelwerten berechnet werden, müssen die Gruppengrößen berücksichtigt werden (GAM).

Page 73: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Maße der Dispersion

• Die Maße der zentralen Tendenz geben Auskunft über die „Mitte“ einer Verteilung.

• Maße der Dispersion beziehen sie dagegen auf die „Variabilität“ einer Verteilung, d.h. darauf, wie sehr sich die Werte unterscheiden.

• Beispiel: Schulnoten in zwei Klassen– Gruppe 1: 3, 3, 3, 3, 3, 3, 3– Gruppe 2: 1, 2, 3, 3, 3, 4, 5– Modalwert (=3), Median (=3) und Mittelwert (=3) unterscheiden nicht

zwischen beiden Gruppen!– Dennoch gibt es natürlich Unterschiede zwischen den Verteilungen.

02_grundbegriffe_kennwerte 73

Page 74: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Maße der Dispersion

Maße der Dispersion:• Spannweite• Interquartilabstand• Varianz• Standardabweichung• Schiefe, Exzess

02_grundbegriffe_kennwerte 74

Page 75: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Spannweite (Range)

• Die Spannweite wird auch als Variationsbreite oder Range bezeichnet.

• Unterschiedliche Definitionen für kontinuierliche und diskrete Variablen:– Für kontinuierliche Variablen:

Range = maximaler Wert – minimaler Wert.– Für diskrete Variablen:

Range = maximaler Wert – minimaler Wert +1(bzw.: Range = Anzahl der Kategorien)

• Bewertung– Eher geringe Aussagekraft über die Verteilung, da nur 2 Werte

berücksichtigt werden (der Kleinste und der Größte)– Hohe Empfindlichkeit gegenüber Ausreißerwerten.

02_grundbegriffe_kennwerte 75

Page 76: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Spannweite (Range)

Beispiel: Wie groß ist der „Range“?

02_grundbegriffe_kennwerte 76

Minimum Maximum Range

Geschlecht 1 2 2

Alter 18 49 31

Bundesland 1 11 11

Kenntnisse „Freiburg“ 5 90 85

Page 77: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Spannweite (Range)

• In SPSS kann der Range über den Befehl „Häufigkeiten“ ausgegeben werden.– Anwählen: Statistiken > Spannweite

• Syntax:

• Achtung: SPSS verwendet immer die Formel für kontinuierliche Variablen!

02_grundbegriffe_kennwerte 77

frequency age, stat_k, lot /format notable /statistic range.

Page 78: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Interquartilabstand

• Als Quartilgrenzen werden die drei Punkte einer Verteilung bezeichnet, welche die geordnete Liste von Werten in vier Bereiche mit jeweils 25% der Stichprobe einteilen.– 25% (1. QG) 25% (2. QG) 25% (3. QG) 25%

• Die 2. Quartilgrenze entspricht damit dem Median• Beispiel: In einem Assessment-Center erhalten die 12 Teilnehmer

folgende Gesamtbeurteilungen (Max. 50 Punkte möglich):– 24, 28, 30, 31, 34, 35, 36, 37, 37, 41, 42, 43

02_grundbegriffe_kennwerte 78

Q1=30.5 Q2=35.5 Q3=39

Page 79: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Interquartilabstand

• Der Abstand zwischen dem 1. und dem 3. Quartil wird als „Interquartilabstand“ bezeichnet.

• Es ist ein Maß für den „Kernbereich“ einer Verteilung.

• Im Interquartilbereich liegen 50% der Stichprobe.

• Berechnung: IQA = Q3 – Q1– IQA = 39 – 30.5 = 8.5

• Vorteil: Der IQA ist weniger anfällig gegenüber Ausreißern als die Spannweite.

• Voraussetzung für die Bildung von Quartilen ist ein Ordinal-skalenniveau.

02_grundbegriffe_kennwerte 79

Page 80: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Interquartilabstand

• In SPSS kann man sich die Quartilgrenzen mit dem Befehl „Häufigkeiten“ ausgeben lassen:

• Im Menu „Analysieren > Deskriptive Statistiken > Häufigkeiten“ aufrufen.

• Dann unter Statistiken „Quartile“ auswählen.

02_grundbegriffe_kennwerte 80

Page 81: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

• In der Syntax:

• Perzentile sind „hundertstel“ der Verteilung• 25 Hundertstel entsprechen 1 Viertel

– 1. Qurtil = Perzentil 25 – 2. Quartil = Perzentil 50– 3. Quartil = Perzentil 75

Interquartilabstand

02_grundbegriffe_kennwerte 81

frequency age, stat_k, lot /format notable /percentiles 25, 50, 75.

Page 82: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

• SPSS Ausgabe:

• IQA = 26.5 – 20.0 = 6.5

Interquartilabstand

02_grundbegriffe_kennwerte 82

Page 83: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Zentrale Momente

• Als zentrales Moment wird der Abstand der Messwerte vom Mittelwert bezeichnet.

• Dabei unterscheidet man verschiedene „Ordnungen“:

– Zentrales Moment 1. Ordnung:

– Zentrales Moment 2. Ordnung: „Varianz“

– Zentrales Moment 3. Ordnung: „Schiefe“

– Zentrales Moment 4. Ordnung: „Exzess“

02_grundbegriffe_kennwerte 83

)( xxi 2)( xxi 3)( xxi 4)( xxi

Page 84: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Varianz

• Das wichtigste Maß für die Dispersion ist die Varianz.• Bei der Berechnung der Varianz wird jeder einzelne Wert

berücksichtigt.• Die Varianz gibt an, wie weit jede individuelle Merkmals-

ausprägung vom Mittelwert der Verteilung entfernt ist.• Dabei wird die Summe des zentralen Moments 2. Ordnung über

alle Probanden einer Stichprobe durch die Anzahl der Probanden dividiert:

• Voraussetzung für die Berechnung der Varianz ist Intervallskalenniveau.

02_grundbegriffe_kennwerte 84

N

xxs

N

i ix

1

2

2

Page 85: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Varianz

Beispiel: Berechnung der Varianz für folgende Variable:

02_grundbegriffe_kennwerte 85

Vp x x-M (x-M)²

1 4 1 1

2 2 -1 1

3 2 -1 1

4 2 -1 1

5 5 2 4

1. Berechnen Sie den Mittelwert

2. Bilden Sie für jede Merkmalsausprägung die Differenz zum Mittelwert

3. Quadrieren Sie die Differenzen

4. Bilden Sie die Summe

5. Teilen Sie die Summe durch N

6.15

82 xs

Page 86: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Varianz

Varianz in der Stichprobe und in der Population• Die Formel für die Varianz, die wir bisher kennengelernt haben,

gilt für die Berechnung der Varianz in einer Stichprobe.• In aller Regel will man etwas über die Varianz eines Merkmals in

der gesamten Population erfahren.• Die Varianz ist aber kein „erwartungstreuer Schätzer“, d.h. wenn

man viele Stichproben untersucht, dann entspricht der Mittelwert der Varianzen dieser Stichproben nicht der Varianz der gesamten Population.

• Die Stichprobenvarianz unterschätzt die Populationsvarianz.• Diese Abweichung ist umso stärker, je kleiner die Stichprobe ist.

02_grundbegriffe_kennwerte 86

Page 87: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Varianz

Varianz in der Population• Die Formel für die Populationsvarianz korrigiert die

Unterschätzung der Varianz in der Stichprobe:

• Unterschiede zu der Formel für s²:– Wir verwenden nun ein griechisches Sigma (statt s), um zu verdeutlichen,

dass wir uns auf die Population beziehen.– Das ^ wird verwendet, um zu zeigen, dass die Populationsvarianz nur

geschätzt werden kann.– Im Nenner steht N-1 (statt N). Dadurch wird das Ergebnis der Formel

etwas größer.

02_grundbegriffe_kennwerte 87

1

)(ˆ 1

22

N

xxN

i ix

Page 88: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Varianz

Zurück zum Beispiel:• Stichprobenvarianz:

• Populationsschätzer:

02_grundbegriffe_kennwerte 88

0.2

4

8

1ˆ 1

2

2

N

xxN

i ix

6.1

5

81

2

2

N

xxs

N

i ix

Page 89: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Standardabweichung

• Die Varianz ist durch die Bildung der Quadrate schwer zu interpretieren.

• Daher wird aus ihr oft die Standardabweichung berechnet, indem wieder die Quadratwurzel aus der Varianz gezogen wird.

• Voraussetzung für die Berechnung der Standardabweichung ist wiederum Intervallskalenniveau.

02_grundbegriffe_kennwerte 89

Page 90: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Standardabweichung

• In der Stichprobe:

• Populationsschätzer:

02_grundbegriffe_kennwerte 90

1

ˆˆ 1

2

2

N

xxN

i ixx

N

xxss

N

i ixx

1

2

2

Page 91: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Schiefe

• Zusätzliche Information über die Form einer Verteilung liefert die Schiefe.

• Man unterscheidet

02_grundbegriffe_kennwerte 91

Linkssteile VerteilungRechtssteile Verteilung

Page 92: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Schiefe

• Die Schiefe wird aus dem zentralen Moment 3. Ordnung berechnet:

• Es gilt dabei:– a3<0 rechtssteile Verteilung– a3=0 symmetrische Verteilung– a3>0 linkssteile Verteilung

02_grundbegriffe_kennwerte 92

3

1

3

3x

N

i i

sN

xxa

Page 93: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Exzess (Kurtosis)

• Weitere Information über die Form einer Verteilung liefert der Exzess (Kurtosis).

• Man unterscheidet

02_grundbegriffe_kennwerte 93

Breitgipflige Verteilung Schmalgipflige Verteilung

Page 94: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Exzess (Kurtosis)

• Der Exzess wird aus dem zentralen Moment 4. Ordnung berechnet:

• Es gilt dabei:– a4<0 breitgipflige Verteilung– a4=0 „Normalverteilung“– a4>0 schmalgipflige Verteilung

02_grundbegriffe_kennwerte 94

3

41

4

4

x

N

i i

sN

xxa

Page 95: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Kennwerte in SPSS

• Varianz, Standardabweichung, Schiefe und Exzess können in SPSS über die Befehle „Häufigkeiten“ oder „Deskriptive Statistiken“ berechnet werden.

• Syntax für den Befehl Häufigkeiten:

02_grundbegriffe_kennwerte 95

frequencies freiburg psycho stat /format notable /statistic mean variance stddev skewness kurtosis.

frequencies freiburg_k psycho_k stat_k /format notable /statistic mean variance stddev skewness kurtosis.

Page 96: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Kennwerte in SPSS

SPSS Ausgabe:

02_grundbegriffe_kennwerte 96

Page 97: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Kennwerte und Skalenniveaus

02_grundbegriffe_kennwerte 97

Maß Skalenniveau mindestens:

Häufigkeit / Prozente Nominal

Modalwert Nominal

Median Ordinal

Quartile Ordinal

Arithmetisches Mittel Intervall

Varianz Intervall

Standardabweichung Intervall

Schiefe Intervall

Exzess Intervall

Page 98: Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Zusammenfassung Dispersionsmaße

02_grundbegriffe_kennwerte 98

• Wichtige Maße der Dispersion sind der Range, der Interquartilabstand, die Varianz und die Standardabweichung.

• Bei Varianz und Standardabweichung muss beachtet werden, ob ein Maß für die Stichprobe oder für eine Population berechnet wird.

• Weiteren Aufschluss über die exakte Verteilungsform liefern die Schiefe und der Exzess.

• Bei der Berechnung statistischer Kennwerte muss beachtet werden, ob das entsprechende Skalenniveau gegeben ist.