statistik 1 einheit 01 - ppcms.univie.ac.atppcms.univie.ac.at/uploads/media/01_Statistik1.pdf ·...

54
Vorlesungsunterlagen zur Übung „Psychologische Methodenlehre und Statistik 1“ Einheit 1

Transcript of statistik 1 einheit 01 - ppcms.univie.ac.atppcms.univie.ac.at/uploads/media/01_Statistik1.pdf ·...

Vorlesungsunterlagenzur Übung

„Psychologische Methodenlehre und Statistik 1“

Einheit 1

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Informationen, Unterlagen und KontaktPrufungSkriptum und LiteraturZusatzliche Materialien

◮ Erganzendes Skriptum: Fischer, Statistische Auswertung

psychologischer Experimente I

Sekretariat Methodenlehre, Liebiggasse 5, 3. Stock, rechteStiege, Zi 03.48, Offnungszeiten: Di,Mi 10-12; Do 16-18;(Bitte Bargeld mitbringen!)

◮ Zusatzliche Literatur:Burkschat, Cramer & Kamps (2004). Beschreibende Statistik.Grundlegende Methoden. Berlin: Springer-Verlag.Sedlmeier, P. & Renkewitz, F. (2008). Forschungsmethoden

und Statistik in der Psychologie. Pearson Studium.Buhner, M. & Ziegler, M. (2009). Statistik fur Psychologen

und Sozialwissenschaftler. Munchen: Pearson Studium.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 4/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Informationen, Unterlagen und KontaktPrufungSkriptum und LiteraturZusatzliche Materialien

◮ SPSS: erhaltlich im Rechenzentrum der Universitat Wien,www.univie.ac.at/zid/software-shop

◮ www.neuestatistik.de

◮ www.mathe-online.at

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 5/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

◮ Psychologie = empirische Wissenschaft(auf Erfahrung beruhend):

◮ Bortz & Doring (2002): Empirische Forschung sucht nach

Erkenntnissen durch systematische Auswertung von

Erfahrungen.

◮ Psychologische Methodenlehre beschaftigt sich mit Fragen derPlanung und Auswertung empirischer Untersuchungen

◮ Gute Untersuchungsplanung entscheidend furAussagekraft der Ergebnisse einer empirischenUntersuchung!

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 6/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Warum benotigt eine Klinische Psychologin und

Gesundheitspsychologin in freier Praxis, die nicht selbst empirische

Untersuchungen durchfuhren mochte, Kenntnisse der

Psychologischen Methodenlehre und Statistik?

◮ Psychologisches Gutachten:Zur Auswahl geeigneter psychologischer Testverfahren und derInterpretation der Ergebnisse (Umgang mit Normtabellen)Kenntnisse der Statistik notwendig.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 7/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

◮ Behandlung:Ethischer Grundsatz: Anwendung evidenzbasierter

Behandlungsmethoden (Behandlungsmethoden, derenEffektivitat z.B. in ”randomized controlled trials” (RCT’s =randomisierte kontrollierte Studien) gezeigt werden konnte) ⇒Notwendigkeit Untersuchungsdesign, statistische Auswertungund Interpretation von entsprechenden Studiennachzuvollziehen und kritisch zu bewerten

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 8/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Gutekriterien einer empirischen Untersuchung◮ Objektivitat: Ergebnisse unabhangig vom jeweiligen

Untersucher.

◮ Validitat = Gultigkeit, Aussagekraft:

1. Interne Validitat = Interpretationseindeutigkeit (keinealternativen Erklarungen moglich)

2. Externe (okologische) Validitat = Verallgemeinerbarkeit(Ergebnisse auf andere Personen, Situationen und/oderZeitpunkte verallgemeinerbar)

◮ Reliabilitat = Zuverlassigkeit, Genauigkeit.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 9/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Deskriptivstatistik und Inferenzstatistik

◮ Deskriptivstatistik oder Beschreibende Statistik:zusammenfassende Beschreibung der Daten, explorativeDatenanalyse (Suchen von Strukturen und Zusammenhangen)

◮ Inferenzstatistik oder Schließende Statistik:Vollstandige Befragung der interessierenden Grundgesamtheitmeist nicht moglich ⇒ mit Hilfe der Inferenzstatistik werdenaufgrund von Beobachtungen in einer Teilmenge von PersonenRuckschlusse auf Gegebenheiten in der interessierendenGrundgesamtheit gezogen.Ruckschlusse sind mit gewisser Fehlerwahrscheinlichkeitbehaftet = Wahrscheinlichkeitsaussagen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 10/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Population und Stichprobe (1)aus Grundgesamtheit aller interessierenden Personen = Populationwird eine Teilmenge von Personen ausgewahlt = Stichprobe undaufgrund der Beobachtungen in dieser Stichprobe auf dieGrundgesamtheit geschlossen.

(Quelle: www.neuestatistik.de)

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 11/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Population und Stichprobe (2)

◮ Beispiel aus dem Alltag: Wenn Sie Spaghetti kochen, werdenSie vielleicht zunachst einige davon aus dem Wasser nehmenum zu uberprufen, ob sie bereits ”al dente” sind. Trifft diesfur diese Stichprobe zu, werden Sie daraus schließen, dass dasmit hoher Wahrscheinlichkeit auch fur die Grundgesamtheitaller von Ihnen ins Wasser gelegten Spaghetti zutrifft.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 12/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Population und Stichprobe (3)

◮ Beispiel: Epidemiologische Studie: Ist Pravalenzrate vonZwangsstorungen in letzten 10 Jahren gestiegen? U.a.Erheben der Anzahl an Personen in Osterreich, die zu einembestimmten Stichtag bei einer Klinischen PsychologIn in freierPraxis wegen Zwangsstorung in Behandlung waren → ausvollstandiger Liste der beim BM fur Gesundheit, Familie undJugend eingetragenen Klinischen PsychologInnen in freierPraxis zufallig 100 ausgewahlt und befragt, wie vielePatientInnen mit Zwangsstorung am Stichtag in Behandlungwaren → aufgrund dieser Anzahl Schluss auf Gesamtheit allerin die Liste eingetragenen Klinischen PsychologInnen

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 13/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Population und Stichprobe (4)

◮ Verallgemeinerung auf Population ist nur mitinferenzstatistischen Verfahren zulassig, Deskriptivstatistikmacht nur Aussagen uber die erhobene Stichprobe.

◮ Inferenzschluss nur bei Zufallsauswahl gultig.

◮ Population muss eindeutig definiert sein.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 14/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Merkmale und Variablen (1)

◮ Psychologie interessiert sich fur Variation von Eigenschaftenin der Population bzw. fur gemeinsame Variation mehrererMerkmale (die Veranderung eines Merkmales in Abhangigkeitvon einem anderen).

◮ In Experimenten wird Veranderung eines Mermales durchaktive Manipulation eines anderen Merkmales untersucht

◮ Beispiel: In einem verkehrspsychologischen Experiment wirduntersucht wie sich die Konzentrationsfahigkeit und dieReaktionsgeschwindigkeit von Personen unter verschiedenstarkem Alkoholeinfluss verandern.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 15/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Merkmale und Variablen (2)◮ Interessierende Merkmale (Eigenschaften) der Personen,

welche verschiedene Auspragungen annehmen konnen, werdenals Variablen bezeichnet.

◮ Variablen werden ublicherweise mit lateinischenGroßbuchstaben gekennzeichnet, die konkreten Auspragungen(Realisierungen) mit Kleinbuchstaben.

◮ Beispiel: Variable X , Geschlecht, steht fur die moglichenMerkmalsauspragungen x ′

1, weiblich, oder x ′

2, mannlich

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 16/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Funktionale Bedeutung von Variablen (1)

◮ Unabhangige Variablen: Variablen, deren Einfluss auf eineoder mehrere andere Variablen untersucht wird (auchFaktoren genannt).

◮ Abhangige Variablen: Variablen, auf die ein Einfluss derVeranderung der unabhangigen Variablen vermutet wird.

◮ Beispiel: Im verkehrspsychologischen Experiment wareAlkoholeinfluss die unabhangige Variable,Konzentrationsfahigkeit und Reaktionsgeschwindigkeit dieabhangigen Variablen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 17/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Funktionale Bedeutung von Variablen (2)

◮ Moderierende Variablen oder Moderatorvariablen sindVariablen, die das Ergebnis beeinflussen, indem sie dieWirkung einer unabhangigen Variablen auf die abhangigeVariable verandern.

◮ Beispiel: Im verkehrspsychologischen Experiment konnte diegleichzeitige Einnahme von Medikamenten die Alkoholwirkungbeeinflussen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 18/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Funktionale Bedeutung von Variablen (3)

◮ Mediierende Variablen oder Mediatorvariablen sind Variablen,die den Zuammenhang zwischen zwei Variablen erklaren(vermitteln).

◮ Beispiel: Altere AutofahrerInnen sind bessere AutofahrerInnen.Dieser Zusammenhang wird durch die Variable ”Fahrpraxis”mediiert (erklart) = indirekter Zusammenhang.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 19/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Funktionale Bedeutung von Variablen (4)

◮ Storvariablen, sind Variablen, die die abhangige Variableebenfalls beeinflussen konnen, aber in der Untersuchung nichtberucksichtigt wurden. Es gibt die Moglichkeiten:

◮ Randomisierung,◮ mogliche Storvariablen als zusatzliche Variable zu erheben und

bei der statistischen Auswertung als Kontrollvariable zuberucksichtigen.

◮ nur Personen mit einer bestimmten Auspragung dieser Variablezu untersuchen (d.h. die Variable konstant halten).

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 20/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Empirische Zuganglichkeit von Variablen◮ Manifeste Variablen sind direkt beobachtbar. Z.B.

Alkoholmenge, Gewicht, Geschlecht, usw.

◮ Latente Variablen sind nicht beobachtbar (sichtbar). Z.B.Konzentrationsfahigkeit, Intelligenz, etc. Hierbei handelt essich um sog. hypothetische Konstrukte, welche nur indirektgemessen werden konnen. Aufgrund der Auspragungen vonmanifesten Variablen wird auf die latente Eigenschaftgeschlossen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 21/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Arten von Merkmalsauspragungen◮ Numerische oder Quantitative Variablen: Auspragungen sind

Zahlenwerte. Z.B. Gewicht, Alter, etc.

◮ Kategoriale oder Qualitative Variablen: Auspragungen sindZustande oder Kategorien. Z.B. Geschlecht, Familienstand,Staatsburgerschaft.

◮ Auspragungen quantitativer Variablen lassen sich durchMessen, Zahlen, Wiegen erfassen und unterscheiden sichdurch ihre Große.Auspragungen qualitativer Variablen unterscheiden sich durchihre Art und lassen sich nicht durch Messen, Zahlen, Wiegenerfassen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 22/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Arten qualitativer Variablen

◮ Bei qualitativen Variablen unterscheidet man weiter zwischen

◮ dichotomen Variablen = Variablen mit nur zwei Auspragungen(z.B. Geschlecht) und

◮ polytomen Variablen = Variablen mit mehr als zweiAuspragungen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 23/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Skalenniveau (1)

◮ Um ein Merkmal zu messen werden den einzelnenAuspragungen Messwerte (Zahlen) auf einer Skala zugeordnet.

◮ Eine Skala ist eine Vorschrift, die jeder Person der Stichprobeeinen Beobachtungswert zuordnet, der die Auspragung desinteressierenden Merkmales angibt.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 24/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Skalenniveau (2)

In diesem Sinne lassen sich auch qualitative Merkmale ”messen”;man nennt diese Zuordnung von Zahlen zu denMerkmalsauspragungen auch Kodierung.Bei der Zuordnung der Zahlen ist zu beachten, dassunterschiedlichen Merkmalsauspragungen unterschiedliche Zahlenzugeordnet werden und jeder moglichen Merkmalsauspragungeindeutig eine Zahl zuordenbar ist.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 25/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Skalenniveau (3)

◮ Nominalskala: Die Skala mit dem niedrigsten Niveau.Rangordnung der Auspragungen nicht moglich oder sinnvoll,auch wenn ihnen Zahlen zugeordnet werden. Beurteilt nurGleichheit und Verschiedenheit von Merkmalsauspragungen.Beispiele: Geschlecht, Familienstand, Staatsburgerschaft.Nominalskalierte Variablen heissen nominale Merkmale.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 26/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Skalenniveau (4)

◮ Ordinalskala oder Rangskala: Auspragungen weisen naturlicheRangordnung auf. Macht Großer-Kleiner-Aussagen. DieAbstande zwischen den verschiedenen Werten einerordinalskalierten Variablen lassen sich jedoch nichtinterpretieren; die Ordinalskala macht keine Aussage uber dieGroße der Unterschiede zwischen den Auspragungen. Solangedie Großer-Kleiner-Relationen erhalten bleiben sind die Zahlenbeliebig wahlbar.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 27/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Skalenniveau (5)

◮ Typisches Beispiel einer Ordinalskala: Platzierungen beisportlichen Wettkampfen. Platzierung gibt nur Auskunftdaruber wer z.B. am schnellsten war, nicht uber Zeitabstandezwischen den einzelnen Rangplatzen.

◮ Auch Schulnoten haben Ordinalskalenniveau. DieAuspragungen unterliegen einer Rangordnung, die Abstandesind jedoch nicht interpretierbar. Ublicherweise wird fur einesehr gute Leistung 1, fur gute Leistung 2, fur befriedigendeLeistung 3, usw. vergeben. Zahlendifferenz jeweils 1, mussjedoch nicht unbedingt bedeuten, dass dieWissensunterschiede zwischen den einzelnen Noten gleichsind. Dies hangt wesentlich von außeren Umstanden ab (z.B.vom Beurteiler). Im Prinzip konnte man ebenso gut dieZahlen 1, 5, 7, 10 und 15 vergeben.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 28/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Skalenniveau (6)

◮ Metrische Variablen: Auspragungen unterliegen nicht nurRangordnung, sondern Differenzen sinnvoll interpretierbar.Gleich große Zahlendifferenzen entsprechen auch gleich großenUnterschieden zwischen den Auspragungen. Beispiele sind:Gewicht, Große, Alter.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 29/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Skalenniveau (7)

◮ Metrische Skalen konnen weiters noch unterteilt werden in◮ Intervallskala: kein naturlicher Nullpunkt (z.B. Kalender,

Temperatur); Verhaltnisse konnen nicht interpretiert werden.In der Psychologie wird fur Psychologische Tests angenommen,dass die Messwerte intervallskaliert sind.

◮ Rationalskala: naturlicher Nullpunkt, daher keine negativenWerte, Verhaltnisse konnen interpretiert werden (Gewicht,Alter, Große, Anzahl der Kinder, usw.)

◮ Weiters unterscheidet man bei metrischen Variablen zwischendiskreten Variablen, welche nur ganzzahlige Auspragungenhaben (1,2,3,. . . ) und stetigen oder kontinuierlichen Variablen,die beliebig fein abstufbar sind.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 30/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Univariat, Bivariat, Multivariat

◮ Univariat: nur eine Variable wird betrachtet.

◮ Bivariat: zwei Variablen werden gemeinsam betrachtet.

◮ Multivariat: mehr als zwei Variablen werden gemeinsambetrachtet.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 31/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Hypothesengenerierende und HypothesenprufendeUntersuchungen

◮ Hypothesenprufende Untersuchungen: aufgrund vonVorinformationen aus bisherigen Untersuchungen konnenwissenschaftliche Hypothesen formuliert und statistischgepruft werden.

◮ Hypothesengenerierende Untersuchungen: bei neuenForschungsgebieten, fur welche zu wenige Informationenvorliegen um Hypothesen zu formulieren, werden zunachsthypothesenerkundende Untersuchungen durchgefuhrt. Ziel istdie Formulierung wissenschaftlicher Hypothesen, die in eineranschließenden hypothesenprufenden Untersuchung statistischgepruft werden.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 32/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Wissenschaftliche Hypothesen (1)

◮ Eine wissenschaftliche Hypothese behauptet eine mehr oder

weniger prazise Beziehung zwischen zwei oder mehr Variablen,

die fur eine bestimmte Population vergleichbarer Objekte oder

Ereignisse gelten soll. (Bortz & Doring, 2002, S. 12)

◮ Die Hypothesen mussen im Rahmen derUntersuchungsplanung vor der Datenerhebung formuliertwerden!

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 33/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Psychologische Methodenlehre und Statistik - Wozu?Grundbegriffe

Wissenschaftliche Hypothesen (2)

◮ Wissenschaftliche Hypothesen (im Gegensatz zuAlltagsvermutungen)

◮ beziehen sich auf reale Sachverhalte, die empirisch uberprufbarsind,

◮ sind allgemeingultige, uber den Einzelfall hinausgehendeBehauptungen,

◮ mussen durch Erfahrung widerlegbar (falsifizierbar) sein,◮ mussen widerspruchsfrei sein,◮ sollen moglichst prazise formuliert sein,◮ mussen theoriegeleitet sein.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 34/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Notation

◮ Die Anzahl der Personen in der Stichprobe =Stichprobenumfang wird mit N bzw. n bezeichnet.

◮ Die Merkmalsauspragungen der einzelnen Personen in derStichprobe werden mit x1, . . . , xi , . . . , xn (oder in andererSchreibweise xi , i = 1, . . . , n) bezeichnet.

◮ Die moglichen Auspragungen (Realisierungen) einesMerkmales X werden mit x ′

1, . . . , x′

j , . . . , x′

k (oder in andererSchreibweise: x ′

j , j = 1, . . . , k) bezeichnet.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 35/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Notation

◮ Hat man nur ein Merkmal erhoben und notiert dieBefragungsergebnisse in der Reihenfolge der Befragung oderzufallig, bezeichnet man die entstehende Liste als Urliste oderBeobachtungsreihe.

◮ Beispiel: Erhobene Variable X : Anzahl der Kinder,Stichprobenumfang n = 15.

◮ Urliste:x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15

0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

x2 = 1 bedeutet, dass die in die Urliste an zweiter Stelleeingetragene Person ein Kind hat.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 36/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Notation

Hat man mehrere Merkmale (Variablen) erhoben, fasst man diesein Form einer Datenmatrix zusammen. Die Matrix besteht aus n

Zeilen fur die Personen, und p Spalten fur die erhobenen Variablen(n × p−Matrix). Die i−te Zeile enthalt die beobachtetenMerkmalsauspragungen der i−ten Person, die j−te Spalte enthaltdie bei den n Personen beobachteten Auspragungen des MerkmalesX . Die Eintragungen x11, . . . , xnp bezeichnen die Auspragungender einzelnen Merkmale bei den einzelnen Personen: x11 steht furdie Merkmalsauspragung der ersten Person beim ersten Merkmal.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 37/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Notation

Beispiel einer Datenmatrix in allgemeiner Notation:

Variable1 2 . . . j . . . p

Person 1 x11 x12 . . . . . . . . . x1p

2 x21 x22 . . . . . . . . . x2p

......

.... . .

...

i...

... xij

......

......

. . ....

n xn1 xn2 . . . . . . . . . xnp

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 38/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Notation

Beispiel einer Datenmatrix fur n = 50 Personen und erhobeneVariablen Geschlecht (1=weiblich, 2=mannlich), Kinderanzahl,Alter

VariableGeschlecht Kinder Alter

Person 1 1 2 402 2 0 25...

......

......

......

...50 2 1 45

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 39/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

◮ Die Deskriptivstatistik dient der Beschreibung der erhobenenDaten in der Stichprobe durch

1. Tabellen,2. Statistische Kennwerte, und/oder3. Grafiken.

◮ Diese Strukturierung, Zusammenfassung und anschaulicheDarstellung der Daten dient aber auch dazu, sich zunachsteinen Uberblick zu verschaffen und ev. Widerspruchlichkeitenzu entdecken (verursacht z.B. durch Fehler beim Ubertragender Daten, falsche Angaben eines Untersuchungsteilnehmers,etc.).

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 40/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Die Datenmatrix liefert Informationen uber die Charakteristikajeder einzelnen Person. Im allgemeinen ist man allerdings daraninteressiert, wie haufig die einzelnen Merkmalsauspragungen in derStichprobe vorkommen. Dazu kann man sich die Haufigkeitstabellebzw. Haufigkeitsverteilung ansehen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 41/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Nominalskalierte Merkmale

Absolute Haufigkeit, fj , ist die Anzahl von Personen mit der j-tenAuspragung des Merkmals X .

Es gilt stets: Die Summe der absoluten Haufigkeiten fur dieverschiedenen Auspragungen betragt n:

k∑

j=1

fj = n

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 42/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

◮ Die absoluten Haufigkeiten sind vom Stichprobenumfangabhangig; eignen sich nicht um die Ergebnisse verschiedenerErhebungen mit unterschiedlichem Stichprobenumfang zuvergleichen. Großen, die unabhangig vom Stichprobenumfangsind, sind die relative Haufigkeit und Prozentwerte.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 43/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

◮ Relative Haufigkeit, rj , ist der Quotient

absolute Haufigkeit

Anzahl der Personen=

fj

n

Es gilt stets: Es konnen nur Werte zwischen 0 und 1vorkommen; die Summe der relativen Haufigkeiten fur alle

j = 1, . . . , k verschiedenen Auspragungen betragt 1.

k∑

j=1

rj = 1

◮ Prozentwerte, pzj :

Prozentuelle Haufigkeit = rj × 100

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 44/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Datenbeispiel 1:

Allgemeine Bevolkerungsumfrage der Sozialwissenschaften

(ALLBUS 2006):1 Variable ”Erhebungsgebiet: Alte Bundeslander(= Westdeutschland) oder Neue Bundeslander (=Ostdeutschland)”; Zufallsstichprobe von n = 50 Personen.Kodierung: 1 = Westdeutschland, 2 = Ostdeutschland.

Urliste: 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1,1, 2, 2, 2, 2, 1, 2, 2, 1, 1, 1, 2, 1, 1, 2, 1, 2, 2, 1, 2, 1, 2, 2, 1, 1,2, 1, 2

1Das ALLBUS-Programm ist 1980-1986 und 1991 von der DFG (Deutsche Forschungsgemeinschaft) gefordert

worden. Die weiteren Erhebungen wurden von Bund und Landern uber die GESIS (Gesellschaftsozialwissenschaftlicher Infrastruktureinrichtungen) finanziert. ALLBUS wird innerhalb der GESIS an denStandorten Mannheim und Koln in Zusammenarbeit mit dem ALLBUS-Ausschuß realisiert. Die vorgenanntenInstitutionen und Personen tragen keine Verantwortung fur die Verwendung der Daten in dieser Vorlesung.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 45/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Haufigkeitstabelle fur Datenbeispiel 1Erhebungsgebiet Strichliste abs. H. rel. H. Prozent

x ′

j fj rj pzj

Westdeutschland ||||— ||||— ||||— ||||— ||||— |||| 29 0.58 58Ostdeutschland ||||— ||||— ||||— ||||— | 21 0.42 42

Summe 50 1 100

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 46/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Ordinalskalierte Merkmale

Zusatzlich kumulative Haufigkeitsfunktionen interessant undsinnvoll.Voraussetzung ist, dass die Merkmalsauspragungen der Große nachgeordnet sind.

◮ Kumulierte absolute Haufigkeit oder EmpirischeVerteilungsfunktion f k = die Summe der absolutenHaufigkeiten der betreffenden Merkmalsauspragung und allerkleineren. Gibt an, wieviele Personen einen Wert haben, derkleiner oder gleich der betreffenden Kategorie l ist.

f kl =

l∑

j=1

fj

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 47/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

◮ Kumulierte relative Haufigkeit rk = die Summe der relativenHaufigkeiten der betreffenden Merkmalsauspragung und allerkleineren. Anteil der Personen, die einen Wert haben, derkleiner oder gleich der betreffenden Kategorie l ist.

rkl =

l∑

j=1

fj

n=

1

n

l∑

j=1

fj

◮ Kumulierte prozentuelle Haufigkeit pzk = die Summe derprozentuellen Haufigkeiten der betreffendenMerkmalsauspragung und aller kleineren. Prozentwert derPersonen, die einen Wert haben, der kleiner oder gleich derbetreffenden Kategorie l ist.

pzkl = rk

l × 100

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 48/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Es gilt stets:

f kk =

k∑

j=1

fj = n

rkk =

1

n

k∑

j=1

fj = 1

pzkk = 100

bei j = 1, . . . , k Merkmalsauspragungen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 49/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Datenbeispiel 2:Variable ”Gesundheitszustand” aus ALLBUS (2006): Kodierung: 1= sehr gut, 2 = gut, 3 = zufriedenstellend, 4 = weniger gut, 5 =schlecht; Zufallsstichprobe von n = 50 Personen.

Urliste: 1, 2, 3, 2, 3, 2, 3, 4, 3, 2, 2, 5, 2, 3, 3, 2, 2, 3, 2, 2, 2, 2,2, 1, 1, 1, 2, 4, 3, 3, 2, 4, 3, 5, 1, 3, 5, 2, 1, 2, 2, 2, 2, 4, 2, 3, 1,2, 4, 4

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 50/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Haufigkeitstabelle fur Datenbeispiel 2

Gesundheitszustand fj rj pzj f kj rk

j pzkj

sehr gut 7 0.14 14 7 0.14 14gut 22 0.44 44 (7+22)=29 0.58 58

zufriedenstellend 12 0.24 24 (29+12)=41 0.82 82

weniger gut 6 0.12 12 47 0.94 94schlecht 3 0.06 6 50 1.00 100

Summe 50 1.00 100 - - -

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 51/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Metrische Merkmale

Haufigkeitstabelle unubersichtlich, insbesondere bei stetigenVariablen → Intervalle (= Klassenzusammenfassung odergruppierte Daten). 5-15 Intervalle (max. 20). Je weniger Intervalleumso großer Informationsverlust, je mehr Intervalle umsounubersichtlicher.Variable ”Alter” aus ALLBUS (2006), Zufallsstichprobe vonn = 50 Personen.

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 52/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Haufigkeitstabelle fur Datenbeispiel 3 mit Originaldaten

Alter fj rj pzj f kj rk

j pzkj

19 1 0.02 2 1 0.02 220 1 0.02 2 2 0.04 424 2 0.04 4 4 0.08 831 1 0.02 2 5 0.10 1033 1 0.02 2 6 0.12 1235 1 0.02 2 7 0.14 1436 2 0.04 4 9 0.18 1838 2 0.04 4 11 0.22 2240 4 0.08 8 15 0.30 3041 2 0.04 4 17 0.34 3442 2 0.04 4 19 0.38 3843 1 0.02 2 20 0.40 40

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 53/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Fortsetzung Haufigkeitstabelle fur Datenbeispiel 3 mitOriginaldaten

45 1 0.02 2 21 0.42 4246 2 0.04 4 23 0.46 4647 2 0.04 4 25 0.50 5048 2 0.04 4 27 0.54 5449 1 0.02 2 28 0.56 5651 1 0.02 2 29 0.58 5852 1 0.02 2 30 0.60 6053 2 0.04 4 32 0.64 6454 1 0.02 2 33 0.66 6655 2 0.04 4 35 0.70 7056 1 0.02 2 36 0.72 7257 1 0.02 2 37 0.74 7458 1 0.02 2 38 0.76 76

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 54/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Fortsetzung Haufigkeitstabelle fur Datenbeispiel 3 mitOriginaldaten

60 1 0.02 2 39 0.78 7862 1 0.02 2 40 0.80 8064 2 0.04 4 42 0.84 8466 1 0.02 2 43 0.86 8667 1 0.02 2 44 0.88 8869 1 0.02 2 45 0.90 9071 2 0.04 4 47 0.94 9475 1 0.02 2 48 0.96 9682 1 0.02 2 49 0.98 9885 1 0.02 2 50 1.00 100

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 55/56

OrganisatorischesEinfuhrung

Aufbereitung der erhobenen DatenUnivariate Deskriptive Statistik

Tabellarische Darstellung - Haufigkeitstabelle

Haufigkeitstabelle fur Datenbeispiel 3 mit gruppierten Daten

Alter fj rj pzj f kj rk

j pzkj

≤ 29 Jahre 4 0.08 8 4 0.08 830-39 Jahre 7 0.14 14 11 0.22 2240-49 Jahre 17 0.34 34 28 0.56 5650-59 Jahre 10 0.20 20 38 0.76 7660-69 Jahre 7 0.14 14 45 0.90 90≥ 70 Jahre 5 0.10 10 50 1.00 100

Summe 50 1 100

Karin Waldherr & Pantelis Christodoulides Psychologische Methodenlehre und Statistik I 56/56