Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal...

49
Statistik I demnächst in Hörsaal 16 !!

Transcript of Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal...

Page 1: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Statistik I

demnächst in Hörsaal 16 !!

Page 2: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

• PD Dr. Ina Grau• Termin der Vorlesung Fr 12-14 in Hörsaal 16• erster Termin 21.10.2005• letzter Termin 10.2. 2006• E-mail: [email protected]• Sprechstunde Di 16-17 in Raum T4-134• Telefon 106-4310

Page 3: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Themen der Vorlesung

• Einführung• Vorgehen bei einer wissenschaftlichen Studie• Möglichkeiten der Datenerhebung• Grafische Darstellung von Variablen• Analyse einzelner Variablen (z.B. Mittelwert)• Zusammenhänge zwischen mehreren

Variablen• SPSS• (Statistik II: Schlussfolgerungen aus einer

Stichprobe auf die Population; Testverfahren)

Page 4: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Säulendiagramm

Page 5: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.
Page 6: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Häufigkeitsverteilung einer Variable

Altersangaben Häufigkeit20 1921 2522 3023 2924 2025 15> 25 9

Page 7: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Bivariate Verteilung zweier kontinuierlicher Variablen

Page 8: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Namen und E-mail der Tutoren

• Cemil Sahinöz [email protected]• Kjell Hoffmann [email protected]• Floris van Veen [email protected]• Sonja Schulz [email protected]

Page 9: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Termine und Räume der Tutorien

• Mo 10-12 in E01-108• Di 10-12 in T2-214• Mi 10-12 in L3-108• Mi 12-14 in C01-148• Do 10-12 in U2-147

• teilweise im Cip-Pool U4-114 (auch in der ersten Sitzung)

Page 10: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Dringend empfohlene Literatur

• Benninghaus, H. (2001): Einführung in die sozialwissenschaftliche Datenanalyse. 6. Aufl., München, Wien: Oldenbourg.

• Gehring, U.W./ Weins, C. (2002): Grundkurs Statistik für Politologen. 3., überarbeitete Auflage. Opladen: Westdeutscher Verlag.

Page 11: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Weiterführende Literatur

• Diekmann, A. (1995): Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Hamburg: Rowohlt.

• Schnell, R.; Hill, P.B.; Esser, E. (1993): Methoden der empirischen Sozialforschung. 4., überarb. Aufl., München, Wien: Oldenbourg.

• Wright, D.B. (1997): Understanding statistics. An introduction for the social sciences. 1st edition. London et al.: Sage.

• Kühnel, S.M./ Krebs, D. (2001): Statistik für die Sozialwissenschaften. Grundlagen, Methoden, Anwendungen. Reinbek: Rowohlt

• Knoke, D. / Bohrnstedt, G.W. / Potter Mee, A. (2002): Statistics for social data analysis. 4th edition. Itasca, Ill: Peacock.

• Bleymüller, J./ Gehlert, G./ Gülicher, H. (2002): Statistik für Wirtschaftswissenschaftler. 13. Aufl. München: Vahlen.

• Fahrmeir, L./ Künstler, R./ Pigeot, I./ Tutz, G. (2003): Statistik: der Weg zur Datenanalyse. 4., verbesserte Auflage. Berlin et al.: Springer.

• Bortz, J. (1999): Statistik für Sozialwissenschaftler. 5. Auflage Berlin/ Heidelberg: Springer.

Page 12: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Für Sie zu tun:

• in Tutoriumsliste eintragen• zum Tutorium Disketten mitbringen, wenn es

im Cip-Pool stattfindet• Cip-Pool-Account im Internet beantragen https://www.cipux.uni-bielefeld.de/antrag und dann mit Vorlage der Immatrikulations-

bescheinigung in Raum T4-142 freischalten lassen, Sprechst. Mo-Fr 11-12).

Page 13: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Das Curriculum sieht im Grund- und Hauptstudium eine Folge von aufeinander aufbauenden Vorlesungen, Übungen und Seminaren vor. Über die Veranstaltungen und die notwendigen Leistungsnachweise informiert die folgende Überblickstabelle.

Curriculum „Methoden der empirischen Sozialforschung“

Page 14: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Studienphase Semester Veranstaltung Leistungsnachweis

Grundstudium

1• Einführung in die

Methoden der emp. Sozial-forschung (Do 18-20, H4)

• Statistik I (Deskriptivstatistik) mit Tutorium

 

2• Statistik II

(Inferenzstatistik) mit Tutorium

Klausur

3 • Grundkurs "Methoden der emp. Sozialforschung"

 

4• Aufbaukurs "Methoden der

emp. Sozialforschung" Schein

Hauptstudium 5-8 • Seminar im Wahlpflichtfach "Methoden"

Schein

Curriculum „Methoden der empirischen Sozialforschung“

Page 15: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Curriculum „Methoden der empirischen Sozialforschung“

Wahlpflichtfach „Methoden der empirischen Sozialforschung“

Im Hauptstudium ist mindestens eine der scheinfähigen Wahlpflichtveranstaltungen erfolgreich zu absolvieren. Ein Leistungsnachweis wird durch eine schriftliche Arbeit im Rahmen einer der regelmäßig angebotenen Wahlpflichtveranstaltungen erworben. Im Bereich der Quantitativen Methoden wird erwartet, dass in den scheinfähigen Wahlpflichtveranstaltungen entweder ein Leistungsnachweis für den Themenbereich "Datenerhebungsverfahren" oder den Themenbereich "Datenanalyse (Statistik)" erworben wird. Der jeweils andere Themenbereich ist dann Gegenstand der Diplom-Fachprüfung.

Page 16: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

"Empirische Sozialforschung ist die systematische Erfassung und Deutung sozialer Erscheinungen. Empirisch bedeutet, dass theoretisch formulierte Annahmen an spezifischen Wirklichkeiten überprüft werden. Systematisch weist darauf hin, dass dies nach Regeln vor sich gehen muss. Theoretische Annahmen und die Beschaffenheit der zu untersuchenden Realität sowie die zur Verfügung stehenden Mittel bedingen den Forschungsablauf."

(Atteslander 1991: 16)

Was ist empirische Sozialforschung?

Page 17: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

"Unter Methoden der empirischen Sozialforschung versteht man die geregelte und nachvollziehbare Anwendung von Erfassungsinstrumenten wie Befragung, Beobachtung, Inhaltsanalyse. Je nach dem Grad der Kontrolle des Forschungsablaufs spricht man von Experimenten."

(Atteslander 1991: 16)

Was sind Methoden? (1)

Page 18: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Was sind Methoden? (2)

"... sind erstens Mittel, um Realität zu erfassen - und damit auch zu schaffen, geleitet von Theorien, seien sie nun expliziert, bekannt oder nur 'background ignorance'. Zweitens, alle Methoden führen zu Aussagen, die auf bestimmten Stichproben von Objekten, von Räumen und von Zeiten beruhen. Immer wird die Wahrnehmung codiert, d.h. Erscheinungen werden Merkmale und ihre Ausprägungen zugeordnet. Die zentrale Frage ist, wie die vermuteten Regelmäßigkeiten, die unterstellte Struktur sozialer Prozesse, in der Sprache abgebildet und die Zusammenhänge als Gesetze formuliert werden."

(Friedrichs 1973: 189)

Page 19: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Quelle: Schnell et al. 1989, 110/Schnell et al. 1993, 118

Auswahl des Forschungsproblems

Theoriebildung

Konzeptspezifikation Operationalisierung

Bestimmung der Untersuchungsform

Auswahl der Untersuchungseinheiten

Datenerfassung

Datenanalyse

Publikation

Datenerhebung

Theoriegewinnung und Theorieprüfung (1)

Page 20: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Verallgemeinerungen Hypothesen

Theorien

Beobachtungen

Theoriegewinnung und Theorieprüfung (2)

Page 21: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

1. Heutzutage werden empirische Informationen zu allen möglichenSachverhalten erhoben, nicht jede Datenerhebung erlaubt jedoch inhaltlich valide Schlußfolgerungen.

2. Dieser Mangel kann auch nur begrenzt durch statistische (oder andere) Auswertungsverfahren ausgeglichen werden. Die Aussagekraft der erhobenen Daten hängt entscheidend von den verwendeten sozialwissenschaftlichen Theorien, Untersuchungsdesigns, Erhebungsinstrumenten und Auswahlverfahren ab.

3. Es gibt keine "theoriefreie" empirische Beobachtung, auch wenn Theorien durch Konfrontation mit "neuen" empirischen Informationen "lernen".

Stellenwert von Statistik im Forschungsprozeß (1)

Page 22: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

4. Statistik ist eine wichtige wissenschaftliche Disziplin, aber die Relevanz einer Untersuchung hängt in erster Linie vom Inhalt und den verwendeten Methoden (s. Punkt 2) ab, nicht vom verwendeten statistischen Auswertungsverfahren. Gleichwohl helfen statistische Kenntnisse, empirische Untersuchungen so durchzuführen, daß gültige und zuverlässige Ergebnisse möglich sind.

5. In den Sozialwissenschaften gibt es neben statistischen auch andere Auswertungsmethoden für empirische Informationen.

6. Eines der Hauptziele von Statistik besteht darin, eine Vielzahl von Daten auf ihre wesentlichen Strukturen zu reduzieren. Die Annahmen über das, was als "wesentlich" betrachtet wird, werden in Form eines statistischen Modells zusammengefaßt. Dementsprechend sind die folgenden Ergebnisse modellabhängig (vgl. Stadtplanbeispiel). Ihre Verallgemeinerbarkeit steht und fällt daher mit der Angemessenheit des verwendeten Modells, die in jedem Anwendungsfall geprüft werden muß.

Stellenwert von Statistik im Forschungsprozeß (2)

Page 23: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

7. Bei der Auswertung und Interpretation empirischer Informationen dürfen drei Dinge nicht vergessen werden:

a. Theoretische Konstrukte, wie z.B. soziale Schicht oder Intelligenz, sind nicht direkt, sondern nur mittels bestimmter Indikatoren (z.B. Schichtindizes oder Intelligenztests) beobachtbar. Das verweist auf die Notwendigkeit der Entwicklung von validen Meßinstrumenten.

b. Erhebungsmethoden sind mit Meßfehlern verbunden. Daraus ergibt sich die Notwendigkeit der Entwicklung von zuverlässigen Meßinstrumenten bzw. der Verwendung geeigneter statistischer Methoden zur Kontrolle mangelnder Reliabilität.

c. Empirische Informationen bestehen in der Regel aus einer Auswahl von Objekten, Räumen und Zeiten. Daraus ergibt sich die Frage, ob und in welcher Weise die Auswertungsergebnisse über diese Auswahl hinaus verallgemeinert werden können.

Stellenwert von Statistik im Forschungsprozeß (3)

Page 24: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

"Eine notwendige Voraussetzung zur Beschreibung und Erklärung eines sozialen Zustandes oder eines sozialen Ereignisses ist seine begriffliche Präzisierung. Wissenschaften - gleich welcher Richtung - arbeiten nie mit konkreten Ereignissen an sich, sondern immer mit in Sprache gefasster Realität, mit Aussagen über die Realität. Wenn solche Aussagen nicht nur von einer einzigen oder einigen ausgewählten Personen verstanden werden, sondern allen Interessierten zugänglich sein sollen, dann ist es unumgänglich, dass der 'gemeinte Sinn' der verwendeten Begriffe von allen erfasst und geteilt werden kann: Man muss wissen, worüber geredet wird. Die am Kommunikationsprozess Beteiligten sollen den verwendeten Begriffen weitestgehend die gleichen Bedeutungen, die gleichen Vorstellungsinhalte zuschreiben."

(SN89: 38, SN93: 38, Herv. HJA)

Begriffsdefinition

Page 25: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Theorien beschreiben Zusammenhänge zwischen theoretischen Begriffen. Theoretische Begriffe als Bestandteile von Theorien (oder 'Konstrukte ') sind nicht direkt beobachtbar. Zur Überprüfung einer Theorie ist die Angabe von Korrespondenzregeln für theoretische Begriffe notwendig. Diese sog. Operationalisierung beinhaltet Angaben darüber, wie die theoretischen Konstrukte gemessen werden sollen.

Operationalisierung (1)

Page 26: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Dimensionale Analyse, Konzeptspezifikation"Die meisten allgemeinen Konzepte sind viel zu unklar, als dass direkt Messanweisungen gegeben werden können. Aus diesem Grund beginnt die Operationalisierung eines theoretischen Begriffs meist mit der Klärung, welche theoretischen Aspekte eines bestimmten Gegenstandsbereichs ('Dimensionen') durch den theoretischen Begriff bezeichnet werden, bzw. welche Dimensionen das Konzept anspricht."(SN89: 120, SN93: 130, Herv. im Original)

Operationalisierung"Die 'Operationalisierung' eines theoretischen Begriffs besteht aus der Angabe einer Anweisung, wie Objekten mit Eigenschaften (Merkmalen), die der theoretische Begriff bezeichnet, beobachtbare Sachverhalte zugeordnet werden können."(SN89: 122, SN93: 132, Herv. im Original)

Operationalisierung (2)

Page 27: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Grundbegriffe

• Theorie: Aussage über Zusammenhang zwischen theoretischen Begriffen (hypothetischen Konstrukten), die zuvor definiert wurden

• Operationalisierung: Messbarmachen der Begriffe, Umwandlung von theoretischen Begriffen in Variablen (Variablen, die für ein hypothetisches Konstrukt stehen, nennt man Indikatoren)

• Hypothese: Aussage über Zusammenhang zwischen Variablen Forschung

Page 28: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Beispiel für die genannten Begriffe

• Theorie: Frustration führt zu Aggression• Begriffsdefinition: Frustration ist eine Hinderung an

der Erreichung eines Ziels, Aggression ist das absichtliche Austeilen schädigender Reize an eine Person.

• Operationalisierung Frustration: Personen, die gerade eine Aufgabe lösen, werden kurz vor dem Ziel gestört. Aggression: Sie haben dann die Gelegenheit, einer anderen Person Elektroschocks zu verabreichen.

• Hypothese: Personen, die soeben gestört wurden, teilen mehr Elektroschocks aus als Personen, die nicht gestört wurden.

Page 29: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Beispiele

1. Wenn der Entscheidungsspielraum (im Beruf) einer Person umfangreich ist, ist ihr Selbstwertgefühl hoch.

2. anders formuliert: Je größer der Entscheidungsspielraum einer Person ist, desto höher ist ihr Selbstwertgefühl.

Die zweite Formulierung berücksichtigt, dass beide Variablen viele Ausprägungen haben können.

Hypothesen (1)

Page 30: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Hypothesen (2)

Definition von „Hypothese“

"Noch unbewiesene Annahme als Hilfsmittel für

wissenschaftliche Erkenntnisse." (Wahrig 1991: Deutsches Wörterbuch)

Eine Hypothese ist empirisch falsifizierbar.

Behauptungen, die die Formulierung „Wenn-dann“ enthalten, sind widerlegt, sobald ein Gegenbeispiel vorliegt. In den Sozialwissenschaften wird üblicherweise eine bestimmte Anzahl von Gegenbeispielen zugelassen, ohne dass die Hypothese als widerlegt gilt.

Page 31: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

1. Eine Hypothese ist eine Aussage, keine Frage…

2. Die Aussage enthält mindestens zwei semantisch gehaltvolle Begriffe [...]

3. Die Begriffe sind durch den logischen Operator 'wenn-dann' verbunden. [...]

4. Die Aussage ist nicht tautologisch, d.h. ein Begriff deckt den anderen semantisch nicht ab. [...]

5. Die Aussage ist widerspruchsfrei, d.h. ein Begriff schließt den anderen semantisch nicht aus.

6. Die empirischen Geltungsbedingungen sind implizit oder explizit im einzelnen aufgezählt. [...]

7. Die Begriffe sind auf Wirklichkeitsphänomene hin operationalisierbar.

8. Die Aussage ist falsifizierbar."

(Atteslander 1991: 65f.) 0

Hypothesen (3)

Page 32: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Häufige Formulierungen von Hypothesen

Zusammenhangshypothesen• Schuhgröße und Körpergröße hängen positiv

miteinander zusammen.

Unterschiedshypothesen• Frauen sind sprachlich begabter als Männer.

Beides ist häufig austauschbar: Das Geschlecht hängt mit der Sprachbegabung zusammen.

Page 33: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Typen von Hypothesen

• Symmetrische Hypothesen: Schuhgröße und Körpergröße hängen zusammen (die wenn-dann-Beziehung kann in beide Richtungen formuliert werden)

• Asymmetrische Hypothesen: Alter und Rückenbeschwerden hängen zusammen (die wenn-dann Beziehung ist nur in eine Richtung sinnvoll zu formulieren); eine Variable gilt als Ursache, die andere als Wirkung.

Page 34: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Typen von Hypothesen

• Hypothesen können positiv oder negativ sein. Je ein Beispiel:

• Je höher die Semesterzahl von Soziologiestudenten, desto größer ist das Wissen über soziologische Theorien.

• Je länger ein Mitarbeiter in einer Firma beschäftigt ist, desto niedriger ist seine Motivation

Page 35: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Typen von Variablen

• Für asymmetrische Hypothesen gilt:• Die Variable, in der man die Ursache

vermutet: unabhängige Variable• Die Variable, in der man die Wirkung

vermutet: abhängige Variable• statistisch können kausale Zusammenhänge

(Ursache – Wirkungs – Zusammenhänge) nicht bewiesen werden, sondern nur, dass überhaupt ein Zusammenhang besteht. Ein kausaler Beweis ist mit Experimenten möglich.

Page 36: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Experiment

• Ein Experiment unterscheidet sich durch andere Arten empirischer Untersuchungen dadurch, dass die unabhängige Variable nicht gemessen, sondern vom Versuchsleiter hergestellt wird (wie im Beispiel Frustration: Störung oder keine Störung bei der Erledigung einer Aufgabe. Anderes Beispiel: Medikament oder Placebo)

• Um die Wirkung von Störvariablen zu kontrollieren, müssen die Personen zufällig auf die Ausprägungen der UV aufgeteilt werden.

Page 37: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Hauptschule

Realschule

Hauptschule

Gymnasium

1

2

1

3

Numerisches Relativ Empirisches Relativ

Messen: schematische Darstellung

Page 38: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

"Unter 'Messen' wird allgemein die Zuordnung von Zahlen ('Messwerten') zu Objekten gemäß festgelegten Regeln verstanden. Die Mängel dieser Definition werden bereits dadurch deutlich, dass die Zuweisung von Schulnoten durch Würfeln eine definitionsgemäße Messung wäre. Eine brauchbare Definition muss für eine Messung fordern, dass die Messwerte zueinander Beziehungen aufweisen, die den Beziehungen der gemessenen Objekte entsprechen. So wird z.B. für eine sinnvolle Längenmessung gefordert, dass der 'größte' Messwert dem 'längsten' Objekt entspricht, der 'kleinste' Messwert dem 'kürzesten' Objekt. Eine Messung in diesem Sinne ist eine 'strukturtreue Abbildung': Die Beziehungen der Objekte ('kürzer' - 'länger') werden durch die Beziehungen der zugeordneten Zahlen ('kleiner' - 'größer') korrekt wiedergegeben."

Messen und Messniveau (1)

(Schnell et al. 1993: 143, Herv. im Original)

Page 39: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

"Die Verwendung eines bestimmten Kriteriums, z.B. Länge, definiert eine bestimmte Beziehung ('Relation') der Objekte zueinander. Eine Menge von Objekten, über die eine Relation definiert wurde, bezeichnet man als 'empirisches Relativ', eine Menge von Zahlen, über die eine Relation definiert wurde, als 'numerisches Relativ'. [...] Das Problem der Messung besteht nun darin, eine Zuordnung der Zahlen zu den Objekten zu finden, so dass die Ordnung im numerischen Relativ der Ordnung im empirischen Relativ entspricht: Das Problem besteht in der Angabe einer Regel, die eine strukturtreue Abbildung ermöglicht."

(Schnell et al. 1993: 143f., Herv. im Original)

Messen und Messniveau (2)

Page 40: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Codieren

• Bei einigen Variablen ergibt sich die Zuordnung von Zahlen zu Variablenausprägungen unproblematisch, z.B. Alter in Jahren – 20

• Bei anderen Variablen muss man Entscheidungen treffen, z.B. beim Geschlecht Mann=1, Frau=2

• Die codierten Werte werden dann in eine Datenmatrix eingegeben

Page 41: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Datenmatrix

Alter GeschlechtVp 1 20 1Vp 2Vp 3Vp 4Vp 5Vp 6Vp 7Vp 8…

Page 42: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Skalenniveaus

SkalenniveausNiveau: Eigenschaft: Beispiel: erlaubte

Rechenoperationen

Nominal-skala

Name Geschlecht =

Ordinal-skala

Rangfolge Schulnoten < >

Intervall-skala

mit gleichen Intervallabständen

Temperatur (Celsius)

+ -

Verhältnis-skala

mit absolutem Nullpunkt

Länge (Meter), Alter

* /

Page 43: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Arten von Variablen

• Diskrete Variablen haben begrenzte Ausprägungen, z.B. Zahl der Kinder

• Kontinuierliche Variablen: zwischen zwei Werten ist jeder Zwischenwert möglich, z.B. Alter, Größe

für die Statistik reicht folgende Unterscheidung:• Kategoriale Variablen: wenige Ausprägungen• Kontinuierliche Variablen: viele

Ausprägungen

Page 44: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Arten von Variablen

Unterscheidung nach... Bezeichnungen

Messniveaunominal ordinal intervall-, verhältnisskaliert

nicht-metrisch metrisch

Anzahl der Ausprägungen diskret kontinuierlich

Art der Datenanalyse kategorial kontinuierlich

Page 45: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Mittelwerte und Streuungsmaße nach Messniveau (1)

Zentrale Tendenz (Mittelwerte)

Nominal Ordinal Intervall Verhältnis

Modus ja ja ja ja

Median nein Ja ja ja

Arithm. Mittel nein nein ja ja

Geom. Mittel nein nein nein ja

Page 46: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Mittelwerte und Streuungsmaße nach Messniveau (2)

Streuung (Streuungsmaße)

Nominal Ordinal Intervall Verhältnis

Spannweite nein (ja) ja ja

Quartilsabstand nein (ja) ja ja

Mittl. absolute Abweichung

nein nein ja ja

VarianzStandardabweichung

nein nein ja ja

Variationskoeffizient nein nein nein ja

Page 47: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Skalierung

• Häufig werden mehrere Variablen gemessen, die gemeinsam eine neue Variable ergeben:

• Index: eine Variable (soziale Schicht) ergibt sich aus mehreren anderen Variablen (Einkommen, Bildung, Berufsprestige).

• Die Berechnung der neuen aus den alten Variablen erfolgt nach definierten Rechenoperationen; im Beispiel ergibt sich das Problem unterschiedlicher Einheiten

Page 48: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Skalierung

• Skala: die Summe oder der Mittelwert aus mehreren Items (Fragen), die dasselbe Konstrukt messen sollen. Die Einheiten sind bei allen Items gleich.

• Es werden mehrere Items vorgelegt, um die Messgenauigkeit zu erhöhen. Wenn einige Items gegensinnig formuliert sind, müssen sie umgepolt werden, z.B.

• Ich habe Angst. nein 1 2 3 4 5 ja• Ich bin ganz ruhig. nein 1 2 3 4 5 ja• recode It2 (1=5) (2=4) (3=3) (4=2) (5=1).

Page 49: Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Skalierung

• Der Skalenwert ergibt sich aus dem Mittelwert der einzelnen Items.

• Die Mittelung hat gegenüber einer Summierung zwei Vorteile:

• Das Minimum und das Maximum der Werte, die auftreten können, sind wie bei den Items, die Werte sind leichter interpretierbar.

• Fehlende Werte werden ausgeglichen, da nur durch die Anzahl vorhandener Werte geteilt wird.