8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem...

12
Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige und abhängige Gruppen Parametrische/Nicht- parametrische Vergl. Für diskrete/qualitative Variablen Binomialtest Chiquadrat-Test Fishers exakter Test Für stetige/quantitative Variablen t-Test für abhängige/unabhängige Gruppen Wilcoxon-Rangsummentest (Mann-Whitney)

Transcript of 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem...

Page 1: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 1

8. Vergleich von zwei Gruppen

Unabhängige und abhängige GruppenParametrische/Nicht-parametrische Vergl.

Für diskrete/qualitative Variablen

� Binomialtest� Chiquadrat-Test� Fishers exakter Test

Für stetige/quantitative Variablen� t-Test für abhängige/unabhängige Gruppen� Wilcoxon-Rangsummentest (Mann-Whitney)

Page 2: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 2

Chiquadrat-Test und Fisher exakt

Statistics Table Analysis ..., Statistics� Beispiel:

SAS-Tabelle fb in N:\sasurz\daten-v8 eingeschränkt auf

Sex in (1,2) and Student in (0,1)Fragen:Sind Frauen und Männer gleichmäßig verteilt hinsichtlich des Status?Gibt es einen Zusammenhang zwischen dem Geschlecht und dem Status?

Tests im Detail

� NullhypothesenAnteil weiblicher Studenten/Angestellten =

Anteil männlicher Studenten/AngestelltenGeschlecht und Status ist unabhängig.

� AlternativhypothesenUngleichheit bzw. Abhängigkeit

� Umsetzung in SASSex in Zeilen, Student in SpaltenStatistics: Chiquadrat und Exact

Page 3: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 3

Statistics for Table of SEX by STUDENT

Statistic DF Value ProbƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒChiChiChiChi----Square 1 6.6491 0.0099Square 1 6.6491 0.0099Square 1 6.6491 0.0099Square 1 6.6491 0.0099Likelihood Ratio Chi-Square 1 6.6169 0.0101Continuity Adj. Chi-Square 1 5.7038 0.0169Mantel-Haenszel Chi-Square 1 6.6116 0.0101Phi Coefficient -0.1938Contingency Coefficient 0.1903Cramer's V -0.1938

Fisher's Exact TestFisher's Exact TestFisher's Exact TestFisher's Exact TestƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒCell (1,1) Frequency (F) 13Left-sided Pr <= F 0.0086Right-sided Pr >= F 0.9971

Table Probability (P) 0.0058TwoTwoTwoTwo----sided Pr <= P 0.0131sided Pr <= P 0.0131sided Pr <= P 0.0131sided Pr <= P 0.0131

Sample Size = 177

Interpretation

ChiChiChiChi----Square 1 6.6491 0.0099Square 1 6.6491 0.0099Square 1 6.6491 0.0099Square 1 6.6491 0.0099

Name desHypothesentest

Freiheitsgrad(Anzahl Zeilen-1)*(Anzahl Spalten-1)

Teststatistik(Chiquadrat)

Irrtumswahrscheinlichkeit(Wahrscheinlichkeit für die Richtigkeit der Nullhypothese)

Page 4: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 4

Prozedur FREQ

PROC FREQ DATA=SAS-Tabelle;TABLES

zeilenvariable*spaltenvariable/ CHISQ EXACT;

RUN;

Statistics Hypothesis Tests

� liefert die übrigen Tests.

� Vorteil gegenüber 'normalem' SAS:Test gegen einen Wert ungleich Null(z.B. H0: Alter=20)Nachteil:Es wird keine Standardprozedur aufgerufen, sondern im Datenschritt programmiert, allerdings mit Kommentar.

Page 5: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 5

Beispiel: t-Test

� Altersvergleich von Männern und Frauen� Nullhypothese: Das mittlere Alter von

Männern und Frauen ist gleich.� Alternativhypothese: Das mittlere Alter von

Männern und Frauen unterscheidet sich.� Annahme: Die Variable Alter ist normalverteilt.� Hypothesentest: Zweiseitiger t-Test für zwei

unabhängige Gruppen.� Signifikanzniveau: 5%

Two-Sample t-Test for Means

Page 6: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 6

Tests

� Konfidenzintervalle

� PoweranalysenPower Analysis Sample Observed

Alpha Size Power----- ---- -----0.050 179 0.4210.010 179 0.2050.100 179 0.547

95% Confidence Interval for the Difference between Two Means

Lower Limit Upper Limit----------- -----------

-14.97 0.81

Plots

� Box-and-Whiskers Plot� Balkendiagramm der Mittelwerte� Plot der Mittelwerte� t-Verteilungsplot

Page 7: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 7

Prozedur TTEST

PROC TTEST DATA=SAS-Tabelle;CLASS gruppenvariable;VAR analysevariable;

RUN;

Nichtparametrische Tests

� ANOVA Nonparametric One-way ANOVA

Gruppe

Analyse-variable

Page 8: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 8

Prozedur NPAR1WAY

PROC NPAR1WAY DATA=SAS-Tabelle;CLASS gruppenvariable;VAR analysevariable(n);EXACT;

RUN;

9. Der SAS-Explorer

Datenmanagement außerhalb der Analyst-Umgebung

Page 9: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 9

SAS Explorer

� Ähnlich wie Windows-Explorer viele Funktionalitäten auf rechter Maustaste (RMM)

� Anzeige und Bearbeiten von Tabellen, Bibliotheken und Katalogen

� Erzeugen neuer Bibliotheken, Filerefs, Tabellen und Katalogen

� Kopieren und Export von Dateien

Menü View

� Zum Ändern der Explorer Darstellung� View Show Tree

öffnet Baumstruktur, die Drill-Down erlaubt, um einzelne Dateien zu öffnen

� View Detailszeigt Details der Bibliotheken, Dateien .. an.

Page 10: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 10

Neue Bibliothek definieren

� Im Explorer-Fenster RMM File New oder RMM New oder

� Öffnet New Library Fenster

Neue SAS-Tabelle definieren

� Auf eine vorhandene Bibliothek klicken (bis diese markiert ist) und dann RMM New, Tableund dann Ok.

� Daraufhin öffnet sich das Viewtable-Fenster (mit dem Table Editor), ähnlich wie Sie es vom Analyst kennen, allerdings mit besserer Variablendefinition (Länge von Textvariablen kann immer festgelegt werden).

Page 11: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 11

Variablen einfügen in Tabellen

� ProblemNachträglich Variablen einfügen in bestehende SAS Tabellen

� Ausweg- Neue Tabelle öffnen- bestehende Tabelle einfügen (File Include)- unter dem alten Namen abspeichern

(File Save as)� Mit Kommandos

vt;new;include work.test;saveas work.test

Tabelleninformationen

Tabelle anklicken, RMM und Propertiesliefert:

� General Properties� Engine/Host Information� Indexes� Columns (= Variablenfenster)

Eintragungen, die sich ändern lassen, haben Popup-Menü.

Page 12: 8. Vergleich von zwei Gruppen - Universitaetsrechenzentrum · Unterlagen zu: Das Datenanalysesystem SAS SS 2000 Kursleitung: C. Ortseifen 1 8. Vergleich von zwei Gruppen Unabhängige

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Kursleitung: C. Ortseifen 12

Variablenfenster

� (auch RMM und View Columns)� Anzeige der Variablen samt Eigenschaften� Name, Label, Format und Informat

können über das RMM geändert werden

Tabellenansicht und zurück

� Doppelklick auf die Tabelle öffnet sie mit dem Viewtable

� Tabelle umbenennen: Tabelle markieren, RMM und Rename

� Mit View Up One Level kehrt man eine Ebene im Explorer zurück (oder dem Tool ).