1
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Angewandte Statistik: Lösung von Grundaufgaben mit SPSS Version 11.5 Daten: grund??.sav Ausgabe WS 2003/04 Begleitskriptum zum Lehrbuch: W. Timischl: Biostatistik, Wien - New York: Springer 2000. Problemlösung (schematisch) mit dem Datenanalysesystem SPSS:
DATEN-FENSTERmit SPSS-Datenmatrix:Variable > Spalten,Untersuchungseinheiten > Zeilen
Dateneingabe:Direkteingabe (Datei-Neu) oder durchImportieren einer Datei (Datei-Öffnen,z.B. Dateien vom Typ sav, xls, txt, ...)
Datenmanipulation wie z.B.:- Daten-Fälle sortieren ...- Daten-Fälle auswählen ...- Daten-Fälle gewichten ...- Transformieren-Berechnen ...
Auswerten mit Menueoptionen wie z.B.:- Analysieren-Deskriptive Statistiken-
Explorative Datenanalyse ...- Analysieren-Mittelwerte vergleichen-
T-Test bei einer Stichprobe ...- Grafiken-Balken ...- Grafiken-Streudiagramm ...
SYNTAX-FENSTERmit SPSS-Programm, z.B.:EXAMINE VARIABLES=x_7 BY typ /PLOT BOXPLOT /COMPARE GROUP /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.
EINFÜGEN
VIEWER-FENSTERmit Ergebnissen
OK AUSFÜHREN
2
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Grundaufgabe 1: Berechnungen im Datenfenster (Rechnen mit Wahrscheinlichkeiten) (i) Die Masse (in mg) einer Wirksubstanz W in einem Präparat sei normalverteilt mit dem Mittelwert 10 und der Vari anz
0.25. Welcher Anteil von Präparaten mit der Substanz W zwischen 9mg und 11mg ist zu erwarten? (ii) Bei einem Test werden 5 Aufgaben derart gestellt, daß es bei jeder Aufgabe 4 Antwortmöglichkeiten gibt, von denen
genau eine die richtige ist. Wie groß ist die Wahrscheinlichkeit, daß man mehr als die Hälfte der Aufgaben richtig löst, wenn die Lösungsauswahl aufs Geratewohl erfolgt, d.h., jeder Lösungsvorschlag mit der Wahrscheinlichkeit 1/4 gewählt wird?
Lösung: (i) Daten-Fenster: Hauptmenü: Transformieren – Berechnen … Ergebnis: anteil = 0,9545 = 95,45% (ii) Wahrscheinlichkeit = 1- CDF.BINOM(2,5,0.25) = 10.35%
3
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Grundaufgabe 2: Eindimensionale Datenbeschreibung Man vergleiche die Verteilungen der Spaltöffnungslängen (Merkmal X, in mm) bei diploiden und tetraploiden Biscutella laevigata . X/diploid: 27, 25, 23, 27, 23, 25, 25, 22, 25, 23, 26, 23,24, 26, 26 X/tetraploid: 28, 30, 28, 32, 25, 29, 28, 33, 32, 28, 28, 30, 32, 31, 31, 34, 29, 36, 33, 30, 29, 27, 27, 29, 26 Datei: grund02.sav Lösung: Daten-Fenster: Hauptmenü: Analysieren – Deskriptive Statistiken – Explorative Datenanalyse ... Syntax-Fenster: SPSS-Programmcode (Einfügen)
EXAMINE VARIABLES=x_7 BY typ /PLOT BOXPLOT STEMLEAF /COMPARE GROUP /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.
4
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Viewer-Fenster: Ergebnisse (teilweise)
Univariate Statistiken
24,67 ,4123,7925,5524,6925,002,5241,59
22275
3,00-,105 ,580
-1,174 1,12129,80 ,5328,7130,8929,7329,006,9172,63
253611
4,00,430 ,464
-,070 ,902
MittelwertUntergrenzeObergrenze
95% Konfidenzintervalldes Mittelwerts
5% getrimmtes MittelMedianVarianzStandardabweichungMinimumMaximumSpannweiteInterquartilbereichSchiefeKurtosisMittelwert
UntergrenzeObergrenze
95% Konfidenzintervalldes Mittelwerts
5% getrimmtes MittelMedianVarianzStandardabweichungMinimumMaximumSpannweiteInterquartilbereichSchiefeKurtosis
TYPdiploid
tetraploid
SpaltöffnungslängeStatistik Standardfehler
Schnelltest („quick and dirty“) auf Abweichungen von der Normalverteilung: Daten sind mit Normalverteilungsannahme verträglich, wenn sowohl die Schiefe als auch die Kurtosis nicht „signifikant“ von null abweichen. Für nicht zu kleine Stichprobenumfänge vertretbare Näherungen für 95%-Konfidenzintervalle für die Schiefe und Kurtosis erhält man, indem man um den jeweiligen Schätzwert ein Intervall mit dem entsprechenden 2-fachen Standardfehler bildet. Liegt die null außerhalb dieses Intervalls, besteht – mit einem Irrtumsrisiko von 5% - eine signifikante Abweichung von null.
Spaltöffnungslänge Stem-and-Leaf Plot for TYP= diploid Frequency Stem & Leaf 1,00 22 . 0 4,00 23 . 0000 1,00 24 . 0 4,00 25 . 0000 3,00 26 . 000 2,00 27 . 00 Stem width: 1 Each leaf: 1 case(s)
Spaltöffnungslänge Stem-and-Leaf Plot for TYP= tetraploid Frequency Stem & Leaf 1,00 2 . 5 3,00 2 . 677 9,00 2 . 888889999 5,00 3 . 00011 5,00 3 . 22233 1,00 3 . 4 1,00 3 . 6 Stem width: 10 Each leaf: 1 case(s)
5
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
2515N =
TYP
tetraploiddiploid
Spa
ltöffn
ungs
läng
e
38
36
34
32
30
28
26
24
22
20
Grundaufgabe 3: Vergleich einer Wahrscheinlichkeit mit einem Sollwert (Binomialtest) Bei einer Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75% garantiert. In einer Stichprobe von n=60 keimten 35 Zwiebeln. (i) Liegt eine signifikante Abweichung vom garantierten Prozentsatz vor? Man prüfe diese Frage auf dem
Signifikanzniveau α=5%. (ii) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von
90% feststellen zu können? Datei: grund3.sav Lösung: (i) Daten-Fenster: Daten- Fälle gewichten …
6
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Anzeige der Daten (im Viewer): Analysieren – Deskriptive Statistiken – Häufigkeiten ... Einseitiger Binomialtest: H0: p>=0.75, H1: p<0.75 Hauptmenü im Datenfenster: Analysieren – Nichtparametrische Tests – Binomial ... Viewer-Fenster: Ergebnisse
Interpretation: 1-seit.Sign. (= P-Wert) = 0,002 = Risiko für irrtümliche Ablehnung von H0 à H1 (p<0.75)
(ii) Fallzahlenschätzung - Formelauswertungen im Daten-Fenster p_0=0.75, delta = 0.1; z0_95= IDF.NORMAL(1-alpha,0,1) = 1.65, z0_90 = IDF.NORMAL(1-beta,0,1) = 1.28, n = 1/delta**2 *(z0_95*SQRT(p_0*(1-p_0)) + z0_90*SQRT((p_0+delta)*(1-p_0-delta)))**2 ≅ 137 (Transformieren – Berechnen …)
Keimfähigkeit
35 58,3 58,3 58,325 41,7 41,7 100,060 100,0 100,0
1 (ja)2 (nein)Gesamt
GültigHäufigkeit Prozent
GültigeProzente
KumulierteProzente
Test auf Binomialverteilung
ja 35 ,583333 ,75 ,002a,b
nein 25 ,4260 1,00
Gruppe 1Gruppe 2Gesamt
KeimfähigkeitKategorie N
BeobachteterAnteil Testanteil
AsymptotischeSignifikanz(1-seitig)
Nach der alternativen Hypothese ist der Anteil der Fälle in der ersten Gruppe < ,75.a.
Basiert auf der Z-Approximation.b.
7
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Grundaufgabe 4: Vergleich eines Mittelwerts mit einem Sollwert Während der Sommermonate wurden von einer Messstelle die in der folgenden Tabelle enthaltenen Ozonwerte (in ppm/100) erfasst. (i) Man erstelle eine geeignete Häufigkeitsverteilung (grafisch) und beschreibe die Verteilung durch die üblichen
deskriptiven Statistiken. Gibt es einen Grund, die Ozonwerte als nicht normalverteilt zu betrachten? (ii) Man prüfe, ob die durchschnittliche Konzentration signifikant (α= 5%) kleiner als 0.045 ppm ist.
3,6 1,5 6,6 6,0 4,2 6,1 7,6 6,2 6,0 5,5 6,7 2,5 5,4 4,5 5,4 5,8 8,2 3,1 5,8 2,6 2,5 3,0 5,6 4,7 6,5 9,5 3,4 8,8 7,3 1,3 6,7 1,7 5,3 4,6 7,4 6,9 3,2 4,7 3,8 5,9 5,4 4,1 5,1 5,6 5,4 6,6 4,4 5,7 4,5 7,7
Datei: grund04.sav (i) Häufigkeitsverteilung Hauptmenü im Datenfenster: Analysieren- Deskriptive Statistiken- Explorative Datenanalyse … à Viewer-Fenster: Ergebnisse (teilweise) Interpretation: P = Risiko für irrtümliche Ablehnung von H0 (Normalverteilung) ≥ 0,2 (K-S-Test) ≥ 5% à auf 5%igem Testniveau kann H0 nicht abgelehnt werden, d.h. Annahme der Normalverteilung bleibt aufrecht.
Univariate Statistiken
Statistik Standard-
fehler OZON Mittelwert 5,212 ,2619 95% Konfidenzintervall
des Mittelwerts Untergrenze 4,686
Obergrenze 5,738 5% getrimmtes Mittel 5,212 Median 5,400 Varianz 3,429 Standardabweichung 1,8518 Minimum 1,3 Maximum 9,5 Spannweite 8,2 Interquartilbereich 2,500 Schiefe -,116 ,337 Kurtosis -,165 ,662
OZON
9,758,25
6,755,25
3,752,25
,75
Histogramm
Häu
figke
it
20
10
0
Std.abw. = 1,85
Mittel = 5,21
N = 50,00
Tests auf Normalverteilung
Kolmogorov-Smirnov(a) Shapiro-Wilk Statistik df Signifikanz Statistik df Signifikanz OZON ,100 50 ,200(*) ,986 50 ,832
* Dies ist eine untere Grenze der echten Signifikanz. a Signifikanzkorrektur nach Lilliefors
8
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Bearbeitung der Grafik: Doppelklicken auf die Grafik im Viewer-Fenster à Öffnen des Chart-Fensters mit Bearbeitungsoptionen
(ii) Sollwertvergleich H0: mittlere Ozonkonzentration ≥ Sollwert = 4,5 vs. H1: mittlere Ozonkonzentration < Sollwert = 4,5 Hauptmenü: Analysieren- Mittelwerte vergleichen- T-Test bei einer Stichprobe ... Viewer-Fenster: Ergebnisse (teilweise)
Interpretation: Wenn - wie in diesem Beispiel - der Stichprobenmittelwert und der Sollwert im Sinne von H0 zueinander stehen: P = Risiko für irrtümliche Ablehnung von H0 = 1-(2-seit.Sig)/2 = 99,55% à H0 nicht ablehnen.
Statistik bei einer Stichprobe
N Mittelwert Standardabw
eichung
Standardfehler des
Mittelwertes OZON 50 5,212 1,8518 ,2619
Test bei einer Sichprobe
Testwert = 4.5 95% Konfidenzintervall
der Differenz
T df Sig. (2-seitig) Mittlere
Differenz Untere Obere OZON 2,719 49 ,009 ,712 ,186 1,238
9
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Grundaufgabe 5: Mittelwertvergleiche im Rahmen eines Parallelversuchs bzw. eines Paarvergleichs An Hand der Datentabelle (siehe das Daten-Fenster) sollen folgende Fragen untersucht werden (α = 5%): (i) Bewirkt das Testpräparat (Präparat=1) eine mittlere Abnahme Fe1-Fe2 der Zielvariablen (Serumeisen) vom
Zeitpunkt 1 (Variable Fe1) bis zum Zeitpunkt 2 (Variable Fe2), die von der durch das Kontrollpräparat (Präparat=2) verursachten abweicht?
(ii) Zeigt die Zielvariable Serumeisen vom Zeitpunkt 1 (Variable Fe1) bis zum Zeitpunkt 2 (Variable Fe2) im Mittel innerhalb jeder Präparatgruppe eine signifikante Änderung?
Datei: grund05.sav Lösung: (i) Parallelversuch Bereitstellung der Zielvariablen abnahme = Fe1 - Fe2 mit Hilfe von: Transformieren - Berechnen ... à Daten-Fenster Berechnung von deskriptiven Statistiken mit Hilfe von: Analysieren- Berichte- Fälle zusammenfassen ...
10
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Viewer – Fenster: Ergebnisse Prüfung auf Normalverteilung (H0: Daten aus normalverteilter Grundgesamtheit): Zur Anwendung des Tests in einem Arbeitsgang auf beide Gruppen: Daten - Datei aufteilen ...
Zusammenfassung von Fällen
Präparat Alter/ Jahre
Serumeisen, Zeitp.1
Serumeisen, Zeitp.2
AB- NAHME
Test N 8 8 8 8 Mittelwert 23,50 102,62 75,63 27,00 Standardabweichung 3,665 36,229 15,137 31,672 Standardfehler des
Mittelwertes 1,296 12,809 5,352 11,198
Schiefe ,418 -,190 ,662 ,193 Standardfehler der Schiefe
,752 ,752 ,752 ,752
Kurtosis -1,222 -2,077 -,309 -1,341 Standardfehler der Kurtosis
1,481 1,481 1,481 1,481
Kontrolle N 8 8 8 8 Mittelwert 25,13 111,13 72,12 39,00 Standardabweichung 2,167 20,657 24,567 26,987 Standardfehler des
Mittelwertes ,766 7,303 8,686 9,541
Schiefe -,549 -1,210 ,445 -,060 Standardfehler der Schiefe
,752 ,752 ,752 ,752
Kurtosis -,663 2,820 -1,684 -1,451 Standardfehler der Kurtosis
1,481 1,481 1,481 1,481
Ins-gesamt
N 16 16 16 16
Mittelwert 24,31 106,87 73,88 33,00 Standardabweichung 3,027 28,826 19,795 29,093 Standardfehler des
Mittelwertes ,757 7,206 4,949 7,273
Schiefe -,193 -,581 ,324 -,027 Standardfehler der Schiefe
,564 ,564 ,564 ,564
Kurtosis -1,014 -,900 -1,069 -1,275 Standardfehler der Kurtosis
1,091 1,091 1,091 1,091
11
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Ausführung des Tests durch Analysieren- Nichtparametrische Tests– K-S bei einer Stichprobe … Testergebnisse im Viewer-Fenster: Interpretation/Testpräparat: P = Asymptotische Sign. = 0.987 ≥ 5% à Normalverteilungsannahme wird beibehalten Interpretation/Kontrollpräparat: P = Asymptotische Sign. = 0.869 ≥ 5% à Normalverteilungsannahme wird beibehalten Mittelwertvergleich mit dem t-Test für unabhängige Stichproben: H0: mittl. abnahme/Test = mittl. abnahme/Kontrolle vs. H1: mittl. abnahme/Test ≠ mittl. abnahme/Kontrolle Wichtig: vor Anwendung des t-Tests ist die Aufteilung der Datei aufzuheben! (Daten - Datei aufteilen ... /alle Fälle analysieren)
Kolmogorov-Smirnov-Anpassungstest(c) ABNAHME N 8
Mittelwert 27,00 Parameter der Normalverteilung(a,b)
Standardabweichung 31,672
Absolut ,159 Positiv ,159
Extremste Differenzen
Negativ -,141 Kolmogorov-Smirnov-Z ,450 Asymptotische Signifikanz (2-seitig)
,987
a Die zu testende Verteilung ist eine Normalverteilung. b Aus den Daten berechnet. c Präparat = Test Kolmogorov-Smirnov-Anpassungstest(c) ABNAHME N 8
Mittelwert 39,00 Parameter der Normalverteilung(a,b)
Standardabweichung 26,987
Absolut ,211 Positiv ,125
Extremste Differenzen
Negativ -,211 Kolmogorov-Smirnov-Z ,596 Asymptotische Signifikanz (2-seitig)
,869
a Die zu testende Verteilung ist eine Normalverteilung. b Aus den Daten berechnet. c Präparat = Kontrolle
12
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
t-Test für unabhängige Stichproben: Analysieren – Mittelwerte vergleichen – T-Test bei unabhängigen Stichproben ... Testergebnis im Viewer-Fenster:
Interpretation: Varianzvergleich (Levene-Test): P = 0.591≥ 5% à Varianzgleichheit kann angenommen werden. Mittelwertvergleich: P = Risiko für eine irrtümliche Ablehnung von H0 ist 2-seit.Sign. = 42.8% > 5% à H0 (Gleichheit der mittleren Abnahmen) kann nicht abgelehnt werden!
Bestimmung des ß-Fehlers (bzw. der Power): Analysieren- Allgemeines lineares Modell– Univariat ... (Hinweis: "Power = Beobachtete Schärfe" in Optionen aktivieren)
Gruppenstatistiken
Präparat N Mittelwert Standardabw
eichung Standardfehler
des Mittelwertes ABNAHME Test 8 27,00 31,672 11,198 Kontrolle 8 39,00 26,987 9,541
Test bei unabhängigen Stichproben
Levene-Test der Varianzgleichheit T-Test für die Mittelwertgleichheit
F S
igni
fikan
z
T df
Sig
. (2-
seiti
g)
Mitt
lere
D
iffer
enz
Sta
ndar
dfe
hler
der
D
iffer
enz
95% Konfidenzintervall
der Differenz
Untere Obere ABNAHME Varianzen sind
gleich ,302 ,591 -,816 14 ,428 -12,00 14,712 -43,553 19,553
Varianzen sind nicht gleich -,816 13,656 ,429 -12,00 14,712 -43,628 19,628
13
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Ergebnis der Powerberechnung im Viewer-Fenster:
Interpretation: Power (=Schärfe) = 11,9% (PRAEP-Zeile), d.h. Sicherheit, mit dem gewählten Versuchsansatz die Differenz der Mittelwerte 27 (Test ) und 39 (Kontrolle) der Zielvariablen abnahme auf 5%igem Testniveau als signikant zu erkennen, ist zu klein, um eine Entscheidung für H0 zuzulassen. à Versuch neu planen (Stichprobenumfang!)
(ii) Paarvergleich für das Testpräparat (Vergleich der Zielvariablen Fe1 und Fe2) Präparatgruppe 1 (Test) auswählen mit: Daten- Fälle auswählen … (Falls Bedingung “praep=1“ zutrifft) Ergebnis der Datenselektion im Daten-Fenster:
Tests der Zwischensubjekteffekte Abhängige Variable: ABNAHME
Quelle Quadratsumme
vom Typ III df Mittel der Quadrate F Sign. NZP Power(a)
Korrigiertes Modell 576,000(b) 1 576,000 ,665 ,428 ,665 ,119 Konstanter Term 17424,000 1 17424,000 20,127 ,001 20,127 ,986 PRAEP 576,000 1 576,000 ,665 ,428 ,665 ,119 Fehler 12120,000 14 865,714 Gesamt 30120,000 16 Korrigierte Gesamtvariation 12696,000 15
a Unter Verwendung von Alpha = ,05 berechnet b R-Quadrat = ,045 (korrigiertes R-Quadrat = -,023)
14
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Mittelwertvergleich: H0: im Mittel gilt fe1 = fe2 vs. H1: im Mittel gilt fe1 ≠ fe2 t-Test für abhängige Stichproben: Analysieren – Mittelwerte vergleichen – T-Test bei abhängigen Stichproben ... Testergebnis im Viewer-Fenster:
Interpretation: P-Wert = 2-seit.Sig = 4.7% < 5% à H0 (Gleichheit der Mittelwerte) ablehnen. Grundaufgabe 6: Wirksamkeits- u. Äquivalenzprüfung im Rahmen eines Paarvergleichs In einem als randomisierte Versuchsanlage geplanten Experiment wurden 7 Probanden zeitlich hintereinander zwei Präparate (1=Test, 2=Kontrolle) verabreicht, wobei die Zuordnung der Probanden zu den Präparatsequenzen 12 bzw. 21 zufällig erfolgte. Die Zielvariable ist die Halbwertszeit HWZ für die Elimination des jeweiligen Präparates aus dem Blut. Man prüfe (α=5%): (i) Gibt es im Mittel einen Unterschied bezüglich der Zielvariablen (Wirksamkeitsprüfung)? (ii) Sind die Halbwertszeiten im Mittel gleich? (Äquivalenzprüfung, Gleichheit besteht, wenn sich die Halbwertszeiten um
weniger als 20% des Kontrollpräparates unterscheiden.) Datei: grund06.sav Lösung: Datenbeschreibung: Auflisten der Stichprobenwerte und Berechnung von deskriptiven Statistiken mit Hilfe von: Analysieren- Berichte-Fälle zusammenfassen ...
Statistik bei gepaarten Stichproben
Mittelwert N Standardab-
weichung Standardfehler
des Mittelwertes Paaren 1 Serumeisen, Zeitp.1 102,63 8 36,229 12,809 Serumeisen, Zeitp.2 75,63 8 15,137 5,352
Test bei gepaarten Stichproben
Gepaarte Differenzen T df Sig. (2-seitig)
Mittel-wert STD SEM
95% Konfidenzintervall
der Differenz
Untere Obere Paaren 1 Serumeisen, Zeitp.1 -
Serumeisen, Zeitp.2 27,00 31,672 11,198 ,52 53,48 2,411 7 ,047
15
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Ergebnisse (Stichproben, deskriptive Statistiken) Im Viewer: (i) Wirksamkeitsprüfung mit dem t-Test für abhängige Stichproben
H0: Die Halbwertszeiten der Präparate stimmen im Mittel überein H1: Die Halbwertszeiten der Präparate sind im Mittel verschieden
t-Test für abhängige Stichproben: Analysieren – Mittelwerte vergleichen – T-Test bei gepaarten Stichproben ... Ergebnis (bearbeitet) im Viewer:
Interpretation: P = 2-seit.Sig. = 4,6% < 5% à Die beobachtete Mittelwertdifferenz (Test-Kontrolle) von -0.4757 ist auf 5%igem Testniveau signifikant.
Zusammenfassung von Fällen(a)
Halbwertszeit-
Testpräp. Halbwertszeit-Kontrollpräp.
1 1,50 1,95 2 1,92 2,05 3 1,43 2,46 4 1,68 2,88 5 1,97 2,52 6 2,01 1,80 7 1,85 2,03
N 7 7 Mittelwert 1,7657 2,2414 Standardabweichung ,23201 ,38607
Standardfehler des Mittelwertes ,08769 ,14592
Schiefe -,558 ,670 Standardfehler der Schiefe ,794 ,794
Kurtosis -1,589 -,713
Insgesamt
Standardfehler der Kurtosis 1,587 1,587
a Begrenzt auf die ersten 100 Fälle.
Statistik bei gepaarten Stichproben Mittelwert N STD SEM Paaren 1 Halbwertszeit
-Testpräp. 1,7657 7 ,23201 ,08769
Halbwertszeit-Kontrollpräp. 2,2414 7 ,38607 ,14592
Test bei gepaarten Stichproben
Gepaarte Differenzen T df Sig. (2-seitig)
Mittel-wert STD SEM
95% Konfidenzintervall
der Differenz
Untere Obere Paaren 1 Halbwertszeit-
Testpräp. - Halbwertszeit-Kontrollpräp.
-,4757 ,50252 ,18994 -,9405 -,0110 -2,505 6 ,046
16
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
(ii) Äquivalenzprüfung H0: absolute Differenz der mittleren Halbwertszeiten ≥ vorgegebener relevanter Unterschied D
(z.B. 20% des Mittels des Kontrollpräparates) H1: absolute Differenz der mittleren Halbwertszeiten < D
(in diesem Fall sind die Präparate äquivalent) Westlake-Verfahren:
H0 wird auf dem Niveau α abgelehnt (d.h. für die Äquivalenz der Präparate entschieden), wenn das (1-2α)-Konfidenzintervall der Mittelwertdifferenz im Toleranzintervall (-D, +D) liegt.
t-Test für abhängige Stichproben: Analysieren – Mittelwerte vergleichen – T-Test bei gepaarten Stichproben ... Hinweis: Konfidenzintervall auf 90% einstellen (Optionen)! Ergebnisse (bearbeitet)im Viewer:
Interpretation: Stichprobenmittel des Kontrollpräperat ist 2.414; D (=20% von 2.414) = 0.448; Toleranzintervall für die Äquivalenz = (-0.448, +0.448); 90%-Konfidenzintervall für die Mittelwertdifferenz ist nicht im Toleranzintervall enthalten à keine Äquivalenz
Grundaufgabe 7: Chiquadrat-Test für diskrete Verteilungen Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis von 9 : 3 : 3 : 1? (α = 5%) Datei: grund07.sav Lösung: Daten-Fenster: Zielvariable = phaeno (Werte 1=rund/gelb usw.), Gewichtung der Fälle mit Hilfsvariabler freq beachten!
Test bei gepaarten Stichproben
Gepaarte Differenzen T df Sig. (2-seitig)
Mittel-wert STD SEM
90% Konfidenzintervall
der Differenz
Untere Obere Paaren 1 Halbwertszeit-
Testpräp. - Halbwertszeit-Kontrollpräp.
-,4757 ,50252 ,18994 -,8448 -,1066 -2,505 6 ,046
17
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Hypothesen: H0: die Phänotypen treten mit Wahrscheinlichkeiten im Verhältnis 9:3:3:1 auf vs. H1: die Phänotypen treten mit Wahrscheinlichkeiten in einem von 9:3:3:1 abweichenden Verhältnis auf. Chiquadrat-Test zur Prüfung auf ein vorgegebenes Verhältnis: Analysieren- Nichtparametrische Tests- Chi-quadrat ... Ergebnisse im Viewer:
Interpretation: P = Asymptotische Signifikanz = 92,5% ≥ 5%à H0 kann nicht abgelehnt werden.
Grundaufgabe 8: Vergleich von zwei Wahrscheinlichkeiten (mit unabhängigen Stichproben) Es ist zu untersuchen, ob die Düngung (Mineral- bzw. Tresterkompostdüngung) einen Einfluss auf den Pilzbefall (Falscher Mehltau) von Weinstöcken (Vitis vinifera) hat oder nicht. Dazu werden 39 mineralgedüngte Weinstöcke beobachtet, und es wird dabei festgestelltet, dass in 6 Fällen ein starker Befall (Ausprägung 1) zu verzeichnen ist, in den restlichen 33 Fällen nur ein schwacher bzw. überhaupt keiner (Ausprägung 0). Parallel dazu werden 39 tresterkompostgedüngte Weinstöcke untersucht mit dem Ergebnis, dass in 23 Fällen ein starker Befall (Ausprägung 1) und in 16 Fällen ein schwacher bis nicht erkennbarer Befall (Ausprägung 0) vo rhanden war. (α = 5%) Datei: grund08.sav Lösung: Daten-Fenster: Zielvariable = pilz, Gruppierungsvariable = dueng, Hilfsvariable = freq (zur Gewichtung der Fälle mit den beobachteten Häufigkeiten)
Phänotyp
Beobachtetes
N Erwartete
Anzahl Residuum rund/gelb 315 312,8 2,3 rund/grün 108 104,3 3,8 kantig/gelb 101 104,3 -3,3 kantig/grün 32 34,8 -2,8 Gesamt 556
Statistik für Test Phänotyp Chi-Quadrat(a) ,470 df 3 Asymptotische Signifikanz ,925
a Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 34,8.
18
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Hypothesen: H0: Befallrisiko ist unabhängig von der Düngung vs. H1: Befallrisiko ist abhängig von der Düngung. Chi-Quadrat-(Homogenitäts-)Test: Analysieren- Deskriptive Statistiken– Kreuztabellen ... Im Fenster „Kreuztabellen: Statistik“ „Chi-Quadrat“ aktivieren … Im Fenster „Kreuztabellen: Zellen“ folgende Einstellungen vornehmen …
19
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Ergebnisse (teilweise) im Viewer:
Interpretation: P = 2-seitige Signifikanz = 0,000 (näherungsweise, Chi-Quadrat nach Pearson) < 0.05 à H0 ablehnen; Exakter Test (nach Fisher): P = 2-seitige exakte Signifikanz = 0.000 < 0.05 à H0 ablehnen.
Grundaufgabe 9: McNemar-Test zum Vergleich von zwei Wahrscheinlichkeiten (mit abhängigen Stichproben) Bei einer Studie wurde u.a. das Ges.Eiweiß i.S. zu Beginn und am Ende bestimmt. Es ergab sich, dass bei 22 Probanden der Eiweißwert vor und nach Ende der Studie im Normbereich lag, bei 12 Probanden lag der Wert vorher im Normbereich und nachher außerhalb, bei 7 Probanden vorher außerhalb und nachher im Normbereich und bei 4 vorher und nachher außerhalb des Normbereichs. Hat sich während der Studie eine signifikante Änderung hinsichtlich des Normbereichs ergeben? (α = 5%) Datei: grund09.sav Lösung: Daten-Fenster: Zielvariablen = beginn, ende, Hilfsvariable = freq (zur Gewichtung der Fälle mit den beobachteten Häufigkeiten)
Pilzbefall * Düngung Kreuztabelle
Düngung Mineral Trester Gesamt
Anzahl 33 16 49 Erwartete Anzahl 24,5 24,5 49,0
nein
% von Düngung 84,6% 41,0% 62,8%
Anzahl 6 23 29 Erwartete Anzahl 14,5 14,5 29,0
Pilzbefall
ja
% von Düngung 15,4% 59,0% 37,2%
Anzahl 39 39 78 Erwartete Anzahl 39,0 39,0 78,0
Gesamt
% von Düngung 100,0% 100,0% 100,0%
Chi-Quadrat-Tests
Wert df
Asymptotische Signifikanz (2-
seitig)
Exakte Signifikanz (2-seitig)
Exakte Signifikanz (1-seitig)
Chi-Quadrat nach Pearson 15,863(b) 1 ,000
Kontinuitätskorrektur(a) 14,052 1 ,000 Likelihood-Quotient 16,656 1 ,000 Exakter Test nach Fisher ,000 ,000 Zusammenhang linear-mit-linear 15,660 1 ,000
Anzahl der gültigen Fälle 78 a Wird nur für eine 2x2-Tabelle berechnet b 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 14,50.
20
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Hypothesen: H0: p(im Normbereich/vorher à außerhalb/nachher) = p(außerhalb/vorher à im Normbereich/nachher) H1: p(im Normbereich/vorher à außerhalb/nachher) ≠ p(außerhalb/vorher à im Normbereich/nachher) McNemar-Test zur „Messung“ von Veränderungen: Analysieren- Nichtparametrische Tests- 2 verbundene Stichproben- McNemar ... Ergebnisse im Viewer:
Interpretation: P = Exakte Signifikanz (2-seitig) = 35,9% ≥ 5% à H0 kann nicht abgelehnt werden.
Grundaufgabe 10: Prüfung auf Abhängigkeit (nominale Daten) Die Wirksamkeit einer Behandlung wurde einerseits durch den Probanden und andererseits durch den Prüfarzt beurteilt. Man beschreibe den Zusammenhang zwischen den Beurteilungen mit einem geeigneten Korrelationsmaß. Wie groß sind die bei einer angenommenen Unabhängigkeit zu erwartenden absoluten Häufigkeiten? Ist die Korrelation signifikant von Null verschieden? (α = 5%) Datei: grund10.sav Lösung: Daten-Fenster: Zielvariable: proband, arzt, Hilfsvariable freq (zur Gewichtung der Fälle mit den beobachteten Häufigkeiten)
Behandlungsbeginn & Behandlungsende
Behandlungsende Behandlungsbeginn 1 2 1 22 12 2 7 4
Statistik für Test(b)
Behandlungsbeginn &
Behandlungsende
N 45 Exakte Signifikanz (2-seitig) ,359(a)
a Verwendetete Binomialverteilung. b McNemar-Test
21
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Hypothesen: H0: die Variablen proband (Beurteilung durch Probanden) und arzt (Beurteilung durch den Prüfarzt) sind unabhängig H1: die Variablen proband und arzt sind abhängig. Abhängigkeitsprüfung mit dem Chi-Quadrat-Test: Analysieren- Deskriptive Statistiken- Kreuztabellen … Im Fenster „Kreuztabellen: Statistik“ „Chi-Quadrat“ und „Phi und Cramer-V“ aktivieren … Im Fenster „Kreuztabellen: Zellen“ die folgenden Einstellungen vornehmen …
22
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Ergebnisse (teilweise) im Viewer:
Interpretation: (unter H0) erwartete Häufigkeiten: siehe Erwartete Anzahl. Interpretation: P = asymptotische Signifikanz (2-seitig, Chi-Quadrat nach Pearson) = 0,000 < 0,05 à H1
Korrelationsmaß: Cramer-V = 0,41 (sign. ≠ 0)
Chi-Quadrat-Tests
Wert df Asymptotische
Signifikanz (2-seitig) Chi-Quadrat nach Pearson 25,215(a) 4 ,000
Likelihood-Quotient 24,045 4 ,000 Zusammenhang linear-mit-linear 17,358 1 ,000
Anzahl der gültigen Fälle 75
a 2 Zellen (22,2%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 4,53.
Symmetrische Maße
Wert Näherungsweise
Signifikanz Nominal- bzgl. Nominalmaß
Phi ,580 ,000
Cramer-V ,410 ,000 Anzahl der gültigen Fälle 75
a Die Null-Hyphothese wird nicht angenommen. b Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet.
Beurteilung d. Proband * Beurteilung d. Prüfarzt Kreuztabelle
Beurteilung d. Prüfarzt sehr gut gut mäßig Gesamt
Anzahl 23 7 3 33 Erwartete Anzahl 14,1 11,4 7,5 33,0
sehr gut
% von Beurteilung d. Prüfarzt
71,9% 26,9% 17,6% 44,0%
Anzahl 5 13 4 22 Erwartete Anzahl 9,4 7,6 5,0 22,0
gut
% von Beurteilung d. Prüfarzt
15,6% 50,0% 23,5% 29,3%
Anzahl 4 6 10 20 Erwartete Anzahl 8,5 6,9 4,5 20,0
Beurteilung d. Proband
mäßig
% von Beurteilung d. Prüfarzt
12,5% 23,1% 58,8% 26,7%
Anzahl 32 26 17 75 Erwartete Anzahl 32,0 26,0 17,0 75,0
Gesamt
% von Beurteilung d. Prüfarzt
100,0% 100,0% 100,0% 100,0%
23
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Grundaufgabe 11: Prüfung auf Abhängigkeit bei metrischen Variablen und lineare Regression In einer Stichprobe von 10 Frauen wurden der Blutdruck (mm Hg)und das Alter registriert (Daten siehe folgende Tabelle). Kann man vom Alter im Rahmen eines linearen Regressionsmodells auf den Blutdruck schließen? (α = 5%) Datei: grund11.sav Lösung: Daten-Fenster: Abhängige Variable blut, unabhängige Variable alt Darstellung der Abhängigkeit im Streudiagramm mit Hilfe von Grafiken- Streudiagramm … Streudiagramm-Einfach-Definieren …
24
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Ergebnis im Viewer … Interpretation: Lineares Modell (Gerade) zur Beschreibung der Abhängigkeit Ist passsend; Anstieg der Geraden ≠ 0, Frage: Ist der Anstieg „signifikant“ von null verschieden? (Nur dann hängt der Blutdruck vom Alter ab.) Hinweis: Bearbeitung der Grafik durch Doppelklicken auf die Grafik à Chart-Fenster z.B. Einzeichnen der Regressionsgeraden: Diagramme-Optionen …
… Optionen für Streudigramme: Anpassungslinie- Gesamt- Anpassungsoptionen …
Alter/Jahre
706050403020
Blut
druc
k (m
m H
g)
150
140
130
120
110 R-Qu. = 0.8689
25
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Abhängigkeitsprüfung - Variante 1: Test auf Abweichung von der Nullkorrelation mit H0: (Pearson-)Korrelation ρ = 0 vs. H1: ρ ≠ 0 Analysieren- Korrelation- Bivariat … … Ergebnis im Viewer: Interpretation: P = Signifikanz (2-seitig) = 0,000 < 0.05 à H1 (Abhängigkeit) Abhängigkeitsprüfung - Variante 2: Test im Rahmen des einfachen linearen Regressionsmodells mit H0: Geradenanstieg β1 = 0 (Modell: Blitdruck = β1 * Alter + β0 + Fehler) Analysieren- Regression- Linear …
Korrelationen
Alter/Jahre Blutdruck (mm Hg)
Korrelation nach Pearson 1 ,932(**)
Signifikanz (2-seitig) . ,000
Alter/Jahre
N 10 10 Korrelation nach Pearson ,932(**) 1
Signifikanz (2-seitig) ,000 .
Blutdruck (mm Hg)
N 10 10 ** Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant.
26
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
… Lineare Regression- Statistiken … … Ergebnisse (teilweise) im Viewer …
Interpretation: R-Quadrat = 86,9% = durch Alter erklärter Anteil der Variation der Blutgruppe
Interpretation: Geradenanstieg b1 = 0,616 signifikant ungleich null (P = Signifikanz = 0,000 < 0,05) à Regressionsgleichung: Blutdurck = 100,679 + 0,616*Alter
Deskriptive Statistiken
Mittelwert Standardabw
eichung N Blutdruck (mm Hg) 127,90 7,909 10 Alter/Jahre 44,20 11,970 10
Modellzusammenfassung
Modell R R-Quadrat Korrigiertes R-
Quadrat Standardfehler des Schätzers
1 ,932(a) ,869 ,853 3,037 a Einflußvariablen : (Konstante), Alter/Jahre
Koeffizienten(a)
Modell Nicht standardisierte
Koeffizienten
Standardisierte
Koeffizienten T Signifikanz
B Standardfe
hler Beta 1 (Konstante) 100,679 3,860 26,086 ,000 Alter/Jahre ,616 ,085 ,932 7,282 ,000
a Abhängige Variable: Blutdruck (mm Hg)
27
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Grundaufgabe 12: 1-faktorielle Varianzanalyse (Globaltest, Varianzhomogenität, multiple Mittelwertvergleiche) Man vergleiche an Hand der Beobachtungsreihen in der folgenden Tabelle die Mg-Konzentration zwischen den Lösungen 1, 2 und 3. Bestehen zwischen den Lösungen signifikante Mittelwertunterschiede? Man führe die Aufgabe auch mit den K- und Ca-Konzentrationen durch. (α = 5%) Datei: grund12.sav Lösung: Daten-Fenster: Zielvariable: mg (bzw. k, ca), Gliederungsmerkmal (Faktor) loesung Abhängigkeitsprüfung im Rahmen der 1-faktoriellen ANOVA: (abhängige Variable mg, unabhängige Variable loesung; deskriptive Statistiken, Globaltest, Prüfung der Varianzhomogenität, multiple Mittelwertvergleiche) Analysieren- Mittelwerte vergleichen- Einfaktorielle ANOVA ...
28
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
… Einfaktorielle ANOVA- Optionen … … EInfaktorielle ANOVA- Post Hoc … … Ergebnisse im Viewer …
Interpretation: H0: Varianzen der Zielvariablen mg stimmen für die drei Lösungen überein; P= Sign. =0,082 à kein Grund für Ablehnung von H0
ONEWAY deskriptive Statistiken Magnesium
N Mittelwert STD SEM 95%-Konfidenzintervall für
den Mittelwert Minimum Maximum
Untergrenze Obergrenze 1.5K, 0.75Ca 6 232,83 26,888 10,977 204,62 261,05 185 256 1.5K, 3.75Ca 6 175,67 18,107 7,392 156,66 194,67 155 203 7.5K, 0.75Ca 6 162,50 38,025 15,524 122,60 202,40 121 216 Gesamt 18 190,33 41,487 9,779 169,70 210,96 121 256
Test der Homogenität der Varianzen Magnesium
Levene-Statistik df1 df2 Signifikanz
2,968 2 15 ,082
29
W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04
Interpretation (Globaltest): H0: Zielvariable mg im Mittel vom Faktor (loesung) unabhängig; P = Sign. (Zwischen den Gruppen)= 0,002 à Faktorwirkung ist signifikant
Interpretation: Der Mittelwert auf der Faktorstufe "1.5K, 0.75Ca" weicht auf dem Testniveau 5% signifikant von den anderen Faktorstufenmittelwerten ab
Diagramm der Mittelwerte
ONEWAY ANOVA Magnesium
Quadratsu
mme df Mittel der Quadrate F Signifikanz
Zwischen den Gruppen 16776,333 2 8388,167 10,079 ,002 Innerhalb der Gruppen 12483,667 15 832,244 Gesamt 29260,000 17
Nährlösung
7.5K, 0.75Ca1.5K, 3.75Ca1.5K, 0.75Ca
Mitt
elwe
rt vo
n M
agne
sium
240
220
200
180
160
140
Mehrfachvergleiche Abhängige Variable: Magnesium Scheffé-Prozedur
95%-Konfidenzintervall
(I) Nährlösung (J) Nährlösung Mittlere
Differenz (I-J) Standardfe
hler Signifikanz Untergrenze Obergrenze 1.5K, 3.75Ca 57,17(*) 16,656 ,013 11,97 102,37 1.5K, 0.75Ca 7.5K, 0.75Ca 70,33(*) 16,656 ,003 25,13 115,53
1.5K, 3.75Ca 1.5K, 0.75Ca -57,17(*) 16,656 ,013 -102,37 -11,97 7.5K, 0.75Ca 13,17 16,656 ,736 -32,03 58,37 7.5K, 0.75Ca 1.5K, 0.75Ca -70,33(*) 16,656 ,003 -115,53 -25,13 1.5K, 3.75Ca -13,17 16,656 ,736 -58,37 32,03
* Die mittlere Differenz ist auf der Stufe .05 signifikant.
Magnesium Scheffé-Prozedur
Untergruppe für Alpha = .05.
Nährlösung N 1 2 7.5K, 0.75Ca 6 162,50 1.5K, 3.75Ca 6 175,67 1.5K, 0.75Ca 6 232,83 Signifikanz ,736 1,000
Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a Verwendet ein harmonisches Mittel für Stichprobengröße = 6,000.
Top Related