Konrad, Lisa - Biostatistik

download Konrad, Lisa - Biostatistik

of 36

Transcript of Konrad, Lisa - Biostatistik

Biostatistik Lisa Konrad Inhaltsverzeichnis 1.Deskriptive (=beschreibende) Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Der Begriff Merkmal und die Einteilung von Merkmalen . . . . . . . . . . . . . . . . . . . . . . . . . . .Einteilung der Merkmale nach Skalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Einteilung der Merkmale mit den Begriffen qualitativ und quantitativ . . . . . . . . . . . . . . . . . . . .Einteilung der Merkmale mit den Begriffen diskret und kontinuierlich . . . . . . . . . . . . . . . . . . . 1.2 Darstellung der Daten in Tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Graphische Darstellung von Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Kreisdiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Balkendiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Histogramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Polygon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Verteilungsformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Formmae von Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Statistische Kennwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1.6.1Lageparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Modalwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Median . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Arithmetischer Mittelwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Gewogenes arithmetisches Mittel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Box-and-Whiskers-Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . 1 1 1 1 1 2 2 2 3 3 4 4 5 5 5 5 5 6 6 TEIL A Theorie & Formeln 1.6.2Streuungsparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Eveness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Spannweite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Interquartilabstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Standardabweichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Variationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Standardfehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Merkmalsverteilung Klassifizierte Hufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .absolute Hufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .relative Hufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .absolute Summenhufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .relative Summenhufigkeit) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Wahrscheinlichkeitstheorie und Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1.8.1Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1.8.2Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Chi (X) Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Gleichverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9 Korrelation und Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Korrelationsanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Korrelationskoeffizient nach Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der kritische Wert r* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Regressionsanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Rangkorrelationskoeffizient nach Spearman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die erklrte Varianz r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 9 9 9 10 10 10 11 11 12 13 13 13 2.induktive (=schlieende) Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Anpassungstests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.1.1 Anpassung an eine Normalverteilung & X-Anpassungstest. . . . . . . . . . . . . . . . . . . . . . . .2.1.2 Anpassung an eine Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.1.3 Anpassung an eine Gleichverteilung & Chi-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Statistische Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.2.1 Chi-Test bei der Logarithmischen Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.2.2 Kolmogorov-Smirnov-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.2.3 t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .t-Test fr unverbundene Stichproben . . . . . . . . . . . . . . . . . . . . . . . . . . . .t-Test fr verbundene Stichproben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14 14 15 17 18 18 19 20 20 20 21 11.Deskriptive (=beschreibende) Statistik Die beschreibende (deskriptive) Statistik befasst sich mit der Untersuchung und Beschreibung, mglichst der ganzen, Grundgesamtheit. Grundgesamtheit: alle zu untersuchenden Daten (z.B. gesamte Schafsherde; nicht nur Stichproben) 1.1Der Begriff Merkmal und die Einteilung von Merkmalen Merkmal: Eigenschaft, die fr die statistische Auswertung relevant ist. Einteilung der Merkmale nach Skalen Nominalskala:Klassifizierung;MerkmalebekommenzurUnterscheidungeine fortlaufende Zahl zugeordnet Ordinalskala (= rating & ranking scales): Wertung der Merkmalsausprgungen mittels Rangfolge (z.B. nach Schulnotensystem oder -- bis ++) Metrische Skalen:oIntervallskala:AbstndederMerkmalsausprgungenknnendurch eine Skala erfasst werden. Intervallskalen besitzen keinen absoluten Nullpunkt. oVerhltnisskala: kann auch die Quotienten (Verhltnisse) vergleichen und hat einen eindeutig festgelegten Nullpunkt. Einteilung der Merkmale mit den Begriffen qualitativ und quantitativ qualitative (artmige) Merkmale: z.B. nominalskalierte Daten quantitative (zahlenmige) Merkmale: z.B. metrisch skalierte Daten semiquantitativeMerkmale:ordinalskalierteDaten,daeineeindeutigeZuordnungzu qualitativen bzw. quantitativen Merkmalen oft nicht mglich ist. Einteilung der Merkmale mit den Begriffen diskret und kontinuierlich diskrete (diskontinuierliche) Merkmale: knnen nur bestimmte Werte annehmen (z.B. Zhlung von ; meist ganze Zahlen) stetige(kontinuierliche)Merkmale:knnenbeliebigeWerteannehmen(z.B. gemessene Lngen; Dezimalzahlen) 1.2Darstellung der Daten in Tabellen Messdaten (mit fortlaufenden Nummern markiert) in Tabelle spaltenweise eintragen Bestimmung der Klassenanzahl (m):Informationsgehalt steigt m nn .. Anzahl der Werte (Messdaten) 2Bestimmung der Klassenbreite: oVariationsbreite (=Spannweite) festlegen: V = Max Min oKlassengrenzen sinnvoll setzen dabei beachten: Klassen sollen disjunkt sein (d.h. alle Werte untergebracht) Klassen sollen gleich gro sein Randklassenknnennachoben/untenoffengelassenwerden, damitAusreierdieStatistiknichtverflschen.Meistensfgtman jedocheineweitereKlassefrAusreierhinzu(auch,wenndann die Zahl der Klassen hher ist als die Berechnete). oKlassenbreite berechnen: Spannweite / Klassenzahl 1.3Graphische Darstellung von Daten Kreisdiagramm: nominal-, ordinalskalierte Daten 496.051; 23%641.923; 29%169.829; 8%363.341; 17%205.492; 10%189.672; 9%62.881; 3%113; 0%26.145; 1%WienBurgenlandNiedersterreichObersterreichSalzburgSteiermarkKrntenTirolVorarlberg dargestellt ist hier ein Kreisdiagramm. Es werden Werte und Anteile angezeigt. Einstellbar bei Diagrammoptionen Das Balkendiagramm: Hufigkeitsdiagramm relative nichtkumulierte Hufigkeit051015202530[0,2 - 2) [2 - 3,8) [3,8 - 5,6) [5,6 - 7,4) [7,4 - 9,2) [9,2 - 11,9]KlassenHufigkeit 3Histogramm: Klassen sind untereinander verbunden (kein Abstand zw. den Balken) Wenn die Breite jeder Klasse auf den Wert 1 standardisiert ist, entspricht die Flche unter der Histogrammkurve der Anzahl der Messwerte 0246810121416(18-25] (25-32] (32-39] (39-46] (46-53] (53-60] (60-67)Inkubationszeit (Tagen)Anzahlh(x)f(x) oSummenhistogramm:DieSummenhufigkeiten(Hi)werden aufgetragen) absolute Summenhufigkeit (kumulierte Hufigkeit)0102030405060[ 18-21) [ 21-24) [ 24-27) [ 27-30) [ 30-33) [ 33-36) [ 36-39]Al t eri nJahrenH(x) Polygon: die Hufigkeiten ber den Klassenmitten werden abgetragen und verbunden und man fgt vorne und hinten noch einer Leerklasse hinzu. 0246810121 2 3 4 5 6 7 8 9 10 11 12 oSummenpolygon:DieSummenhufigkeitenwerdenberdem jeweiligenEndederKlasseabgetragenundverbunden.Eswird zustzlichnochvorneund hinteneineLeerklasse hinzugefgt.DieFunktion,die das Polygon beschreibt, verluft unter dem Summenhistogramm. dargestellt ist hier ein Histogramm kombiniert mit einer angepassten Fuktion Darstellungsmglichkeit mit der Diagrammoption Sule-Linie Zustzlich wurde die Funktion noch geglttet. Zu finden bei Diagrammoptionen 41.4Verteilungsformen unimodal: eingipflig bimodal: zweigipflig multimodal: mehrgipflig 1.5Formmae von Verteilungen GraphischeDarstellungenvonVerteilungenlassenschnellerkennen,welcheFormdieVerteilung besitzt:symmetrischoderasymmetrisch,eingipfligodermehrgipflig,normalverteiltodernicht normalverteilt. Die Formae g1 und g2 geben bei metrischen Datenvon Stichproben diesbezgliche Informationen. Die Schiefe, g1, ist nur bei eingipfligen Hufigkeitsverteilungen sinnvoll zu berechnen. Sie beschreibt den Grad der Unsymmetrie von Verteilungen: Formel:g11n1nixim ( )3=s3 n Anzahl der Messwerte xi Messwerte m arithmetischer Mittelwert s .. Standardabweichung g1 = 0symmetrische Verteilung g1 < 0linksschiefe (rechtssteil) Verteilung g1 > 0rechtsschiefe (linkssteil) Verteilung DieWlbung,g2auchKurtosisoderExzess,dientzurBeschreibungvonVerteilungen,diezwar symmetrisch sind, aber schmaler (steilgipfliger) als die Normalverteilung verlaufen oder aber flacher (oder sogar u-frmig) sind. Formel:g21n1nixim ( )4=s43 n Anzahl der Messwerte xi Messwerte m arithmetischer Mittelwert s .. Standardabweichung g2 < 0Verteilung flacher oder u-frmig g2 > 0Verteilung schmaler und steiler rechtsschief linksschief 5Beispiele, und der Grund, warum g1 bei Normalverteilung und u-frmigen Verteilungen sinnlos ist: 01020304050601 3 5 7 9 11 13 15 17 19xHufigkeit 01020304050601 3 5 7 9 11 13 15 17 19xHufigkeit 1.6Statistische Kennwerte Lageparameter oModalwert:Anwendung:beiNominaldaten,ordin.u.metr.Datenmitmultimodaler Verteilung.Definiton:DerModalwertistderamhufigstenineinerListe(Grund-gesamtheit) auftretende Wert. EXCEL-Funktion: =MODALWERT() oMedian:Anwendung: bei metrisch- und nominalskalierten Daten. Definition:gleichvieleMesswerteliegenoberhalbundunterhalbdieser Zahl.BeieinerungeradenAnzahlanMesswertenentsprichtdieserWertdem mittleren Wert. Besondere Eigenschaft: ist robust gegen Ausreier. EXCEL-Funktion: =MEDIAN() oArithmetischer Mittelwert:Anwendung: fr metrische Daten Defnition: Summe aller Messwerte, geteilt durch die Anzahl der Messwerte Formel:m1n1nixi= BesondereEigenschaft:sehrempfindlichgegenAusreier.Schonein falscher Wert kann den Mittelwert dramatisch verndern. EXCEL-Funktion: =MITTELWERT() g1 = -0,302 g2 = 1,21 g1 = -0,043 g2 = -1,58 6Auswirkungen der 3 oben genannten Lageparameter auf eine Glockenkurve: oGewogenes arithmetisches Mittel: wird angewandt, wenn der Mittelwert von mehreren UntersuchungenmitverschiedenerAnzahlvonMesswertenermitteltwerdensoll. DabeimussmansichnachderjeweiligenAnzahlrichten(dabeiwirdmitderAnzahl multipliziert). Formel:m1n1nini mi( )= Box-and-Whiskers-Plot Der Box-and-Whiskers-Plot zeigt, ob die Verteilung symmetrisch oder asymmetrisch ist,wo der Median liegt, wie gro die Spannweite ist und in welchem Bereich 50% der Messwerte liegen. Die Box begrenzt das erste und das dritte Quartil (Q3 Q1) und beinhaltet 50% der Messwerte, whrend dieSpannweitesowiesoerstesundviertesQuartilabgrenzt.DieSpannweitewirdmitStrichen dargestellt auch als Whiskers (Schnurrhaare) bezeichnet. Ist der Median (Linie in der Box) der oberen Boxbegrenzung nher, so ist die Verteilung rechtssteil. 7Streuungsparameter:oEveness(Homogenittsindex):beschreibt,wieunterschiedlichdieAusprgungen einesnominalskaliertenMerkmalssind.DerIndexerreichtdenWert1,wennalle Kategoriengleichstarkbesetztsind(Gleichverteilung).WennalleWerteinder gleichen Kategorie liegen, nimmt der Wert 0 an. oSpannweite (=Variationsbreite): V = xmax xmin oInterquartilabstand:Quartil: Teilung der ansteigend sortierten Messwerte in 4 Klassen. 1.Quartil: enthlt 25% der Messwerte 2.Quartil: enthlt 50% der Messwerte 3.Quartil: enthlt 75% der Messwerte 4.Quartil: enthlt 100% der Messwerte I50 = Q3 Q1 EXCEL-Funktion: =QUARTILE(Daten;Qx) Quantil: x-viele Klassen EXCEL-Funktion: =QUANTIL(Daten;%) oVarianz:Formel:2 1n 1 1nixim ( )2= EXCEL-Funktion: =VARIANZ() oStandardabweichung: je kleiner , desto homogener ist die Stichprobe Formel: 2 EXCEL-Funktion: =STABW() oVariationskoeffizient:beschreibtdieamarith.Mittelwertrelativierte Standardabweichung Formel:cvm oStandardfehler:Formel:sxn 100% = 1 50% = 0,5 8 1.7Merkmalsverteilung Klassifizierte Hufigkeiten Klassifizierte Hufigkeit (=absolute Hufigkeit): hi = Anzahl der Messwerte in Klasse i EXCEL-Funktion: Spalten, in dies reinkommen soll, markieren, dann oben in der Leiste wo f(x)= steht: =HUFIGKEIT(Daten;Klassenobergrenzen) + Crtl. + SHIFT + ENTER &DatenmitF4fixieren,dannENTERdrckenund runterziehen. Prozentuale klassifizierte Hufigkeit (=relative Hufigkeit):Formel:hi%hin100 KlassifizierteSummenhufigkeit(=absolute/kumulierteHufigkeit):AnzahlderMesswertebis einschlielich Klasse i. EXCEL-Funktion:=HUFIGKEIT(Daten;Klassenobergrenze),dannENTERdrckenund runterziehen. Formel:Hi1ijhj= ProzentualeklassifizierteSummenhufigkeit(=relativeSummenhufigkeit):prozentualerAnteil der Messwerte bis inklusive Klasse i. Formel:Hi%Hin100 ACHTUNG:oAusreier beeinflussen die Statistik oBeinominalskaliertenMerkmalenistdieBerechnungvonSummenhufigkeitennicht sinnvoll 1.8Wahrscheinlichkeitstheorie und Verteilungen Diskrete Verteilungen: oBinomialverteilung:DieBinomialverteilungergibtsichausdemBernouli-Versuch,derdieFrage beantwortet, wie oft ein Ereignis eintritt. Dieser Versuch ist n-mal reproduzierbar. IstdieberechneteWahrscheinlichkeit1,sohatman(zu100%)Erfolg,istdie berechnete Wahrscheinlichkeit jedoch 0, so hat man einen Misserfolg (=0% Erfolg). absolute Summenhufigkeit (kumulierte Hufigkeit)0102030405060[ 18-21) [ 21-24) [ 24-27) [ 27-30) [ 30-33) [ 33-36) [ 36-39]Al t er i nJahr enH(x)024681012141 2 3 4 5 6 7 8 9 109Formel:PX k ( )nk|

\||pk 1 p ( )n k nk|

\||n!k! n k ( )! n Anzahl der Wiederholungen k Zahl der Erfolge pWahrscheinlichkeit,dasseingewnschtes Ereignis eintritt P errechnete Wahrscheinlichkeit P(X = k)genauPX k ( )nk|

\||pk 1 p ( )n k P(X k)max. PX k ( )0kiPiX ki( )= P(X k)mind.PX k ( ) 1 PX k 1 ( ) [ ] EXCEL-Funktion: =BINOMVERT(k;n;p; 0 od. 1) oPoissonverteilung: DiePoissonverteilungwirddannangewandt,wenndieAnzahlderVersuchegegen UnendlichgehtunddieWahrscheinlichkeitsehrgeringist,denndie Binomialverteilung wre hier viel zu ungenau. Formel:PX k ( )kke Erwartungswert EXCEL-Funktion: =POISSON(Klassenobergr.;Mittelwert; 0 od. 1) Stetige Verteilungen: oNormalverteilung (= Dichtekurve, Gausche Glockenkurve): Der Flcheninhalt unter der Kurve bis zu dem Punkt, an dem die Wahrscheinlichkeit abgetragenist,entsprichtderWahrscheinlichkeit(kannalsonurzw.0und1sein). Die Werte der x-Achse haben keine Bedeutung. DerMittelwert(Lageparameter) isthierauchderErwartungswert jegrerdieserist,umsohherist der Peak. DieStandardabweichung (Streuungsparameter)isteinweitereswichtigesMa.Jegrerist,destobreiter werden die Auslufe der Glockenkurve. 0 bei max. 1 bei genau 0 bei nicht kumuliert 1 bei kumuliert 10Formel: X ( )12 e1 2X |

\||2 Erwartungswert, Mittelwert Standardabweichung x GesetzdergroenZahlen:DieNormalverteilungkannaufjedeVerteilung angewendetwerden,sofernderStichprobenumfangsehrgroist.Soistder MittelwertvonStichprobennormalverteilt,auchwenndieGrundgesamtheitnicht normalverteilt ist. EXCEL-Funktion: =NORMVERT(Klassenmitte;Mittelwert;Standardabw.;0 od.1) oChi (X) Verteilung:Die X-Verteilung hnelt der Normalverteilung, jedoch ist diese immer unsymmetrisch. AuerdemisthiernurdieSummederQuadratevonvmitunabhngigen Standardnormalvaribalen normalverteilt. DieFormderVerteilunghngtvondenFreiheitsgradenab,abermitwachsenden Freiheitsgraden nhert sie sich an die Normalverteilung an ( = v; = 2v). Daher ist die X-Verteilung mit den meisten Freiheitsgraden der Normalverteilung sehr hnlich. Nimmt der Freiheitsgrad zu, so wird die Kurve flacher und symmetrischer. Die Freiheitsgrade v = n 1 . Die X-Verteilung ist fr Test mit unabhngigen Gren geeignet. Grund dafr ist die AdditivittzweierFreiheitsgrade,wennmanzweiunabhngigeGrenmitX-Verteilung mit den Freiheitsgraden v1 und v2 hat. Die Summe dieser Verteilungen hat dann v1 + v2 Freiheitsgrade. Formel:X21vixi( )2= Die Gleichverteilung: Bei dieser Verteilung kommt jeder Wert gleich hufig in einer Klasse vor. g1 ist in diesem Fall = 0. Diese Verteilung kann bei sehr hufigen Versuchswiederholungen erreicht werden. Z.B. Wrfeln 1.9Korrelation und Regression Begriffe: oBivariate Analyse: Zusammenhang von zwei Merkmalen xi..unabhngige,standardnormalverteilte Zufallsvariblen 0 bei nicht kumuliert 1 bei kumuliert 11oKorrelation:beschreibtdenmathematischenZusammenhang.SinddieMerkmale metrisch skaliert, so ist der Zusammenhang linear. oRegression: Form und Strke des Zusammenhangs oKoordinatendiagramm: x-Achse: unabhngiger Parameter y-Achse: abhngiger Parameter oScatterplot: Streudiagramm oKonfidenzintervall: Intervall, in dem der wahre Messwert liegt.DabeiderMessungvonmehreren,z.B.Lngenmessungenim MillimeterbereichmiteinemLineal,verschiedeneMesswerte auftreten, stellt sich die Frage, welcher dieser Werte nun der wahre Messwertist.DaherwerdenKonfidenzintervalleoderder Standardfehlerangegeben.DiesewerdendenMesswertenim Diagramm (Punkt, Balken) mit Linien (od. hnlichem) angehngt. Korrelationsanalyse: oVorraussetzungen:Beide Merkmale sind metrisch skaliert Zusammenhang scheint linear Die einzelnen Beobachtungen sind unabhngig voneinander oKorrelationskoeffizient nach Pearson (=Makorrelationskoeffizient): Beschreibt die Strke und Form des Zusammenhangs Der Korr.koeff. kann Werte zw. -1 und +1 annehmen r = 1r = -1r = 0 gleichsinnig linearer Zusammenhang gegensinnig linearer Zusammenhang kein linearer Zusammenhang obenm st +nuntenm st n t = TINV(%;FG) 100% = 1 50% = 0,5 12 fr normalverteilte und metrische Daten Formel:rx y ,sx y ,sx sy1niximx( )yimy( ) ( =n 1 ( ) sx sysx sy1niximx( )2= 1niyimy( )2=n Anzahl der Messwerte mx, my Mittelwerte sx, sy Standardabweichungen der Mittelwerte sx,y Kovarianz zweier Merkmale in der Stichprobe rx,y Korrelationskoeffizient EXCEL-Funktion: =PEARSON(Daten) =KORREL(Daten) Test, ob eine lineare Korrelation besteht bzw. ob diese Korrelation signifikant (deutlicherkennbar)ist:Vergleichvonrmitr*(=kritischerWert),einem Tabellenwert bei einer Irrtumswahrscheinlichkeit von . Ist |r| > r*, so besteht ein deutlich erkennbarer linearer Zusammenhang. Ist |r| < r*, so gibt es keinen erkenntlichen linearen Zusammenhang. Der kritische Wert r* Der Tabellenwert hngt von drei Parametern ab: oN (Zahl der Wertepaare)Freiheitsgrade ( v = n 2, da 2 Parameter in Funktion) oIrrtumswahrscheinlichkeit oEinseitig oder zweiseitiger Test? (wenn nicht bekannt, dann zweiseitig whlen) einseitig: Irrtumswahrscheinlichkeit nur auf einer Seite (Datenreihe) zweiseitig: Irrtumswahrscheinlichkeit auf beiden Seiten (od. unbekannt wer) ? 13Der kritische Wert r* ist erst bei grerem Stichprobenumfang (>70) aussagekrftig! Regressionsanalyse:beschreibteinenlinearenZusammenhangmittelsRegressionsgeradeder Form y = kx + d, wobei diese Gerade den Nullpunkt nicht schneiden muss. oLineares Modell:linear oMethodederkleinstenQuadrate:Summedery-AbstndederWertevonder Regressionsgeradengestreut oTrendlinie hinzufgen bei einem Diagramm in EXCEL Rangkorrelationskoeffizient nach Spearman: fr Werte, die man nicht durch Zahlen ausdrcken kann, aber in eine Rangfolge ordnen kann. Dazu muss mindestens ein Datensatz ordinalskaliert sein. Da man rechnerisch mit den Rngen so nichts anfangen kann, gibt es eine Variante diese Wertung in Zahlen auszudrcken: mit einem berechneten Koeffizienten. DahieraberdieVorraussetzungenfrdenKorr.koeff.rnichterflltsind(Unabhngigkeit,abh. Merkmalyistnichtnormalverteilt),kannmaneineNherungvondmitderPearsonfunktion erreichen. In EXCEL wird diese Berechnung mit der Pearson-Funktion angenhert. EXCEL-Funktion: =PEARSON() BevormanaberdieRngeinZahlenumwandelnkann,brauchtmanzunchsteineRangfolge der Daten. Hndisch teilt man einfach den Zahlen ihre Rangnummer zu, mit EXCEL jedoch kann man dies automatisieren. EXCEL-Funktion: =RANG() Die erklrte Varianz r DieerklrteVarianzrdasBestimmtheitsmaderKorrelationundRegressionundsagtaus,wieviel ProzentdereinenGredieandereerklrt.DabeiwerdendieQuadratedesAbstandsvonPunktzu Linie berechnet, zusammengezhlt und ausgewertet. r=durch Regression erklrte Varianz / Gesamtvarianz rkanninEXCELautomatischberechnetwerden,wenndasDiagramm fertiggestelltundeineTrendlinieerstelltwurde.Dabeikannmaninden Optionen whlen, dass r angezeigt wird. Formel:rs161nidi2=n n21 ( ) di .. Differenzen der Rangzahlen r2 1niyimy.( )2=1niximx( )yimy( )

( =??? 142.induktive (=schlieende) Statistik DieschlieendeStatistikuntersuchtnureinenTeil,derfrdieGrundgesamtheit,derenEigenschaften uns interessieren, charakteristisch oder reprsentativ sein soll. EswirdalsovoneinemTeilderBeobachtungenaufdieGrundgesamtheitallergeschlossen. Entscheidendisthierbei,dassderzuprfendeTeilderGrundgesamtheitdieStichprobezufllig ausgewhlt wird. WirbezeichneneineStichprobenentnahmealszufllig,wennjedemglicheKombinationvon Stichprobenelementen der Grundgesamtheit dieselbe Chance der Entnahme besitzt. Zufallsproben sind wichtig, da nur sie Rckschlsse auf die Grundgesamtheit zulassen. Totalerhebungen sind hufig kaum oder nur mit groem Kosten- und Zeitaufwand mglich abgesehen von ethischen Bedenken. Die Stichprobe Die Stichprobe muss zufllig gewhlt werden. Mit Excel geht das sehr einfach: EXCEL-Funktion: ZUFALLSZAHL() DadieseFunktionabernurWertevon01ausgibtmussmanmultiplizierenunddieZahlaufeine ganzeZahlrunden.WillmaneinspeziellesFensteranZahlen,z.B.10-20,somussmandie multiplizierten Zufallszahlen auch noch verschieben (Addition/Subtraktion). 2.1Anpassungstests WirdaneineempirischbestimmteHufigkeitsverteilungeinetheoretischeVerteilungangepasst, dann muss man immer mit einem statistischen Testverfahren prfen, ob die Anpassung erfolgreich war. Nullhypothese:DieHypothese,dasszweiStichproben(bzw.Grundgesamtheiten)hinsichtlicheines odermehrererMerkmalebereinstimmen,wirdNullhypothesegenannt.(Ausreierwerdenals zufllig betrachtet) Alternativhypothese: Im Fall, dass sich zwei Stichproben hinsichtlich eines Merkmals unterscheiden, wird dies als Alternativhypothese bezeichnet. DieIrrtumswahrscheinlichkeit: gibtdasRisikoan,dassdieNullhypotheseirrtmlichabgelehntwird. (=Fehler 1. Art1)

1 Fehler 1. Art: Der Fehler 1. Art besteht darin, dass die Nullhypothese (H0) aufgrund der Stichprobe verworfenwird, in der Grundgesamtheit abertrifftH0zu.EswirdsomitindenStichprobeneinzuflligbestehenderUnterschiedgefunden,abertatschlichexistiertinder Grundgesamtheit kein Unterschied. Fehler 2. Art: Der Fehler 2. Art besteht darin, dass H0 aufgrund der Stichprobe akzeptiert wird, in der Grundgesamtheit aber trifft H0 nicht zu. = Irrtumswahrscheinlichkeit ( 1- = Testpower = Wahrscheinlichkeit, signifikante Testergebnisse zu erhalten) 15Theoretischer Ablauf:Fragestellung: Passt die angepasste Funktion? Oder sind die beobachteten Unterschiede signifikant (bedeutend)?InwieweitdieseVorgangsweisesinnvollistkanndurchverschiedeneTests,wiedem X-Test berprft werden. Ermittlung einer Prfgre (z.B. X) Bestimmung des kritischen Wertes Vergleich: berschreitet die Prfgre den kritischen Wert, so wird die Nullhypothese abgelehnt (theoretische Funktion passt nicht). Daher ist der beobachtete Unterschied nicht zufllig. 2.1.1Anpassung an eine Normalverteilung & X-Anpassungstest Anpassung Berechnungvon:Mittelwert,Standardabweichung,Minimum,Maximum,Spannweite, Klassenzahl,Klassenbreite,Klasseneinteilung,Obergrenzen,Klassenmitte,absoluteHufigkeit, Verteilung bei Normalverteilung f(x), Differenz, kritischer Wert ad Berechnung der Klassenmitte: EXCEL-Funktion: =(Kassenuntergrenze+Klassenobergrenze)/2 und dann runterziehen ad Berechnung von f(x):EXCEL-Funktion: =NORMVERT(Klassenmitte;Mittelwert;Standardabw.;0/1) *Klassenbreite * Anzahl ad Berechnung der Differenz:EXCEL-Funktion: =(f(x) abs.H.)^2) / f(x) und dann runterziehen 0 bei nicht kumuliert 1 bei kumuliert 16Anpassungstest DazuwhltmanzumBeispieldenChi-Anpassungstest.HierzuistderMittelwertmder empirischenVerteilung=derNormalverteilungunddieStandardabweichungswirdfr eingesetzt. Der Chi-Test BeidiesemTestwirdberprft,obdieAbstndederAnzahlvon WertenindenKlassenzuder theoretischen Verteilung mglichst klein / gering ist ist dies der Fall, so passt die theoretische Verteilung zu der empirisch ermittelten Hufigkeitsverteilung. 024681012141618(155-160] (160-165] (165-170] (170-175] (175-180] (180-185] (185-190] (190-195)KlassenAnzahl Vorrausetzungen:oDie zu untersuchende Stichprobe muss klassenorientiert vorliegen oEine Einschrnkung auf die Normalverteilung besteht nicht Prfgre X: Formel:X21kihxi( )f xi( )( )2f xi( )= h(xi)relativeHufigkeitderStichprobeanxi(empirische Daten) f(xi) relative Hufigkeit der Grundgesamtheit (theoretische Daten) k Klassenanzahl v Freiheitsgradev = k a 1 a Zahl der freien Parameter der theoretischen Verteilung DieFreiheitsgradebeeinflussendenChi-Testenorm.Frdieeinzelnenanzupassenden Verteilungen gibt es verschiedene Freiheitsgrade: va Gleichverteilungk - 21 Normalverteilungk 32 Log-Normalverteilungk 32 17Ist X sehr gro, so sind die Abweichungen von der theoretischen Funktion sehr gro und somit ist die Wahrscheinlichkeit gro, dass die Nullhypothese abgelehnt wird. Die angepasste Funktion wrde dann nicht zu der empirisch ermittelten Hufigkeitsverteilung passen. DahervergleichtmandenWertvonXmiteinemTabellenwert(kritischerWert)beieinerbest. Irrtumswahrscheinlichkeit. Man kann diesen Tabellenwert auch automatisiert mit EXCEL berechnen:EXCEL-Funktion: =CHIINV(;k) Ist X < CHIINV, so passt die theoretische Funktion zur ermittelten Hufigkeitsverteilung. IstX>CHIINV,soistdietheoretischeFunktionzuverwerfenundeineandere Verteilungsfunktion zu prfen. MitdemNormalverteilungs-AnpassungstestkannmannatrlichauchdieNormalverteilungals Hufigkeitsverteilung sicher ausschlieen (Ausschlussverfahren), sofern Zweifel bestehen. 2.1.2Anpassung an eine Poissonverteilung Dazumussmandieabsolute(nicht-kumulierte)Hufigkeitberechnen.Dannwerdender Mittelwert und die Anzahl der Messwerte berechnet. UmdenabsolutenPOISSON-Wertzuerhalten,berechnetmanmitExcel =POISSON(Klassenobergrenze;Mittelwert;0)*AnzahlderMesswerte.DenMittelwertnicht vergessenzufixieren.BeideSpaltenineinDiagrammeingetragenzeigen,obdieVerteilung passt.

Labmagenverlagerungen bei Khen05101520253035400 1 2 3 4 5 6 7 8 9 10 11Anz. der Verl. pro PentadeAnz. der Milchkheabs. n-kum. Habs. POISSON Irrtumswahrscheinlichkeit k Klassenzahl 182.1.3Anpassung an eine Gleichverteilung & Chi-Test Abgesehen von f(x) wie bei Normalverteilung. Verteilungsdiagramm024681012(10-12] (12-14] (14-16] (16-18] (18-20)ZufallszahlAnzahlReihe2Reihe1 Min10 Max20 Klassenbreite2 Klassenanzahl5 h(X)h(x)f(x) KlasseKlassenobergr.abs. H.abs. S. H.Differenz (10-12]12101080,5 (12-14]14112181,125 (14-16]1662780,5 (16-18]1883580 (18-20)2054081,125 Summe:403,25CHI^2 Irrtumswahrsch.0,05 Freiheitsgrade3,00 kritischer Wert7,814727764 2.2Statistische Tests Auswahl des Testverfahrens DieBedingungenzurAnwendbarkeitdesTestsmssenvonderTestsituationerflltwerden.Die Anwendbarkeit eines Tests wird von verschiedenen Faktoren bestimmt: Von der Anzahl der Stichproben, Ob die Stichproben verbunden oder nicht verbunden sind, Vom Datenmaterial (Skalenniveau und Verteilungsform der Daten) Prfung der Verteilung: Chi-Test, Kolmogorov-Smirnov-Test Prfung auf Unterschiede: t-Test (=Vergleich von 2 verbundenen/unverbundenen Stichproben) Bei Normalverteilung werden parametrische Tests durchgefhrt. 19Verbundene und unverbundene Stichproben verbundeneStichproben:VergleichvoneinerGruppenachzweiUntersuchungseinheiten (Zeitunterschied); jeweils zu einem bestimmten Tier gehrig unverbundeneStichproben:Vergleichvon2GruppenzumselbenZeitpunkt;Gruppenausversch. Tieren (z.B. Placebo-Gruppe & Arznei-Gruppe) 2.2.1Chi-Test bei der Logarithmischen Normalverteilung DadieDatenlinkssteil(rechtsschief)sind,wirdandielogarithmischeNormalverteilung angepasst. EXCEL-Funktion: =LOGNORMVERT(Klassenobergr.;Mittelwert;Stabw 0246810121416(18-25](25-32](32-39](39-46](46-53](53-60](60-67)Inkubationszeit (Tagen)Anzahlh(x)f(x) Nr. t ln(t) norm log1 23 3,13549 Mittelwert 31 32 22 3,09104 Stabw. 10,2105 0,307973 38 3,637594 20 2,99573 Min 185 26 3,2581 Max 646 23 3,13549 Spannw. 467 28 3,3322 Anzahl 408 21 3,04452 Kl.anz 6,32456 79 22 3,09104 Kl.breit. 7,27324 710 23 3,1354911 21 3,04452 h(x) F(x) f(x)12 35 3,55535 Klassen Obergr. abs. H. log. S. H. log. H. (f(x)-h(x))/f(x)13 54 3,98898 (18-25] 25 15 11,82 11,82 0,85745567114 25 3,21888 (25-32] 32 9 24,16 12,35 0,90727912515 30 3,4012 (32-39] 39 10 32,70 8,54 0,24928396216 48 3,8712 (39-46] 46 3 37,02 4,31 0,39881227817 40 3,68888 (46-53] 53 1 38,86 1,84 0,38449553318 29 3,3673 (53-60] 60 1 39,58 0,72 0,10941982119 34 3,52636 (60-67) 67 1 39,85 0,27 1,99281813320 32 3,4657421 46 3,82864 chi 4,89956452122 19 2,94444 Irrtumswahrsch. 0,0523 24 3,17805 Freiheitsgrade 4,0024 37 3,61092 kritischer Wert 9,48772903720 2.2.2Kolmogorov-Smirnov-Test AusgewhltestatistischeTestsbasierenaufeinertheoretischenEbene,beideralle Vorraussetzungenerflltsind.InderRealittistdiesabernichtimmergegeben,dasichimmer wieder Fehler einschleichen. DeshalbsollbeidiesemTestgetestetwerden,obzweiVerteilungsfunktionen(mssenstetig sein, z.B. Normalverteilung) bereinstimmen. Nullhypothese: Zufallsvariable X ist normalverteilt. 2.2.3t-Test 2.2.3.1t-Test fr unverbundene Stichproben Beim t-Test fr unverbundene Stichproben werden mit den jeweiligen Mittelwerten m1 und m2 verglichen und geprft, ob diese sich signifikant unterscheiden. Die Nullhypothese H0 postuliert, dass sich die Mittelwerte nicht unterscheiden. Vorraussetzungen:NormalverteilungderGrundgesamtheit,HomogenittderVarianzen (beide Zufallsvariablen haben dieselbe unbekannte Standardabweichung ) Freiheitsgrade: v = n1 + n2 2 (n1/n2 Anzahl der Messwerte) Prfma t: Kritischer Wert t*: EXCEL-Funktion: t* = TINV(0,05;FG) di: Differenz der Werte n: Anzahl s: Standardabweichung se: Standardfehler smd: Standardabweichung der Mittelwerte ? Fr einen signifikanten unterschied muss |t| > als |t*| sein. tdsmdsmd se12se22+sesn212.2.3.2t-Test fr verbundene Stichproben Eswirdgeprft,obsichdiemittlereDifferenzdergepaartenMesswertesignifikantvon0 unterscheiden. gepaarte Messwerte: zB. Messwerte desselben Tieres zu 2 versch. Zeiten HUND vor Bewerb nach Bewerb 16470 25969 Vorraussetzungen:NormalverteilungderGrundgesamtheit,bekannterMittelwert, unbekannte Standardabweichung Freiheitsgrade: v = n - 1 (nAnzahl der Messwerte) Prfma t: Kritischer Wert t*: EXCEL-Funktion: t* = TINV(0,05;FG) t m di ( ) dinsdi ( ) di: Differenz der Werte si: Standardabweichung der di-Werte mi: Mittelwert der di-Werte Inhaltsverzeichnis 1.Deskriptive (=beschreibende) Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Der Begriff Merkmal und die Einteilung von Merkmalen . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Darstellung der Daten in Tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Graphische Darstellung von Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Kreisdiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Balkendiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Histogramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Polygon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Verteilungsformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Formmae von Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Statistische Kennwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1.6.1Lageparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Modalwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Median . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Arithmetischer Mittelwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Gewogenes arithmetisches Mittel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2Streuungsparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Eveness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Spannweite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Interquartilabstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 2 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 TEIL B EXCEL-Hilfe Standardabweichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Merkmalsverteilung Klassifizierte Hufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .absolute Hufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .relative Hufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .absolute Summenhufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .relative Summenhufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Wahrscheinlichkeitstheorie und Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1.8.1Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1.8.2Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9 Korrelation und Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Korrelationsanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Korrelationskoeffizient nach Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Regressionsanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Rangkorrelationskoeffizient nach Spearman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die erklrte Varianz r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4 4 4 5 5 5 5 5 5 5 5 5 6 6 6 6 6 7 2.induktive (=schlieende) Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anpassungstests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Anpassung an eine Normalverteilung & X-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . .Anpassung an eine Gleichverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Statistische Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Chi-Test bei der logarithmischen Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Automatische Antwort Zufllige Einteilung in 2 Gruppen 7 6 6 8 8 8 8 1Hilfe, wie geht das in EXCEL ???!!!??? 1.1-- 1.2Darstellung der Daten in Tabellen Messdaten (mit fortlaufenden Nummern markiert) in Tabelle spaltenweise eintragen Nr. Gewicht Brustumfang (kg) (cm)1 19 62,02 20 63,03 20 63,04 22 65,05 24 71,06 25 69,07 25 67,08 25 67,09 28 68,0 Bestimmung der Klassenanzahl (m): EXCEL-Funktion: =WURZEL(n) FormeleingebenundMarkierenvonZellen:InZelleklicken,FormelschreibenundKlammerffnen, dann, wenn die Werte eingegeben werden sollen: a)hndisch eintippen (mhsam) b)einfach auf andre Zellen klicken (und mit ziehen der Maus andre Zellen mitmarkieren) danndieParametereingeben(werdenimmermit;getrennt)unddieKlammerschlieenschlielich ENTER-Taste drcken n =ANZAHL(Wert1;Wert2;)=ANZAHL(Wert1:letzter Wert)

oVariationsbreite (=Spannweite) festlegen: V = Max Min min =MIN(Wert1:letzter Wert)max =MAX(Wert1:letzter Wert)Spannweite =(Zelle von min) - (Zelle von max) Pseudoformeln mit Rechenoperatoren InZelleklicken,dannbetroffeneZellemarkieren,dann+-/*eingeben(ohneLeerzeichenoder hnlichem!), dann weitere Zelle(n) anklickenetc. Sollte es eine Rechnung mit mehreren Operatoren sein, sind Klammern obligat. Beispiel: Berechnung der Spannweite mit EXCEL m nn .. Anzahl der Werte (Messdaten) 2oKlassenbreite berechnen: Spannweite / Klassenzahl Klassenbreite =(Zelle von Spannweite) / (Zelle von Klassenanzahl) Runden: =RUNDEN(Zelle anklicken;Zahl der Kommastellen) 1.3Graphische Darstellung von Daten Diagrammerstellen:AufeineleereZelleklicken,danninderLeistedasDiagramm-Symbolanklicken. Der Diagrammasisstent wird geffnet und du musst eine Form auswhlen. Mchtest du ein Sule-Linie- oder ein Sulen-Flche-Diagramm, musst du die Rubrik Benutzerdefinierte Typen anklicken und dann die gewnschte Form suchen. Dann weiter klicken und die Datenfelder eingeben (reinklicken). EXCEL nimmt automatisch die Sulen- oderBalkenform(beiSule-Linie-Diagramm).SolltedasProgrammdiefalscheReihealsLinie/Sule dargestellthaben,lsstsichdasganzeinfachrichten:RubrikReihenwhlen,dortdieDatenfelderder Reihen so tauschen, dass EXCEL es wie gewnscht anzeigt. DesWeiterenkannmanindieserRubrikdenReihenNamengeben,dieseinihrerReihenfolge verschieben UND: die Bezeichnungen fr die x-Achse eingeben (letzte Zeile). Kreisdiagramm: nominal-, ordinalskalierte Daten 496.051; 23%641.923; 29%169.829; 8%363.341; 17%205.492; 10%189.672; 9%62.881; 3%113; 0%26.145; 1%WienBurgenlandNiedersterreichObersterreichSalzburgSteiermarkKrntenTirolVorarlberg Anzeigen von Werten und Anteilen:a)BeimErstellendesDiagrammes:NachdemdudieDatenfeldereingegebenhast, klicke auf weiter. Dann findest du eine Rubrik Datenbeschriftungen. Dort findest du Kstchenzumanhaken.Wertund Prozentsatzanhakelnundschonerscheintdas gewnschte Ergebnis. b)AufdasfertigeDiagrammrechts-klicken.DannaufDatenreihenformatieren klickenundeserscheinteinFenster.DortfindestduwiederdieRubrik Datenbeschriftungen und kannst Wert und Prozentsatz anhakeln. dargestellt ist hier ein Kreisdiagramm Es werden Werte und Anteile angezeigt. Einstellbar bei Diagrammoptionen 3Das Balkendiagramm: Hufigkeitsdiagramm relative nichtkumulierte Hufigkeit051015202530[0,2 - 2) [2 - 3,8) [3,8 - 5,6) [5,6 - 7,4) [7,4 - 9,2) [9,2 - 11,9]KlassenHufigkeit ExistiertnureineDatenreihe,kannmandieLegendeweglassen,dadiesenurstrt. EinstellenkannmandasindemmanaufdasDiagrammrechts-klickt,dannauf DiagrammoptionengehtundbeiderRubrikLegendeLegendeanzeigenvom Hakerl befreit. Frben von Hintergrund und Balken/Linien/Punkten: funktioniert nur beim fertig erstellten Diagramm.FrbenvomHintergrund:KlickedoppeltaufeinefreieStelleamHintergrund.EserscheinteinFenster und du kannst eine Farbe auswhlen. Bei einem serisen Diagramm entfrbt man den Hintergrund. FrbenderBalken/Linien/Punkte:DoppelklickaufeinenBalken/dieLinie/einenPunkt.EinFenster erscheint und man kann die Farben und die Gren der Punkte bzw. die Strke der Linie verndern. Histogramm: Klassen sind untereinander verbunden (kein Abstand zw. den Balken) 0246810121416(18-25] (25-32] (32-39] (39-46] (46-53] (53-60] (60-67)Inkubationszeit (Tagen)Anzahlh(x)f(x) AbstandzwischendenBalkenauf0setzen:funktioniertnurbeimfertig erstelltenDiagramm.KlickedoppeltaufdieBalken,whledieRubrik Optionen und setze die Abstandsbreite von 150 auf 0. dargestellt ist hier ein Histogramm kombiniert mit einer angepassten Fuktion Darstellungsmglichkeit mit der Diagrammoption Sule-Linie Zustzlich wurde die Funktion noch geglttet. Zu finden bei Diagrammoptionen 4Polygon: die Hufigkeiten ber den Klassenmitten werden abgetragen und verbunden und man fgt vorne und hinten noch einer Leerklasse hinzu. 0246810121 2 3 4 5 6 7 8 9 10 11 12 Polygonzeichnen:WhledenDiagrammtyp:Sule-Flchein Benutzerdefinierte Diagrammtypen. Damit die Flche sichtbar wird musst du die Sulen entfrben (keine Farbe) und die Linien verstrken. oSummenpolygon: mit EXCEL nicht darstellbar. (bzw. wei ichs nicht) 1.4 -- 1.5 -- 1.6Statistische Kennwerte Lageparameter oModalwert:Modalwert =MODALWERT(Daten markieren) oMedian:Median =MEDIAN(Daten markieren) oArithmetischer Mittelwert:arith. Mittelwert =MITTELWERT(Daten markieren) Streuungsparameter:oInterquartilabstand:Quartil: Quartil =QUARTILE(Daten;Qx) Quantil: Quantil =QUANTILE(Daten;%)

oVarianz:Varianz =VARIANZ(Daten markieren) oStandardabweichung:Standardabw. =STABW(Daten markieren) 1.7Merkmalsverteilung Klassifizierte Hufigkeiten absolute Hufigkeit: hi = Anzahl der Messwerte in Klasse i EXCEL-Funktion: Spalten, in dies reinkommen soll, markieren, dann oben in der Leiste wo f(x)= steht: =HUFIGKEIT(Daten;Klassenobergrenzen) + Crtl. + SHIFT + ENTER & Daten mit F4 fixieren ENTER drcken, dann runterziehen 100% = 1 50% = 0,5 5Anz. D. Messwerten 40Klassenanzahl 6,32455532min 0,2 Klassen Klassenob. h(i) H(i) %H(i)max 11,9 1 [0,2 - 2) 2 3 3 7,52 [2 - 3,8) 3,8 10 7 17,5Spannweite 11,7 3 [3,8 - 5,6) 5,6 16 6 154 [5,6 - 7,4) 7,4 27 11 27,5Klassenbreite 1,84993243 5 [7,4 - 9,2) 9,2 33 6 156 [9,2 - 11,9] 11,9 40 7 17,5Summe: 100 Prozentuale klassifizierte Hufigkeit (=relative Hufigkeit): =(hi / n) * 100 absolute / kumulierte Hufigkeit: Anzahl der Messwerte bis einschlielich Klasse i. EXCEL-Funktion: =HUFIGKEIT(Daten;Klassenobergrenze), ENTER drcken und runterziehen. Anz. D. Messwerten 40Klassenanzahl 6,32455532min 0,2 Klassen Klassenob. h(i) H(i) %H(i)max 11,9 1 [0,2 - 2) 2 3 3 7,52 [2 - 3,8) 3,8 10 7 17,5Spannweite 11,7 3 [3,8 - 5,6) 5,6 16 6 154 [5,6 - 7,4) 7,4 27 11 27,5Klassenbreite 1,84993243 5 [7,4 - 9,2) 9,2 33 6 156 [9,2 - 11,9] 11,9 40 7 17,5Summe: 100 1.8Wahrscheinlichkeitstheorie und Verteilungen Diskrete Verteilungen: oBinomialverteilung:EXCEL-Funktion: =BINOMVERT(X;k;p; 0 od. 1) oPoissonverteilung: EXCEL-Funktion: =POISSON(X;Mittelwert; 0 od. 1) Stetige Verteilungen: oNormalverteilung: EXCEL-Funktion: =NORMVERT(x;Mittelwert;Standardabw.;0 od.1) oChi (X) Verteilung: -- =HUFIGKEIT(Daten;Klassen-obergrenze) 0 bei max. 1 bei genau 0 bei nicht kumuliert 1 bei kumuliert 0 bei nicht kumuliert 1 bei kumuliert 61.9Korrelation und Regression Korrelationsanalyse: oKorrelationskoeffizient nach Pearson: EXCEL-Funktion: =PEARSON(Daten) oder: =KORREL(Daten) Korrelationsgerade: in Excel: Trendlinie Korrelationsgerade mit der Hand: Krpermasse = Steigung * Krpergre + Achsenabschnitt y-Wertex-Werte Steigung: EXCEL-Funktion: =STEIGUNG(y-Werte;x-Werte) Achsenabschnitt:EXCEL-Funktion: =ACHSENABSCHNITT(y-Werte;x-Werte) Regressionsgerade Student Nr. Krper- gre (cm) Krper- masse (kg)krpermasse regression 11675256 216855 57 316860 57 41675056 51786566 61756764 Regressionsanalyse:beschreibteinenlinearenZusammenhangmittelsRegressionsgeradeder Form y = kx + d, wobei diese Gerade den Nullpunkt nicht schneiden muss. HinzufgeneinerTrendlinieineinemScatterplot:Punktanklicken,rechts-klicken,dannaufTrendliniehinzufgen.EsffnetsichnuneinFenster. Nun die Trendlinienform whlen (meistens linear) und auf OK klicken. GibtesmehralseineDatenreihe,somussmanbevormandie TrendlinienformwhltnochdieReihe(meistensbenannt)auswhlen,fr die eine Trendlinie hinzugefgt werden soll.Rangkorrelationskoeffizient nach Spearman:EXCEL-Funktion: =PEARSON() oRnge vergeben:EXCEL-Funktion: =RANG() Student Nr. Krper- gre (cm) Krper- masse (kg)Rang GreMasse Differenz di^2Rangkorr.koeff. 1167529690,704562862 21685512111 316860121949 4167509425Nherung: 51786530291 6175672731160,70186968 werden in Diagramm als Regressionsgerade dargestellt 7Die erklrte Varianz r r kann in EXCEL automatisch berechnet werden, wenn das Diagramm fertig gestellt und eine Trendlinie erstellt wurde. Dabei kann man in den Optionen whlen, dass r angezeigt wird. 2.induktive (=schlieende) Statistik Stichproben zufllig auswhlen:EXCEL-Funktion: ZUFALLSZAHL() DadieseFunktionabernurWertevon01ausgibtmussmanmultiplizierenunddieZahlaufeine ganzeZahlrunden.WillmaneinspeziellesFensteranZahlen,z.B.10-20,somussmandie multiplizierten Zufallszahlen auch noch verschieben (Addition/Subtraktion). 2.1Anpassungstests 2.1.1Anpassung an eine Normalverteilung und X-Anpassungstest Berechnung der Klassenmitte:EXCEL-Funktion: =(Kassenuntergrenze+Klassenobergrenze)/2 und dann runterziehen Berechnung von f(x) = Normalverteilung:EXCEL-Funktion: =NORMVERT(Klassenmitte;Mittelwert;Standardabw.;0/1) Berechnung der Differenz:EXCEL-Funktion: =(f(x) abs.H.)^2) / f(x) und dann runterziehen 0 bei nicht kumuliert 1 bei kumuliert 8024681012141618(155-160] (160-165] (165-170] (170-175] (175-180] (180-185] (185-190] (190-195)KlassenAnzahl 2.1.2Anpassung an eine Poissonverteilung -- 2.1.3Anpassung an eine Gleichverteilung & Chi-Test -- 2.2Statistische Tests2.2.1Chi-Test bei der logarithmischen Normalverteilung EXCEL-Funktion: =LOGNORMVERT(Klassenobergr.;Mittelwert;Stabw 2.2.2Kolmogorov-Smirnov-Test -- 2.2.3t-Test 2.2.3.1t-Test fr unverbundene Stichproben Kritischer Wert t*: EXCEL-Funktion: t* = TINV(0,05;FG) 2.2.3.2t-Test fr verbundene Stichproben Gruppe1 (Mastfutter A) Gruppe2 (Mastfutter B) Krpermasse, Mastende (g) Krpermasse, Mastende (g)Gruppe1Gruppe2 16441638m1636,71644,6 16421638s9,35,4 16581638n27,027,0 16241639se1,81,0 16521639 16531640 16371640 16311640 16221640smd2,1 16461641d-7,9 16221642t3,8 16321642FG52,0 16321643t*2,0 Automatische Antwort: Zum Beispiel: =WENN(K29>K25;"Daten gleichverteilt";"Daten sind nicht gleichverteilt") Zufllige Einteilung in 2 Gruppen:Zufallszahlen zw. 0 u. 20: =ZUFALLSZAHL()*20 Gerundet und durch Division durch 2 (Erg. = 0 od. 1): =REST(RUNDEN(ZUFALLSZAHL()*20;0);2)