Statistik: 19.10.04 Quantitative Merkmale. 19.10.04PI Statistik, WS 20042 Metrische Merkmale...

Click here to load reader

  • date post

    06-Apr-2015
  • Category

    Documents

  • view

    116
  • download

    8

Embed Size (px)

Transcript of Statistik: 19.10.04 Quantitative Merkmale. 19.10.04PI Statistik, WS 20042 Metrische Merkmale...

  • Folie 1
  • Statistik: 19.10.04 Quantitative Merkmale
  • Folie 2
  • 19.10.04PI Statistik, WS 20042 Metrische Merkmale 22718484621318579912482696 1631536979718799740371576 655660800750949478566718 53865878887897910475371226 7816545938967191234561665 3681973267618756711836602 943348 Beispiel: 50 Rechnungsbetrge in der Elektroabteilung eines Einkaufszentrums (in Euro)
  • Folie 3
  • 19.10.04PI Statistik, WS 20043 Metrisches Merkmal Das Merkmal wird als (reelles) Vielfaches einer Maeinheit gemessen Stetig, z.B. Rechnungsbetrge Diskret, z.B. beim Test erzielte Punkte
  • Folie 4
  • 19.10.04PI Statistik, WS 20044 Klasse Hufig keit 0-2000 200-4005 400-60011 600-80019 800-10008 1000-12001 1200-14003 1400-16000 1600-18001 1800-20002 grer0 Metrisches Merkmal: Tabelle Beispiel: Rechnungsbetrge in der Elektroabteilung eines Einkaufszentrums (in Euro)
  • Folie 5
  • 19.10.04PI Statistik, WS 20045 Metr. Merkmal: Histogramm Beispiel: Rechnungsbetrge
  • Folie 6
  • 19.10.04PI Statistik, WS 20046 Histogramm Klassenhufigkeiten: Hufigkeiten, mit der die Klassen der Merkmalsausprgungen besetzt sind Darstellung der Klassenhufigkeiten als Flchen Gre der Flche ist proportional zur Hufigkeit Am einfachsten sind Klassen gleicher Breite (dann ist Hhe proportional zu Hufigkeit) Histogramm (fr stetige Merkmale) Balkendiagramm (fr diskrete Merkmale)
  • Folie 7
  • 19.10.04PI Statistik, WS 20047 Histogramm in EXCEL Beispiel: Rechnungsbetrge
  • Folie 8
  • 19.10.04PI Statistik, WS 20048 Histogramm in EXCEL Teil der Analyse-Funktionen Probleme und deren Lsung: Balken (vergl. Balkendiagramm) statt Flchen Anklicken eines Stabes -> Datenreihen formatieren -> Optionen -> Abstandsbreite auf 0 setzen Klassengrenzen werden als Klassenmitten angezeigt Bereich mit Klassenmitten erzeugen Diagramm anklicken -> Datenquelle -> als Beschriftung der Rubrikenachse (X): Bereich mit Klassenmitten angeben X-Achse anklicken -> Muster -> Hauptstriche auf innen setzen -> Hilfsstriche auf auen setzen ->
  • Folie 9
  • 19.10.04PI Statistik, WS 20049 Verbessertes Histogramm Beispiel: 50 Rechnungsbetrge
  • Folie 10
  • 19.10.04PI Statistik, WS 200410 Histogramm-Konstruktion 1. Ordne die n Beobachtungen nach steigender Gre, bestimme die Spannweite der Hufigkeitsverteilung. 2. Zur Festlegung der Klassen unterteile die Spannweite in Intervalle gleicher Lnge; die Zahl k der Klassen soll zwischen fnf und 20 liegen. Die Klassenmitten sollen einfache Zahlen sein. 3. Bestimme die Zahl der Beobachtungen jeder Klasse, d.s. die (absoluten) Klassenhufigkeiten. 4. Zeichne das Histogramm. Bei gleichen Klassenbreiten sind die Hhen der Flchen proportional den Hufigkeiten; bei ungleichen Klassenbreiten sind die Hhen proportional den Quotienten aus Hufigkeit und Klassenbreite (gesamte Flche: n oder 100%)
  • Folie 11
  • 19.10.04PI Statistik, WS 200411 Zahl k der Klassen nnn 2054 3055 4066 5067 7579 100710 150812 200814 kleinstes k mit k n k soll nicht kleiner als 5 nicht grer als 20 sein (siehe Demo)
  • Folie 12
  • 19.10.04PI Statistik, WS 200412 Altersverteilung aus College
  • Folie 13
  • 19.10.04PI Statistik, WS 200413 Nochmals College
  • Folie 14
  • 19.10.04PI Statistik, WS 200414 College 3
  • Folie 15
  • 19.10.04PI Statistik, WS 200415 College 4
  • Folie 16
  • 19.10.04PI Statistik, WS 200416 Beispiele von Verteilungen Rechnungsbetrge CO-Emission von PKWs Lebensalter Schden durch Wirbelstrme (in Mio USD)
  • Folie 17
  • 19.10.04PI Statistik, WS 200417 Schden durch Wirbelstrme
  • Folie 18
  • 19.10.04PI Statistik, WS 200418 Schden durch Wirbelstrme KlasseKl.-BreiteHufigk'trel.Hufigk'tDichte 0 5050190,500,010000 50 1005040,110,002105 100 500400100,260,000658 500 - 2000150050,130,000088 381,00 Dichte: Relative Hufigkeit/Klassenbreite Dichtehistogramm: Flche betrgt 1
  • Folie 19
  • 19.10.04PI Statistik, WS 200419 Schuh- und Krpergre Nach R. Hatzinger, 2003
  • Folie 20
  • 19.10.04PI Statistik, WS 200420 Charakteristika von Verteilungen Beschreiben durch Kennzahlen wesentliche Eigenschaften der Verteilung Dazu gehren: Quantile, Minimum, Maximum Lagemae Streuungsmae Schiefe: charakterisiert Symmetrie Wlbung (Kurtosis): Vergleich von symmetrischer Verteilung mit Gaussscher Glockenform
  • Folie 21
  • 19.10.04PI Statistik, WS 200421 Populationskenngren Analyse-Funktion in EXCEL Rechnungsbetrge Mittelwert772,46 Standardfehler50,10 Median714,62 Modus718,46 Standardabweichung354,29 Stichprobenvarianz125518,49 Kurtosis3,29 Schiefe1,60 Wertebereich1746,15 Minimum226,92 Maximum1973,08 Summe38623,15 Anzahl50
  • Folie 22
  • 19.10.04PI Statistik, WS 200422 Lage- und Streuungsmae Lagemae Mittelwert Median, getrimmter Mittelwert Modus Streuungsmae Standardabweichung s Varianz s 2 Interquartilsabstand I Spannweite R
  • Folie 23
  • 19.10.04PI Statistik, WS 200423 Lagemae Mittelwert: Median: nach der Gre geordnete Beobachtungen: den Index i nennen wir den Rang von Median: wenn n=2m+1 ungerade (m ist Rang der mittleren Beobachtung): wenn n=2m gerade:
  • Folie 24
  • 19.10.04PI Statistik, WS 200424 Robuste Lagemae Median: extreme Werte (Ausreier) haben keinen Effekt Getrimmter Mittelwert: Mittelwert von 80% der Beobachtungen, je 10% grte und kleinste Beobachtungen bleiben unbercksichtigt
  • Folie 25
  • 19.10.04PI Statistik, WS 200425 Quantil (Perzentil) Quantil der Ordnung p aus n Beobachtungen x 1, , x n ist die Beobachtung x (r) mit Rang r = (n+1)p wenn (n+1)p keine ganze Zahl ist: Mittel der benachbarten Beobachtungen Runden des Ranges (n+1)p Beispiel: Rechnungsbetrge (50 Beobachtungen) Quantil der Ordnung 0.8 (oder 0.8-Quantil): Mittel aus Beobachtungen mit Rngen 40 und 41 1. Quartil oder 0.25-Quantil: Mittel aus Beobachtungen mit Rngen 12 und 13
  • Folie 26
  • 19.10.04PI Statistik, WS 200426 Einige Quantile Quartile: 0.25-Quantil oder 1. Quartil (Q 1, Q u ) 0.75-Quantil oder 3. Quartil (Q 3, Q o ) 0.5-Quantil ist der Median Dezile Unteres Dezil oder 0.1-Quantil Oberes Dezil oder 0.9-Quantil
  • Folie 27
  • 19.10.04PI Statistik, WS 200427 Standardabweichung Ist die Wurzel aus der Varianz s 2 : Varianz oder Stichprobenvarianz: Eigenschaften der Standardabweichung: s kann nicht negativ sein s = 0: alle Beobachtungen haben gleichen Wert s wird in den gleichen Einheiten gemessen wie X
  • Folie 28
  • 19.10.04PI Statistik, WS 200428 berdeckung Intervall Anteil der Beobachtungen 2/3 95% ~ 100% Gilt fr die Normalverteilung exakt Gilt weitgehend fr alle symmetrischen, unimodalen Verteilungen
  • Folie 29
  • 19.10.04PI Statistik, WS 200429 Andere Streuungsmae Interquartilsabstand I = Q o Q u = Q 3 Q 1 berdeckt die zentralen 50% der Beobachtungen Spannweite (range) R = x (n) x (1) Variationskoeffizient (s in Prozent des Mittelwertes): fr nicht-neg. Merkmale; unabhngig von Maeinheit MAD (mean absolute deviation)
  • Folie 30
  • 19.10.04PI Statistik, WS 200430 Schiefe und Wlbung Schiefe: Ma fr Asymmetrie (unimodale Verteilung) rechtsschief: Modus < < Momentkoeffizient (Fisher): mit Wlbung: g 2 = 0: Gausssche Glockenkurve g 2 < 0: abgeplattet, platykurtisch, heavy tail g 2 > 0: spitz, leptokurtisch, light tail
  • Folie 31
  • 19.10.04PI Statistik, WS 200431 Box Plot Darstellung einer Hufigkeitsverteilung; gibt die wesentlichen Charakteristika wieder. (siehe Hackl & Katzenbeisser, S. 29-30) Ausreier Whisker Q o Median Q u Whisker 50% der Daten
  • Folie 32
  • 19.10.04PI Statistik, WS 200432 Beispiel: Heilmittelkosten Heilmittelkosten je Patient (in Euro) bei 1682 Praktischen rzten (AM) 176 Internisten (IN) 242 Orthopden (OP) WGKG, 2002
  • Folie 33
  • 19.10.04PI Statistik, WS 200433 Box Plot: Elemente Box: mittlere 50% der Beobachtungen; Begrenzungen sind Quartile; Median als Mittellinie Innere Grenzen (inner fences): Q u - 1.5I, Q u + 1.5I uere Grenzen (outer fences): Q u - 3I, Q u + 3I Beobachtungen innerhalb der Inneren Grenzen werden verbunden (whiskers) Beobachtungen auerhalb der Inneren Grenzen und innerhalb der ueren Grenzen: einzeln mit einem + einzeichnen (outlier) Beobachtungen auerhalb der ueren Grenzen: einzeln mit einem * einzeichnen (far outlier)
  • Folie 34
  • 19.10.04PI Statistik, WS 200434 Fragestellungen In welchem Bereich kann man einen Mittelwert in der Grundgesamtheit erwarten ? Ist ein Mittelwert anders (kleiner, grer, oder ungleich) als eine bestimmte Vorgabe ?