374r Betriebswirtschaft, Internationales ... - hs- .Statistik für Betriebswirtschaft,...

download 374r Betriebswirtschaft, Internationales ... - hs- .Statistik für Betriebswirtschaft, Internationales

of 25

  • date post

    13-Sep-2018
  • Category

    Documents

  • view

    213
  • download

    0

Embed Size (px)

Transcript of 374r Betriebswirtschaft, Internationales ... - hs- .Statistik für Betriebswirtschaft,...

  • Statistikfr Betriebswirtschaft, Internationales Management,Wirtschaftsinformatik und Informatik

    Sommersemester 2016

    Prof. Dr. Stefan EtschbergerHochschule Augsburg

    steImage

    steImage

    steline

    ste1004.04.

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    67

    Weitere Konzentrationsmae

    Konzentrationskoeffizient:

    CRg = Anteil, der auf die g grten entfllt =n

    i=ng+1

    pi = 1 vng

    Herfindahl-Index:

    H =

    ni=1

    p2i ( [ 1n ;1])

    Es gilt: H = 1n (V2 + 1) bzw. V =

    n H 1

    Exponentialindex:

    E =

    ni=1

    ppii

    ( [ 1n ;1]

    )wobei 00 = 1

    Im Beispiel mit x = (1,2, 2, 15):

    CR2 = 1720 = 0,85

    H =

    (1

    20

    )2+ +

    (15

    20

    )2= 0,59

    E =

    (1

    20

    ) 120

    (15

    20

    ) 1520

    = 0,44

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    steline

    steline

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stePolygon

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    steline

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    steline

    steline

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stePolygon

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stehhhh

    stehhhh

    stehhhh

    stehhhh

    stehhhh

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

    stellllz

  • steText Box> # Aufgabe zu Lorenzkurve und Gini-Koeffizient> require(ineq) # Paket ist ntig > set.seed(4)> x = c(max(na.exclude(Umfrage$AusgKomm)), sample(Umfrage$AusgKomm, 4))> x[1] 4668 250 420 250 300 > # Aufgabe: > # a) Zeichne Lorenzkurve (5 Minuten)> # b) Berechne Gini-Koeffizient (3 Minuten)> > # Loesung> plot(Lc(x))> grid()> sort(cumsum(x)/sum(x))[1] 0.04245924 0.11379076 0.15625000 0.20720109 1.00000000> > # Gini von Hand> pi = sort(x)/sum(x) # Sortieren nicht vergessen> n = length(x)> x.Gini = ((2*sum(pi*(1:n))) - 6 )/n> x.Gini[1] 0.6118207> > # Oder ber Paket ineq> Gini(x)[1] 0.6118207

    steLine

    ste10Umfrage: In der letzten Aufgabe hatte ich

    A) Alles richtigB) Alles bis auf die Zeichnung richtigC) Einen Fehler in den ZahlenD) Mehr als einen Fehler in den ZahlenE) Ich wusste nicht, was zu tun ist

    steImage

    steImage

    steImage

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    68

    Auswertungsmethoden fr zweidimensionale Daten

    Zweidimensionale Urliste

    Urliste vom Umfang n zu zwei Merkmalen X und Y:

    (x1, y1), (x2, y2), . . . , (xn, yn)

    Kontingenztabelle:

    Sinnvoll bei wenigen Ausprgungen bzw. bei klassierten Daten.

    Ausprgungen von Y

    Ausprgungen von X b1 b2 . . . bl

    a1 h11 h12 . . . h1l

    a2 h21 h22 . . . h2l...

    ......

    ...

    ak hk1 hk2 . . . hkl

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    69

    Kontingenztabelle

    Unterscheide:

    Gemeinsame Hufigkeiten:

    hij = h(ai, bj)

    Randhufigkeiten:

    hi =

    lj=1

    hij und hj =k

    i=1

    hij

    Bedingte (relative) Hufigkeiten:

    f1(ai | bj) =hij

    hjund f2(bj | ai) =

    hij

    hi

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    70

    Hufigkeiten

    Beispiel: 400 unfallbeteiligte Autoinsassen:

    leicht verletzt schwer verletzt tot(= b1) (= b2) (= b3)

    angegurtet 264 90 6 360(= a1) (= h11) (= h12) (= h13) (= h1)

    nicht angegurtet 2 34 4 40(= a2) (= h21) (= h22) (= h23) (= h2)

    266 124 10 400

    (= h1) (= h2) (= h3) (= n)

    f2(b3 | a2) =440

    = 0,1 (10 % der nicht angegurteten starben.)

    f1(a2 | b3) =410

    = 0,4 (40 % der Todesopfer waren nicht angegurtet.)

    stellllz

    stellllz

    stellllz

    stellllz

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    71

    Streuungsdiagramm

    Streuungsdiagramm sinnvoll bei vielen verschiedenenAusprgungen (z.B. stetige Merkmale) Alle (xi, yi) sowie (x, y) in Koordinatensystem eintragen.

    Beispiel:

    i 1 2 3 4 5

    xi 2 4 3 9 7 25

    yi 4 3 6 7 8 28

    x = 255

    = 5

    y = 285

    = 5,6x

    y

    1

    1

    2

    2

    3

    3

    4

    4

    5

    5

    6

    6

    7

    7

    8

    8

    9

    9

    y

    x

    stehhhh

    stehhhh

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    72

    Beispiel Streuungsdiagramm

    (Datenquelle: Fahrmeir u. a. (2009))

    stehhhh

    steline

    stellllz

    stellllz

    stellllz

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    73

    Beispiel Streuungsdiagramm

    if (!require("RColorBrewer")) {install.packages("RColorBrewer")library(RColorBrewer)}mieten

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    74

    Beispiel Streuungsdiagramm

    x = cbind("Alter des Vaters"=AlterV, "Alter der Mutter"=AlterM)require("geneplotter") ## from BioConductorsmoothScatter(x, colramp=colorRampPalette(brewer.pal(9,"YlOrRd")) )

    40 50 60 70 80

    4045

    5055

    6065

    70

    Alter des Vaters

    Alte

    r de

    r M

    utte

    r

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    75

    require(GGally)ggpairs(MyData[, c("Alter", "AlterV", "AlterM", "Geschlecht")],

    upper = list(continuous = "density", combo = "box"),color='Geschlecht', alpha=0.5)

    Alte

    rA

    lterV

    Alte

    rMG

    esch

    lech

    t

    Alter AlterV AlterM Geschlecht

    20

    25

    30

    35Frau Mann

    40

    50

    60

    70

    80

    40

    50

    60

    70

    0

    20

    40

    60

    80

    0

    20

    40

    60

    80

    20 25 30 35 40 50 60 70 80 40 50 60 70 Frau Mann

  • StatistikEtschberger SS2016

    1. Einfhrung

    2. Deskriptive Statistik

    Hufigkeiten

    Lage und Streuung

    Konzentration

    Zwei Merkmale

    Korrelation

    Preisindizes

    Lineare Regression

    3. W-Theorie

    4. Induktive Statistik

    Quellen

    Tabellen

    76

    Bagplot: Boxplot in 2 Dimensionen

    require(aplpack)bagplot(jitter(AlterV), jitter(AlterM), xlab="Alter des Vaters", ylab="Alter der Mutter")

    ## [1] "Warning: NA elements have been exchanged by median values!!"

    40 50 60 70 80

    4045

    5055

    6065

    70