1. Aufgabe · 2012. 6. 4. · 1 15 -25 19,5 99 0,027 0,027 2 25 - 35 29,5 531 0,147 0,175 3 35 - 45...
Transcript of 1. Aufgabe · 2012. 6. 4. · 1 15 -25 19,5 99 0,027 0,027 2 25 - 35 29,5 531 0,147 0,175 3 35 - 45...
-
1. Aufgabe
Fall Merkmalsträger Merkmal Merkmalsausprägung Skalenniveau
a)
Studierende des 1. Semesters im Studiengang „Betriebswirtschaftslehre“ an der Hochschule Bonn-Rhein-Sieg, Standort Sankt Augustin
Staatsangehörigkeit Alle möglichen Staatsangehörigkeiten: Deutsch Russisch Polnisch Türkisch ……………..
nominal
b)
Alle wahlberechtigten Bürger der Stadt Bonn
Partei CDU, SPD, FDP, Bündnis 90/Die Grünen, BBB,…………
nominal
c)
Alle deutschen Frauen zwischen 30 und 40
Einkommen Alle möglichen Angaben in Euro
Metrisch – verhältnisskaliert (stetig oder diskret)
d)
Aller Städte ( >= 100.000 Einwohner) in NRW
Außentemperatur am 31. Dezember 2008
Alle möglichen Temperaturangaben in C °
Metrisch – intervallskaliert (stetig)
e)
Ausgewählte Konsumenten
Beurteilung der Qualität einer TV -Show
Von „sehr gut“ bis „sehr schlecht“
ordinal
f)
Alle Bonner Gymnasialschüler
Anzahl Kinobesuche in den Sommerferien 2009
Von 0 bis …… Metrisch - diskret
g)
Alle EU Mitgliedsstaaten Inflationsrate im Juli 2009
Von 0% bis ………… Metrisch - stetig
h)
Bonner Bürger Einstellung zum geplanten Bau des Festspielhauses
Verschiedene Einstellungsabstufungen
ordinal
i)
Eier vom Bonner Wochenmarkt
Güteklasse Die verschiedenen Klassen, A, B und C
ordinal
j)
Bonner Kinder, die zum Schuljahr 2009/10 eingeschult wurden
Körpergröße Alle möglichen Ausprägungen in cm
Metrisch (stetig)
-
2. Aufgabe
Merkmal Merkmalsausprägung Information
Augenfarbe Grün, blau, braun qualitativ
Bierkonsum 0 – 5 [ Liter ] quantitativ
Bruttogehalt Niedrig, hoch, sehr hoch qualitativ
Konfession evangelisch, katholisch qualitativ
Steuerklasse I -V qualitativ
3. Aufgabe
Merkmal Skalenniveau Vermerk
Geschwindigkeit von Ameisen Metrisch (Verhältnisskaliert) stetig
Alter in ganzen Jahren Metrisch (Verhältniskaliert) diskret
Fernsehkonsum in Std Metrisch (Verhältnisskaliert) diskret
Seitenzahl Buch Metrisch (Verhältnisskaliert) diskret
Steuerklasse nominal
Konfektionsgröße ordinal
Fußballmannschaft nominal
Wertung beim Eiskunstlauf ordinal
Güteklasse von Restaurants ordinal
-
4. Aufgabe
a)
b)
Arithmetisches Mittel: 333,5
Modus: 270
Median: 297,5
c)
Der Median von 297,5 wird von den Ausreißern nicht beeinflusst. Das arithmetische Mittel von 333,5 ist allerdings höher als 80% der beobachteten Werte (wird maßgeblich durch die Ausreißer verzerrt!)!
xi hi fi Hi Fi
270 2 0,2 2 0,2
280 1 0,1 3 0,3
290 1 0,1 4 0,4
295 1 0,1 5 0,5
300 1 0,1 6 0,6
310 1 0,1 7 0,7
330 1 0,1 8 0,8
480 1 0,1 9 0,9
510 1 0,1 10 1
Summe: 10 1
-
5. Aufgabe
Der Median liegt bei 61 Punkten: Bei 21 Beobachtungswerten (ungerade) liegt der Median beim (n+1)/2 ten (nach der Größe geordneten) Beobachtungswert: (21 + 1)/2 =11. Beobachtungswert
Arithmetisches Mittel: 59,048
Summenhäufigkeitsfunktion
Die Punktzahl, die 50% aller Teilnehmer erreicht haben ist natürlich der Median: 61 und diese Punktzahl liegt in Klasse 4!
6. Aufgabe
6G 06.1*15,1*92,0**1,1*18,1*16,1X = 1,09124
Intervall Klassenmitte hi Hi fi Fi
0 – 20 9,5 1 1 0,048 0,048
21 - 40 30,5 4 5 0,19 0,238
41 - 60 50,5 5 10 0,238 0,476
61 - 80 70,5 7 17 0,333 0,81
81 - 100 90,5 4 21 0,19 1
21 1
-
7. Aufgabe
Die durchschnittliche Entwicklungsrate beträgt 11,73%
8. Aufgabe
Durchschnittliche Wachstumsrate Branche:
Wachstumsfaktoren: 1,021; 1,069; 1,0714
√
Durschnittliche W.-rate : 5,35% (mögliche Rundungsdiff. 5,38% genauer!!!)
Durchschnittliche Wachstumsrate Unternehmen:
√
Durchschnittliche W.-rate: 6,11% (6,12% genauer!)
9. Aufgabe
Varianz: 6860,25 [€²]
Stabw.: 82,8266 €
Gemessen am arithmetischen Mittel von 333,50 € ist ein Preis von 320€ eher als unterdurchschnittlich anzusehen. Er liegt, gemessen am Median aber über den ersten 50% der Verteilung und findet sich somit im oberen Preisniveau wieder!
-
10. Aufgabe
Modus: 181 € (der häufigste Wert)
Median: 192 € (bei 8 Beobachtungswerten, liegt der Median, nachdem man die Beobachtungswerte der Größe nach geordnet hat bei
Arithmetisches Mittel: 194 €
Varianz: 1436
Standardabweichung: 37,89
Kosten in€ hi fi Fi
125 1 0,125 0,125
159 1 0,125 0,25
181 2 0,25 0,5
203 1 0,125 0,625
225 1 0,125 0,75
233 1 0,125 0,875
245 1 0,125 1
Die mittleren 40% liegen 20% über und 20% unter dem Median (=50%), d.h. in dem Intervall
30% und 70%.
Die 30% werden bei 181 € erreicht – die 70% bei 225 €
Intervall der mittleren 40% [181; 225]
-
11. Aufgabe
Person Anteile an der Grundgesamtheit
Kumulierte Anteile an der Grundgesamt-heit Einkommen
Anteile am Gesamtein-kommen
Kumulierte Anteile am Gesamt-einkommen
0 0
A 0,2 0,2 11.000,00 € 0,183 0,183
D 0,2 0,4 11.000,00 € 0,183 0,367
E 0,2 0,6 11.000,00 € 0,183 0,550
B 0,2 0,8 13.000,00 € 0,217 0,767
C 0,2 1 14.000,00 € 0,233 1,000
60.000,00 €
-
12. Aufgabe
In einer amtlichen Statistik finden Sie folgende Verteilung der Erwerbstätigen in der BRD für April 1990 (in 1.000 Personen):
Nr.
Altersgruppe
von … ..
bis unter…
Selbstständige und
mithelfende
Familienangehörige
abhängig
Beschäftigte
1 15 -25 99 5002
2 25 - 35 531 7009
3 35 - 45 1243 5731
4 45 - 55 937 6051
5 55 - 65 595 2284
6 65 - 75 160 63
7 75 - 95 42 16
1)Was sind die statistischen Einheiten, Grundgesamtheiten und Merkmale?
Statistische Einheit ist bzgl. der 2 dimensionalen HV der einzelne Erwerbstätige in der BRD im April 2009
Grundgesamtheit: Alle Erwerbstätigen im April 2009
Merkmale: 1.) Art der Beschäftigung mit 2 Ausprägungen
2.) Zugehörigkeit Altersklasse mit 7 Ausprägungen
2) Berechnen Sie das Durchschnittsalter der Selbstständigen und Familienangehörigen sowie der abhängig Beschäftigten.
Durchschnittsalter Selbstständige: 45,23
Durchschnittsalter abh. Beschäftigte: 37,16
-
Nr.
Altersgruppe X
von … ..
bis unter… Klassenmitte xi
Selbstständige und
mithelfende
Familienangehörige
1 15 -25 19,5 99 1.931
2 25 – 35 29,5 531 15.665
3 35 – 45 39,5 1243 49.099
4 45 – 55 49,5 937 46.382
5 55 – 65 59,5 595 35.403
6 65 – 75 69,5 160 11.120
7 75 – 95 84,5 42 3.549
Summen 3.607 163.147
3) Welcher Anteil der Selbstständigen und welcher Anteil der Unselbstständigen ist 55 Jahre und älter?
Nr.
Altersgruppe X
von … ..
bis unter… Klassenmitte xi
Selbstständige und
mithelfende
Familienangehörige
Rel.
Häufigkeiten
Kum. rel.
Häufigkeiten
1 15 -25 19,5 99 0,027 0,027
2 25 - 35 29,5 531 0,147 0,175
3 35 - 45 39,5 1243 0,345 0,519
4 45 - 55 49,5 937 0,260 0,779
5 55 - 65 59,5 595 0,165 0,944
6 65 - 75 69,5 160 0,044 0,988
7 75 - 95 84,5 42 0,012 1,000
Summen 3.607 1,000
-
Nr.
Altersgruppe X
von … ..
bis unter… Klassenmitte xi
abhängig
Beschäftigte
Rel.
Häufigkeiten
Kum. rel.
Häufigkeiten
1 15 -25 19,5 5002 0,191 0,191
2 25 - 35 29,5 7009 0,268 0,459
3 35 - 45 39,5 5731 0,219 0,678
4 45 - 55 49,5 6051 0,231 0,910
5 55 - 65 59,5 2284 0,087 0,997
6 65 - 75 69,5 63 0,002 0,999
7 75 - 95 84,5 16 0,001 1,000
Summen 26.156 1,000
4) Welcher Anteil der 65jährigen und älteren Erwerbstätigen ist selbstständig?
Anzahl der Erwerbstätigen ab 65 und älter: 223 + 58 = 281
Davon sind selbstständig: 160 + 42 = 202
Anteil: 202/281 = 71,9 %
-
13. Aufgabe
(a) Merkmalsträger: Anzahl der Vorstellungen
Merkmal: Anzahl der verkauften Karten
(b) Xa = 800 Karten (Klassenmitten ausrechnen; diese mit den absoluten Häufigkeiten
multiplizieren und anschließend durch 500 teilen!)
(c) Einzelne absolute Häufigkeiten aufaddieren: 200+50+50 = 300
(d) (200/2)+50+50 = 300
(e) 400.000 Karten
14. Aufgabe
a) 200,30 cm
b) 203 cm
c) Varianz: 74,21 [cm²] => Stabw: 8,61 cm
d) 8,61 / 200,30 = 0,043 = 4,30%
15. Aufgabe
Zu a) ordinal skaliertes Merkmal: nur Median möglich
Nach der Reihenfolge sortiert (1, 2, 3,4, 4,), der 3. Beobachtungswert: 3
Modus : 4
Zu b) Verhältnisskaliertes Merkmal/metrisch skaliert: Geometrisches Mittel, da
Wachstumsfaktoren:
Durchschnittlicher Wachstumsfaktor 2,49%
Zu c) nominalskaliertes Merkmal: nur Modus: 4 (graublaue Augen)
Zu d) metrische Skalierung: arithmetisches Mittel: (1 +2 +3+ 4 + 4)/5 = 2,8 km
491,2
*3*2*1
x*...*x*xx
5 2
n h
k
h
2
h
1G
4
k21
-
16. Aufgabe
a)
Merkmal: Anzahl der Taxen in der Stadt
Merkmalsträger: 20 Taxi Unternehmen
Merkmalsausprägungen: jede denkbare Taxi-Anzahl (xi)
Beobachtungswerte: Taxianzahl in dem jeweiligen Unternehmen
b)
xi hi fi Hi Fi
1 8 0,4 8 0,4
2 4 0,2 12 0,6
3 2 0,1 14 0,7
4 2 0,1 16 0,8
5 2 0,1 18 0,9
6 2 0,1 20 1
Summe: 20 1
-
c)
Arithmetisches Mittel: 2,6
Modus: 1 [Taxi]
Median: 2 [Taxen]
Q1 = 1 [Taxi]
Q3 = 4 [Taxen]
d)
QA = Q3 – Q1 = 3 => 50% der UN haben zwischen 1 und 4 Taxen!
Varianz: 3,04 => Stabw: 1,7436
e)
Anzahl aller Taxen der Stadt (bzw. der 20 Unternehmen): 2,6 (arithmetisches Mittel) * 20 (Unternehmen) = 52 Taxen
Anzahl der Taxen der 5 kleinsten Unternehmen
=> 1+1+1+1+1 = 5 => 5/52 * 100 = 9,6%
-> Die 5 kleinsten Unternehmen, haben 9,6% aller Taxen der Stadt!
Anzahl der Taxen der 5 größten Unternehmen:
=> 6+6+5+5+4=26 => 26/52 * 100= 50%
->Die 5 größten Taxiunternehmen haben 50% aller Taxen der Stadt!
-
17. Aufgabe
a)
Anzahl
Überstunden
Anzahl
Mitarbeiter fi Hi Fi
0 7 0,23 7 0,23
1 3 0,10 10 0,33
2 4 0,13 14 0,47
3 9 0,30 23 0,77
4 4 0,13 27 0,90
5 2 0,07 29 0,97
8 1 0,03 30 1,00
1
(b) 72 Überstunden! (0*7+1*2+2*4…)
(c) Median: 0,5* (3+3)= 3 Überstunden
50% der MA haben bis zu 3 Überstunden gemacht
Modus: 3 Überstunden
Der am häufigsten beobachtete Wert waren 3 Überstunden
Arithmetisches Mittel: 72/30 = 2,4 Überstunden
Im Durchschnitt hat jeder MA 2,4 Überstunden gemacht.
(d)
Varianz= 3,507 => Stabw. = 1,873 Überstunden
Durchschnittlich weichen die einzelnen Beobachtungswerte um ca. 1,87
(Über-)Stunden vom arithmetischen Mittel ab.
(e) - die 10 Mitarbeiter mit den wenigsten Überstunden?
0*7+3*1 = 3 3/72= 4,16%
- die 10 Mitarbeiter mit den meisten Überstunden?
1*8+2*5+4*4+3*3= 43 43/72= 59,72
(f) 0,3+0,13+0,07 = 50%
-
18. Aufgabe
a) 8.050.000,00 € - hier die Klassenmitten berechnen xi’ als Stellvertreter b) 35.590,91 € arithmetisches Mittel; Der Modus liegt in Klasse 2 [ 10 bis unter 20 ], der Median
liegt in Klasse 3 [20 bis unter 30].
c) Unter 30.000 € = F(3) = 68% d) In Klasse 5: Hier wird der 50% Anteil am Gesamtwert überschritten
Klasse
Depotwert
(in Tausend €)
Anzahl
Depots hi
Klassen
breite
xi’
Depotwert pro
Klasse (in Tausend
€) Hi fi Fi von bis unter
1 0 10 40 10 5 200 40 0,18 0,18
2 10 20 60 10 15 900 100 0,27 0,45
3 20 30 50 10 25 1250 150 0,23 0,68
4 30 50 30 20 40 1200 180 0,14 0,82
5 50 100 20 50 75 1500 200 0,09 0,91
6 100 200 20 100 150 3000 220 0,09 1,00
220 8050
Klasse Fi
kum
Depotwert
Anteil am
Gesamtwert
1 0,18 200 2,48%
2 0,45 1100 13,66%
3 0,68 2350 29,19%
4 0,82 3550 44,10%
5 0,91 5050 62,73%
6 1,00 8050 100,00%
2
xx'x
u
i
o
ii
2
xx'xu
i
o
ii
-
Zweidimensionale Häufigkeitsverteilungen
19. Aufgabe
beobachtete absolute Häufigkeiten
Lernfrequenz
Erfolg Regelmäßig nicht regelmäßig
Bestanden 152 8
nicht bestanden 8 32
beobachtete relative Häufigkeiten
Lernfrequenz (Y)
Erfolg (X) regelmäßig nicht regelmäßig Summen
Bestanden 0,76 0,04 0,8 f(x1)
nicht bestanden 0,04 0,16 0,2 f(x2)
Summen 0,8 0,2 1
f(y1) f(y2)
erwartete (theoretische) relative Häufigkeiten (Unabhängigkeit!!!)
Lernfrequenz (Y)
Erfolg (X) regelmäßig nicht regelmäßig Summen
Bestanden 0,64 0,16 0,8
nicht bestanden 0,16 0,04 0,2
Summen 0,8 0,2 1
Indifferenztabelle (theor. abs. Häufigkeiten)
-
Lernfrequenz (Y)
Erfolg (X) regelmäßig nicht regelmäßig Summen
Bestanden 128 32 160
nicht bestanden 32 8 40
Summen 160 40 200
Arbeitstabelle
X² max = 200
X²/X²max = 0,5625
V = 0,75
20. Aufgabe
a) 10,13%
b) 87%
Zeile i Spalte j ho he (ho-he) (ho-he)² X²
1 1 152 128 24 576 4,5
1 2 8 32 -24 576 18
2 1 8 32 -24 576 18
2 2 32 8 24 576 72
Summen: 200 200 0 2304 112,5
-
21. Aufgabe
Absolute Häufigkeiten
Relative Häufigkeiten
a) Anteil der Frauen unter den Personen, die mit der Euro-Währung zufrieden sind:
45,10% (198/439)
b) % der Männer, die unzufrieden sind mit der Euro-Währung
30,27% (122/403)
unzufrieden neutral zufrieden Summe
männlich 122 40 241 403
weiblich 173 20 198 391
Summe 295 60 439 794
unzufrieden neutral zufrieden Summe
männlich 0,1537 0,0504 0,3035 0,5076
weiblich 0,2179 0,0252 0,2494 0,4924
Summe 0,3715 0,0756 0,5529 1,0000
-
22. Aufgabe
a)
Beobachtete absolute Häufigkeiten
Beobachtete relative Häufigkeiten
Erwartete relative Häufigkeiten (bei Unabhängigkeit)
Erwartete absolute Häufigkeiten (bei Unabhängigkeit)
Arbeitstabelle
männlich weiblich Summe
Bier 12 32 44
Wein 25 31 56
Summe 37 63 100
männlich weiblich Summe
Bier 0,12 0,32 0,44
Wein 0,25 0,31 0,56
Summe 0,37 0,63 1
männlich weiblich Summe
Bier 0,16 0,28 0,44
Wein 0,21 0,35 0,56
Summe 0,37 0,63 1,00
männlich weiblich Summe
Bier 16 28 44
Wein 21 35 56
Summe 37 63 100
Zeile i Spalte j ho he (ho-he) (ho-he)² X²
1 1 12 16 -4 16 1,00
1 2 32 28 4 16 0,57
2 1 25 21 4 16 0,76
2 2 31 35 -4 16 0,46
100 100 0 64 2,79
-
b)
Mit Cramer-Kontingenzmaß
V =√
√
= 0,167 => schwacher Zusammenhang der beiden Merkmale
Mit Phi-Koeffizienten
Φ = √
= √
= 0,167 => schwacher Zusammenhang der beiden Merkmale
Mit dem Pearson’schen Kontingenzkoeffizienten
C = √
= √
= 0,1647
Ckorr=
mit cmax= √
= 0,707
Ckorr =
= 0,233 => schwacher Zusammenhang der beiden Merkmale
c)
Es wurden wesentlich mehr Frauen als Männer befragt. Daher könnte man daran zweifeln, ob die Umfrage repräsentativ ist!
-
23. Aufgabe
a)
Relative Häufigkeiten
b)
Bedingung „Geschlecht“
c)
Bedingung „Alkohol“
Bier (y1) Wein (y2) Tequila (y3)Whiskey
(y4)Wodka (y5) Summe
Weiblich
(x1)0,10 0,25 0,07 0,06 0,09 0,57
Männlich
(x2)0,23 0,09 0,05 0,03 0,03 0,43
Summe 0,33 0,34 0,11 0,10 0,11 1,00
Bier (y1) Wein (y2) Tequila (y3)Whiskey
(y4)Wodka (y5) Summe
Weiblich
(x1)0,18 0,44 0,12 0,11 0,15 1,00
Männlich
(x2)0,53 0,21 0,11 0,08 0,07 1,00
Summe
Bier (y1) Wein (y2) Tequila (y3)Whiskey
(y4)Wodka (y5) Summe
Weiblich
(x1)0,31 0,73 0,60 0,65 0,75
Männlich
(x2)0,69 0,27 0,40 0,35 0,25
Summe 1,00 1,00 1,00 1,00 1,00
-
d)
Unabhängigkeit.
Bei Unabhängigkeit müssten die Werte folgendermaßen verteilt sein:
Zum Vergleich nochmal die Verteilung der relativen Häufigkeiten:
Daraus folgt, dass die Merkmale nicht unabhängig voneinander sind!!!
Bier (y1) Wein (y2) Tequila (y3)Whiskey
(y4)Wodka (y5) Summe
Weiblich
(x1)0,19 0,20 0,07 0,06 0,07 0,57
Männlich
(x2)0,14 0,15 0,05 0,04 0,05 0,43
Summe 0,33 0,34 0,11 0,10 0,11 1,00
Bier (y1) Wein (y2) Tequila (y3)Whiskey
(y4)Wodka (y5) Summe
Weiblich
(x1)0,10 0,25 0,07 0,06 0,09 0,57
Männlich
(x2)0,23 0,09 0,05 0,03 0,03 0,43
Summe 0,33 0,34 0,11 0,10 0,11 1,00
-
24. Aufgabe
a)
rs= 0,783 [Rechnung:(1 -
)]=> Starker positiver Zusammenhang
der beiden Merkmale.
Das Sprichwort trifft auf Basis der oben aufgeführten Untersuchung zu!
(b)
Es fällt auf, dass Paar #4 die größte Differenz aufweist! Es handelt sich bei
diesem Paar um einen Ausreißer!
Durch Weglassen des Paares #4 ergibt sich folgendes Bild:
Ehepaar Nr. 1 2 3 5 6 7 8 9 10
Konfektionsgröße Frau xi 46 52 32 42 36 48 38 44 34
Konfektionsgröße Mann yi 56 58 44 54 46 60 50 52 48
Rang xi 3 1 9 5 7 2 6 4 8
Rang yi 3 2 9 4 8 1 6 5 7
di 0 -1 0 1 -1 1 0 -1 1
di2 0 1 0 1 1 1 0 1 1 6
n = 9!!! Und es entsteht eine neue Rangfolge
-
D.h. der Zusammenhang der beiden Merkmale ohne den Ausreißer (Paar
Nummer 4) ist deutlich höher als vorher. Dies schlägt sich in einem höheren
Wert des Rangkorrelationskoeffizienten wieder!
25. Aufgabe
̅̅̅̅
̅̅̅̅
sx² = 44,790 => sx = 6,693
sy² = 99.982,001 => sy = 316,199
Cxy = 478,012,
rxy = 0,226 => d.h. positiver linearer Zusammenhang der beiden Merkmale.
Regressionsgrade:
f(x) = a+b*x
b = rxy *
0,226 * (316,199/6,693) = 10,677
a = ̅̅̅̅ ̅̅̅̅ 530,27 – 10,677*6,68 = 458,948
f(x) = 458,948+10,677*x
-
R² = (rxy²) = (0,226²) = 0,051 => d.h. 5% der Varitation von y durch x warden durch die Regressionsgerade erklärt!
-
26. Aufgabe
a)
Verteilung der absoluten Häufigkeiten:
Verteilung der relativen Häufigkeiten:
b)
1. keinen: 20%
einen: 60%
zwei: 20%
2. 25 % (0,05 / 0,2)
3. 35% (1*1 + 3*2 PKW = 7 PKW => 7/20 = 0,35)
4. 31,25% (5/16 = 0,3125)
5. 65% (13/20)
c) Arithmetisches Mittel von X = 2 Personen
0 1 2 Summe
1 2 6 0 8
2 1 4 1 6
3 0 1 3 4
4 1 1 0 2
Summe 4 12 4 20An
zah
l Per
son
en (
X)
Anzahl PKW (Y)
0 1 2 Summe
1 0,1 0,3 0 0,4
2 0,05 0,2 0,05 0,3
3 0 0,05 0,15 0,2
4 0,05 0,05 0 0,1
Summe 0,2 0,6 0,2 1
Anzahl PKW (Y)
An
zah
l Per
son
en (
X)
-
Arithmetisches Mittel von Y = 1 PKW
Varianz von X = 1 [Person²] => Stabw. = 1
Varianz von Y = 0,4 [PKW²] => Stabw. = 0,632
d)
Kovarianz
Tabelle zur Hilfe:
HH x y x*y
1 1 0 0
2 1 0 0
3 1 1 1
4 1 1 1
5 1 1 1
6 1 1 1
7 1 1 1
8 1 1 1
9 2 0 0
10 2 1 2
11 2 1 2
12 2 1 2
13 2 1 2
14 2 2 4
15 3 1 3
16 3 2 6
17 3 2 6
18 3 2 6
19 4 0 0
20 4 1 4
Summe 40 20 43
/20 /20
Xa= 2 Ya = 1
-
s²x= 100/20 – (2²) = 1 => √
s²y= 28/20 – (1²) = 0,4 => √
Antwort:
Schwache positive Korrelation der beiden Merkmale X und Y!!!
HH x y x*y x² y²
1 1 0 0 1 0
2 1 0 0 1 0
3 1 1 1 1 1
4 1 1 1 1 1
5 1 1 1 1 1
6 1 1 1 1 1
7 1 1 1 1 1
8 1 1 1 1 1
9 2 0 0 4 0
10 2 1 2 4 1
11 2 1 2 4 1
12 2 1 2 4 1
13 2 1 2 4 1
14 2 2 4 4 4
15 3 1 3 9 1
16 3 2 6 9 4
17 3 2 6 9 4
18 3 2 6 9 4
19 4 0 0 16 0
20 4 1 4 16 1
Summe 40 20 43 100 28
-
27. Aufgabe
a) Absolute Häufigkeitsverteilung
relative Häufigkeitsverteilung
b)
Durchschnittsalter ermitteln => zunächst Klassenmitten berechnen:
15 – 35 Jahre = 25 ( (15+35)/2)
35 – 45 Jahre = 40 ((35+45)/2)
45 – 75 Jahre = 60 ((45+75)/2)
Durchschnittsalter: 25*80+40*110+60*60 = 10000/250 = 40 Jahre
Varianz von X = 168 [Jahre²]
c)
Arithmetisches Mittel von Y: 1,20
Varianz: 0,96 [PCs²]
d)
yi 0 1 2 3 4 Summe
xi
15-35 Jahre 10 30 25 13 2 80
35-45 Jahre 30 50 20 7 3 110
45-75 Jahre 25 20 15 0 0 60
Summe 65 100 60 20 5 250
yi 0 1 2 3 4 Summe
xi
15-35 Jahre 0,04 0,12 0,1 0,052 0,008 0,32
35-45 Jahre 0,12 0,2 0,08 0,028 0,012 0,44
45-75 Jahre 0,1 0,08 0,06 0 0 0,24
Summe 0,26 0,4 0,24 0,08 0,02 1
-
a) 300 PCs (100*1+2*60+3*20+4*5)
b) 16,67% (20*1+15*2 = 50/300 = 0,1667
c) 0,8333 PCs (20*1+15*2 = 50/60 = 0,8333)
d) 41,67% (25/60 = 0,4167)
e) 14% (35/250 = 0,14)
28. Aufgabe
Arbeitstabelle:
positiver, mäßig starker Zusammenhang zwischen den Platzierungen des 1. und 2. Wettbewerbs
Person A B C D E F G H
Wettbewerb 1 (X) 4 8 1 7 6 2 5 3
Wettberwerb 2 (Y) 6 4 3 7 5 1 8 2
i X Y d d²
1 4 6 -2 4
2 8 4 4 16
3 1 3 -2 4
4 7 7 0 0
5 6 5 1 1
6 2 1 1 1
7 5 8 -3 9
8 3 2 1 1
Summe 36 36 0 36
1- ((6*36)/8*(8²-1)) = 0,5714
-
29. Aufgabe
a) Merkmalsträger: Die neun bewerteten Fakultäten bzw. Universitäten!
b) Anwendung des Rangkorrelationskoeffizienten für den Fall von Bindungen!
Universität Studentenurteil (X) Rang X Professorenurteil (Y) Rang Y X*Y X² Y²
Köln 3 3,5 2,3 4 14 12,25 16
Frankfurt 3,1 6 2,4 5 30 36 25
Münster 3,2 8 2,1 2,5 20 64 6,25
Hamburg 3 3,5 3,1 9 31,5 12,25 81
Mannheim 3,1 6 1,6 1 6 36 1
Sankt Augustin 2,9 2 2,8 8 16 4 64
München 2,6 1 2,6 7 7 1 49
Göttingen 3,1 6 2,1 2,5 15 36 6,25
Erlangen 3,3 9 2,5 6 54 81 36
Summe 45 45 193,5 282,5 284,5
Arithm. Mittel X 5 Arithm. Mittel Y 5
Kovarianz -3,5
Stabw. X 6,38889 Wurzel => 2,528
Stabw. Y 6,61111 Wurzel => 2,571
Korrelationskoeffizient -0,5385
-
30. Aufgabe
Wie gut schätzt die Regressionsgerade die Veränderung der Punktzahl in der Klausur bei
einer Veränderung der Anzahl vorbereiteter Hausübungen?
R² = 0,513 => 51,30 % der Regression von Y durch X werden durch die Regressionsgrade erklärt.
31. Aufgabe
-
32. Aufgabe
Betrieb Umsatz (X) Aufwand (Y) xi2 yi
2 xi*yi
A 78 27 6084 729 2106
B 85 28 7225 784 2380
C 105 31 11025 961 3255
D 116 32 13456 1024 3712
E 91 28 8281 784 2548
F 74 25 5476 625 1850
G 63 22 3969 484 1386
H 75 26 5625 676 1950
I 85 30 7225 900 2550
J 98 31 9604 961 3038
K 105 32 11025 1024 3360
L 57 24 3249 576 1368
Summe 1.032 336 92.244 9.528 29.503
Xa = 1.032/12 = 86 Ya= 336/12 = 28
59,5028*86503.29*12
1YXyx)yy(*)xx(
n
1C AAj
n
1j
jj
n
1j
jXY n
1
059,17291s
29186244.92*12
1)X(xs
x
2n
1i
22
i
2
x
n
1
162,310s
1028528.9*12
1)y(ys
y
2n
1i
22
i
2
y
n
1
-
938,0162,3*059,17
59,50
*
Cr
YX
XYXY
174,0059,17
162,3*938,0
s
s*rb
x
y
xy
036,1386*174,028 a
216,2570*174,0036,13)70(y
x*174,0036,13y
bxaŷ
^
ii
^
ii
869,0938,0)r(R 22xy2
-
33. Aufgabe
1. Zunächst werden die Ränge über jeden Gutachter erstellt
Kandidat
i
Bewertung
A Rang A
Bewertung
B Rang B
1 82 11 42 10
2 98 7 46 9
3 87 8 39 11
4 40 12 37 12
5 116 3 65 5
6 113 4 88 2
7 111 5 86 3
8 83 10 56 7
9 85 9 62 6
10 126 1 92 1
11 106 6 54 8
12 117 2 81 4
2. Da es keine Bindungen gibt, kann mit der vereinfachten Formel des
Rangkorrelationskoeffizienten nach Spearman berechnet werden:
)1n(*n
d*6
1)1n(*n*)1n(
d*6
1r2
n
1i
2n
1i
2
s
-
Hierzu müssen zunächst die Rangdifferenzen berechnet werden!
Es besteht somit ein starker positiver Zusammenhang zwischen den beiden Einstufungen
der Abteilungsleiter A und B.
Den gleichen Wert hätte man erhalten, wenn man den Bravais-Pearson
Korrelationskoeffizient auf die Ränge A und B angewendet hätte.
Ist aber aufwendiger und nur im Fall von „Bindungen“ anzuwenden.
Kandidat
i Rang A Rang B
Differenz der
Rangplätze( d):
Rang A - Rang B d2
1 11 10 1 1
2 7 9 -2 4
3 8 11 -3 9
4 12 12 0 0
5 3 5 -2 4
6 4 2 2 4
7 5 3 2 4
8 10 7 3 9
9 9 6 3 9
10 1 1 0 0
11 6 8 -2 4
12 2 4 -2 4
Summe 78 78 0 52
8182,01818,011716
3121
143*12
3121
)112(*12
52*61
)1n(*n
d*6
1r22
n
1i
2
s
-
34. Aufgabe
(a)
X= Fläche der Wohnung in m²
Y= Mietpreis in €
sx= 8,944
sy= 76,345
Berechnung von rxy:
7,904= rxy *76,345/8,944
7,904= rxy * 8,536
rxy= 0,926
R² = (0,926²) = 0,857
85,7 % der Variation von Y (der Kaltmiete) werden durch die Regressionsfunktion
bzw. durch die Variation von X (der Fläche der Wohnung) erklärt.
(b)
Mit circa 466,61€ ( y= 166,26+7,904*38 => 466,61)
-
35. Aufgabe
relative Häufigkeiten
positiv unentschieden negativ Summe
weiblich 0,17 0,082 0,148 0,4
männlich 0,3 0,104 0,196 0,6
Summe 0,47 0,186 0,344 1
Wie müssten die relativen Häufigkeiten aussehen, wenn es keinen Zusammenhang
zwischen der Entscheidung der Pausenregelung und dem Geschlecht gibt:
Unabhängigkeitstabelle
Positiv unentschieden negativ Summe
weiblich 0,47*200 = 94 0,186*200 = 37,2 0,344*200 = 68,8 200
männlich 141 55,8 103,2 300
Summe 235 93 172 500
ij hij (o) hij ( e ) hij (o) - hij (e ) (hij (o) - hij (e ))2
(hij (o) - hij (e ))2/ hij ( e )
11 85 94 -9 81 0,862
12 41 37 4 16 0,432
13 74 69 5 25 0,362
21 150 141 9 81 0,574
22 52 56 -4 16 0,286
23 98 103 -5 25 0,243
Summe Chi-Quadrat =2,759
0741,00055,0500759,2
759,22
2
nC
-
36. Aufgabe
Zunächst muss die Rangfolge bzgl. beider Ausprägungen bestimmt werden:
Nr Preis € Rang (P) Qualitätsurteil Rang (Q)
1 15 8 ++ 1
2 30 5 - 10
3 10 12 + 5
4 22 7 ++ 2
5 44 3 ++ 3
6 13 10 + 6
7 15 9 0 8
8 23 6 + 7
9 30 4 0 9
10 45 2 ++ 4
11 12 11 - 11
12 46 1 -- 12
105,0707,0
0741,0
max
2
2
max
C
n
C
CCkorr
707,0)r,kmin(
1)r,kmin(Cmax
2
1
-
Hier ist jetzt zu beachten, dass sowohl bzgl. des Preises als auch des Qualitätsurteils die
Produkte teilweise gleiche Ränge erhalten: Es muss der durchschnittliche Rang
berechnet werden.
Bzgl. des Preises haben Produkt Nr. 1 und 7 den gleichen Preis von 15 €, d.h. sie
belegen Rang 8 und 9: Ø Rang: (8 + 9)/2 =8,5
Produkt 2 und 9 kosten jeweils 30 €, d.h. sie belegen Rang 4 und 5: Ø Rang: (4 + 5)/2
=4,5
Bzgl. des Qualitätsurteils sind
4 Produkte mit ++ bewertet: (Rang1,2,3 und 4):Ø Rang: (1 +2+ 3+4)/4 = 2,5
3 Produkte mit + bewertet (Rang 5,6 und 7): Ø Rang: (5 +6+ 7)/3 = 6
2 Produkte mit 0 bewertet (Rang 8 und 9): Ø Rang: (8+9)/2 = 8,5
2 Produkte mit - bewertet (Rang 10 und 11): Ø Rang: (10+11)/2 = 10,5
Nr Preis € Rang (P) Qualitätsurteil Rang (Q)
1 15 8,5 ++ 2,5
2 30 4,5 - 10,5
3 10 12 + 6
4 22 7 ++ 2,5
5 44 3 ++ 2,5
6 13 10 + 6
7 15 8,5 0 8,5
8 23 6 + 6
9 30 4,5 0 8,5
10 45 2 ++ 2,5
11 12 11 - 10,5
12 46 1 -- 12
-
Es muss aufgrund der vielen Bindungen der Rangkorrelationskoeffizient nach Bravais-
Pearson berechnet werden, aber anstatt der Werte werden die Ränge betrachtet:
Es folgen zwei Lösungsmöglichkeiten
I. Lösungsweg aus dem Skript von Frau Jacobsen:
n
1j
n
1j
2
j
2
j
n
1j
jj
XY
y)yn
1)x)x
n
1
y)y)x)xn
1
r
)rg(rg(rg(rg(
)rg(rg(rg(rg(
-
Rang (P) (X) Rang (Q) (Y)
1.) rg(x) -
rg(Xa)
2.) rg(y) -
rg(Ya) 1.)*2.)
3.) (rg(x) -
rg(Xa)) 2
4.) (rg(y) -
rg(Ya))2
1 8,5 2,5 2,00 -4,00 -8,00 4,00 16,00
2 4,5 10,5 -2,00 4,00 -8,00 4,00 16,00
3 12 6 5,50 -0,50 -2,75 30,25 0,25
4 7 2,5 0,50 -4,00 -2,00 0,25 16,00
5 3 2,5 -3,50 -4,00 14,00 12,25 16,00
6 10 6 3,50 -0,50 -1,75 12,25 0,25
7 8,5 8,5 2,00 2,00 4,00 4,00 4,00
8 6 6 -0,50 -0,50 0,25 0,25 0,25
9 4,5 8,5 -2,00 2,00 -4,00 4,00 4,00
10 2 2,5 -4,50 -4,00 18,00 20,25 16,00
11 11 10,5 4,50 4,00 18,00 20,25 16,00
12 1 12 -5,50 5,50 -30,25 30,25 30,25
Summen 78 78 0 0 -2,5 142 135
-
Zähler von rs: 2083,0)5,2(*12
1y)y)x)x
n
1 n
1j
jj
)rg(rg(rg(rg(
Nenner von rs :
53798,11125,133135*12
1*142*
12
1y)y
n
1)x)x
n
1 n
1j
n
1j
2
j
2
j
)rg(rg(rg(rg(
Es besteht kein linearer Zusammenhang und die Aussage trifft nicht zu!!!
II. Lösungsweg den wir im Tutorium besprochen haben:
Rang (X) Rang (Y) X*Y X² Y²
1 8,5 2,5 21,25 72,25 6,25
2 4,5 10,5 47,25 20,25 110,25
3 12 6 72 144 36
4 7 2,5 17,5 49 6,25
5 3 2,5 7,5 9 6,25
6 10 6 60 100 36
7 8,5 8,5 72,25 72,25 72,25
8 6 6 36 36 36
9 4,5 8,5 38,25 20,25 72,25
10 2 2,5 5 4 6,25
11 11 10,5 115,5 121 110,25
12 1 12 12 1 144
Summen 78 78 504,5 649 642
Xa = 78/12 = 6,5
Ya = 78/12 = 6,5
Cxy = ((504,5/12))-(6,5*6,5) = -0,2083
sx = (649/12)-(6,5²) = 11,8333333 => Wurzel 3,440
sy = (642/12)-(6,5²) = 11,25 => Wurzel 3,354
r = -0,2083/(3,440*3,354) = -0,018
018,053798,11
2083,0rs
-
5,3)2,45,33,33(4
1YA
37. Aufgabe
Zunächst wird die abhängige Variable Ct mit y bezeichnet, die unabhängige Variable Yt mit x.
Die Koeffizienten a und b werden wie folgt berechnet:
Hilfstabelle aufstellen, um sx und sy zu berechnen sowie den Korrelationskoeffizient bzw. die
Covarianz:
Jahr Ct =Yj Yt = Xj
2000 3 3,5 -0,5 -1 0,5
2001 3,3 4 -0,2 -0,5 0,1
2002 3,5 4,5 0 0 0
2003 4,2 6 0,7 1,5 1,05
14 18 Summe = 1,65
Jahr Ct =Yj Yt = Xj xj - X (xj - X) 2
2000 3 3,5 -1 1
2001 3,3 4 -0,5 0,25
2002 3,5 4,5 0 0
2003 4,2 6 1,5 2,25
Summe = 3,5
AAj
n
1j
jj
n
1j
jXY YXyx)yy(*)xx(n
1C
n
1
ax*b y
AYy AXx )Yy(*)Xx( AA
5,4)65,445,3(4
1XA
4125,065,1*)yy(*)xx(n
1C j
n
1j
jXY 4
1
x
y
xy
xyx
yxy
x2
xy
s
s*r
s*s*s
s*C
s
Cb
s
s*|
y
y
-
Die Varianz von x sx2:
Oder zunächst den Korrelationskoeffizienten berechnen
Ct = a + b*Yt
Ct (yt) = 1,378 + 0,471*Yt
C (7) = 1,378 + 0,471*7 = 4,678 Billionen
Gütemaß
x
y
xys
s*rb
998,04415,0*9354,0
4125,0
*
)yy(*)xx(n
1
*
Cr
YX
j
n
1j
j
YX
XYXY
875,05,3*4
1)xx(
n
1 2A
n
1j
j
2
x
9354,0875,02
xx
471,0s
Cb
x2
xy
0,875
0,4125
4415,01955,02
yy
471,09354,0
4415,0*998,0
s
s*rb
x
y
xy
378,14,4*471,05,3x*b y a
997,0)998.0()r(R 22xy2