Ausgleichsrechnung - Lineare · PDF fileDr. Hempel – Mathematische Grundlagen,...
Transcript of Ausgleichsrechnung - Lineare · PDF fileDr. Hempel – Mathematische Grundlagen,...
Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 1
Ausgleichsrechnung - Lineare Regression
Die bisher betrachtete Fehlerrechnung ist gut verwendbar, wenn sich die betrachteten Größen direkt
messen lassen.
Oft sind physikalische Größen für eine direkte Messung aber nur schwer zugänglich; sie lassen
sich aber unter Verwendung leicht zu bestimmender Größen ermitteln.
Stellen wir uns als Beispiel vor, die Geschwindigkeit eines Autos auf einem Kinderkarussell ist zu
ermitteln. Das Auto selbst verfügt über kein Tachometer - es bleibt Ihnen eigentlich nur die Mög-
lichkeit, die Zeit eines Umlaufs zu stoppen und aus der Geometrie des Karussells den zurückge-
legten Weg zu bestimmen. Daraus lässt sich die Geschwindigkeit leicht berechnen.
Wie aber könnte eine Fehlerrechnung aussehen? Wie lässt sich eine Mehrfachmessung anstellen?
Sinnvoll wäre sicher, die Zeit bei jedem Umlauf zu messen. Da sich das Karussell mit weitgehend glei-
cher Geschwindigkeit (außer vielleicht in der 1. Runde) bewegt, lässt sich ein linearer Zusammenhang
zwischen zurückgelegtem Weg und der benötigten Zeit für die zurückgelegten Runden vermuten.
Mathematisch lässt sich ein solch linearer Zusammenhang ausdrücken:
BxAy bzw. 0 BxAy
Der physikalische Sinn lässt sich in den Konstanten A und B finden, die es über (mindestens 2) Mes-sungen von x und y zu bestimmen gilt.
Wir wissen inzwischen, dass die Größen x und y fehlerbehaftet sein werden und damit zu einer
Verfälschung der errechneten A und B führen. Wir suchen eine Möglichkeit, durch eine Vielfach-
messung den Einfluss der zufälligen Fehler auf die errechneten A und B zu vermindern und abzu-
schätzen.
Dabei beschränken wir uns auf den speziellen Fall, dass die Größe x fehlerfrei (fehlerarm) gemessen werden kann. Für verschiedene x - Werte ergeben sich dann entsprechende y -Werte, die mit einem
Zusammenhang BxAy beschrieben werden können.
Eine erste wichtige Frage ist also: Welche Größe lässt sich genauer ermitteln?
Im Falle des Kinderkarussells bleibt unser Messpunkt unverändert - also sehr genau.
Ein Fehler wird sicher bei der Zeitmessung auftreten. In unseren linearen Zusammenhang würden wir damit den Weg als x und die Zeit als y ausweisen.
Im Experiment werden also zurückgelegter Weg und Zeit für 10 Runden gemessen:
Weg s (m) Zeit t (s) Weg s (m) Zeit t (s)
12 12,2 72 59,1
24 17 84 60,2
36 22,1 96 65,7
42 33,2 108 69,9
60 34,4 120 70,1
Die Zeit wird als Funktion des vorgegebenen Wegs gemessen und sei dabei mit einem zufälligen Feh-
ler unbekannter Größe behaftet.
Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 2
Der unterstellte linearen Zusammenhang 0 BsAt wird nicht exakt erfüllen, d.h. für die einzel-
nen Zahlenpaare ),( kk ts wird stets 0 kk BsAt gelten.
Stellt man sich diesen Sachverhalt graphisch dar, liegen die gemessenen Punkte ),( kk ts stets um
eine Differenz kt neben der Gerade BsAt .
Eine fehlerfreie Berechnung der unbekannten Parameter A und B aus den Wertepaaren
),( kk ts wird daher nicht gelingen.
Möglich ist es, aus den Wertepaaren eine Schätzung für A und B zu gewinnen, die bei einer
wachsenden Anzahl von eingehenden Wertepaaren ),( kk ts den wahren Zahlenwerten von A
und B beliebig nahe kommt.
Berechnet werden also B als Näherung für den wahren Parameter B und A als Näherung für
den wahren Parameter A . A und B nennt man Regressionskoeffizienten.
Welche physikalische Bedeutung haben die Koeffizienten A und B eigentlich im Beispiel?
A ist der Achsenabschnitt der Zeitachse. Er gibt uns die Zeitverzögerung beim Anfahren an.
B ist der Anstieg der Regressionsgeraden st /tan ; das Reziproke der Geschwindigkeit.
Die mathematische Bedingung, die der Regressionsgeraden zu Grunde liegt, lautet
min)()(10
1
210
1
2 k
kk
k
k AsBtt
A und B müssen so gewählt werden, dass die Summe aller Abweichungen (positiv und negativ -
daher Quadrat) minimal wird.
Die einzelnen Terme )( AsBt kk entsprechen dabei der Differenz kt zwischen dem
Messwert kt und dem exakten Wert der Regressionsgeraden bei ks .
Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 3
Wir berechnen die Regressionskoeffizienten A und B :
Im Minimum der Summe der quadrierten kt verschwinden die ersten partiellen Ableitungen
nach A und B .
02
2
11
11
2
N
k
k
N
k
k
N
k
kk
N
k
kk
sBANt
AsBtAsBtA
und
02
2
1
2
11
11
2
N
k
k
N
k
k
N
k
kk
k
N
k
kk
N
k
kk
sBsAts
sAsBtAsBtB
Wie führen Mittelwerte ein:
N
k
kk
N
k
k
N
k
k
N
k
k tsN
ts,sN
s,tN
t,sN
s11
22
11
1111
und erhalten damit:
0 sBNANtN 0 sBAt
sowie
02 sBNsANtsN 02 sBsAts
Auflösen der Gleichungen nach B und A liefert die Berechnungsvorschriften
2
11
2
111
2211
111
N
k
k
N
k
k
N
k
k
N
k
k
N
k
kk
sN
sN
tN
sN
tsN
ss
tstsB
und
2
11
2
111
2
1
22
2
11
1111
N
k
k
N
k
k
N
k
k
N
k
kk
N
k
k
N
k
k
sN
sN
sN
tsN
sN
tN
ss
xtsstA
N
k
k
N
k
k sN
BtN
sBtA11
11
In unserem Beispiel bedeutet das:
sm 3638,88m 4277,1639,4465,4 22 ts,s,st,ms
msm
ms
mm
smms
ss
tstsB /6066,0
84,1212
774,735
4277,165490
39,444,653638,8822222
smmsssBtA 7418,439,44/81996,139,44
Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 4
Physikalische Bedeutung hat hier besonders (wie oben bereits erwähnt) der Kehrwert von B ,
der mit der Beziehung B
v1
den Schätzwert für die wahre Geschwindigkeit v liefert.
damit wird hkmsmmsv /934,5/648,1)/6066,0( 1 .
Da wir hier Fehlerrechnung betreiben, fragen wir natürlich nach dem Fehler von v !
Diesen Fehler von v gewinnen wir aus dem Fehler des Regressionskoeffizienten B .
Also auf! Berechnen wir den Fehler von B .
1. Wir berechnen die Summe der Fehlerquadrate der Messwerte kt :
2
1
2
1
2 888,276)()( sAsBttN
k
kk
N
k
k
2. Daraus gewinnen wir die mittlere Streuung ts der Messwerte
kt um die Regressionsgerade:
ssBAtN
sN
k
kky 883,52
1
1
2
Man beachte hier das )2( N im Nenner !
)2( N ergibt sich aus der Tatsache, dass ein Fehler im Anstieg B bzw. im
Achsenabschnitt A sinnvoll erst ab 3 Messwertepaaren bestimmt werden kann.
welchen Anstiegsfehler könnte man z.B. bestimmen, wenn die Gerade durch genau
2 Punkte verläuft?
3. Da A und B nur mittelbar (aus den Messwerten 101 ...tt ) errechnet werden, werden ihre
Fehler mittels Fehlerfortpflanzung ermittelt.
Es ergibt sich:
2
11
222
1
N
k
k
N
k
k
yyB
ssN
Ns
ssNss
2
11
2
1
2
22
2
N
k
k
N
k
k
N
k
k
yyA
ssN
s
sssN
sss oder
N
k
kBBA sN
ssss1
22 1
Im Beispiel:
msssN
ss yB /0534,01
22
ssN
ssssN
k
kBBA 958,31
1
22
Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 5
Es bleibt spannend!
Uns interessierte eigentlich der absoluten Fehler des Schätzwertes v !
Da die Geschwindigkeit hier das Reziproke des Anstiegs, müssen wir wieder einmal die Fehler-
fortpflanzung bemühen. Wie wirkt sich ein Fehler auf den Kehrwert einer Größe aus?
smsB
sB
sB
sB
Bs
B
Bs
B
BvBΔ
B
BvvΔ
BBB
-
B
-
BB
/145,011
1
1
22
2
1
Es ergibt sich somit eine Geschwindigkeit des Karussells von
smv /)145,0648,1(
Ist diese Angabe sinnvoll? NEIN !!
Wenn sich der Fehler bereits in der ersten Stelle nach dem Komma bemerkbar macht - was soll
dann eine Angabe weiterer Stellen für einen Sinn haben?
sinnvolle Ergebnisangabe: (Fehler werden immer aufgerundet!)
smv /)2,06,1(
Aussagekräftiger als der Wert des absoluten Fehlers sm,vΔ /20 ist häufig die Angabe des
relativen Fehlers v
vΔ.
Dieser errechnet sich z.B., indem man die Beziehung BsB
vΔ 2
1 durch erneutes Einsetzen des
Zusammenhanges B
v1
umformt: B
svs
Bvs
BBs
BvΔ B
BBB 1111
2
Division durch v ergibt dann B
BΔ
B
s
v
vΔ B
die relativen Fehler von v und B sind gleich.
Im Beispiel ergibt sich hier
%,
,
B
s
v
vΔ B 8,8088,0606650
053420
Der Korrelationskoeffizient r
Gelegentlich (besonders bei schwierigen Messungen) stellt sich die Frage, ob ein vermuteter linearer
Zusammenhang zwischen zwei Größen tatsächlich existiert; ob die beiden Größen also miteinander
korreliert sind.
Nicht immer sieht man es dem Diagramm der Messwerte an, wie „gut“ die eingetragenen Messwerte
auf einer Geraden liegen - oder auch nicht.
Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 6
Quantifizieren lässt sich „gut“ hier mit dem Korrelationskoeffizienten r .
Er ist gegeben durch:
2
11
2
2
11
2
111
22221111
111
N
k
k
N
k
k
N
k
k
N
k
k
N
k
k
N
k
k
N
k
kk
tN
tN
sN
sN
tN
sN
tsN
ttss
tsstr
Der Korrelationskoeffizient r kann dabei Werte zwischen 1r und 1r annehmen;
eine physikalische Größe lässt sich aus ihm nicht direkt gewinnen.
Je näher der Betrag von r dabei der 1 kommt, desto stärker enthalten die Wertepaare eine line-
are Beziehung.
Für einen Betrag von exakt 1 liegen alle Wertepaare exakt auf einer Geraden, die für 1r fal-
lend und für 1r steigend verläuft.
Für 0r ist keine Abhängigkeit anzunehmen.
Im Beispiel ergibt sich: 970350,r
Der Korrelationskoeffizient 970350,r zeigt mit dem positiven Vorzeichen eine direkte Pro-
portionalität zwischen s und t .
Die geringfügige Abweichung zu +1 zeigt die geringfügige Abweichung der realen Messwertpaare
vom erwarteten linearen Zusammenhang.