Ausgleichsrechnung - Lineare · PDF fileDr. Hempel – Mathematische Grundlagen,...

6
Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 1 Ausgleichsrechnung - Lineare Regression Die bisher betrachtete Fehlerrechnung ist gut verwendbar, wenn sich die betrachteten Größen direkt messen lassen. Oft sind physikalische Größen für eine direkte Messung aber nur schwer zugänglich; sie lassen sich aber unter Verwendung leicht zu bestimmender Größen ermitteln. Stellen wir uns als Beispiel vor, die Geschwindigkeit eines Autos auf einem Kinderkarussell ist zu ermitteln. Das Auto selbst verfügt über kein Tachometer - es bleibt Ihnen eigentlich nur die Mög- lichkeit, die Zeit eines Umlaufs zu stoppen und aus der Geometrie des Karussells den zurückge- legten Weg zu bestimmen. Daraus lässt sich die Geschwindigkeit leicht berechnen. Wie aber könnte eine Fehlerrechnung aussehen? Wie lässt sich eine Mehrfachmessung anstellen? Sinnvoll wäre sicher, die Zeit bei jedem Umlauf zu messen. Da sich das Karussell mit weitgehend glei- cher Geschwindigkeit (außer vielleicht in der 1. Runde) bewegt, lässt sich ein linearer Zusammenhang zwischen zurückgelegtem Weg und der benötigten Zeit für die zurückgelegten Runden vermuten. Mathematisch lässt sich ein solch linearer Zusammenhang ausdrücken: Bx A y bzw. 0 Bx A y Der physikalische Sinn lässt sich in den Konstanten A und B finden, die es über (mindestens 2) Mes- sungen von x und y zu bestimmen gilt. Wir wissen inzwischen, dass die Größen x und y fehlerbehaftet sein werden und damit zu einer Verfälschung der errechneten A und B führen. Wir suchen eine Möglichkeit, durch eine Vielfach- messung den Einfluss der zufälligen Fehler auf die errechneten A und B zu vermindern und abzu- schätzen. Dabei beschränken wir uns auf den speziellen Fall, dass die Größe x fehlerfrei (fehlerarm) gemessen werden kann. Für verschiedene x - Werte ergeben sich dann entsprechende y -Werte, die mit einem Zusammenhang Bx A y beschrieben werden können. Eine erste wichtige Frage ist also: Welche Größe lässt sich genauer ermitteln? Im Falle des Kinderkarussells bleibt unser Messpunkt unverändert - also sehr genau. Ein Fehler wird sicher bei der Zeitmessung auftreten. In unseren linearen Zusammenhang würden wir damit den Weg als x und die Zeit als y ausweisen. Im Experiment werden also zurückgelegter Weg und Zeit für 10 Runden gemessen: Weg s (m) Zeit t (s) Weg s (m) Zeit t (s) 12 12,2 72 59,1 24 17 84 60,2 36 22,1 96 65,7 42 33,2 108 69,9 60 34,4 120 70,1 Die Zeit wird als Funktion des vorgegebenen Wegs gemessen und sei dabei mit einem zufälligen Feh- ler unbekannter Größe behaftet.

Transcript of Ausgleichsrechnung - Lineare · PDF fileDr. Hempel – Mathematische Grundlagen,...

Page 1: Ausgleichsrechnung - Lineare  · PDF fileDr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 3 Wir berechnen die Regressionskoeffizienten A und

Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 1

Ausgleichsrechnung - Lineare Regression

Die bisher betrachtete Fehlerrechnung ist gut verwendbar, wenn sich die betrachteten Größen direkt

messen lassen.

Oft sind physikalische Größen für eine direkte Messung aber nur schwer zugänglich; sie lassen

sich aber unter Verwendung leicht zu bestimmender Größen ermitteln.

Stellen wir uns als Beispiel vor, die Geschwindigkeit eines Autos auf einem Kinderkarussell ist zu

ermitteln. Das Auto selbst verfügt über kein Tachometer - es bleibt Ihnen eigentlich nur die Mög-

lichkeit, die Zeit eines Umlaufs zu stoppen und aus der Geometrie des Karussells den zurückge-

legten Weg zu bestimmen. Daraus lässt sich die Geschwindigkeit leicht berechnen.

Wie aber könnte eine Fehlerrechnung aussehen? Wie lässt sich eine Mehrfachmessung anstellen?

Sinnvoll wäre sicher, die Zeit bei jedem Umlauf zu messen. Da sich das Karussell mit weitgehend glei-

cher Geschwindigkeit (außer vielleicht in der 1. Runde) bewegt, lässt sich ein linearer Zusammenhang

zwischen zurückgelegtem Weg und der benötigten Zeit für die zurückgelegten Runden vermuten.

Mathematisch lässt sich ein solch linearer Zusammenhang ausdrücken:

BxAy bzw. 0 BxAy

Der physikalische Sinn lässt sich in den Konstanten A und B finden, die es über (mindestens 2) Mes-sungen von x und y zu bestimmen gilt.

Wir wissen inzwischen, dass die Größen x und y fehlerbehaftet sein werden und damit zu einer

Verfälschung der errechneten A und B führen. Wir suchen eine Möglichkeit, durch eine Vielfach-

messung den Einfluss der zufälligen Fehler auf die errechneten A und B zu vermindern und abzu-

schätzen.

Dabei beschränken wir uns auf den speziellen Fall, dass die Größe x fehlerfrei (fehlerarm) gemessen werden kann. Für verschiedene x - Werte ergeben sich dann entsprechende y -Werte, die mit einem

Zusammenhang BxAy beschrieben werden können.

Eine erste wichtige Frage ist also: Welche Größe lässt sich genauer ermitteln?

Im Falle des Kinderkarussells bleibt unser Messpunkt unverändert - also sehr genau.

Ein Fehler wird sicher bei der Zeitmessung auftreten. In unseren linearen Zusammenhang würden wir damit den Weg als x und die Zeit als y ausweisen.

Im Experiment werden also zurückgelegter Weg und Zeit für 10 Runden gemessen:

Weg s (m) Zeit t (s) Weg s (m) Zeit t (s)

12 12,2 72 59,1

24 17 84 60,2

36 22,1 96 65,7

42 33,2 108 69,9

60 34,4 120 70,1

Die Zeit wird als Funktion des vorgegebenen Wegs gemessen und sei dabei mit einem zufälligen Feh-

ler unbekannter Größe behaftet.

Page 2: Ausgleichsrechnung - Lineare  · PDF fileDr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 3 Wir berechnen die Regressionskoeffizienten A und

Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 2

Der unterstellte linearen Zusammenhang 0 BsAt wird nicht exakt erfüllen, d.h. für die einzel-

nen Zahlenpaare ),( kk ts wird stets 0 kk BsAt gelten.

Stellt man sich diesen Sachverhalt graphisch dar, liegen die gemessenen Punkte ),( kk ts stets um

eine Differenz kt neben der Gerade BsAt .

Eine fehlerfreie Berechnung der unbekannten Parameter A und B aus den Wertepaaren

),( kk ts wird daher nicht gelingen.

Möglich ist es, aus den Wertepaaren eine Schätzung für A und B zu gewinnen, die bei einer

wachsenden Anzahl von eingehenden Wertepaaren ),( kk ts den wahren Zahlenwerten von A

und B beliebig nahe kommt.

Berechnet werden also B als Näherung für den wahren Parameter B und A als Näherung für

den wahren Parameter A . A und B nennt man Regressionskoeffizienten.

Welche physikalische Bedeutung haben die Koeffizienten A und B eigentlich im Beispiel?

A ist der Achsenabschnitt der Zeitachse. Er gibt uns die Zeitverzögerung beim Anfahren an.

B ist der Anstieg der Regressionsgeraden st /tan ; das Reziproke der Geschwindigkeit.

Die mathematische Bedingung, die der Regressionsgeraden zu Grunde liegt, lautet

min)()(10

1

210

1

2 k

kk

k

k AsBtt

A und B müssen so gewählt werden, dass die Summe aller Abweichungen (positiv und negativ -

daher Quadrat) minimal wird.

Die einzelnen Terme )( AsBt kk entsprechen dabei der Differenz kt zwischen dem

Messwert kt und dem exakten Wert der Regressionsgeraden bei ks .

Page 3: Ausgleichsrechnung - Lineare  · PDF fileDr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 3 Wir berechnen die Regressionskoeffizienten A und

Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 3

Wir berechnen die Regressionskoeffizienten A und B :

Im Minimum der Summe der quadrierten kt verschwinden die ersten partiellen Ableitungen

nach A und B .

02

2

11

11

2

N

k

k

N

k

k

N

k

kk

N

k

kk

sBANt

AsBtAsBtA

und

02

2

1

2

11

11

2

N

k

k

N

k

k

N

k

kk

k

N

k

kk

N

k

kk

sBsAts

sAsBtAsBtB

Wie führen Mittelwerte ein:

N

k

kk

N

k

k

N

k

k

N

k

k tsN

ts,sN

s,tN

t,sN

s11

22

11

1111

und erhalten damit:

0 sBNANtN 0 sBAt

sowie

02 sBNsANtsN 02 sBsAts

Auflösen der Gleichungen nach B und A liefert die Berechnungsvorschriften

2

11

2

111

2211

111

N

k

k

N

k

k

N

k

k

N

k

k

N

k

kk

sN

sN

tN

sN

tsN

ss

tstsB

und

2

11

2

111

2

1

22

2

11

1111

N

k

k

N

k

k

N

k

k

N

k

kk

N

k

k

N

k

k

sN

sN

sN

tsN

sN

tN

ss

xtsstA

N

k

k

N

k

k sN

BtN

sBtA11

11

In unserem Beispiel bedeutet das:

sm 3638,88m 4277,1639,4465,4 22 ts,s,st,ms

msm

ms

mm

smms

ss

tstsB /6066,0

84,1212

774,735

4277,165490

39,444,653638,8822222

smmsssBtA 7418,439,44/81996,139,44

Page 4: Ausgleichsrechnung - Lineare  · PDF fileDr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 3 Wir berechnen die Regressionskoeffizienten A und

Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 4

Physikalische Bedeutung hat hier besonders (wie oben bereits erwähnt) der Kehrwert von B ,

der mit der Beziehung B

v1

den Schätzwert für die wahre Geschwindigkeit v liefert.

damit wird hkmsmmsv /934,5/648,1)/6066,0( 1 .

Da wir hier Fehlerrechnung betreiben, fragen wir natürlich nach dem Fehler von v !

Diesen Fehler von v gewinnen wir aus dem Fehler des Regressionskoeffizienten B .

Also auf! Berechnen wir den Fehler von B .

1. Wir berechnen die Summe der Fehlerquadrate der Messwerte kt :

2

1

2

1

2 888,276)()( sAsBttN

k

kk

N

k

k

2. Daraus gewinnen wir die mittlere Streuung ts der Messwerte

kt um die Regressionsgerade:

ssBAtN

sN

k

kky 883,52

1

1

2

Man beachte hier das )2( N im Nenner !

)2( N ergibt sich aus der Tatsache, dass ein Fehler im Anstieg B bzw. im

Achsenabschnitt A sinnvoll erst ab 3 Messwertepaaren bestimmt werden kann.

welchen Anstiegsfehler könnte man z.B. bestimmen, wenn die Gerade durch genau

2 Punkte verläuft?

3. Da A und B nur mittelbar (aus den Messwerten 101 ...tt ) errechnet werden, werden ihre

Fehler mittels Fehlerfortpflanzung ermittelt.

Es ergibt sich:

2

11

222

1

N

k

k

N

k

k

yyB

ssN

Ns

ssNss

2

11

2

1

2

22

2

N

k

k

N

k

k

N

k

k

yyA

ssN

s

sssN

sss oder

N

k

kBBA sN

ssss1

22 1

Im Beispiel:

msssN

ss yB /0534,01

22

ssN

ssssN

k

kBBA 958,31

1

22

Page 5: Ausgleichsrechnung - Lineare  · PDF fileDr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 3 Wir berechnen die Regressionskoeffizienten A und

Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 5

Es bleibt spannend!

Uns interessierte eigentlich der absoluten Fehler des Schätzwertes v !

Da die Geschwindigkeit hier das Reziproke des Anstiegs, müssen wir wieder einmal die Fehler-

fortpflanzung bemühen. Wie wirkt sich ein Fehler auf den Kehrwert einer Größe aus?

smsB

sB

sB

sB

Bs

B

Bs

B

BvBΔ

B

BvvΔ

BBB

-

B

-

BB

/145,011

1

1

22

2

1

Es ergibt sich somit eine Geschwindigkeit des Karussells von

smv /)145,0648,1(

Ist diese Angabe sinnvoll? NEIN !!

Wenn sich der Fehler bereits in der ersten Stelle nach dem Komma bemerkbar macht - was soll

dann eine Angabe weiterer Stellen für einen Sinn haben?

sinnvolle Ergebnisangabe: (Fehler werden immer aufgerundet!)

smv /)2,06,1(

Aussagekräftiger als der Wert des absoluten Fehlers sm,vΔ /20 ist häufig die Angabe des

relativen Fehlers v

vΔ.

Dieser errechnet sich z.B., indem man die Beziehung BsB

vΔ 2

1 durch erneutes Einsetzen des

Zusammenhanges B

v1

umformt: B

svs

Bvs

BBs

BvΔ B

BBB 1111

2

Division durch v ergibt dann B

B

s

v

vΔ B

die relativen Fehler von v und B sind gleich.

Im Beispiel ergibt sich hier

%,

,

B

s

v

vΔ B 8,8088,0606650

053420

Der Korrelationskoeffizient r

Gelegentlich (besonders bei schwierigen Messungen) stellt sich die Frage, ob ein vermuteter linearer

Zusammenhang zwischen zwei Größen tatsächlich existiert; ob die beiden Größen also miteinander

korreliert sind.

Nicht immer sieht man es dem Diagramm der Messwerte an, wie „gut“ die eingetragenen Messwerte

auf einer Geraden liegen - oder auch nicht.

Page 6: Ausgleichsrechnung - Lineare  · PDF fileDr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 3 Wir berechnen die Regressionskoeffizienten A und

Dr. Hempel – Mathematische Grundlagen, Ausgleichsrechnung, lineare Regression Seite 6

Quantifizieren lässt sich „gut“ hier mit dem Korrelationskoeffizienten r .

Er ist gegeben durch:

2

11

2

2

11

2

111

22221111

111

N

k

k

N

k

k

N

k

k

N

k

k

N

k

k

N

k

k

N

k

kk

tN

tN

sN

sN

tN

sN

tsN

ttss

tsstr

Der Korrelationskoeffizient r kann dabei Werte zwischen 1r und 1r annehmen;

eine physikalische Größe lässt sich aus ihm nicht direkt gewinnen.

Je näher der Betrag von r dabei der 1 kommt, desto stärker enthalten die Wertepaare eine line-

are Beziehung.

Für einen Betrag von exakt 1 liegen alle Wertepaare exakt auf einer Geraden, die für 1r fal-

lend und für 1r steigend verläuft.

Für 0r ist keine Abhängigkeit anzunehmen.

Im Beispiel ergibt sich: 970350,r

Der Korrelationskoeffizient 970350,r zeigt mit dem positiven Vorzeichen eine direkte Pro-

portionalität zwischen s und t .

Die geringfügige Abweichung zu +1 zeigt die geringfügige Abweichung der realen Messwertpaare

vom erwarteten linearen Zusammenhang.