Hilfen zur Datenauswertung - univie.ac.at · Zeitpunkt stattfindende Wärmeabfuhr an die Umgebung...

3
Hilfen zur Datenauswertung Einleitung Aus registrierten Datensätze lassen sich im allgemeinen nur grob qualitative Aussagen ableiten. In der Mehrzahl der Fälle ist eine Nachbearbeitung des Daten notwendig. Diese Nachbearbeitung beinhaltet unter ande- rem: Mathematische Datenmanipulation (z.B. Multiplikation mit einem Skalierungsfaktor) Daten“glättung“ und Rauschreduktion (z.B. durch die Anwendung eines gleitenden Mittelwerts) Anpassung der Messung an eine mathematisch definierte Funktion (z.B. Lineare Ausgleichsgerade) Statistische Funktionen (z.B. Verteilung der Meßpunkte um einen Mittelwert) In der Regel werden geeignete Anwenderprogramme für diese Aufgaben genutzt. Es gibt zahlreiche dafür entwickelte Anwenderprogramme die sich durch ihren Umfang und den daraus resultierenden Aufwand an tech- nischen und finanziellen Ressourcen unterscheiden. Viele produktunterstützende Programme (für ein bestimmtes Meßgerät oder Meßsystem entwickelt) inkludieren neben der eigentlichen Datenerfassung bereits eine einge- schränkte und anwendungsspezifische Datenaufbereitung. Daneben gibt es eine Vielzahl von „universellen“ auswertungsorientierten Programmen die oftmals ursprünglich für einen bestimmten Anwendungsbereich konzi- piert wurden. So hat sich das weitverbreitete Tabellenkalkulationsprogramm MS EXCEL [1] aus finanzspezifi- schen Dateninterpretationen entwickelt. Wenngleich heute bei guter Kenntnis auch wissenschaftliche Problemlö- sungen zufriedenstellend gemeistert werden können ist es für den täglichen Gebrauch wenig attraktiv. Professio- nelle Programmpakete wie etwa IDL [2] sind zwar extrem mächtig in ihren Möglichkeiten der Datenaufberei- tung erfordern aber vor Gebrauch eine intensive Einschulung. Im technisch wissenschaftlichen Bereich hat sich das Programm Microcal Origin [3] weit verbreitet, das einen guten Kompromiss zwischen (intuitiv erfassbarer) Bedienung und spezifisch benötigten Funktionen bietet. Eine für den privaten Bereich (kosten)günstige Alterna- tive bietet das Programm QtiPlot [4], das sich stark an dem weit teureren Marktführer orientiert. In vielen Linuxdistributionen (z.B. Ubuntu) wird QtiPlot als kostenfreie Anwendung mitgeliefert. Beispiel einer Datenauswertung mittels Microcal Origin Die registrierten Temperaturdaten der beiden Versuche vom Montag 19.10. werden im Folgenden beispiel- haft ausgewertet, diskutiert und mögliche Schlußfolgerungen abgeleitet. 1. Die registrierten Temperaturdaten als Funktion der Zeit wurden mittels Importfunktion in eine Tabelle (worksheet) des Programms importiert. In einem ersten Schritt wurde der Skalenursprung derart verschoben, daß der Zeitnullpunkt den Beginn des Erwärmungsvorgangs markiert (dieser ist nicht ident mit dem Zeit- punkt an dem der jeweilige Wasserkocher eingeschaltet wurde) 2. Die Temperatur wurde um den Ausgangswert, T 0 des Wasser vor Beginn des Erwärmens reduziert Unmittelbar nach dem Einschalten des Wasserkochers wird zuerst das Heizelement selbst erwärmt bevor es die Wärme an das zu erhitzende Wasser abgibt. Ebenso heizt das Heizelement nach dem Abschalten des Was- serkochers solange nach bis ein Temperaturausgleich zwischen Heizelement und Wasser stattgefunden hat. Da weder Material noch Masse oder Temperatur des Heizelements bekannt sind oder experimentell bestimmt wur- den entziehen sich diese beiden Phasen der Wärmezufuhr einer vernünftigen Dateninterpretation. Die Zeitskala wurde an die Gepflogenheiten des interessierten Fachpublikums angepaßt (Skaliert). In der Haushalts- bzw. Küchenphysik dominiert die Zeiteinheit Minuten: Ein Ei wird 3 Minuten gekocht und nicht (180 Sekunden), den Tee lassen wir 6 Minuten ziehen und nicht 0.1 Stunden. Viele Wissenschaftszweige bevorzugen in ihrem Bereich Einheiten die gelegentlich nicht mit den Maßeinheiten des SI systems kompatibel sind (In der Astronomie werden Längen in astronomischen Einheiten angegeben, Volumenangaben werden in der Festkörperphysik bevorzt in cm 3 , in der analytischen Chemie in ml, .. genannt). Nach diesen Datenmanipulationen können wir die zeitlichen Verläufe beider Experimente (Wasserkocher #1, bzw. #2) in einer graphischen Darstellung unmittelbar vergleichen (schwarze bzw. rote Symbole in Abb. 1). Ebenfalls mit Hilfe des Programms wurden zunächst jene Abschnitte der zeitlichen Entwicklung der Tempe- ratur eingegrenzt die (den Erwartungen folgend) einen mathematisch formulierbaren Zusammenhang folgen: Während des Erwärmens einer linearen Erhöhung der Temperatur mit der Zeit Während des Abkühlens ein exponentielles Abklingen der Temperatur mit der Zeit Diese mathematischen Funktionen, die an die Meßreihe mittels der Methode der kleinsten Fehlerquadrate der Abweichungen angepaßt wurden sind als schwarze bzw. rote Linien in Abb. 1 für die lineare Abhängigkeit dargestellt. Die Anstiege der beiden Ursprungsgeraden sind als Legende in der Darstellung angeführt und zeigen

Transcript of Hilfen zur Datenauswertung - univie.ac.at · Zeitpunkt stattfindende Wärmeabfuhr an die Umgebung...

Page 1: Hilfen zur Datenauswertung - univie.ac.at · Zeitpunkt stattfindende Wärmeabfuhr an die Umgebung nicht berücksichtigt. In der experiemntellen Durchführung haben wir den Erwärmvorgang

Hilfen zur Datenauswertung

EinleitungAus registrierten Datensätze lassen sich im allgemeinen nur grob qualitative Aussagen ableiten. In der

Mehrzahl der Fälle ist eine Nachbearbeitung des Daten notwendig. Diese Nachbearbeitung beinhaltet unter ande-rem:

• Mathematische Datenmanipulation (z.B. Multiplikation mit einem Skalierungsfaktor)

• Daten“glättung“ und Rauschreduktion (z.B. durch die Anwendung eines gleitenden Mittelwerts)

• Anpassung der Messung an eine mathematisch definierte Funktion (z.B. Lineare Ausgleichsgerade)

• Statistische Funktionen (z.B. Verteilung der Meßpunkte um einen Mittelwert)

In der Regel werden geeignete Anwenderprogramme für diese Aufgaben genutzt. Es gibt zahlreiche dafürentwickelte Anwenderprogramme die sich durch ihren Umfang und den daraus resultierenden Aufwand an tech-nischen und finanziellen Ressourcen unterscheiden. Viele produktunterstützende Programme (für ein bestimmtesMeßgerät oder Meßsystem entwickelt) inkludieren neben der eigentlichen Datenerfassung bereits eine einge-schränkte und anwendungsspezifische Datenaufbereitung. Daneben gibt es eine Vielzahl von „universellen“auswertungsorientierten Programmen die oftmals ursprünglich für einen bestimmten Anwendungsbereich konzi-piert wurden. So hat sich das weitverbreitete Tabellenkalkulationsprogramm MS EXCEL [1] aus finanzspezifi-schen Dateninterpretationen entwickelt. Wenngleich heute bei guter Kenntnis auch wissenschaftliche Problemlö-sungen zufriedenstellend gemeistert werden können ist es für den täglichen Gebrauch wenig attraktiv. Professio-nelle Programmpakete wie etwa IDL [2] sind zwar extrem mächtig in ihren Möglichkeiten der Datenaufberei-tung erfordern aber vor Gebrauch eine intensive Einschulung. Im technisch wissenschaftlichen Bereich hat sichdas Programm Microcal Origin [3] weit verbreitet, das einen guten Kompromiss zwischen (intuitiv erfassbarer)Bedienung und spezifisch benötigten Funktionen bietet. Eine für den privaten Bereich (kosten)günstige Alterna-tive bietet das Programm QtiPlot [4], das sich stark an dem weit teureren Marktführer orientiert. In vielenLinuxdistributionen (z.B. Ubuntu) wird QtiPlot als kostenfreie Anwendung mitgeliefert.

Beispiel einer Datenauswertung mittels Microcal OriginDie registrierten Temperaturdaten der beiden Versuche vom Montag 19.10. werden im Folgenden beispiel-

haft ausgewertet, diskutiert und mögliche Schlußfolgerungen abgeleitet.

1. Die registrierten Temperaturdaten als Funktion der Zeit wurden mittels Importfunktion in eine Tabelle(worksheet) des Programms importiert. In einem ersten Schritt wurde der Skalenursprung derart verschoben,daß der Zeitnullpunkt den Beginn des Erwärmungsvorgangs markiert (dieser ist nicht ident mit dem Zeit-punkt an dem der jeweilige Wasserkocher eingeschaltet wurde)

2. Die Temperatur wurde um den Ausgangswert, T0 des Wasser vor Beginn des Erwärmens reduziert

Unmittelbar nach dem Einschalten des Wasserkochers wird zuerst das Heizelement selbst erwärmt bevor esdie Wärme an das zu erhitzende Wasser abgibt. Ebenso heizt das Heizelement nach dem Abschalten des Was-serkochers solange nach bis ein Temperaturausgleich zwischen Heizelement und Wasser stattgefunden hat. Daweder Material noch Masse oder Temperatur des Heizelements bekannt sind oder experimentell bestimmt wur-den entziehen sich diese beiden Phasen der Wärmezufuhr einer vernünftigen Dateninterpretation.

Die Zeitskala wurde an die Gepflogenheiten des interessierten Fachpublikums angepaßt (Skaliert).

In der Haushalts- bzw. Küchenphysik dominiert die Zeiteinheit Minuten: Ein Ei wird 3 Minuten gekocht undnicht (180 Sekunden), den Tee lassen wir 6 Minuten ziehen und nicht 0.1 Stunden. Viele Wissenschaftszweigebevorzugen in ihrem Bereich Einheiten die gelegentlich nicht mit den Maßeinheiten des SI systems kompatibelsind (In der Astronomie werden Längen in astronomischen Einheiten angegeben, Volumenangaben werden inder Festkörperphysik bevorzt in cm3, in der analytischen Chemie in ml, .. genannt).

Nach diesen Datenmanipulationen können wir die zeitlichen Verläufe beider Experimente (Wasserkocher#1, bzw. #2) in einer graphischen Darstellung unmittelbar vergleichen (schwarze bzw. rote Symbole in Abb. 1).

Ebenfalls mit Hilfe des Programms wurden zunächst jene Abschnitte der zeitlichen Entwicklung der Tempe-ratur eingegrenzt die (den Erwartungen folgend) einen mathematisch formulierbaren Zusammenhang folgen:

• Während des Erwärmens einer linearen Erhöhung der Temperatur mit der Zeit

• Während des Abkühlens ein exponentielles Abklingen der Temperatur mit der Zeit

Diese mathematischen Funktionen, die an die Meßreihe mittels der Methode der kleinsten Fehlerquadrateder Abweichungen angepaßt wurden sind als schwarze bzw. rote Linien in Abb. 1 für die lineare Abhängigkeitdargestellt. Die Anstiege der beiden Ursprungsgeraden sind als Legende in der Darstellung angeführt und zeigen

Page 2: Hilfen zur Datenauswertung - univie.ac.at · Zeitpunkt stattfindende Wärmeabfuhr an die Umgebung nicht berücksichtigt. In der experiemntellen Durchführung haben wir den Erwärmvorgang

für beide Versuche nur eine kleine statistische Schwankungsunsicherheit von weniger als 0.3 %. Für den 1.Versuch wurde auch der Verlauf der exponentiellen Anpassung an den Abkühlvorgang eingezeichnet (blaustrichlierte Linie). Für diesen Fall ist die charakteristische Zeitkonstante, τ=51.6 min, in der Legende vermerkt.Sie gibt an wie lange sie (vermutlich) warten müßten bis das zuvor kochende Wasser auf ~1/3 (genauer auf 1/e)seiner ursprünglichen Temperatur abgekühlt sein wird. Beachten sie, daß für das kochende Wasser die Tempe-ratur nicht mit ~100°C anzusetzen wäre sondern mit (T-T0)=(100-22.7)°C. D.h. nach knapp einer Stunde ist dasWasser auf T(t0+τ)~52°C = (87.3/3+22.7)°C abgekühlt und nicht auf T=100/3~33°C.

Für die Darstellung in einem Lehrbuch ist die visuelle Übereinstimmung zwischen theoretischer Herleitung(Voraussage) mit mehr oder weniger deutlich offengelegten Randbedingungen (bzw. Vereinfachungen) und demExperiment überzeugend gut illustriert.

Zum besseren Verständnis möchte ich diese Bemerkung mit einem kurzen Beispiel aus der Optik illustrie-ren. In einführenden Lehrbücher stoßen sie sehr schnell auf das Snellius‘sche Brechungsgesetz für die Ablen-kung von Licht(strahlen) beim Übertritt von einem Medium in ein Medium mit unterschiedlichem Brechungsin-dex. Hier beruht die Vereinfachung in den Annahmen, daß die Wellenlänge des Lichts nicht zu berücksichtigensei und daß der Brechungsindex lediglich aus einem Realteil besteht und keine imaginäre Komponente hat. So-bald sie Phänomene der nichtlinearen Optik oder der Nahfeldmikroskopie beschreiben wollen scheitern sie mitdiesem vereinfachten Lehrbuch - Ansatz. Leider wird es insbesondere bei Schulbüchern meist verabsäumt stetsdeutlich darauf hinzuweisen, daß es sich bei den angeführten Lösungen (Gleichungen) sehr oft nur um eine, imAlltagsleben meist sinnvolle Näherung zur Beschreibung eines physikalischen Problems handelt. Es wird so derEindruck vermittelt, daß die Physik eine abgeschlossene Wissenschaft ist die „alles“ erklären kann und die kei-nen weiteren Forschungsbedarf mehr hat.

Im wissenschaftlichen Forschungsbetrieb sollte ihre Datenanalyse daher nicht an diesem Punkt enden, son-dern die Frage gestellt werden ob aus dem Datenmaterial systematische Abweichungen zur Erwartung erkennbarsind. Die programmatische lineare Anpassung des Temperaturanstiegs während des Erwärmens behandelt alleAbweichungen nach statistischen Kriterien, die darauf basieren, daß Schwankungen rein zufällig um einen ex-akten Wert „pendeln“ („verrauschtes Signal“). Ein Kriterium zur Entscheidung ob diese Annahme gerechtfertigtist liefert ein sogenanntes Histogramm, das mit den Hilfsmitteln von Origin leicht erstellbar ist. Um zu einemHistogramm der Meßwertverteilung bezogen auf die mathematische Anpassung mittels Ausgleichsgeraden zukommen, wurde punktweise die Differenz aus Meßwert und zeitlich korrespondierendem „Geraden-“wert gebil-det. Wie oft ein Differenzwert innerhalb von einem Temperaturintervall vorkommt wurde gezählt. Im nächstenSchritt wird die Anzahl als Funktion der Lage des Temperaturintervalls bezogen zum „Idealwert“ (durch dieAusgleichsgerade ermittelt) dargestellt. Das Ergebnis für den 1. Versuch ist in Abb. 2 gezeigt. In diesem Histo-gramm wurde das Temperaturintervall mit 0.1 K festgelegt (= Auflösung der Temperaturmessung) und der Be-reich von –1 K bis +1 K berücksichtigt. Die Höhe der grauen Balken entspricht der Anzahl der Meßwerte die imjeweiligen Intervall gelegen sind. Insgesamt wurden dabei 121 Meßwerte berücksichtigt. Sofern die Meßwertetatsächlich ausschließlich statistisch um den „Idealwert“ verteilt wären müßte sich annähernd eine Kurvenformergeben die der, zum Vergleich eingezeichneten Gauß’schen Normalverteilung (roter Linienzug) um den Wert 0nachzeichnet. Wenngleich in der Interpretation von statistischen Daten immer mit der unzureichend hohen An-zahl an Proben („wann nähert man sich dem ∞ an?“) argumentiert werden kann ist die Ähnlichkeit des Balken-diagramms mit der mathematischen Gaußverteilung in diesem Bild wenig überzeugend. Um die Frage („Ist der

Abbildung 1: Experimenteller (Symbole) underwarteter Verlauf (Linien) der Temperatur in2 Wasserkochern

Abbildung 2: Statistische Verteilung derAbweichungen der Meßpunkte von einemlinearen Verlauf

Page 3: Hilfen zur Datenauswertung - univie.ac.at · Zeitpunkt stattfindende Wärmeabfuhr an die Umgebung nicht berücksichtigt. In der experiemntellen Durchführung haben wir den Erwärmvorgang

einfache linearer Zusammenhang berechtigt?“) klären zu können habe ich im folgenden Schritt die Ableitung derFunktionen graphisch verglichen. Aus der mathematischen Ableitung der Geraden ergibt sich ein zeitlich kon-stanter Wert, der gleich dem Anstieg der Geraden ist (strichlierte Linien in Abb. 3) Datenreihen lassen sich imOrigin numerisch Differenzieren. Diese Funktion habe ich auf die registrierten Meßdaten angewendet und den,durch die Symbole dargestellten Verlauf gefunden. Für beide Versuche sind die systematischen Abweichungenvon einem konstanten Plateau während der Aufwärmphase deutlich erkennbar und lassen bei mir wenig Zweifelübrig, daß die Annahme einer ausschließlich linearen Approximation des Temperaturverlaufs nicht gerechtfertigtist.

Die Ursachen für diese zusätzlichen Einflüsse können grundsätzlich in

• Der vereinfachten Annahme liegen

• In der experimentellen Durchführung begründet sein.

Folgende Annahme haben wir vor der Durchführung der Experimente getroffen:

( ) .constTfmcWasser =≠⋅Tatsächlich variiert cWasser im Temperaturbereich der Experimente zwischen (4181 und 4204) J/(kg·K) [5].

Weiters verdampft Wasser bereits bei T<TSiedepunkt so daß unsere ursprüngliche Annahme einer Konstantenbestenfalls Näherungsweise gilt.

Weiters haben wir für die Prognose der zeitlichen Temperaturänderung beim Erwärmen die schon zu diesemZeitpunkt stattfindende Wärmeabfuhr an die Umgebung nicht berücksichtigt.

In der experiemntellen Durchführung haben wir den Erwärmvorgang „sich selbst“ überlassen. Ziemlich si-cher auftretende Temperaturinhomogenitäten (Blasenbildung) im Wasser können zu lokalen Variationen imTemperaturverlauf (am Ort des Thermometers) geführt haben.

Jede Datenanalyse sollte durch eine zusammenfassende Schlußfolgerung bezüglich des weiteren Vorgehensvervollständigt werden:

Ich habe mich bemüht ihnen die Sinnhaftigkeit einer programmunterstützten Dateninterpretation vermittelseines einfachen Beispiels zu illustrieren. Da für die weitere Durchführung der Lehrveranstaltung keine negativenKonsequenzen aus der Unkenntnis über die tatsächliche Ursache der experimentellen Abweichungen von derTheorie zu erwarten sind wird auf weitere abklärende Untersuchungen verzichtet.

Quellen:[1] Wikipedia – Eintrag zu MS Excel, https://en.wikipedia.org/wiki/Microsoft_Excel

[2] Wikipedia – Eintrag zu IDL programming language,https://en.wikipedia.org/wiki/IDL_%28programming_language%29

[3] Wikipedia – Eintrag zu Microcal Origin, https://en.wikipedia.org/wiki/Origin_%28software%29

[4] Homepage der Anbieter von QtiPlot, http://www.qtiplot.com/

[5] Tabellensammlung Chemie/ Stoffdaten Wasser,https://de.wikibooks.org/wiki/Tabellensammlung_Chemie/_Stoffdaten_Wasser

Abbildung 3: 1. Ableitung der registrierten(durchgezogene Linien) und berechneten(strichlierte Linien) zeitlichen Verläufe.