PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨...

47
PLABSTAT Ein Computerprogramm zur statistischen Analyse von pflanzenz ¨ uchterischen Experimenten Version 3A vom 14. Juni 2011 H.F. Utz Institut f ¨ ur Pflanzenz ¨ uchtung, Saatgutforschung und Populationsgenetik Universit¨ at Hohenheim, 70593 Stuttgart Email: [email protected] Die wichtigsten ¨ Anderungen der Version3 im Vergleich zur Version2 1. Primes, mit denen Befehlsnamen in Version2 eingefasst wurden, entfallen. 2. Kommentare werden durch ! markiert bzw. alles was nach einem Ausrufezeichen kommt, wird als Kommentar angesehen. 3. Um alte Dateien mit Version2-Befehlen weiter verarbeiten zu k¨ onnen, werden diese von der Version3 automatisch umgeformt und weiterhin verrechnet. Allerdings sind Kommentare innerhalb Befehlen nicht mehr m¨ oglich, etwa ’CALC’ ’’Berechnung von..’’ X1=X1/5 Der Kommentar muss nach hinten, also ’CALC’ X1=X1/5 ’’Berechnung von..’’ Diese Version2-Variante wird akzeptiert. Konform mit Version3 w¨ are CALC X1=X1/5 ! Berechnung von.. c Copyright 1986, 1991, 2003 H.F. Utz

Transcript of PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨...

Page 1: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

PLABSTAT

Ein Computerprogrammzur statistischen Analyse

von pflanzenzuchterischen Experimenten

Version 3A vom 14. Juni 2011

H.F. Utz

Institut fur Pflanzenzuchtung,Saatgutforschung und Populationsgenetik

Universitat Hohenheim, 70593 StuttgartEmail: [email protected]

Die wichtigsten Anderungen der Version3 im Vergleich zur Version2

1. Primes, mit denen Befehlsnamen in Version2 eingefasst wurden, entfallen.

2. Kommentare werden durch ! markiert bzw. alles was nach einem Ausrufezeichenkommt, wird als Kommentar angesehen.

3. Um alte Dateien mit Version2-Befehlen weiter verarbeiten zu konnen, werden diesevon der Version3 automatisch umgeformt und weiterhin verrechnet.

Allerdings sind Kommentare innerhalb Befehlen nicht mehr moglich, etwa’CALC’ ’’Berechnung von..’’ X1=X1/5

Der Kommentar muss nach hinten, also’CALC’ X1=X1/5 ’’Berechnung von..’’

Diese Version2-Variante wird akzeptiert.Konform mit Version3 ware

CALC X1=X1/5 ! Berechnung von..

c© Copyright 1986, 1991, 2003 H.F. Utz

Page 2: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

Inhaltsverzeichnis

1 Was PLABSTAT ist 3

2 Ein einfaches Beispiel 4

3 Allgemeine Bedienung 63.1 Schreibregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63.2 Allgemeine Befehle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73.3 Dateneingabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

4 Einfache statistische Maßzahlen und Regressionsanalysen 124.1 Befehle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134.2 Ausgabe und Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

5 Einfache Block- und Gitteranlagen 155.1 Befehle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165.2 Ausgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185.3 Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

6 Mehrfaktorielle Experimente 206.1 Befehle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206.2 Ausgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266.3 Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

7 Nichtwiederholte Experimente 297.1 Befehle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297.2 Ausgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317.3 Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

8 Erganzende Befehle 33

9 Winke, Wurmer, Wande 37

10 Literaturverzeichnis 39

ANHANG A Liste der Befehle 42

ANHANG B Beispiele 45

ANHANG C MODEL-Zeilen fur einige Versuchsanlagen 46

Page 3: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

1 WAS PLABSTAT IST 3

1 Was PLABSTAT ist

PLABSTAT kann als Kurzel fur ”PLAnt Breeding STATistical program” oder auch als”PLAnned Block experiments and their STATistical analysis” gelesen werden.

Obwohl genugend Statistikpakete auf dem Markt sind, besteht offensichtlich eineBedarf fur ein kompaktes Programm, mit dem die wichtigsten Routineauswertungendes Pflanzenversuchs durchgefuhrt werden konnen. Es sollte schneller als die großenPakete sein, leicht zu bedienen, kompakten Output erzeugen, Ausreißertests oder an-dere Kontrollen enthalten und wichtige Parameter wie Wiederholbarkeit oder Herita-bilitat schatzen.

Da ein Programm nie fertig ist und auch nicht alle Methoden enthalten kann, istPLABSTAT so angelegt, dass ein Umsteigen auf großere Pakete leicht moglich ist, et-wa auf GENSTAT, das schon vom verwandten Namen her, solches nahe legen soll.Vernachlassigt ist bei PLABSTAT der Input, dieser muß außerhalb des Programms miteinem entsprechenden Editor, etwa mit KEDIT, THE, EMACS, WORD, EXCEL, odereinem Datenbankprogramm erfolgen.

Im folgenden seien kurz die rechnerischen Moglichkeiten von PLABSTAT zusam-mengestellt.

Einfache statistische Maßzahlen und multiple Regression

Mit PLABSTAT lassen sich einfache statistische Maßzahlen, wie Varianz, Schiefe, Exzeßoder Korrelationskoeffizienten von Variablen, schatzen. Einfache und multiple Regres-sionsanalysen, einschl. von Pfadkoeffizienten, konnen berechnet werden.

Gitteranlagen

PLABSTAT analysiert Gitteranlagen, genauer quadratische, Rechteck- und verallge-meinerte Gitteranlagen (PATTERSON und WILLIAMS, 1976), jeweils ohne Wiederho-lung des Grundplans. Fur Gitteranlagen berechnet es die adjustierten Mittelwerte oderEffekte und gibt eine Liste der unvollstandigen Blockeffekte aus. Es pruft die Residuenauf Ausreißer. Desweiteren konnen partiell wiederholte Anlagen (augmented designs,p-rep designs) analysiert werden.

Mehrfaktorielle Experimente

PLABSTAT berechnet Varianzanalysen fur balancierte Datensatze, wobei fehlendeWerte erlaubt sind. Bei vielen fehlenden Werten werden nur die Mittelwerte, berech-net nach der Methode der kleinsten Quadrate, ausgegeben. Das Programm verarbeitetfaktorielle und hierarchische Klassifikationen mit fixierten, zufalligen oder gemischtenModellen. Situationen mit nichtorthogonalen Anlagen oder Reihen-Saulen-Anlagen,wie Lat. Quadrat, sind ausgeschlossen, doch konnen solche Falle uber einen zweitenDurchgang, siehe HARTLEY (1956), verarbeitet werden.

Es werden die Varianzanalyse-Tabellen, einschließlich Varianzkomponenten, derenStandardfehler und F-Tests, sowie Mittelwerte mit Standardfehlern und Grenzdifferen-zen berechnet. Tabellen von Mittelwerten, Effekten oder Rangen konnen ausgegebenwerden. Residuen und Effekte konnen auf Ausreißer hin uberpruft werden.

Page 4: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

2 EIN EINFACHES BEISPIEL 4

Heritabilitaten, genetische Korrelationen oder Kovarianzanalysen lassen sich er-rechnen. Zweiwegetafeln konnen nach einem Regressionsmodell varianzanalytischzerlegt werden.

Nichtwiederholte Experimente

Experimente ohne Wiederholung lassen sich, wenn Standards vorhanden sind, alsStandardanlage auswerten oder uber gleitende Mittelwerte analysieren.

Weitere Moglichkeiten

Korrelationsdiagramme werden erzeugt. Mittelwerte und unvollstandige Blockeffek-te konnen auf eine Datei gegeben werden, um anschließend weitere Analysen damitdurchzufuhren.

Neue Variablen werden berechnet oder vorhandene modifiziert. Beobachtungenlassen sich uberprufen, ob gewisse Grenzen uberschritten sind.

2 Ein einfaches Beispiel

Die Analyse mit PLABSTAT soll an einem simplen Beispiel demonstriert werden. Ineinem rekurrenten Selektionsprogramm ist der Kornertrag wahrend sechs aufeinan-derfolgenden Zyklen gemessen worden. Um eine Vorstellung zu erhalten, wie sich dieErtrage entwickelt haben, soll ein Diagramm erzeugt werden. Die dazugehorigen Be-fehle und Daten sind folgende:

!! Ertrage von Mais in 6 Zyklen! Kornertrag in kg/ha eingegebenBASIC 6 0 2 2VARIABLE_NAMES CYCLE YIELDCALCULATE X2=X2/100 ! Ertrag in dt/haPLOT/2 X2.X1RUN1 47582 49703 50534 53765 54296 5607EODSTOP

Der erste Teil besteht aus den Befehlen, wobei die Befehlsnamen in Großbuchsta-ben geschrieben sind, und der zweite Teil aus den sechs Datenzeilen mit der Zyklus-nummer und dem Ertrag. Alle Befehle und Daten sind in freiem Format gehalten, wasbedeutet, dass die einzelnen Großen durch Leerzeichen getrennt werden.

Mit ! werden Kommentare eingeleitet, die jeweils bis zum Ende der Zeile uberlesenwerden. Die erste Zeile wird als als Titel des Experiments interpretiert. Hier wurdedoppeltes !! benutzt, um spater leichter nach dem Titel des Experiments suchen zukonnen.

Page 5: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

2 EIN EINFACHES BEISPIEL 5

Der Befehl BASIC sagt dem Programm, dass Daten zu lesen sind, namlich sechs Da-tenzeilen bestehend aus je zwei Werten. Die zweite Zwei in BASIC zeigt an, dass auchzwei Merkmale oder Variablen zu verrechnen sind. Sollen zusatzliche Variablen be-rechnet oder Variablen weggelassen werden, dann ist die Zahl der einzulesenden Va-riablen nicht mehr identisch mit der Zahl der zu verrechnenden Variablen. Die zweiteZahl der BASIC-Zeile, namlich 0, wird in 4.1.1 erlautert.

Mit dem Befehl VARIABLE NAMES werden die Namen der beiden Variablen definiert.Im CALCULATE wird Variable 2 mit 100 dividiert, um die Ertrage in dt/ha anzugeben.

PLABSTAT VERSION 3A of 2003-08-16INSTITUT FUER PFLANZENZUECHTUNG, UNIVERSITAET HOHENHEIMAt 2003/08/19 17h 54m 10s

!! Ertrage von Mais in 6 Zyklen! Kornertrag in kg/ha eingegebenBASIC 6 0 2 2VARIABLE_NAMES CYCLE YIELDCALCULATE X2=X2/100 ! Ertrag in dt/haPLOT/2 X2.X1RUN

CYCLE YIELDMIN 1.00 47.58MAX 6.00 56.07

SCATTER PLOT Ertrage von Mais in 6 Zyklen 2003/08/16 12h 09mYIELDI 6 /IIII 5II 4IIIIMIIII 3II 2IIII/ 1-------------------M-------------------CYCLE

YIELD: Min 47.6 Max 56.1 Mean 52.0 s.d. 3.2 b(Y.X) 1.6986CYCLE: 1.0 6.0 3.5 1.9 b(X.Y) 0.5728

Corr. 0.986EODSTOP

Mit PLOT wird dann das hier interessierende Diagramm erzeugt, indem der Ertraggegen die Zyklusnummer geplottet wird. Im einzelnen wird durch PLOT/2 mit dem

Page 6: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

3 ALLGEMEINE BEDIENUNG 6

Qualifier 2 nach dem Schragstrich vermerkt, dass eine besondere Ausgabe gewunschtwird, namlich dass das Diagramm kleiner gedruckt wird, so dass gerade zwei solcheDiagramme auf eine Seite gehen.

Mit der RUN-Zeile sind die PLABSTAT-Befehle abgeschlossen, es folgen die Daten.Das Ende der Daten wird mit EOD angezeigt, der Abkurzung fur End Of Data. Durchden STOP-Befehl weiß PLABSTAT, dass kein weiterer Rechenjob folgt und der Job zuEnde ist.

Nun sei der Output zu unserem kleinen Beispiel angeschaut, wobei er nichtvollstandig hier wiedergegeben werden soll. Die Befehlszeilen werden anfangs zuKontrollzwecken gelistet. Nach der RUN-Zeile werden die Befehle ausgefuhrt.

Wenn PLABSTAT einen Fehler beim Lesen der Befehle entdeckt, so gibt es eineMeldung aus. Etwa wenn Sie falschlich BASIC 6 0 K 2 eingegeben haben, dann mel-det sich das System an der Stelle, wo es den Befehl nicht mehr interpretieren kann,mit:

BASIC 6 0 K 2|

*** WRONG PARAMETER VALUE

So konnen Sie leicht die Zeile verbessern und den korrekten Wert 2 anstelle von Keinsetzen.

Die beiden Ausgabezeilen, beginnend mit MIN und MAX, geben fur jede Variableden kleinsten und großten Wert.

Im Diagramm sind die Mittelwerte auf beiden Achsen mit dem Buchstaben M sym-bolisiert. Mit zwei Schragstrichen ist der Anfangs- und Endpunkt der linearen Re-gressionsgerade markiert, so dass sie leicht von Hand nachgezogen werden kann. DiePunkte sind aufsteigend durchgezahlt wie die Daten, so dass der Experimentator auf-fallende Punkte identifizieren kann.

Unterhalb des Diagramms finden sich einige anderen Schatzwerte der beiden Va-riablen, wie Mittelwert, Standardabweichung, beide Regressionskoeffizienten und derKorrelationskoeffizient.

3 Allgemeine Bedienung

PLABSTAT arbeitet mit ungefahr dreißig Befehlen. In diesem Kapitel soll kurz dar-gestellt werden, wie die PLABSTAT-Befehle formal zu schreiben, wie die allgemeinenBefehle definiert und wie Daten einzugeben sind.

3.1 Schreibregeln

3.1.1 Der Name eines PLABSTAT-Befehls muß in Großbuchstaben eingegeben werden.Befehlszeilen und ebenso Datenzeilen konnen bis zu 255 Zeichen lang sein.

3.1.2 PLABSTAT benutzt nur die ersten drei Buchstaben eines Befehlsnamens zurIdentifikation. Die anderen Zeichen in einem Befehlsnamen sind irrelevant. Sokann etwa VARIABLE NAMES als VAR oder VARIABLES oder VAR-NAMEN geschrieben

Page 7: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

3 ALLGEMEINE BEDIENUNG 7

werden. Fur Zwecke der leichteren Lesbarkeit wird empfohlen, Befehle nicht zusehr abzukurzen.

3.1.3 Jeder Befehl muß in der ersten Spalte beginnen. Wenn mehr als eine Zeile fureinen Befehl benotigt wird, so sind die folgenden Zeilen mit mindestens einemLeerzeichen anzufangen, z. B.

VARIABLE_NAMES CYCLEYIELD

3.1.4 Befehle konnen meistenteils in beliebiger Reihenfolge eingegeben werden. EineRestriktion ist etwa, dass PLOT nur nach einem BASIC, LATTICE oder ANOVA-Befehlgegeben werden kann, da zuerst Daten eingelesen sein mussen. Es wird empfoh-len, die Befehle in logischer Ordnung niederzuschreiben.

3.1.5 Auf jeden Fall muß einer der vier Analysenbefehle BASIC, LATTICE , ANOVA oderUNREP in einem PLABSTAT-Lauf gegeben werden, damit uberhaupt eine Berech-nung erfolgen kann.

3.1.6 Qualifier werden nach einem Schragstrich eingegeben, z.B. ANOVA/12 . Mit einemQualifier konnen Voreinstellungswerte der Analyse oder der Ausgabe verandertwerden. Wenn der eingelesene Qualifier aus weniger Stellen als definiert besteht,so wird der restliche Teil mit den Stellen der Voreinstellung aufgefullt.

3.1.7 Wenn ein Befehl aus Versehen mehr als einmal geschrieben wird, dann wird nurder letzte Befehl fur eine Analyse benutzt.

3.2 Allgemeine Befehle

3.2.1 Kommentare nach !

Kommentare werden mit ! eingeleitet und gehen immer bis zum Ende der Zeile. Hier-mit lassen sich der Titel und Details des Experiments oder sonstige Erlauterungen fest-halten.

! beliebiger TEXT

Da die erste Zeile meist den Namen des Experiments enthalt, ist zu empfehlen, die-sen Kommentar etwa mit zwei !! einzuleiten, so dass er leichter gesucht werden kann.Diese erste Kommentarzeile wird außerdem als Titel fur Tabellen und Diagramme be-nutzt.

Kommentare konnen außerdem am Ende eines Befehls gegeben werden, etwa:

CALC X10 = X2/X3*100 ! Standfestigkeit in Prozent! wobei X2 = Zahl der aufrecht. Pfl. je Parz.! X3 = Zahl der vorhand. Pfl. je Parz.

3.2.2 Der Befehl INPUT

Uber den INPUT-Befehl konnen Variablen in den CALCULATE-, PLOT-, RESTRICT-, FIT-oder TBT TAB-Befehlen mittels eines Namens angesprochen werden:

INPUT Variablenliste

Page 8: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

3 ALLGEMEINE BEDIENUNG 8

Wird INPUT nicht eingesetzt, werden Variablen mit X1, X2, X3, ... angesprochen.Variablennamen mussen mit einem Buchstaben beginnen, genauer mit einem Zei-

chen, dessen ASCII-Dezimalcode großer oder gleich 64 betragt. Groß- und Kleinbuch-staben werden unterschieden. Nur die ersten funf Buchstaben sind von Bedeutung.Weitere Zeichen konnen fur Zwecke der Dokumentation angehangt werden, werdenjedoch nicht beachtet. Etwa ist Ertrg und Ertrg dt/ha gleichwertig.

Reservierte Namen, die innerhalb CALCULATE verwendet werden, konnen nicht be-nutzt werden, namlich NOTE, EXP, LN, SQRT, ARCSINST. Die arithmetischen Sonder-zeichen, wie + - * / : ( ) und einige weitere, wie $ ! ? > < = . ; sind in Na-men nicht zugelassen. Genauer sind alle ASCII-Zeichen mit Dezimalcode 40-47 und58-63 je einschl. nicht zugelassen. Dagegen konnen andere Sonderzeichen, wie %

2[

] { } fur die Namensgebung benutzt werden.

3.2.3 Der Befehl CALCULATE

Mit dem Befehl CALCULATE werden Variablen modifiziert, neue berechnet oder die Be-obachtungswerte auf gewisse Grenzen hin uberpruft. Beachte insbesondere, dass Leer-stellen Formeln trennen, siehe (2).

(1) Variablen werden mit X1, X2, X3, ... bzw. mit den in INPUT definierten Variablenna-men angesprochen. Desweiteren konnen Hilfsvariablen eingefuhrt werden, etwaX50, Dummy1 oder Parz Groesse.

Alle Rechenoperationen werden im Gleitkommamodus ausgefuhrt. Ein Beispielfur einen CALCULATE-Befehl ist:

CALCULATE X2=X1+X2+X3-100

CALCULATE Parz Groesse=3.5 Ertrag=Gewicht/Parz Groesse

CALC TS%=Einwaage/Auswaage*100

(2) Berechnungen werden von links nach rechts vorgenommen. Leerzeichen innerhalbvon Ausdrucken sind nicht erlaubt, da Leerzeichen Zuweisungen trennen. Sokann eine CALCULATE-Befehlszeile mehrere Zuweisungen enthalten.

CALC X2=X6/X7*100.0 X3=X8*X9/X10

(3) Die ublichen Grundrechen-Operationen + - * und / sind moglich, außerdem dieganzzahlige Division : . Etwa berechnet CALC X1=5:3 eine 1. Klammerausdruckesind erlaubt, nicht dagegen Potenzen.

CALC X5=X1/(X2-X3)*(-X4) X5=((-X3+X4)/X1)-X2 .

(4) Als Funktionen sind moglich:

LN = naturlicher LogarithmusSQRT = QuadratwurzelEXP = ExponentialfunktionARCSINST = Arcussinus der Wurzel von X (mit 0 < X < 1)

wobei die Variablen in Klammer zu setzen sind, etwa:CALC X3=LN(X2) X5=ARCSINST(X5) X3=X1+EXP(-1/X2)

Page 9: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

3 ALLGEMEINE BEDIENUNG 9

(5) Mit NOTE kann abgefragt werden, ob in einer Variablen Werte vorkommen, die au-ßerhalb einer bestimmten Grenze liegen. Dabei sind nur Abfragen mit ”großerals” und ”kleiner als” moglich, etwa:

CALCULATE NOTE X6<X7 NOTE X7>99.9

(6) Kommentare konnen am Ende angefugt werden, etwa:

CALC X10=X2/X3*100 ! Standfestigk.

(7) Potenzen sind nicht erlaubt, dagegen konnen Klammerausdrucke verwendet wer-den. Komplexere Formeln sind also in angemessener Weise zu zerlegen, sieheDatenbeispiele PSDLATT-2 und PSDANOV-2 in psdlatt.dat bzw. psdanov.dat

CALC Z0=Faktor*(Sollp-VPF)+VPF Z1=LN(2*X1*X1*X1)

(8) Auch bedingte Anweisungen konnen benutzt werden, etwa

CALC X15=X1>0.5 X16=X3==100

wobei folgende Vergleichsoperatoren zugelassen sind:

< kleiner> großer== gleich<= kleiner oder gleich>= großer oder gleich<> ungleich

Bei der Ausfuhrung ergibt sich ein Wert von 1, falls der Vergleich wahr ergibt,bzw. 0, falls nicht wahr zutrifft. Bei fehlenden Werten, ergibt sich ein fehlenderWert.

Diese Operatoren konnen in Ausdrucken weiter verwendet werden, etwa:

CALC X21=X14+(X1>=0.5)*10

d.h. es wird immer 10 zu X14 addiert, wenn X1 großer oder gleich 0.5 ist.

CALC X22=X14+X1>=0.5*10

d.h. es wird immer 1 zu X14 addiert, wenn X1 großer oder gleich 0.5*10 bzw. 5ist.

Zu beachten ist die Reihenfolge in der Abarbeitung von Ausdrucken, wobei zu-erst * und : , dann + und - , abschließend obige Vergleiche durchgefuhrt werden.

Bemerkung zum Rechnen mit Nullen:Eine Division mit Null oder ein naturlicher Logarithmus von Null wird ergebnismaßigals Null dargestellt. Wenn der Qualifier MISS=0 zugrunde liegt, also Nullen nicht alsfehlende Werte behandelt werden, dann ergibt etwa 100 + 0 = 100. Hingegen, wennMISS=1, dann ergibt sich bei Rechenoperationen mit Null ein fehlender Wert als Ergeb-nis.

3.2.4 Der Befehl VARIABLE NAMES

Mit diesem Befehl werden die Namen von Variablen spezifiziert. Diese Namen werdendann in Tabellenuberschriften verwendet.

Page 10: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

3 ALLGEMEINE BEDIENUNG 10

VARIABLE NAMES Variablenliste

Die Zahl der Namen muß mit NVAR, der Zahl der zu analysierenden Variablen,ubereinstimmen. Nur die ersten 5 Zeichen jeden Namens werden benutzt. Zu Do-kumentationszwecken konnen die Namen verlangert werden, etwa von Ertrg aufErtrg dt/ha. Variablennamen mussen mit einem Buchstaben beginnen, genauer miteinem Zeichen, dessen ASCII-Dezimalcode großer oder gleich 64 betragt. Die Namenwerden durch ein oder mehrere Leerzeichen getrennt. Gleichheits- und Ausrufezei-chen konnen innerhalb von Namen nicht benutzt werden. Ein Beispiel mit drei Varia-blen ist

VARIABLES Ertrag Standfestigkeit TS% (Trockensubst.Proz.)

Wurde der Befehl INPUT eingesetzt, werden mit VARIABLE NAMES die zu verrechnen-den Variablen und deren Reihenfolge bei der Analyse festgelegt. Naturlich mussen dieVariablennamen dann mit den in INPUT und CALCULATE definierten Namen uberein-stimmen, siehe auch 3.2.2.

3.2.5 Der Befehl NAMES OF TREATMENTS

Mit diesem Befehl werden Namen von Prufgliedern eingelesen:NAMES OF TREATMENTS/Q Liste von TEXTen

Die Zahl der Namen muß mit der Zahl der Prufglieder ubereinstimmen. Ohne Qua-lifier werden nur die ersten 5 Zeichen eines jeden Namens benutzt. Werden mehr Zei-chen eingegeben, werden diese uberlesen. Wenn weniger als 5 Zeichen geschriebenwerden, wird der Name bis zum Ende mit Leerzeichen aufgefullt. Nur die ersten vierNAMES-Zeilen werden im spateren Ausdruck gelistet. Gleichheitszeichen durfen nichtinnerhalb eines Namens benutzt werden. Mit dem Qualifier Q kann erwirkt werden,dass mehr als 5 Zeichen fur Namen verwendet werden. Als Q wird dann die maxima-le Zahl der Zeichen in den Namen eingegeben. Beachte dabei, dass die Namenlangebeim ersten NAMES-Aufruf zu andern ist. Bei ANOVA muß mit einem weiteren Zeichenim Qualifier das Symbol desjenigen Faktors vermerkt werden, auf den sich die Namenbeziehen (siehe FACTOR-Befehl 6.1.2). Beispiele hierfur sind:

NAMES_OF_TREATMENTS D1 D2 D3NAMES E1*D2_(EMMA.LENA)*(DORA.ROSA)

M1*O2_(MARY.LENA)*(ORA_.ROSA)NAMES/T9 Manchuria Svansota Velvet

Naturlich wird beim zweiten Beispiel nur E1*D2 und M1*O2 von PLABSTAT be-nutzt.

3.2.6 Der Befehl CHECKS

Damit werden die Standard- oder Kontrollprufglieder festgelegt und eine zusatzlicheTabelle von Prozentwerten ausgegeben, namlich relative Prufgliedmittelwerte in Pro-zent vom Mittelwert der Standardprufglieder.

CHECKS/Q Liste von Prufgliedbezeichnern

Prufgliedbezeichner sind die Nummern oder Namen der Standards. Wird ein Stern* benutzt, wird auf den Versuchsmittelwert bezogen. Bei ANOVA muß als Qualifier das

Page 11: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

3 ALLGEMEINE BEDIENUNG 11

Symbol desjenigen Faktors vermerkt werden, dem die Standardprufglieder als Stufenangehoren (siehe FACTOR-Befehl 6.1.2). Bei LATTICE entfallt der Qualifier Q. Etwa

CHECKS 10 20 30 (bei LATTICE)CHECKS/T 24 25 (bei ANOVA)

Um Serien von Experimenten, in denen oft zusatzliche lokale Standards zugelas-sen sind, verrechnen zu konnen, wird der Qualifier +n benutzt. Dabei werden nur dieersten n Standardprufglieder zur Berechnung der Relativwerte herangezogen, etwa

CHECKS/+2 TASSILO SYMPHONY DUMMY1 DUMMY2 DUMMY3

Die nachgeordneten lokalen Standards, hier DUMMY1 bis DUMMY3, konnen in einzelnenExperimenten fehlen. Im Korrelationsdiagramm werden die ersten n Standards zuerstmit ihren Nummern angezeigt, anschließend die eigentlich zu testenden Prufgliederund zum Schluß die lokal angefugten Standardsorten. In mehrfaktoriellen Versuchen,etwa in Serien von Tester×Linien gehen die Standardprufglieder von CHECK/+ oderCHECK/+n nicht in die ANOVA ein, sie werden nur in Korrelationsdiagrammen ein-gefugt.

3.2.7 Der Befehl CSV

Damit lassen sich csv-Dateien (comma separated values) erzeugen, die von Daten-banken leichter zu lesen sind. Es werden insgesamt vier csv-Dateien produziert:*_mean.csv mit den Prufgliedmittelwerten, *_perc.csv mit den Relativwerten alsProzente vom Standardmittel, *_anov.csv mit Parametern aus den Varianzanaly-sen (etwa Freiheitsgrade, Abweichungsquadrate, Varianzkomponenten, F-Werte) und*_corr.csv mit der Korrelationsmatrix der Prufgliedmittelwerte. Ubrigens ist auch die*.mnv-Datei ene Art von csv-Datei, wobei das Leerzeichen als Trenner und der Dezi-malpunkt benutzt wird. In den *_mean.csv und *_perc.csv konnen unter Benutzungdes ANOVA-Befehls ein- und zweifaktorielle Mittelwerttafeln ausgegeben werden, so-fern diese im TBT_TAB-Befehl aufgerufen werden.

Es kann deutsches oder englisches Format fur die csv-Dateien gewahlt werden.CSV/Q Liste von funf Identifikatoren

oderCSV/Q Calculation_ID,Crop,Trial,Year,Location

Mit dem Qualifier E bzw. ohne Qualifier wird englisches Format mit Dezimalpunktund Komma als Trenner benutzt. Mit dem Qualifier G wird deutsches Format mit De-zimalkomma und Semikolon als Trenner verwendet.

Die funf Identifikatoren dienen als Kennzeichnung fur den Versuch, etwaCSV/E LP1,wheat,17,2009,serie

In diesem Falle werden alle erzeugten csv-Dateien mit diesen funf einleitendenSpalten versehen. An sich sind die funf Identifikatoren frei wahlbar.

Ist der erste Identifikator eine Zahl, z.B.CSV/G 123,,,,

dann werden die Namen der csv-Dateien durch Anhangen an diese Zahl gebil-det, also etwa 123_mean.csv, 123_corr.csv, 123_anov.csv, 123_perc.csv. Ande-renfalls wird der Datendateiname entsprechend verlangert.

Page 12: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

4 EINFACHE STATISTISCHE MASSZAHLEN UND REGRESSIONSANALYSEN 12

3.2.8 Der Befehl RUN

Beim Aufruf von RUN fuhrt PLABSTAT die vorausgehenden Befehle aus. Es ist moglich,dass dabei weitere Fehler entdeckt werden, welche beim Einlesen der einzelnen Be-fehlszeilen nicht zu finden waren. So wird etwa gepruft, ob die Zahl der Variablenna-men mit der Zahl der zu analysierenden Variablen ubereinstimmt. RUN ist ein essenti-eller Befehl.

3.2.9 Der Befehl EOD

Nach dem RUN-Befehl erwartet PLABSTAT einen Datensatz, dessen Struktur durch dengewahlten BASIC- , LATTICE- , ANOVA- oder ANOVA-Befehl beschrieben worden ist. DieDatenzeilen werden durch eine Zeile mit EOD abgeschlossen.

3.2.10 Der Befehl STOP

Hiermit wird ein PLABSTAT-Job abgeschlossen. Falls erwunscht, konnen vor dem STOP

weitere Jobs mit Befehls- und Datenzeilen gegeben werden.

3.3 Dateneingabe

Die Daten sind meistens numerischer Art und konnen in freiem Format, getrenntdurch mindestens ein Leerzeichen, eingegeben werden. Fur jede Parzelle oder Ver-suchseinheit muß eine Datenzeile eingeben werden.

Zuweilen ist ein formatierter Input wunschenswert, etwa wenn Daten aus einer Da-tenbank ubernommen werden sollen. In solchen Fallen kann ein FORTRAN-ahnlichesFormat verwendet werden, naheres siehe 4.1, 5.1 oder 6.1.

Fur LATTICE and ANOVA konnen, falls erwunscht, die Daten sortiert werden (5.1.2und 6.1.11), was mit irgendeinem Sortierprogramm oder mittels des Editors durch-gefuhrt werden kann.

Fehlende Werte werden uber einen Stern * oder als Null eingegeben. In einer forma-tierten Eingabe konnen dazu Leerzeichen oder Nullen verwendet werden. PLABSTATersetzt diese fehlenden Werte durch geschatzte Ersatzwerte, wenn LATTICE oder ANOVAdurchgefuhrt wird. Weitere Details finden sich in 5.1.2 und 6.1.11.

4 Einfache statistische Maßzahlen und Regressionsana-lysen

Mit dem BASIC-Befehl werden einfache statistische Maßzahlen, wie Mittelwert, Vari-anz, Standardabweichung, Variationskoeffizient, Schiefe oder Exzeß fur einzelne Va-riablen und die Matrix der Korrelationskoeffizienten fur einen Satz von Variablen be-rechnet. Mediane, Quartile und Spearmansche Korrelationskoeffizienten sind wahl-bar. Mit dem FIT-Befehl laßt sich eine einfache oder multiple Regressionsanalysedurchfuhren.

Page 13: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

4 EINFACHE STATISTISCHE MASSZAHLEN UND REGRESSIONSANALYSEN 13

4.1 Befehle

4.1.1 Der Befehl BASIC

Mit dem BASIC-Befehl werden Daten eingelesen und einfache statistische Maßzahlengeschatzt:

BASIC/Q NROW NIDT NINPT NVAR

wobei NROW = Zahl der Einheiten oder Zeilen des DatensatzesNIDT = Zahl der alphanumerischen Felder, welche die Datenzeile identifizierenNINPT = Zahl der einzulesenden VariablenNVAR = Zahl der zu analysierenden Variablen.

Der Qualifier Q dient zur Steuerung der Ein- und Ausgabe. Oft kann der Qualifier,einschl. des Schragstrichs, weggelassen werden. In diesem Fall wird eine bestimmteVoreinstellung (default mit 1110) vorgenommen, siehe dazu auch 3.1.6. Der Qualifierbesteht aus bis zu 4 Ziffern mit Namen MISS, EXTR, PRIN und NEWF,

wobei MISS = 0 Nullen in den Daten nicht als fehl. Werte behandeln1 Nullen als fehl. Werte behandeln (Voreinstellung)

EXTR = 1 nicht benutzt (Voreinstellung)PRIN = 1 normale Ausgabe (Voreinstellung)

2 Ausgabe von Spearmanschen KorrelationskoeffizientenNEWF = 0 Beobachtungswerte nicht auf sek. Datei sichern (Voreinstellung)

1 oder 2 transformierte Beobachtungswerte auf sek. Datei sichern.

Sollen die Beobachtungsdaten formatiert eingelesen werden, etwa wenn keineLeerzeichen zum Trennen der Daten verwendet werden, wenn mehr als eine Datenzei-le je Parzelle eingelesen oder wenn die Zeichenreihenfolge geandert werden soll, dannkann an den BASIC-Befehl ein $F mit einem FORTRAN-ahnlichen Format angehangtwerden, z.B.

BASIC 16 0 6 6 $F X5, F2.1, 3F3.0, 1X, 2F.2

Die eigentlichen Beobachtungswerte mussen mit F- oder E-Beschreibern eingelesenwerden. Daneben konnen auch andere Beschreiber, etwa X fur das Uberlesen einzel-ner Zeichen oder / fur nachfolgende Zeile, verwendet werden. Weiteres siehe in einerFORTRAN-Beschreibung.

Mit CALCULATE konnen Variable (Merkmale) modifiziert oder neue berechnet wer-den, siehe Abschnitt 3.2.3. Mit VARIABLE NAMES (3.2.4) lassen sich ihre Namen eingeben.Mit PLOT (8.3) konnen Korrelationsdiagramme erzeugt werden.

4.1.2 Der Befehl FIT

Mit dem FIT-Befehl werden einfache und multiple Regressionsrechnungen durch-gefuhrt, nachdem zuvor mit dem BASIC-Befehl die Daten eingelesen worden sind:

FIT/Q Y X1 X2 ....

wobei Y = Variablenbezeichner fur die abhangige Variable YX1 = Variablenbezeichner der ersten unabhangigen Variablen

Page 14: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

4 EINFACHE STATISTISCHE MASSZAHLEN UND REGRESSIONSANALYSEN 14

X2 = Variablenbezeichner der zweiten unabhangigen Variablenusw.

Sollen mehrere Regressionsanalysen durchgefuhrt werden, so muß jeder Variablen-satz auf eine Zeile geschrieben werden, z.B.:

FIT X5 X1 X2 X3

Ertrg BD KZjeA TKG

Der Qualifier Q dient zur Steuerung. Er kann oft weggelassen werden. In diesemFall wird eine bestimmte Voreinstellung (default mit 111) vorgenommen, siehe dazuauch 3.1.6. Der Qualifier besteht aus bis zu 3 Ziffern mit Namen PRIN, RSDL und ICPT

wobei PRIN = 0 nur Regressionsanalysen ausgeben1 Kovarianzmatrix der multiplen Regressionskoeffizienten zusatzlich

ausgeben (Voreinstellung)2 Kovarianzmatrix der Variablen zusatzlich ausgeben

RSDL = 0 Residuen nicht ausgeben1 Test auf Ausreißer (Voreinstellung)2 gefittete Werte und Residuen auf sekundare Datei ausgeben

ICPT = 0 Regression ohne y-Achsenabschnitt1 Regression mit y-Achsenabschnitt (Voreinstellung)

4.1.3 Die Dateneingabe

Fur jede Beobachtungseinheit ist eine Datenzeile mit folgender Struktur einzugeben:ID1 ID2 ... X1 X2 ...

ID1, ID2, ... sind alphanumerische Felder, welche Experiment, Jahr, Ort, Kultur-pflanzenart und andere Codes zur Identifizierung der Einheiten enthalten. Ins-gesamt NIDT solche Felder - durch Leerzeichen voneinander getrennt - werdeneingelesen, wobei NIDT auch Null sein kann. Diese Identifikatoren sind belanglosfur BASIC, so dass Sie beliebige Zeichen dafur wahlen konnen.

X1, X2, ... sind die NINPT Beobachtungen je Beobachtungseinheit, die eingelesenwerden sollen. Diese Zahlen werden durch ein oder mehrere Leerzeichen von-einander getrennt. Ist dies in einem Datensatz nicht eingehalten worden, kanneventuell durch obiges $F-Format doch eine Eingabe erreicht werden.

Beispiele fur die Dateneingabe finden sich in Kapitel 2 und auf der Datei psd-basc.dat.

Fehlende Werte mussen durch einen Stern * oder Null im freien Format und durchLeerzeichen oder Nullen beim $F-Format gekennzeichnet werden. Wird MISS=0 imQualifier des BASIC-Befehls gewahlt, dann werden Nullen nicht als fehlende Wertebehandelt. Beachte: Datenpaare, die einen fehlenden Wert enthalten, werden beimSchatzen einer Kovarianz innerhalb FIT weggelassen.

Page 15: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

5 EINFACHE BLOCK- UND GITTERANLAGEN 15

4.2 Ausgabe und Methoden

Fur jede zu analysierende Variable wird eine Zeile mit der Zahl der festgestellten Beob-achtungen (Units) - fehlende Werte sind abgezogen -, mit dem Mittelwert (Mean), derVarianz (Variance), der Standardabweichung (Std.dev), dem Variationskoeffizienten(Coef.var), der Schiefe (Skewness) und dem Exzeß (Kurtosis).

Es wird der Schiefekoeffizient g1 ausgegeben, der in einer Normalverteilung 0 ist.Bei positiven Schiefewerten ist die Verteilung rechtsschief, bei negativem linksschief.Falls er signifikant von Null abweicht, wird bei P = 10%, 5% bzw. 1% mittels + , * oder** eine entsprechende Signifikanz angezeigt. Entsprechendes gilt fur den Exzeßschatz-wert g2 , der bei einer Normalverteilung 0 ist, bei negativem Wert eine abgeflachtereVerteilung, bei positivem Wert eine spitzgipfligere Verteilung anzeigt. Weiteres sieheSNEDECOR und COCHRAN (1980, S. 79).

Treten fehlende Werte bei der Berechnung des Korrelationskoeffizienten zwischenzwei Variablen auf, so wird jeweils das Paar von Beobachtungen ausgeschlossen, indem ein fehlender Wert enthalten ist.

In der multiplen Regressionstabelle findet sich unter der Uberschrift Regr.coeff.der y-Achsenabschnitt und die Regressionskoeffizienten. Daneben sind ihre Stan-dardfehler unter Std.error und die t-Werte unter t-value zu finden. UnterStd.regr.coeff. sind die Pfadkoeffizienten oder standardisierten Regressionskoeffi-zienten als Maße fur die relative Bedeutung der einzelnen Regressionsvariablen auf-gelistet, siehe auch SNEDECOR und COCHRAN (1980, S. 357). Unter part_r sind diepartiellen Korrelationskoeffizienten von Y auf Xi unter Konstanthalten der Xj (allej 6= i), unter part_SS die partiellen Summen der Abweichungsquadrate und unterSSXY**2/SSX die Reduktionen in der Summe der Abweichungsquadrate durch die Ein-fachregression von Y auf Xi zu finden.

Fur jedes Regressionsmodell werden das Bestimmtheitsmaß in % (R^2%), der mul-tiple Korrelationskoeffizient (R) und das korrigierte Akaike Informationskriterium(AICc) zum Vergleich verschiedener Modelle, siehe BURNHAM and ANDERSON(1998), ausgegeben.

Ausreißer werden im Verlauf der multiplen Regressionsberechnungen getestet, sie-he DRAPER und SMITH (1998). Dabei werden auffallende Restabweichungen und Da-tenpunkte, welche die Regression stark beeinflussen, aufgelistet.

Bei der multiplen Regression sollte beachtet werden, dass die numerischen Kalku-lationen instabil werden konnen, wenn sehr hohe Korrelationskoeffizienten zwischenVariablen, etwa r > 0, 998, auftreten. Ein solcher Nachteil kann vermieden werden,wenn bei einer solchen Variablen uber einen CALCULATE-Befehl ein Wert abgezogenwird, der nahe oder auch gleich dem Variablenmittelwert ist, siehe dazu auch SNEDE-COR und COCHRAN (1980, S. 400).

5 Einfache Block- und Gitteranlagen

Mit dem LATTICE-Befehl werden generalisierte Gitteranlagen (α-designs) und einfacheBlockexperimente analysiert. Zusatzlich lassen sich damit erweiterte teilweise wie-derholte Anlagen (augmented p-rep designs, augmented designs, WILLIAMS et al.2011) analysieren, deren Kern eine generalisierte Gitteranlage darstellt. Randomisierte

Page 16: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

5 EINFACHE BLOCK- UND GITTERANLAGEN 16

vollstandige Blockanlagen (RCB) konnen auch mit dem ANOVA-Befehl verarbeitet wer-den. Ein einfacher Blockversuch ist unter LATTICE mit weniger PLABSTAT-Befehlenund geringerem Rechenaufwand zu verrechnen als unter ANOVA, jedoch muß bei derLATTICE-Dateneingabe auf jeden Fall die Blocknummer eingegeben werden. Naheresdazu im Abschnitt 5.1.2.

5.1 Befehle

5.1.1 Der Befehl LATTICE

Mit dem LATTICE-Befehl werden Daten eingelesen und Analysen durchgefuhrt:LATTICE/Q T S K R NINPT NVAR

wobei T = Zahl der PrufgliederS = Zahl der unvollstandigen Blocke je Wiederholung

(falls Blockversuch, S=1 wahlen)K = Zahl der Parzellen je unvollstandigem Block

(falls Blockversuch, K=1 wahlen)R = Zahl der WiederholungenNINPT = Zahl der einzulesenden VariablenNVAR = Zahl der zu analysierenden Variablen.

Der Qualifier Q dient zur Steuerung der Ein- und Ausgabe. Oft kann der Qualifier,einschl. des Schragstrichs, weggelassen werden. In diesem Fall wird eine bestimmteVoreinstellung (default mit 1110) vorgenommen, siehe dazu auch 3.1.6. Der Qualifierbesteht aus bis zu 4 Ziffern mit Namen MISS, EXTR, PRIN und NEWF,

wobei MISS = 0 Nullen nicht als fehl. Werte behandeln1 Nullen als fehl. Werte behandeln (Voreinstellung)

EXTR = 0 kein Test auf extreme Werte bzw. Ausreißer1 Testen auf extreme Werte (Voreinstellung)

PRIN = 0 keine Ausgabe der Varianzanalyse-Tabelle1 Ausgabe der Varianzanalyse-Tabelle (Voreinstellung)2 Ausgabe der adj. Prufgliedeffekte statt der Prufgliedmittelwerte3 Ersatzwerte bei fehlenden Werten auch bei mehr als 15 ausgeben,

fehl. Prufgl. in den Mittelwerttabellen nicht durch Null ersetzenNEWF = 0 Mittelwerte nicht auf sek. Datei sichern (Voreinstellung)

1 adj. Mittelwerte auf sek. Datei sichern2 transformierte adj. Parzellenwerte sichern3 adj. Mittelwerte und adj. Parzellenwerte sichern.

Sollen die Beobachtungsdaten formatiert eingelesen werden, etwa wenn keineLeerzeichen zum Trennen der Daten verwendet werden, wenn mehr als eine Daten-zeile je Parzelle eingelesen oder wenn die Zeichenreihenfolge geandert werden soll,dann kann an den LATTICE-Befehl ein $F mit einem FORTRAN-ahnlichen Format an-gehangt werden, z.B.

LATT 7 1 1 2 6 3 $F A6, 2I2, 3F3.0, 1X, 3F5.0

Page 17: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

5 EINFACHE BLOCK- UND GITTERANLAGEN 17

Das erste Feld mit dem Identifikator muss dabei mit A6, die beiden nachsten Felder(die Block- und die Prufgliednummer, siehe 5.1.2) mussen mit einem I-Beschreiber unddie eigentlichen Meßwerte mit F- oder E-Beschreibern eingelesen werden. Danebenkonnen auch andere Beschreiber, etwa / fur nachfolgende Zeile, verwendet werden.Weiteres siehe in einer FORTRAN-Beschreibung.

Die Effekte der unvollstandigen Blocke (beim Gitter in adjustierter Form und dendazugehorigen Wiederholungseffekt gleich addiert) konnen auf der sekundaren Aus-gabedatei gesichert werden, wenn ein $A an den LATTICE-Befehl angehangt wird, etwa:

LATT 7 1 1 2 6 3 $An

”Augmented designs” lassen sich damit verrechnen, indem die wiederholten bzw.Standardprufglieder zuerst eingelesen werden. Die Zahl der angehangten Prufgliederbzw. Parzellen n wird dabei nach $A vorgegeben. Die dazugehorigen Beobachtungsda-ten werden im selben Format wie die Standardprufglieder, siehe 5.1.2, nach deren Da-tenzeilen eingegeben. Entsprechend sind Block- und Prufgliednummern (T+1, T+2,

... T+n) fur jede der n Parzellen notwendig.LATTICE kann auch mit nur einer Wiederholung (R=1) ausgefuhrt werden.Mit CALCULATE konnen Variable (Merkmale) modifiziert oder neue berechnet wer-

den, siehe Abschnitt 3.2.3. Mit VARIABLE NAMES (3.2.4) lassen sich ihre Namen einge-ben und mit NAMES OF TREATMENTS (3.2.5) diejenigen der Prufglieder. Mit CHECKS (3.2.6)konnen Relativwerte zu den Standardprufgliedern, mit INDEX (8.2) Selektionsindizes,mit PLOT (8.3) Korrelationsdiagramme der Prufgliedmittel oder der einzelnen Wie-derholungen erzeugt werden und mit TBT TAB (8.1) konnen formatierte oder sortiertePrufgliedmittelwertlisten angewahlt werden.

5.1.2 Die Dateneingabe

Fur jede Parzelle oder Versuchseinheit ist eine Datenzeile mit folgender Struktur ein-zugeben:

IDENTIFIKATOR BN TN X1 X2 ...

IDENTIFIKATOR ist ein alphanumerisches Feld, welches Experiment, Jahr, Ort, Kul-turpflanzenart, u.a. anzeigt. Wegen des Schreibens von adjustierten Mittelwertenauf die sekundare Ausgabedatei sollte der Identifikator maximal 6 Zeichen langsein.

BN gibt in Gittern die Nummer des unvollstandigen Blocks an, in der die Parzelle sichbefindet, sie lauft 1,2, ... R*S. Im Blockversuch wird die Wiederholungsnummer,1,2, ... R , verwendet.

TN ist die Prufgliednummer mit den moglichen Werten 1, 2, ... T.

X1, X2, ... sind die NINPT Beobachtungen je Parzelle, die eingelesen werden sol-len. Diese Zahlen werden durch ein oder mehrere Leerzeichen voneinander ge-trennt. Ist dies in einem Datensatz nicht eingehalten worden, kann eventuelldurch obiges $F-Format doch eine Eingabe erreicht werden.

Die Daten konnen sortiert oder nichtsortiert eingehen. Beispiele finden sich auf derDatei psdlatt.dat.

Page 18: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

5 EINFACHE BLOCK- UND GITTERANLAGEN 18

Fehlende Werte mussen durch einen Stern * oder Null im freien Format und durchLeerzeichen oder Nullen beim $F-Format gekennzeichnet werden. Wird MISS=0 imQualifier des LATTICE-Befehls gewahlt, dann werden Nullen nicht als fehlende Wer-te behandelt. Ubrigens konnen ganze Prufglieder als fehlend betrachtet werden. Indiesem Fall setzt PLABSTAT den Prufgliedeffekt als Null an und schatzt die fehlendeWerte wie gewohnt. Fehlende Prufglieder werden in den Mittelwert-Tabellen und inder sekundaren Ausgabedatei als Null ausgegeben, sofern der LATTICE-Qualifier PRINnicht auf 3 gesetzt ist. Auch Falle, in denen in einzelnen Variablen weniger Wiederho-lungen vorhanden sind, lassen sich analysieren.

5.2 Ausgabe

Schatzwerte fur die fehlenden Werte werden nur gedruckt, wenn weniger als 15 Wertefehlen. Wird der Qualifier PRIN=3 gesetzt, konnen auch mehr als 15 angezeigt werden.

Der Ausreißertest arbeitet in abgeanderter Form, nach der Methode von ANSCOM-BE und TUKEY (1963), siehe auch SNEDECOR und COCHRAN (1967, Kap. 11.11) undstellt extreme Residuen (Parzellenfehler) fest. Damit mehrfache Ausreißer moglichstgut identifiziert werden, wird zuerst ein robuster Schatzwert fur die Fehlervarianz,namlich der MAD (Median der absoluten Residuen), berechnet. Damit werden diestandardisierten (bzw. studentisierten) Residuen, also Residuum dividiert durch dieStandardabweichung, berechnet. Wird eine gewisse Grenze, die von der Fehlervarianzund dessen Freiheitsgraden abhangt, uberschritten, wird der Beobachtungswert alsAusreißer gemeldet. Da bei der Uberprufung normalverteilte Residuen vorausgesetztwerden, konnen in manchen Fallen zu viele Extremwerte identifiziert werden.

Fur jedes Merkmal wird dabei als erste Zeile die Wiederholungsmittelwerte(Replic.means) ausgegeben und darunter die Liste der verdachtigen Ausreißer mitdem studentisierten Residuum (St.Resid) und ihren Beobachtungswerten in jederWiederholung. Es wird empfohlen, zuerst die Zeilen mit dem großten studentisiertenResiduum zu uberprufen. Wenn Sie sehr große Fehler, etwa Schreibfehler, in Ihrem Ex-periment korrigieren mußten, dann werden eventuell im zweiten Durchgang weitereAusreißer durch PLABSTAT ausgegeben.

Weiterhin ist eine Tabelle der Effekte der unvollstandigen Blocke zu finden. DieseEffekte, in adjustierter Form geschatzt, spiegeln die Boden- oder sonstige Blockvaria-bilitat wieder. Gradienten, Nester oder andere grobe Einflusse auf die Daten konnendamit gegebenfalls erkannt werden.

Fur jedes Merkmal, sofern es variiert, wird eine Tabelle mit der Varianzanalyseausgegeben. Im Falle eines Gitters werden die Varianzkomponenten uber eine ”Intra-Block-Analyse”, siehe FEDERER (1955) oder UTZ (1969, Bad Nauheim), berechnet. Aufdieser Basis wird auch der F-Test fur die Prufglieder vorgenommen. Die Signifikanz-tests haben folgende Bedeutung:

+ signifikant bei 10% Irrtumswahrscheinlichkeit* signifikant bei 5% Irrtumswahrscheinlichkeit** signifikant bei 1% Irrtumswahrscheinlichkeit

Einige andere ausgegebene Parameterschatzwerte sind:

SE(tr) = Standardfehler der (adjustierten) Prufgliedmittelwerte

Page 19: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

5 EINFACHE BLOCK- UND GITTERANLAGEN 19

SD(tr) = Standardabweichung der (adjustierten) PrufgliedmittelwerteC.V.% = Variationskoeffizient (coefficient of variation),

= namlich die Wurzel aus der effektiven Fehlervarianzdividiert durch das Versuchsmittel mal 100

Repeat1% = Wiederholbarkeit (repeatability) eines einzelnen Parzellenwertes in %= Var.-komp. der Prufgl. /(Var.-Komp. der Prufgl. + Eff. Fehlervar.)

Effic. = Effizienz des Gitters im Vergleich zum Blockversuch in Prozentmy = Wagungsfaktor der Gitteranalyse, siehe COCHRAN und COX (1957)Eff.Err.MS = Effektive Fehlervarianz im Gitter oder Fehlervar. im Blockversuch

Mit dem Parameter Repeat1% oder der Wiederholbarkeit einer Parzelle konnen Ver-suche hinsichtlich ihrer Genauigkeit verglichen werden, und zwar unabhangig von derjeweiligen Zahl der Wiederholungen. Dieser Parameter ist auch dann beachtenswert,wenn die Fehler- und Prufgliedvarianz korreliert sind. Zeigt dagegen die Fehlervari-anz eine Abhangigkeit vom Versuchsmittelwert, dann durfte der VariationskoeffizientC.V.% als Genauigkeitsmaß vorzuziehen sein.

Die Prufgliedmittelwerte werden beim Gitter in allen Merkmalen adjustiert, in de-nen die Effizienz mehr als 100% betragt. Dieses Vorgehen durfte dem Versuchsanstel-ler die besten Informationen geben und wird daher auch in den meisten Lehrbuchernempfohlen.

Am Anfang der Tafel der Prufgliedmittelwerte finden sich einige weitere Zeilen:

C.V. = obiger VariationskoeffizientREP1 = obige Wiederholbarkeit Repeat1%LSD5 = Grenzdifferenz bei 5% IrrtumswahrscheinlichkeitCHEC = Mittelwert der Standardprufglieder (falls CHECKS gegeben wurde)MEAN = Versuchsmittel

oderMwCh = Mittelwert der Nicht-Standard-Prufglieder (Mean without Checks)

Ein Teil obiger Parameter wird auch auf die sekundare Ausgabedatei geschrieben,wenn der Qualifier NEWF=1 benutzt wird.

Wenn CHECKS gegeben wird, wird gleichzeitig eine Tabelle der adjustiertenPrufgliedmittel in Prozenten vom Standardmittel erzeugt.

Ferner wird eine Tabelle der Korrelationskoeffizienten zwischen den Merkmalen,berechnet aufgrund der (adjustierten) Prufgliedmittelwerte, einschl. eines approxima-tiven Signifikanztests ausgegeben.

5.3 Methoden

Die Analyse von generalisierten Gitteranlagen wird mittels einer iterativen Methodenach WILLIAMS (1977) durchgefuhrt. Eingeschlossen sind die Spezialfalle eines qua-dratischen Gitters oder eines vollstandigen Blockversuchs.

Fehlende Werte werden iterativ berechnet, indem die Fehlervarianz minimiert wird(YATES, 1933; HEALY und WESTMACOTT, 1956). Die Iteration wird abgebrochen,wenn die vierte Dezimale der Fehlervarianz bei wiederholter Iteration sich nicht mehrandert. Damit durften die gegebenen Dezimalstellen in der Varianztabelle auch bei

Page 20: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 20

fehlenden Werten gultig sein. Die Zahl der notwendigen Iterationen wird mit Hilfeeines Tricks von PREECE (1971) reduziert.

6 Mehrfaktorielle Experimente

Mit dem ANOVA-Befehl werden balancierte mehrfaktorielle Versuche analysiert und In-teraktionen zwischen zwei Faktoren nach einem Regressionsmodell unterteilt, etwaum eine phanotypische Stabilitatsanalyse durchzufuhren.

6.1 Befehle

6.1.1 Der Befehl ANOVA

Mit dem ANOVA-Befehl werden Daten eingelesen und die dazugehorige Analyse durch-gefuhrt:

ANOVA/Q NIDT NINPT NVAR

wobei NIDT = Zahl der alphanumerischen Felder, welche die Datenzeile identifizierenNINPT = Zahl der einzulesenden VariablenNVAR = Zahl der zu analysierenden Variablen.

Der Qualifier Q dient zur Steuerung der Ein- und Ausgabe. Oft kann der Qualifier,einschl. des Schragstrichs, weggelassen werden. In diesem Fall wird eine bestimmteVoreinstellung (default mit 1110) vorgenommen, siehe dazu auch 3.1.6. Der Qualifierbesteht aus bis zu 4 Ziffern mit Namen MISS, EXTR, PRIN und NEWF,

wobei MISS = 0 Nullen nicht als fehl. Werte behandeln1 Nullen als fehl. Werte behandeln (Voreinstellung)

EXTR = 0 kein Test auf extreme Werte bzw. Ausreißer1 Test auf extreme Werte in den Residuen (Voreinstellung)2 Test auf extreme Werte in den Residuen und Effekten

PRIN = 1 normale Ausgabe (Voreinstellung)3 erweitertes Ausgeben bei fehlenden Werten, namlich Ausgeben aller

errechneten Ersatzwerte, Belassen der Ersatzwerte in Mittelwert-tabellen und Ausgeben von Konvergenzkriterien

NEWF = 0 Mittelwerte nicht auf sek. Datei sichern (Voreinstellung)1 Mittelwerte auf sekundarer Datei sichern2 (transformierte) Parzellenwerte auf sek. Datei sichern.

Sollen die Beobachtungsdaten formatiert eingelesen werden, etwa wenn keineLeerzeichen zum Trennen der Daten verwendet werden, wenn mehr als eine Datenzei-le je Parzelle eingelesen oder wenn die Zeichenreihenfolge geandert werden soll, dannkann an den ANOVA-Befehl ein $F mit einem FORTRAN-ahnlichen Format angehangtwerden, z.B.

ANOVA 0 6 6 $F 5X, F2.1, 3F3.0, 1X, 3F5.2

Die Beobachtungswerte mussen mit F- oder E-Beschreibern eingelesen werden. Da-neben konnen auch andere Beschreiber, etwa X fur das Uberlesen einzelner Zeichen

Page 21: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 21

oder / fur nachfolgende Zeile, verwendet werden. Weiteres siehe in einer FORTRAN-Beschreibung.

Die Befehle FACTORS, MODEL und gegebenfalls RANDOM sollten vor den ANOVA-Befehlgestellt werden, da die experimentelle Struktur zuerst definiert sein muß.

Mit CALCULATE konnen Variable (Merkmale) modifiziert oder neue berechnet wer-den, siehe Abschnitt 3.2.3. Mit VARIABLE NAMES (3.2.4) lassen sich ihre Namen eingebenund mit NAMES OF TREATMENTS (3.2.5) diejenigen der Prufglieder, so dass Tabellenuber-schriften damit beschriftet werden konnen. Mit CHECKS (3.2.6) konnen Relativwerte zuden Standardprufgliedern, mit INDEX (8.2) Selektionsindizes und mit PLOT (8.3) Korre-lationsdiagramme der Prufgliedmittel erzeugt werden. Mit TBT TAB (6.1.7 und 8.1) las-sen sich Mittelwerttabellen auch formatiert oder sortiert ausgeben. Mit ERROR konnenFehlervarianzen, Fehlerfreiheitsgrade u.a. aus Einzelversuchen ubernommen werden,wenn mit ANOVA eine zusammenfassende Auswertung uber Serien von Experimentenvorgenommen werden soll (siehe 8.5).

6.1.2 Der Befehl FACTORS

Dieser Befehl gibt die Faktoren und die Stufenzahl fur jeden Faktor:FACTORS TEXT1=N1 TEXT2=N2 TEXT3=N3 ....

wobei die ersten 10 Zeichen jeden TEXTes als Faktorname dienen. Nach dem Gleich-heitszeichen folgt die Zahl der Stufen N dieses Faktors. Beachte, dass Gleichheitszei-chen innerhalb des Faktornamens nicht zugelassen sind.

Das erste Zeichen jeden Faktornamens wird als Kurzsymbol in Tabellen und an-deren Befehlen, wie etwa MODEL oder MEANS benutzt, so dass die Faktornamen jeweilsmit verschiedenem Zeichen beginnen mussen. Folgende zwei Beispiele mogen obigesverdeutlichen:

FACTORS T Sorten = 35 B Wiederholungen = 3

FACT VAETER = 178

MUETTER innerhalb Vaetern = 9

PLAETZE = 3

REIHEN in V und M = 2

Der FACTOR-Befehl muß, um die moglichen Faktorsymbole zu definieren, vor denanderen Befehlen, wie MODEL oder RANDOM stehen. Die Reihenfolge der Faktornamenin FACTORS gibt gleichzeitig die Reihenfolge der Daten wieder, nach der diese sortiertsind, sofern die $-Spezifikation in ANOVA nicht benutzt wird.

Es ist moglich, mit nur einem Faktor eine Varianzanalyse durchzufuhren.

6.1.3 Der Befehl MODEL

Dieser Befehl definiert das biometrische Modell fur die Varianzanalyse. Der Befehl be-steht aus den Effekten, welche durch eine Kombination von Faktorsymbolen symboli-siert und durch Pluszeichen verbunden werden:

MODEL EFFEKT1 + EFFEKT2 + EFFEKT3 + ...

Haupteffekte werden durch ein einzelnes Faktorsymbol und Interaktionseffektedurch eine Kombination solcher Symbole dargestellt. Eine Dreifachklassifikation mitden Faktorsymbolen A, B und C wird also wie folgt codiert:

Page 22: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 22

MODEL A + B + C + AB + AC + BC + ABC .Hierarchische Effekte werden mit einem Doppelpunkt versehen, wobei die Fakto-

ren, innerhalb denen der hierarchische sich befindet, nach dem Doppelpunkt gegebenwird. Wenn etwa C ein hierarchischer Effekt innerhalb A und B ist, dann schreibt sichdas biometrische Modell wie folgt:

MODEL A + B + C:AB .Der letzte Effekt wird immer als ein Fehler oder Residuum interpretiert. Wenn wei-

tere Effekte als Fehler interpretiert werden sollen, etwa in Spaltanlagen der Fehler derGroßparzellen, so ist nach solchen Effekten ein Schragstrich zu schreiben, z.B.

MODEL W + G + WG/ + K + KG + KGW

wobei W der Wiederholungseffekt, G der Effekt des Großteilstucksfaktors, K derEffekt des Kleinteilstucksfaktors, KG der Interaktionseffekt der beiden Faktoren undWG der Fehler der Großteilstucke und KGW der Fehler der Kleinteilstucke darstellt.

Nach der Reihenfolge der Effekte in MODEL werden die Zeilen in der Varianzanaly-setabelle ausgegeben.

Der MODEL-Befehl muß sorgfaltig ausgearbeitet werden, da die korrekte Aufteilungder Totalvariabilitat und die Richtigkeit der Signifikanztests davon abhangen. Zu die-sem Zweck sollten Sie die Faktoren in Ihrem Experiment in faktorielle (kreuzklassifi-zierte) und hierarchische einteilen. Weiterhin mussen Sie die Randomisation Ihrer Ver-suchseinheiten nachvollziehen, erst dann haben Sie die Gewahr, das richtige Modellaufgestellt zu haben. Weitere Hinweise sind im Anhang C oder in Buchern, wie SNE-DECOR und COCHRAN (1980) oder SEARLE (1971), bzw. im Vorlesungsmanuskript”Datenverarbeitung in der Angewandten Genetik” zu finden.

6.1.4 Der Befehl RANDOM

Mit diesem Befehl werden die zufalligen Faktoren definiert, alle nicht aufgefuhrtenFaktoren werden als fest behandelt:

RANDOM Liste von Faktorsymbolen

In obigem dreifaktoriellen Beispiel moge A fest, B und C zufallig sein, dann ist zuschreiben:

RANDOM B C

Meist wird man Blocke oder Wiederholungen sowie Orte und Jahre als zufalligannehmen, um die in der Pflanzenproduktion ublichen Signifikanztests zu erhalten.Wann ein Effekt als fest oder als zufallig zu gelten hat, besprach SEARLE (1971, S.376ff).

6.1.5 Die Befehle MEANS, EFFECTS, PERCENTS und RANKS

Zwei-Wege-Mittelwerttabellen, einschließlich der Marginalmittelwerte, werden mitMEANS Liste von Zweifaktor-EFFEKTen

erzeugt, beispielsweise:MEANS AB AC

Durch die Reihenfolge der Faktorsymbole in der Liste wird gleichzeitig der Tabel-lenaufbau festgelegt, indem der erste Buchstabe den Reihenfaktor und der zweite den

Page 23: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 23

Saulenfaktor bezeichnet.Enstsprechend konnen fur Zweiwegetabellen die Effekte mit

EFFECTS Liste von Zweifaktor-EFFEKTen

die Prozente (relativ zum Mittelwert der Standardprufglieder) mitPERCENTS Liste von Zweifaktor-EFFEKTen

und die Range mitRANKS Liste von Zweifaktor-EFFEKTen

angefordert werden. Naturlich sind diese Tabellen nur produzierbar und auch nursinnvoll, wenn der entsprechende Zweifaktor-Effekt in der MODEL-Zeile erscheint.

Beachte,

dass RANKS mindestens als RANK abgekurzt wird, da der Befehl sonst nicht von RANDOM

zu unterscheiden ist,

dass PERCENTS diejenigen Relativwerte bildet, die durch CHECKS definiert werden. Da-bei muss CHECKS die Standard-Mittel des Reihenfaktors definieren, also wennPERCENTS TP ausgegeben werden soll, muss etwa CHECK/T * definiert sein (alsonicht CHECK/P * ). Der Import von Standard-Mittelwerten durch die CHEC-Zeilein den Daten ist nur fur TBT TAB-Tabellen moglich.

dass mit dem Befehl RESTRICT (6.1.10) die Ausgabe obiger Tabellen auf bestimmteVariablen eingeschrankt werden kann. So kann etwa bei der Analyse von Kreu-zungsexperimenten mit den Daten fur Tester*Linien*Platze nur fur das wichtigs-te Merkmal detaillierte Zwei-Wege-Tabellen angefordert werden:

RESTRICT Ertrag

EFFECTS LT (also die gca-sca-Tabelle)RANKS LP (also die Range der Linien an den Platzen)

6.1.6 Der Befehl SUBINT

Eine Unterteilung der Wechselwirkungen (SUBdivision of the INTeractions = SUBINT)in einer Zweiwegetafel kann mit diesem Befehl erreicht werden.

SUBINT Liste von Zweifaktor-EFFEKTen

Ein Beispiel dafur istSUBINT AB

SUBINT produziert eine Korrelationsmatrix der AB-Mittelwerte und berechnet eineStabilitatsanalyse, was insbesondere fur Versuchsserien von Interesse ist. Weiteres imAbschnitt 6.2.

Da eine Unterteilung sinnlos ist, wenn einer der beiden Faktoren weniger als dreiStufen besitzt, werden nur Datensatze mit mindestens drei Stufen je Faktor analysiert.Datensatze mit fehlenden Werten werden allerdings nicht optimal behandelt.

6.1.7 Der Befehl TBT TABLE

Eine Mittelwerttabelle uber die Variablen hinweg (Treatment By Trait TABle =TBT TAB) kann mit diesem Befehl angefordert werden:

Page 24: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 24

TBT TABLE Liste von EFFEKTen

beispielsweiseTBT TAB AB

TBTTAB ABC AB AC B

Gleichzeitig werden die in diesem Befehl genannten Mittelwerte auf die sekundareAusgabedatei geschrieben oder uber PLOT geplottet, falls der entsprechende ANOVA-Qualifier oder PLOT gegeben worden ist.

Wie mit TBT TAB Tabellen formatiert und gleichzeitig absolute und relative Werteausgegeben werden konnen, ist in Kap. 8.1 beschrieben.

6.1.8 Der Befehl HERITABILITY

Mit diesem Befehl wird fur bestimmte Prufgliedmittelwerte die Heritabilitat berechnet:HERIT Faktorsymbol

beispielsweiseHERIT T

HERIT T:C

Gleichzeitig wird in runder Klammer das dazugehorige 95%-Konfidenzintervallausgegeben.

6.1.9 Der Befehl GENOTYPIC CORRELATION MATRIX

Damit werden die phanotypische und genotypische Korrelationsmatrix und bei Bedarfauch die ausfuhrlichen Varianz-Kovarianzanalysen berechnet:

GENOT EFFEKT

Fur den Prufglied-EFFEKT, der in der MODEL-Zeile vertreten sein muß, wird die Korre-lationsmatrix berechnet, beispeilsweise

GENOT T

GENOT T:BC

Wird der Qualifier auf 1 gesetzt, werden zusatzlich die Varianz-Kovarianz-Analysen ausgegeben:

GENOT/1 EFFEKT

Wegen Interna werden diese Analysen vor den ublichen PLABSTAT-Analysen aus-gegeben (zugegebenerweise, vielleicht etwas unmotiviert).

6.1.10 Der Befehl RESTRICT

Hiermit kann die Ausgabe von Zwei-Wege-Tabellen, die mit MEANS, EFFECTS,

PERCENTS, RANKS oder SUBINT erzeugt wurden, auf bestimmte Variablen beschranktwerden:

RESTRICT Liste von Variablenbezeichnern

beispielsweiseRESTRICT X1 X5

RESTRICT Ertrag TKG

Page 25: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 25

6.1.11 Die Dateneingabe

Fur jede Beobachtungseinheit ist eine Datenzeile mit folgender Struktur einzugeben:ID1 ID2 ... X1 X2 ...

ID1, ID2, ... sind alphanumerische Felder, welche Experiment, Jahr, Ort, Kultur-pflanzenart und andere Codes zur Identifizierung der Einheiten anzeigen. DieFelder werden durch ein oder mehrere Leerzeichen voneinander getrennt. Ins-gesamt NIDT solche Felder werden eingelesen, wobei NIDT auch Null sein kann.Diese Identifikatoren sind, falls die Daten sortiert eingelesen werden, belanglosfur ANOVA, so dass Sie beliebige Zeichen dafur wahlen konnen.

X1, X2, ... sind die NINPT Beobachtungen je Beobachtungseinheit, die eingelesenwerden sollen. Diese Zahlen werden durch ein oder mehrere Leerzeichen von-einander getrennt. Ist dies in einem Datensatz nicht eingehalten worden, kanneventuell durch obiges $F-Format doch eine Eingabe erreicht werden.

Falls der Datensatz als sortiert eingelesen werden soll, muß die Reihenfolge derFaktoren im FACTORS-Befehl so gewahlt werden, dass sie mit der Sortierfolge uberein-stimmt. Etwa wenn wie folgt sortiert ist,

A B X11 B A X111 1 12.3 1 1 12.31 2 11.7 2 1 11.72 1 13.5 oder 1 2 13.52 2 12.8 2 2 12.83 1 10.4 1 3 10.43 2 12.9 2 3 12.9

dann muß in beiden Fallen die Reihenfolge in der FACTORS-Zeile lauten:FACTORS A Faktor=3 B Faktor=2 ,

denn die lexikalische Reihenfolge obiger Daten basiert zuerst auf dem A-Namen,dann auf dem B-Namen. Beispiele fur die Dateneingabe finden sich auf der Datei ps-danov.dat.

Falls die Daten nicht sortiert oder fehlende Datenzeilen vorhanden sind, dann mußder ANOVA-Befehl mit einem Zusatz versehen werden, bei dem nach einem Dollarzei-chen vermerkt wird, an welchen Stellen der Datenzeilen die Faktorstufen zu findensind:

ANOVA NIDT NINPT NVAR $ K1 (KS1) K2 (KS2) K3 (KS3) ...

Die ganzzahligen Werte K1, K2, ... geben den Beginn derjenigen Spalten in denDatenzeilen an, in denen die Stufenbezeichnungen fur die einzelnen Faktoren begin-nen. Die ganzzahligen Werte KS1, KS2, ... geben an, wieviele Zeichen die entspre-chende Stufenbezeichnung lang ist.

Die Reihenfolge dieser Schlusselzahlen hat in derselben Reihenfolge wie die Faktor-bezeichnungen im FACTOR-Befehl zu erfolgen. Die NAMES-Befehle sind in diesem Falleunnotig bzw. die Stufenbezeichnungen in Mittelwerttabellen erfolgt in der Reihenfolgedieser Namen.

Ein Beispiel soll das Vorgehen verdeutlichen:FACTOR Sorten = 15 Jahre = 2 Orte = 6

Page 26: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 26

ANOVA 3 8 8 $ 12(4) 3(2) 8(3)

wobei die dazugehorigen Datenzeilen folgendermaßen aufgebaut sind:9987 XXP30 LEO 70.3 552 1.3 29.3 43.6 96.0 514 0

-- --- ---

In dieser Beobachtungszeile stellt also ”87” das Jahr, ”P30” den Ort und ”LEO” dieSorte dar. Die Zahl der Identifikatoren ist davon unbeeinflußt und wird durch NIDT

wie gewohnt im ANOVA-Befehl angegeben.Fehlende Werte mussen durch einen Stern * oder Null im freien Format und durch

Leerzeichen oder Nullen beim $F-Format gekennzeichnet werden. Wird MISS=0 imQualifier des ANOVA-Befehls gewahlt, dann werden Nullen nicht als fehlende Wertebehandelt. Ubrigens konnen auch einzelne Stufen oder Faktorkombinationen fehlen.In diesem Fall nimmt PLABSTAT den entsprechenden Effekt als Null an und schatztdie fehlende Werte wie bei der Methode der kleinsten Quadrate (”Fitting constants”)gewohnt.

6.2 Ausgabe

Die Ausgabe von ANOVA beginnt mit einer Tafel der Erwartungswerte der Mittleren Ab-weichungsquadrate. Sie bildet die Basis fur die Berechnung der Varianzkomponentenund F-Werte. Diese Tafel ist fur den balancierten Fall gultig.

In der Varianzanalyse-Tabelle werden neben den Freiheitsgraden (Degrees of Free-dom = DF), Summen von Abweichungsquadraten (Sums of Squares = SS) und MittlerenAbweichungsquadraten (Mean Squares = MS) die Varianzkomponenten Var.cp. undihre Standardfehler s(V.cp.) ausgegeben. Varianzkomponenten werden auch fur fes-te Effekte ausgegeben, obwohl deren Große dann selten von Interesse ist. Sie konnenjedoch interpretiert werden, siehe SNEDECOR und COCHRAN (1980, Kap. 13.9).

Die F-Werte F mit Signifikanztests, siehe auch 5.2, sowie die dazugehorigen Frei-heitsgrade des Zahlers DF-NM und des Nenners DF-DN werden ausgegeben. Die Frei-heitsgade sind nicht immer ganze Zahlen, da die SATTERTHWAITEsche Approxima-tion in komplizierten Fallen benutzt wird.

Fur jede Varianzursache oder genauer fur die dazugehorigen Mittelwerte ist derStandardfehler dieser Mittelwerte s.e. und die Grenzdifferenz bei 5% Irrtumswahr-scheinlichkeit LSD5 in den letzten beiden Spalten zu finden.

Die Heritabilitat, namlich der Quotient aus genetischer und phanotypischer Vari-anz von bestimmten Mittelwerten, und das dazugehorige 95%-Konfidenzintervall er-scheint nach Aufruf von HERITAB. Zur Berechnung siehe KNAPP and BRIDGES (1987).

Der Ausreißertest wird nach ANSCOMBE und TUKEY (1963), siehe auch SNE-DECOR und COCHRAN (1967, Kap. 11.11) durchgefuhrt und stellt extreme Residu-en (Parzellenfehler) fest. Dieser Test setzt normalverteilte Residuen voraus. Fur einenverdachtigen Extremwert wird der Prozentsatz des Residuums zur Testgroße ausge-geben. Zusatzlich konnen auch Effekte getestet werden, dann wird der verdachtigeEffekt mit seinen Stufennummern und dem Schatzwert ausgegeben.

Schatzwerte fur die fehlenden Werte werden im Standardfall nur bis zu 15 fehlen-den ausgegeben. Mochte man diese auch bei hoheren Anzahlen gedruckt haben, ist imANOVA-Qualifier PRIN=3 zu wahlen. In den Mittelwerttabellen und in der sekundaren

Page 27: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 27

Ausgabedatei werden fehlende Werte als Null ausgegeben, sofern nicht obiger Quali-fier auf 3 gesetzt ist.

Bei TBT TABLE mit Zweiwegetafel AB werden die Korrelatationskoeffizienten derAB-Mittelwerte auf die marginalen A-Mittelwerte fur jede Stufe von B berechnet. Beiweniger als 20 Stufen fur den Faktor A fehlt diese Tafel. Diese Korrelationen durftenvor allem beim Analysieren von Serien von Interesse sein. Wenn diese Korrelationsko-effizienten verschieden sind, durften die Interaktionseffekte unterschiedlich mit denHaupteffekten korreliert sein. Korrelationskoeffizienten nahe Null durften darauf hin-weisen, dass die Werte dieser Stufe im Widerspruch zu denen auf anderen Stufen ste-hen. Diese Schatzwerte konnen bei der Interpretation von Zweiwegetafeln Hinweiseuber Zusammenhange geben. Eine ausfuhrlichere Analyse liefert ein SUBINT-Aufruf.

Die Analyse einer Zweiwegetafel mittels SUBINT produziert zuerst eine zusammen-fassende Varianzanalyse. Zur Interpretation siehe bei BLISS (1967), WRIGHT (1971)oder UTZ (1972). Die beiden Unter-Varianzanalysen oder SubANOVAs sind nach YATESund COCHRAN (1938) oder PERKINS und JINKS (1968) berechnet.

Fur die Stufen der beiden Faktoren werden verschiedene Schatzwerte ausgegeben.Wenn wir die Werte in einer Zweiwegetafel mit xik ansprechen, wobei i der Index furdie Reihe und k der Index fur die Spalte darstellt, dann erhalten wir fur die i-te Stufe:

Mean = Mittel xi. , wobei der Punkt darauf hinweist,dass uber den Index k gemittelt ist,

Corr. = Korrelationskoeffizient zwischen xik und x.k

Regr. = dazugehoriger Regressionskoeffizient von xik auf x.k

MSdev = Mittleres Abweichungsquadrat der xik von obiger RegressionMSentry = einfache Varianz fur die i-te Stufe, namlich var(xik)i

MSinteract. = Varianz der Interaktionseffekte var(xik − xi. − x.k + x..) ,welche mit der Okovalenz von WRICKE, die als SQ definiert ist,korrespondiert.

MSdevXHY = Varianz der Abweichungen vom ”Site Highest Yield”,wie JENSEN (1976) beschrieben hat.

Entsprechend sind die Schatzwerte fur die k-te Stufe des anderen Faktors definier-bar.

In den Kovarianzanalyse-Tabellen werden zusatzlich folgende Schatzwerte ausge-geben:

In der Spalte V.cp% der ANOVA-Tabellen findet sich fur jede Varianzursache dasVerhaltnis des Schatzwerts der Varianzkomponente zur Varianz der entsprechendenMittelwerte. In genetischen Situationen ist dieses Verhaltnis fur die Prufglieder dieHeritabilitat. Zu bemerken ist, dass sich diese Spalte nicht zu 100% addieren laßt.

Der phanotypische Korrelationskoeffizient r-phen wird fur jede Zeile in denANCOVA-Tabellen berechnet und getestet. Der genotypische Korrelationskoeffizientist unter r-gen, sein Standardfehler unter s(r-gen) zu finden. Falls der genotypischeKorrelationskoeffizient mit seinem absoluten Betrag großer als der einfache Standard-fehler ist, wird ein + angehangt, wenn er großer als der zweifache Standardfehler ist,ein ++\verb.

Page 28: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

6 MEHRFAKTORIELLE EXPERIMENTE 28

6.3 Methoden

Die Variananalyse wird mit Hilfe der Algorithmen AS1, ASR1, AS18 und AS19 be-rechnet, die in Appl. Statist. Band 17 und 19, siehe auch UTZ (1978), veroffentlichtworden sind. Diese Algorithmen wurden in FORTRAN ubersetzt und hinsichtlich derRechenzeit schneller gemacht. Die Berechnungen werden mit doppelter Genauigkeitausgefuhrt und die Summe der Abweichungsquadrate werden uber die Effekte be-rechnet.

Die SATTERTHWAITEsche Approximation der F-Werte basiert auf dem TypF = (MS1 + MS4) / (MS2 + MS3) ,

also nicht auf dem TypF = MS1 / (MS2 + MS3 - MS4) ,

siehe dazu auch COCHRAN (1951) oder SNEDECOR und COCHRAN (1980, Kap.16.14).

Fehlende Werte werden iterativ nach der Methode der kleinsten Quadrate, wieschon unter 5.3 beschrieben, berechnet. Zuweilen fehlt eine Stufe eines Faktors odereine Faktorkombination vollig, dann gibt PLABSTAT die Meldung aus:

MISSING LEVEL(S) IN ...

Sollte der Iterationsprozess nicht konvergieren - hoffentlich selten - , dann wird einentsprechender Vermerk gegeben und die einfachen Mittelwerte berechnet.

Bei fehlenden Werten sind die Prufglied-MQ uberschatzt und die F-Werte ergebenzu oft signifikante Resultate. Bei wenigen fehlenden Werten kann dies vernachlassigtwerden (COCHRAN und COX, 1957, Kap. 3.7). Eine grobe Grenze fur eine nicht mehrzu tolerierende Verzerrung geben BENNETT und FRANKLIN (1954) mit 10% fehlen-der Werte an. Daher wird in Fallen mit mehr als 13% fehlender Werte von PLABSTATkeine Varianzanalyse mehr ausgegeben. Bei fehlenden Werten konnen die MQ nachSNEDECOR und COCHRAN (1980, Kap. 15.3), GOULDEN (1952; Kap. 14) oder SEAR-LE (1971) nachtraglich korrigiert werden. BERK (1987) verglich die moglichen Metho-den miteinander. Gegebenenfalls ist auf ein Statistikpaket fur Analysen von unbalan-cierten Datensatzen zu wechseln.

Die Standardfehler von genotypischen Korrelationskoeffizienten, die mittels GENOT(6.1.9) angefordert werden, werden nach MODE und ROBINSON (1959) berechnet.

Im unbalancierten Fall wird die analoge Varianzanalysemethode oder Methode 1nach HENDERSON (1953) fur die Varianz-Kovarianzanalysen verwendet, siehe auchSEARLE (1971, S. 424ff). Varianz- und Kovarianzkomponenten sowie F-Tests werdendabei berechnet als ob die MS und MP balanciert ist. Dieses Verfahren wird von TIET-JEN (1974, Biometrics 30,573) fur den F-Test sinnvoller angesehen als ein F-Test ba-sierend auf der SATTERTHWAITE-Approximation. Naturlich kann der Experimenta-tor bei sehr unbalancierten Datensatzen mit gemischten Modellen eine REML-Analysedurchfuhren, wie sie etwa in SAS, GENSTAT, ASREML oder R moglich ist.

Beachte:Bei fehlenden Werten kann demnach PLABSTAT in den Kovarianzanalysen, mitGENOT/1 erwirkt, andere SQ und MQ bzw. SP und MP ausgeben als in den Varianz-analysen. Bei Henderson 1 konnen auch negative SQ (bzw. SQ-Ananloge) errechnetwerden. Bei jeder Kovarianzanalyse werden die beiden Varianzanalysen neu erstelltund dabei die gemeinsamen fehlenden Werte aus der Analyse weggelassen. Daher las-sen sich in gewissen Fallen die Korrelationkoeffizenten nicht uber die ausgegebenen

Page 29: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

7 NICHTWIEDERHOLTE EXPERIMENTE 29

Analysen nachrechnen.Selbstverstandlich ist es dem Anwender in starker unbalancierten Datensatzen frei-

gestellt, die Erwartungswerte der SQ bzw. MQ fur Henderson 1 nach Searle (1971) oderBLISS (1967), LE ROY und GLUCKOWSKI (1961) zu berechnen sowie andere Testsdurchzufuhren. Dies ist bei Henderson 1 naturlich nur fur vollig zufallige Modellemoglich (siehe SEARLE, 1971, S.429f). Fur gemischte Modelle vergleiche BERK (1987)oder SEARLE (1982), der die Statistikpakete SAS, GENSTAT, SYSTAT u.a. hinsichtlichgultiger Losungen vergleicht.

Desweiteren wird der Restfehler nach Henderson 1 bekanntlich verzerrt geschatzt,siehe HENDERSON (1953). Auch hier kann es sinnvoll sein, den unverzerrten Schatzerzu verwenden, der z.B. durch Poolen der effektiven Fehlervarianz in einer Serie vonGitteranlagen leicht von Hand zu ermitteln ist.

7 Nichtwiederholte Experimente

Mit dem UNREP-Befehl werden Experimente ohne Wiederholung analysiert, wobei eineEliminierung etwaiger Gradienten uber Standardprufglieder oder gleitender Mittel-werte vorgenommen wird.

7.1 Befehle

7.1.1 Der Befehl UNREPLICATED

Mit dem UNREP-Befehl werden Daten aus nichtwiederholten Versuchen eingelesen undanalysiert:

UNREP/Q NPARZ NROW NCOL NSTD NIDT NINPT NVAR

wobei NPARZ = Gesamtzahl der Einheiten oder der zu verrechnenden Parzellen,mit NPARZ ≤ NROW×NCOL

NROW = Zahl der Reihen oder BeeteNCOL = Zahl der Saulen oder Parzellen je BeetNSTD = 0 mit gleitenden Mitteln wird adjustiert

= n mit Standardprufgliedern wird adjustiertwobei n die Zahl der Standardsorten, die im Versuch mehrmalsvorkommen, angibt. (Nur einmal vorkommende Standardsorten laufenals normale Testprufglieder.)

NIDT = 4 bzw. Zahl der Felder, welche die Datenzeile identifizieren(Es wird ein alphanumerischer Identifikator fur das Experiment,eine Reihen-, Saulen- und Prufgliednummer benotigt.)

NINPT = Zahl der einzulesenden VariablenNVAR = Zahl der zu analysierenden Variablen.

Der Qualifier Q dient zur Steuerung der Ein- und Ausgabe. Oft kann der Qualifier,einschl. des Schragstrichs, weggelassen werden. In diesem Fall wird eine bestimmteVoreinstellung (default mit 1110) angenommen, siehe dazu auch 3.1.6. Der Qualifierbesteht aus bis zu 4 Ziffern mit Namen MISS, EXTR, PRIN und NEWF,

Page 30: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

7 NICHTWIEDERHOLTE EXPERIMENTE 30

wobei MISS = 0 Nullen in den Daten nicht als fehl. Werte behandeln1 Nullen als fehl. Werte behandeln (Voreinstellung)

EXTR = 1 nicht benutzt (Voreinstellung)PRIN = 1 normale Ausgabe (Voreinstellung)

3 Detaillierte Ausgabe mit unadj. und adj. Beobachtungen,je Merkmal nebeneinander in *.prt gelistet

NEWF = 0 Beobachtungswerte nicht auf sek. Datei sichern (Voreinstellung)1 oder 2 adjustierte Beobachtungswerte auf sek. Datei sichern.

Sollen die Beobachtungsdaten formatiert eingelesen werden, etwa wenn keineLeerzeichen zum Trennen der Daten verwendet werden, wenn mehr als eine Datenzei-le je Parzelle eingelesen oder wenn die Zeichenreihenfolge geandert werden soll, dannkann an den UNREP-Befehl ein $F mit einem FORTRAN-ahnlichen Format angehangtwerden, z.B.

UNREP 27 3 9 3 4 3 4 $F 6X,2I2,I5,3F5.0

Die eigentlichen Beobachtungswerte mussen mit F- oder E-Beschreibern eingelesenwerden. Daneben konnen auch andere Beschreiber, etwa X fur das Uberlesen einzel-ner Zeichen oder / fur nachfolgende Zeile, verwendet werden. Weiteres siehe in einerFORTRAN-Beschreibung.

Mit CALCULATE konnen Variable (Merkmale) modifiziert oder neue berechnet wer-den, siehe Abschnitt 3.2.3. Mit VARIABLE NAMES (3.2.4) und mit NAMES OF TREATMENTS

(3.2.5) lassen sich die Namen der Variablen oder Prufglieder eingeben. Mit PLOT (8.3)

konnen Korrelationsdiagramme erzeugt werden. Mit TBT TAB (8.1) lassen sich for-matierte und sortierte Beobachtungstabellen erzeugen.

Bei gleitenden Mittelwerten kann CHECKS (3.2.6) mit Nummern der Standardsbenutzt werden, etwa

CHECKS 1 2 11 12

7.1.2 Die Dateneingabe

Bei jeder Parzelle mussen Position, also Reihen- und Saulennummer, und Prufglied-nummer angegeben werden, etwa wie folgt:

T299XX 01 01 1 5.0 1.0 ...

wobei diese nacheinander durch ein oder mehrere Leerzeichen getrennt einzuge-ben sind, der Versuchsidentifikator, Reihen- und Saulennummer (1,2 ... NROW bzw. 1, 2... NCOL), Prufgliednummer und die Beobachtungswerte. Die erste Saule, der Identifika-tor sollte 6 Zeichen breit sein und uber die Datenzeilen konstant sein. Standardsortenmussen durch eine Prufgliednummer großer als 99000 kenntlich gemacht werden.

Die Reihenfolge der einzulesenden Datenzeilen ist frei. Es konnen in einem durchNROW×NCOL beschriebenen Rechteck außerdem Parzellen bzw. Datenzeilen, etwa in ei-ner Ecke, fehlen.

Fehlende Werte am besten mit Stern *, wie sonst auch, eingeben.Pedigrees werden uber den NAMES-Befehl, wie gewohnt, eingefuhrt, wobei in der

Reihenfolge der Prufgliednummern die Pedigrees folgen (bei NSTD=0) oder in der Rei-henfolge der einlaufenden Parzellen (bei NSTD>0).

In der Datei psdunrep.dat sind Beispielsdatensatze zu finden, die einmal mit der

Page 31: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

7 NICHTWIEDERHOLTE EXPERIMENTE 31

Standardmethode und zum anderen mit gleitenden Mitteln verrechnet werden.

7.2 Ausgabe

Zuerst wird eine Zusammenfassung der unkorrigierten Daten wie mit dem BASIC-Befehl ausgegeben. Anschließend werden der Korrelationskoeffizient r(obs,concom)

und der Regressionskoeffizient b(obs.concom) zur Beurteilung der Effizienz der Ad-justierung, weiteres siehe 7.3.3, gegeben. Mit einer Tabelle der adjustierten Beobach-tungswerte, identisch mit einer TBT-Tabelle, wird abgeschlossen. Bei gleitenden Mittel-werten werden in letzterer eventuell Mittelwerte errechnet, wenn bestimmte oder allePrufglieder mehrfach vorkommen. Dadurch laßt sich uberprufen, ob in einem Block-versuch eine Trendkurve nachweisbar ist und ob an eine Elimination dieses Trends zudenken ist.

Wird PRIN=3 gegeben, finden sich getrennt nach dem Merkmal weitere Zwischen-resultate der Berechnungen, namlich bei einer Standardanlage:

Mean of checks, Check means, No. of check plots sowie

NBETW = maximum distance between two check plotsNNMIN = minimum number of check plots for the adjustment of a test plot

(e.g. in the corner or with missing check plots)NNMAX = maximum number of check plots for the adjustment of a test plot

Unter CHECK PLOT VALUES werden die Residuen jeder Standardparzelle unddie Mittelwerte der Residuen der direkt benachbarten Standardparzellen auf-gefuhrt. Die Assoziation der beiden Variablen wird durch die beiden Koeffizientenr = r(obs,concom) und b = b(obs.concom) beschrieben.

Unter PLOT VALUES werden fur jede Parzelle die Position im Versuch, namlichReihen- und Saulen-Nummer der Parzelle, und der Typ (bei Testparzellen typ = 0, beiStandardparzellen typ = i, namlich die Nummer des Standards), der nichtadjustierteund der adjustierte Beobachtungswert und die Differenz der letzteren beiden bzw. derBetrag der Adjustierung gelistet.

Bei Gleitenden Mittelwerten (Moving averages) wird unter PLOT VALUES eben-falls die Position der Parzellen, ihre Prufgliednummer und die Beobachtungswer-te, nichtadjustiert, adjustiert und das zum Ausgleich benutzte gleitende Mittel(mov.ave.), zusatzlich gelistet.

7.3 Methoden

Ein etwaiger Gradient wird bei der Standardanlage mittels der nachstliegenden Stan-dards oder bei den gleitenden Mittelwerten mittels benachbarter Parzellen geschatzt.Die Standardanlage ist weniger zu empfehlen, siehe 7.3.3. Sie wurde hier als Varianteberucksichtigt, da sie in der praktischen Pflanzenzuchtung oft eingesetzt worden ist.

7.3.1 Standardanlage

Als Schatzwerte fur die Bodengute werden zuerst die Differenzen der Standardpar-zellen zu ihrem jeweiligen Sortenmittelwert berechnet. Als Kovariable (concomitant

Page 32: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

7 NICHTWIEDERHOLTE EXPERIMENTE 32

variable) fur den Ausgleich wird das Mittel aller solchen Differenzen benutzt, die ineinem Rechteck, um eine Standardparzelle liegen. Dieses Rechteck wird durch dennachsten Standard auf der linken und rechten Seite gebildet und umfasst das Beetoberhalb und unterhalb der Testparzelle. Dieser an den Standardparzellen kalibrierteRegressionskoeffizient b(obs.concom) wird zur Gewichtung der nachfolgenden Test-parzellen mit der entsprechenden Kovariablen verwendet. In den Ecken und Randernbzw. wenn fehlende Standards vorhanden sind, wird eben uber weniger benachbarteStandardparzellen-Abweichungen gemittelt. Die Standards konnen beliebig positio-niert sein, sie konnen etwa in Streifen oder anderen mehr oder weniger regelmaßigenMustern (Diamonds) angeordnet sein. Bei mehrfachen Standards nebeneinander wer-den nur die nachstliegenden zur Adjustierung verwendet.

7.3.2 Gleitende Mittelwerte

Fur jede zu adjustierende Parzelle werden die zehn benachbarten Beobachtungen,namlich die von den vier linken und vier rechten Parzellen und von der direkt daruberund darunterliegenden Parzelle, zu einem Mittelwert zusammengefaßt und als Kova-riable (concomitant variable) fur eine Adjustierung benutzt. In den Ecken wird uberentsprechend weniger Nachparparzellen gemittelt. Bei dieser Methode wird der Trendmit Hilfe eines Mittels, das uber mehr Parzellen als bei der Standardanlage gebildetwird, geschatzt. Dies ist auch notwendig, da die Nachbarbeobachtungen ja jeweils an-dere genotypische Effekte enthalten.

7.3.3 Hinweise zur Beurteilung der Adjustierungen

Der Regressionskoeffizient b(obs.concom) , da er kleiner als 1 ist, dient dazu eineUberkorrektur zu vermeiden (siehe YATES, 1936). Mit dem Korrelationskoeffizientenr(obs,concom) kann der Wert einer Adjustierung beurteilt werden. Nach COCHRAN(1957) sollte er mindestens 0.3 betragen, anderenfalls wird sich eine Korrektur nichtlohnen. An sich sollten die Korrelationskoeffizienten positiv sein, negative sind nurbei starker Konkurrenz unter den Prufgliedern zu erwarten. Daher sind negative wohlals unbrauchbar fur eine Adjustierung eines Bodentrends anzusehen.

Eine Standardanlage ist nach BAKER and McKENZIE (1967) wohl selten empfeh-lenswert. Denn setzt man, wie es oft der Fall ist, etwa auf jede zehnte Parzelle einenStandard, dann ist dies zu wenig, um einen Bodengradienten ausreichend genau zuschatzen. Benutzt man mehrere Standards (etwa vier) nebeneinander oder setzt auf je-der zweiten Parzelle Standards ein, dann mag zwar eine Schatzung des Bodengradien-ten eher moglich sein. Doch wird damit der Anteil der Standardparzellen im Vergleichzu den eigentlichen Testparzellen zu hoch und die Korrektur zu teuer.

Gleitende Mittelwerte sind daher eher zu empfehlen, Voraussetzung dabei ist aber,dass die Prufglieder randomisiert auf dem Feld stehen, sonst werden etwaige Famili-eneffekte eliminiert. Je nach Art des Gradienten und Hohe des Versuchsfehlers durftedie optimale Kovariable verschieden zusammengesetzt sein. Die benutzten zehn Par-zellen durften einen brauchbaren Kompromiss darstellen. Wichtig scheint auch, dassParzellen in der Senkrechten zum Korrigieren mit eingehen, etwa in ein- oder zweirei-higen Experimenten, um senkrechte Einflusse, wie Schlepperspuren, auszuschalten.Siehe auch Literatur zu Nachstnachbarmethoden.

Page 33: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

8 ERGANZENDE BEFEHLE 33

Weitere Details und Literatur siehe CHANDRA (1991), KEMPTON (1984), KEMP-TON und FOX (1997, Kap. 5-7) oder YATES (1936).

8 Erganzende Befehle

Anbei sind einige erganzende Befehle beschrieben, die insbesondere fur LATTICE- undANOVA-Laufe von Interesse sind.

8.1 Der Befehl TBT TABLE

Neben den unter 6.1.7 genannten Funktionen, namlich der Wahl der Mittelwerttabel-len im ANOVA-Fall, kann mit diesem Befehl die Ausgabe der Mittelwertlisten gesteuertwerden. Solches ist empfehlenswert, wenn etwa die Mittelwertlisten DIN-A4-Breiteerhalten sollen oder wenn spezielle Outputs gestaltet werden sollen. TBT TAB-Tabellenkonnen bis 255 Zeichen bzw. bis 34 Merkmale ohne Umbruch in der Breite gestaltetwerden.

Durch den Zusatz von $F gefolgt von einem FORTRAN-Format konnen die Mittel-werte einer TBT-Tabelle formatiert, also mit einer bestimmten Zahl von Stellen vor odernach dem Dezimalpunkt versehen werden. Es gelten samtliche FORTRAN-Regeln furFormate. Insofern dabei auch die Uberschriften der Tabellen zu andern sind, kann mitZusatz $T mit nachfolgendem Text eine veranderte Uberschriftszeile eingelesen wer-den. Dabei sind bis zu 6 $T-Zeilen erlaubt, die dann direkt uber den Beobachtungsmit-telwerten plaziert werden.

Wenn unter Verwendung von CHECKS auch die Relativwertliste ein anderes Formaterhalten soll, kann ein solcher Block von $F- mit $T-Zusatzen wiederholt werden.

Anschließend kann durch einen $S-Zusatz, z.B. $S X2 oder $S TS% , bewirkt wer-den, dass die Mittelwertliste nach einem bestimmten Merkmal, hier der zweiten Varia-blen, sortiert wird.

Durch den Zusatz $V und einer Folge von Variablenbezeichnern mit Zeichen a furabsolut oder p fur Prozentzahl, z.B.

$V X3p X3a X2a X1a

$V Ertrag.a TS%.p

kann erreicht werden, dass die Mittelwerttabellen hinsichtlich der Merkmale umge-ordnet und gleichzeitig Absolut- und Relativwerte (zum Standard-Mittelwert) enthal-ten. Der Punkt . wird zur Trennung von Variablennamen und den Zeichen a bzw. pbenutzt.

Ein Beispiel sei nachfolgend gegeben:

FACTORS REPLICAT. = 2 GENOTYPES = 25MODEL R + G + RGANOVA/1211 0 7 6CHECKS/G *! bei LATTICE wuerde in der nachfolg. Zeile das G fehlenTBTTABLE G $F 2(F5.0),3(F5.1),F4.1,F5.0

$T$T PflH KoH Ertr Spind TS% Bon. SEL$T cm cm dt/ha % % 1-9 IND$F 10(F6.1)$T PflH KolH Ertrag Spind TS% Bon. SEL

Page 34: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

8 ERGANZENDE BEFEHLE 34

$T cm cm dt/ha % % 1-9 IND$S YIELD

! Sorting of TBT_tables according variable 3 yieldCHECKS/G *INDEX -0.2 0 1 -0.2 1 0 50VAR_NAMES PLHIG COHIG YIELD %COB %D.M. SCORE

Dabei werden die (absoluten) Mittelwerte fur das erste und zweite Merkmal mitinsgesamt 5 Stellen (Format F5.0 zweimal wiederholt) ausgegeben, wobei keine Nach-kommastelle vorgesehen ist. Das dritte, vierte und funfte Merkmal (Format F5.1 drei-mal wiederholt) wird mit einer Nachkommastelle ausgegeben usf. Hingegen werdenalle Relativwerte (Format F6.1), also mit insgesamt 6 Stellen, wobei eine Nachkommas-telle, der Dezimalpunkt und das Vorzeichen sowie drei Stellen fur die Prozentzahl vordem Punkt vorgesehen sind.

8.2 Der Befehl INDEX

Damit konnen Selektionsindizes oder andere Funktionen der Mittelwerte in TBT TAB-Tabellen berechnet werden. Mit Hilfe von CALC-analogen Befehlen werden neue Varia-blen erzeugt, fur die keine Varianzanalyse durchgefuhrt wird, die nur als letzte Spaltenan die TBT TAB-Tabellen angehangt werden. Ein Selektionsindex rechnet sich z.B. wiefolgt:

INDEX 1 X4=-0.5*X1-1.33*X2+0.77*X3+100

oderINDEX 1 Index=2*TS%+Ertrag+Standf

Der Befehl muß als erste Große die Anzahl der zu erstellenden Index-Variablenaufweisen. Die Große NVAR im LATTICE- und ANOVA-Befehl muß die neuen Variablenenthalten, ebenso naturlich dann VARIABLES.

Mit Hilfe einer Funktion MC zur Berechnung von Mittelwerten von Standard-prufgliedern (Mean of Checks) konnen auch Relativwerte erzeugt werden, etwa fur dieErtragswertzahl des Bundessortenamtes mit zwei verschiedenen Gewichten fur denTrockensubstanzgehalt TS%:

INDEX 2 CH Ertrag=MC(Ertrag,1,2,3)

CH TS%=MC(TS%,1,2,3)

CH Stdf=MC(Stdf,1,2,3)

INDX1=Ertrag/CH Ertrag*100+2.5*(TS%-CH TS%*100)+1.0*(Stdf-CH Stdf)

INDX2=Ertrag/CH Ertrag*100+1.5*(TS%-CH TS%*100)+1.0*(Stdf-CH Stdf)

Hierbei werden zuerst fur drei Merkmale Ertrag, TS% und Stdf die Standardsorten-mittel aus den Mittelwerten der Prufglieder 1, 2 und 3 berechnet und den HilfsgroßenCH Ertrag, CH TS% und CH Stdf zugewiesen. Anschließend werden zwei Indexvaria-blen INDX1 und INDX2 mit unterschiedlichen Gewichten gebildet. Da zwei zusatzlicheIndex-Variablen in den TBT-Tabellen erscheinen sollen, beginnt INDEX mit 2.

Auf Grund einer Index-Variablen kann naturlich auch eine Sortierung der TBT-Tabellen uber die $S-Option erfolgen, siehe Befehl TBT TAB (8.1).

8.3 Der Befehl PLOT

Mit diesem Befehl konnen Korrelationsdiagramme (Scatterplots) erzeugt werden.

Page 35: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

8 ERGANZENDE BEFEHLE 35

PLOT/Q X1.X2 X2.X3 ...

etwaPLOT/2 X3.X2 Ertrag.TS%

Der erste Bezeichner gibt die Variablennummer oder den Variablennamen, die furdie y-Achse bzw. Ordinate verwendet werden soll, der zweite Bezeichner nach demPunkt die Variable fur die x-Achse oder Abszisse. Es konnen mehrere Plots durchAnfugen weiterer Variablenpaare, getrennt durch ein oder mehrere Leerzeichen, an-gefordert werden.

Wenn die erste und zweite Variable gleich ist, etwa in:PLOT X1.X1 TKG.TKG

dann werden die Beobachtungswerte der einzelnen Wiederholungen geplottet. Sol-che Diagramme dienen dazu, Ausreißer oder andere auffallende Beobachtungswerteim Datenmaterial aufzufinden. (Gilt nur in Verbindung mit LATTICE). Genauer gesagt,werden bei zwei Wiederholungen die Beobachtungswerte der ersten Wiederholungauf diejenigen der zweiten Wiederholung geplottet, bei mehr als zwei Wiederholungenwerden die Beobachtungswerte jeder Wiederholung auf die Mittelwerte uber alle Wie-derholungen geplottet. Beim Gitter werden die Beobachtungswerte zuvor naturlich furdie unvollstandigen Blocke korrigiert.

Die maximale Zahl der Diagramme je Lauf ist 40.Der Qualifier Q gibt die Zahl der Diagramme, die je Seite ausgedruckt werden:

Q = 1 ein Diagramm je Seite (Voreinstellung)= 2 zwei Diagramme je Seite (fur DIN-A4-Formate geeignet)= 3 drei Diagramme je Seite.

Wenn PLOT in Verbindung mit einem ANOVA-Aufruf benutzt wird, werden fur alle inTBT TABLE genannten einfaktoriellen Mittelwerte Diagramme erzeugt.

Im Diagramm, siehe Kap. 2, werden die Punkte fortlaufend nach den Nummern derTBT TAB- bzw. der Prufgliedmittelwerttabelle durchnummeriert. Mehrfachbelegungenwerden durch einen Stern * mit nachfolgender Ziffer, z.B. *3, gekennzeichnet, wobeiam rechten Rand, dann unter *3 die entsprechenden Prufgliednummern der Mehr-fachbelegung aufgelistet sind. Die Standard-Prufglieder sind als Punkte unterstrichen.

Die Regressionsgerade von y auf x ist durch einen Schragstrich / in der y-Achseund einen weiteren am rechten Rand markiert, so dass von Hand die Regressionsgera-de eingezeichnet werden kann. Die Mittelwerte sind durch ein M auf der x- und y-Achsevermerkt. Wenn die Grenzdifferenz berechenbar ist, wird diese durch eine Folge von D

auf den Achsen visualisiert. Unter Miss. ist die Zahl der Punkte, die wegen fehlenderWerte fehlen angegeben.

8.4 Der Befehl PPLOT

Mit diesem Befehl konnen Korrelationsdiagramme (Scatterplots) fur zwei Variablen inPostScript erzeugt werden. Die Ausgabe wird auf eine separate Datei *.ps geschrieben.

PPLOT/n X1.X2

etwaPPLOT/1 Ertrag.TS%

Page 36: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

8 ERGANZENDE BEFEHLE 36

Es wird ein Streudiagramm fur die Variable X1 auf der y-Achse und X2 auf der x-Achse gezeichnet. Standardsorten, siehe CHECKS, werden darin mit einee fettgedruck-ten Nummer verzeichnet. Desweiteren wird die Regressionsgerade, das Versuchsmit-tel und die beiden Grenzdifferenzen eingezeichnet.

Mit dem Qualifier n kann die Spalte im Namen der Prufglieder (bzw. im Pedigree)definiert werden, die als Diagrammsymbol statt eines kleinen Kreises verwendet wer-den soll.

8.5 Der Befehl ERROR

Fur das Verrechnen von Versuchsserien kann der Befehl ERROR benutzt werden. Da-durch ist es moglich, *.mnv-Dateien ohne Anderung miteinzubinden.

ERROR Faktorsymbol Spaltenzahl

oderERROR Zahl der zu poolenden Versuche Spaltenzahl

wobei Faktorsymbol auf den Faktor hinweist, der durch die Einzelversuche (z.B. Orte)reprasentiert wird und naturlich im dazugehorigen FACTORS-Befehl vertreten sein muß.Die Spaltenzahl gibt an, in welcher Datenspalte VAR, DFE, SE, LSD, CHEC, MEAN be-ginnt. Durch diese werden die entsprechenden Schatzwerte aus den Einzelversucheneingebracht. Voreinstellung fur die Spaltenzahl ist 12. Beispiele sind etwa:

ERROR P 7

ERROR Q

Besitzt man eine andere Zahl von Versuchen, deren Fehler in der Serie gepoolt wer-den soll, kann man statt dem Faktorsymbol auch direkt die Zahl der zu poolendenVersuche angeben.

Ein solcher Import von Fehlervarianzen ist naturlich nur sinnvoll, wenn die Va-riablen unverandert bleiben. Werden CALC-Befehle benutzt, treffen diese Fehler nichtmehr zu. Wenn der ERROR-Befehl falsch gewahlt wird, resultiert oft ein TOO MUCH

LEVEL-Fehler. Daher beachte folgendes:

1. VAR-, DFE-, SE-, LSD-, CHEC- oder MEAN-Zeilen konnen in beliebiger Reihenfolgebzw. eine beliebige Auswahl daraus und an beliebiger Stelle im Datensatz gege-ben werden. Wichtig sind nur DFE- und SE-Zeilen, wobei die DFE-Zeilen vor denSE-Zeilen stehen mussen.

2. VAR ... MEAN darf daher nicht (genauer nicht an der durch obige Spaltenzahl

angegebenen Position) in Prufgliednamen auftauchen, um Verwechslungen zuvermeiden.

3. Die Namen VAR ... MEAN mussen unter den Identifikatoren der Daten enthaltensein. Deren Zeilen mussen durch genauso viele Identifikatoren wie die normalenDaten spezifiziert sein.

4. Wenn kein CHECK-Befehl gegeben wird, wird die Relativwertberechnung aufgrundder eingelesenen CHEC-Zeilen durchgefuhrt. Ist jedoch ein CHECK-Befehl vorhan-den, werden die CHECK-Mittelwerte neu berechnet.

Beispiel fur einen Serien-Input, siehe auch psdanov-6 in psdanov.dat:

Page 37: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

9 WINKE, WURMER, WANDE 37

!! SERIES OF RYE EXPERIMENTSFACTORS PLACES = 3 TREAT = 25MODEL P + T + TPANOVA 2 9 9CHECKS 24 25ERROR P 8TBT_TAB TP TRUN117001 DFE 12 16 0 16 16 23 0 0 0117001 SE 4.79 2.17 0 0.86 .82 .40 0 0 0117001 LSD 14.77 6.51 0 2.59 2.45 1.16 0 0 0117001 CHEC 0 0 0 0 0 0 0 0 0117001 001 79.77 130.36 .00 1.21 4.88 23.00 .00 .00 .00117001 002 73.90 133.93 .00 1.32 6.00 23.00 .00 .00 .00117001 003 74.78 132.86 .00 2.00 7.00 22.50 .00 .00 .00

obiges ist der Anfang der .MNV-Datei des ersten Versuchs,es folgen weiter alle .MNV-Dateien der Serie.

EODSTOP

8.6 Der Befehl OMISS

Damit konnen fehlende Werte (Missing data) in der sekundaren Output-Datei mitspeziellen Werten gekennzeichnet werden, was bei der Benutzung von Datenbankenerwunscht sein kann.

OMISS Liste von Zahlen

Es mussen NVAR Zahlen angegeben werden, so dass fur jede zu analysierendeVariable eine Zahl zur Kennzeichnung der fehlenden Werte vorliegt. Etwa bei NVAR= 4

OMISS 0 -9 0 99.99

Wird OMISS weggelassen, wird jeder fehlende Wert in der sekundaren Ausgabedateimit Stern * gekennzeichnet. Voreinstellung ist also OMISS mit einer Liste von Nullen.

9 Winke, Wurmer, Wande

(1) In der Biologie werden Beobachtungen meist hochstens 3 Stellen genau gemessen,so dass Mittlere Abweichungsquadrate oder Varianzkomponenten nicht mehrals 5 bis 6 Stellen genau sein konnen. Selbst wenn ein Computerprogramm mehrStellen ausgeben sollte, sollten Sie nur die biologisch sinnvollen Stellen entneh-men.

(2) Es ist nicht moglich, dass PLABSTAT jeden Fehler bei der Eingabe entdeckt undeine korrekte Meldung liefert. Zum Beispiel, wenn Sie schreiben:

ANOVA 10 10 100

weil Sie aus Versehen die letzte Null der Zeile doppelt eingeben. Dieser Befehlist naturlich legal, so dass PLABSTAT anfangt zu rechnen und vielleicht an ganzanderer Stelle, hier etwa zu wenig Speicherplatze, meldet. Daher sollte in Fallenmit unerwarteten Fehlern, zuerst das richtige Schreiben der PLABSTAT-Befehleuberpruft werden.

Page 38: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

9 WINKE, WURMER, WANDE 38

Selbstverstandlich wird ein Programm immer auch Fehler enthalten, die abge-stellt gehoren. Daher ist der Autor Ihnen dankbar, wenn Sie solche Fehler ihmweitergeben.

(3) Einige Grenzen sind im Programm gesetzt:

Maximale Zahl der Faktoren in ANOVA = 10Maximale Zahl der Variablen = 350

(eingeschlossen die Konstanten in CALCULATE)Maximale Zahl von fehlenden Werten in LATTICE = 150

Auch einige andere Datenfelder haben eine fixierte Große. Wenn notig, konnendiese Beschrankungen nach einer weiteren Compilierung nach oben gesetzt wer-den. Im Zweifelsfalle wenden Sie sich an die Stelle, von der Sie das Programmbezogen haben.

Page 39: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

10 LITERATURVERZEICHNIS 39

10 Literaturverzeichnis

ANDERSON, R.L. and T.A. BANCROFT, 1952. Statistical Theory in Research. McGraw-Hill, New York.

ANSCOMBE, F.J. and J.W. TUKEY, 1963. The examination and analysis of residuals.Technometrics 5, 141-160.

BAKER, R.J. and R.I.H. MCKENZIE, 1967. Use of control plots in yield trials. CropSci. 7, 335-337.

BENETT, C.A. and N.L. FRANKLIN, 1954. Statistical Analysis in Chemistry and Che-mical Industry. Wiley, New York.

BERK, K., 1987. Computing for incomplete repeated measures. Biometrics 43, 385-398.

BLISS, C.I., 1967. Statistics in Biology. Vol. 1. McGraw-Hill, New York.

BURNHAM, K.P. and D.R. ANDERSON, 1998. Model Selection and Inference. A Prac-tical Information-Theoretic Approach. Springer, New York.

CHANDRA, S., 1991. Optimal planning of unreplicated field trials in recurrent selec-tion. Dissertation Hohenheim.

COCHRAN, W.G., 1951. Testing a linear relation among variances. Biometrics 7, 17-32.

COCHRAN, W.G., 1957. Analysis of covariance: Its nature and uses. Biometrics 13,261-281.

COCHRAN, W.G. and G.M. COX, 1957. Experimental designs. Wiley, New York.

DRAPER, N.R. and H. SMITH, 1998. Applied Regression Analysis. 3rd ed. Wiley, NewYork.

FEDERER, W.T., 1955. Experimental Designs. Mcmillan Comp., New York.

GOULDEN, C.H., 1952. Methods of Statistical Analysis. Wiley, New York.

HARTLEY, H.O., 1956. A plan for programming analysis of variance for general pur-pose computers. Biometrics 12, 110-122.

HEALY, M.J.R. and M.H. WESTMACOTT, 1956. Missing values in experiments ana-lyzed on automatic computers. Appl. Statist. 5, 203-206.

HENDERSON, C.R., 1953. Estimation of variance and covariance components. Bio-metrics 9, 226-252.

JENSEN, N.F., 1976. Floating checks for plant breeding nurseries. Cereal ResearchCommunications 4, 285-295.

KEMPTON, R.A., 1984. The design and analysis of unreplicated field trials. Proc. ofFifth Meeting of the EUCARPIA Section Biometrics in Plant Breeding, Hohen-heim, Vortr. Pflanzenzuchtg. 7, 219-242.

Page 40: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

10 LITERATURVERZEICHNIS 40

KEMPTON, R.A. and P.N. FOX (eds.), 1997. Statistical Methods for Plant Variety Eva-luation. Chapman&Hall, London.

KNAPP, S.J. and W.C. BRIDGES, 1987. Confidence interval estimators for heritabilityfor several mating and experimental designs. Theor. Appl. Genet. 73, 759-763.

LE ROY, H.L. und W. GLUCKOWSKI, 1961. Die Bestimmung der Varianzkomponen-ten im a.b.c-Faktorenversuch mit ungleichen Klassenfrequenzen. Biometr. Zeit-schrift 3, 73-91.

MODE, C.J. and H.F. ROBINSON, 1959. Pleiotropism and the genetic variance andcovariance. Biometrics 15, 518-537.

PATTERSON, H.D. and E.R. WILLIAMS, 1976. A new class of resolvable incompleteblock designs. Biometrika 63, 83-92.

PERKINS, J.M. and J.L. JINKS, 1968. Environmental and genotype-environmentalcomponents of variability. III. Multiple lines and crosses. Heredity 23, 339-356.

PREECE, D.A., 1971. Iterative procedures for missing values in experiments. Techno-metrics 13, 743-753.

SEARLE, S.R., 1971. Linear Models. Wiley, New York.

SEARLE, S.R., 1982. Technical reports on variance component estimation. CornellUniv. See http://www.biom.cornell.edu/Publications/aco.html.

SNEDECOR, G.W. and W.G. COCHRAN, 1967, 6th ed.; 1980, 7th ed. Statistical Me-thods. Iowa State University Press, Ames.

TIETJEN, G.L., 1974. Exact and approximate tests for unbalanced random effects de-signs. Biometrics 30, 573-581.

UTZ, H.F., 1972. Die Zerlegung der GenotypxUmwelt-Interaktionen. EDV in Medizinund Biologie 3, 52-59.

UTZ, H.F., 1978. Ein Algol-60-Programm fuer die Analyse von balancierten faktoriel-len Versuchsanlagen. EDV in Medizin und Biologie 9, 34.

WILLIAMS, E.R., 1977. Iterative analysis of generalized lattice designs. Austr. J. Sta-tist. 19, 39-42.

WILLIAMS, E., PIEPHO, H.-P., and WHITAKER, D., 2011. Augmented p-rep designs.Biom. J. 53, 19-27

WRIGHT, A.J., 1971. The analysis and prediction of some two factor interactions ingrass breeding. J.agric. Sci., Camb. 76, 301-306.

YATES, F., 1933. The analysis of replicated experiments when the field results are in-complete. Emp.J.Exp.Agric. 1,129-142.

YATES,F. 1936. A new method of arranging variety trials involving a large number ofvarieties. J. agric. Sci., Camb. 24, 424-455.

Page 41: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

10 LITERATURVERZEICHNIS 41

YATES,F. and W.G. COCHRAN, 1938. The analysis of groups of experiments. J. agric.Sci., Camb. 28, 556-580.

Page 42: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

ANHANG A Liste der Befehle 42

ANHANG A Liste der Befehle

! Text bis zum Ende der Zeile [siehe 3.2.1]! Text nach ! wird als Kommentar angesehen

BASIC/Q NROW NIDT NINPT NVAR [siehe 4.1.1]LATTICE/Q T S K R NINPT NVAR [siehe 5.1.1]ANOVA/Q NIDT NINPT NVAR [siehe 6.1.1]UNREP/Q NPARZ NROW NCOL NSTD NIDT NINPT NVAR [siehe 7.1.1]

mit NROW = Zahl der Versuchseinheiten oder Zeilen im DatensatzNIDT = Zahl der alphanumerischen Felder, welche die Datenzeile

identifizierenNINPT = Zahl der einzulesenden VariablenNVAR = Zahl der zu analysierenden Variablen

T = Zahl der PrufgliedernS = Zahl der unvollstandigen Blocke je Wiederholung

(bei Blockversuch, S=1)K = Zahl der Parzellen je unvollstandigem Block

(bei Blockversuch, S=1)R = Zahl der Wiederholungen

mit 4-ziffrigem Qualifier Q (Voreinstellung 1110):MISS = 0 Nullen nicht als fehlende Werte behandeln

= 1 Nullen als fehl. Werte behandeln (Voreinstellung)EXTR = 0 kein Test auf Ausreißer oder extreme Werte

= 1 Test der Residuen auf Ausreißer (Voreinstellung)= 2 Test der Residuen und Effekte auf Ausreißer (nur ANOVA)

PRIN = 0 keine Ausgabe der Varianzanalysetabellen (nur LATTICE)= 1 normaler Druck (Voreinstellung)= 2 Ausgabe der Effekte statt Mittelwerte (nur LATTICE)

Spearmanschen Korrelationskoeff. drucken (nur BASIC)= 3 erweitertes Drucken bei fehlenden Werten

(nur ANOVA und LATTICE)NEWF = 0 Mittelwerte nicht auf sek. Datei sichern (Voreinstellung)

= 1 Mittelwerte auf sekundarer Ausgabedatei sichern= 2 transformierte (event. adj.) Parzellenwerte sichern= 3 adj. Mittelwerte und Parzellenwerte sichern (nur LATTICE)

Zusatzefur formatiertes Einlesen der Daten hange $F mit einem FORTRAN-ahnlichenFormat an, z.B.

ANOVA 6 0 5 5 $F 15X, 2(F2.1), F5.2, 3X, F4.1

fur Ausgeben der Effekte der unvollstandigen Blocke auf sekundareAusgabedatei bzw. fur "augmented designs" mit n angehangten Parzellen

LATTICE . . . $An [siehe 5.1.1]

fur unsortierte und unvollstandige Datensatze, z.B.ANOVA . . . $ 2(1) 5(3) [siehe 6.1.11]

Page 43: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

ANHANG A Liste der Befehle 43

INPUT Variablenliste (jeweils erste 5 Zeichen von Bedeut.) [siehe 3.2.2]CALCULATE X2=X6/X7*100 X3=X3*X4-100 ! einige Beispiele [siehe 3.2.3]

X2=LN(X2) X3=SQRT(X8) X4=EXP(X4) X5=ARCSINST(X10)X15=X1>0.5 X15=X3==100 X15=X14+(X1>=0.5)*10

VARIABLE NAMES Liste von Texten (erste 5 Zeichen werden benutzt)[siehe 3.2.4]

Befehle nur im Zusammenhang mit ANOVA (Einfacher Blockversuch als Beispiel)[siehe 6.1.2 und 6.1.7]

------------------------------------------------------------------------------FACTORS TREAT=15 REPLICATION = 3 (beachte: als erste Zeile bringen)

[siehe 6.1.2]MODEL R + T + RT (benutze jeweils das erste Zeichen des Faktornamens)

[siehe 6.1.3]RANDOM R T [siehe 6.1.4]RESTRICT X1 [siehe 6.1.10]MEANS RT TA [siehe 6.1.5]EFFECTS TA [siehe 6.1.5]RANKS TA [siehe 6.1.5]SUBINT RT [siehe 6.1.6]

TBT_TAB T (ist außerdem notwendig, wenn Qualifier NEWF=1 oderPLOT benutzt werden soll)

$F 2(F5.0), 3(F5.1), ... fur Formatierung$T Text ... fur Uberschrift [siehe 8.1]$S X2 fur Sortierung$V X3p X3a X1 Ertr.p fur Variablenwahl

HERIT T oder HERIT T:C [siehe 6.1.8]GENOT/Q name z.B. GENOT T oder GEN T:BC

mit name = Effekt-Kurzzeichen [siehe 6.1.9]Q = 1 zusatzlich Varianz-Kovarianz-Analysen

-------------------------------------------------------------------------------

FIT/Q Y X1 X2 ... (nur mit BASIC, je Regression eine Zeile)z.B. FIT X5 X1 X2mit 3-ziffrigem Qualifier Q (Voreinstellung 111): [siehe 4.1.2]PRIN = 0 nur Regressionsanalysen ausgeben

= 1 Kovarianzmatrix der Regressionskoeffizientenzusatzlich ausgeben (Voreinstellung)

= 2 Kovarianzmatrix der Variablen zusatzlich ausgebenRSDL = 0 Residuen nicht ausgeben

= 1 Test auf Ausreißer (Voreinstellung)= 2 gefittete Werte und Residuen auf sekund. Datei ausgeben

ICPT = 0 Regression ohne y-Achsenabschnitt= 1 Regression mit y-Achsenabschnitt (Voreinstellung)

Page 44: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

ANHANG A Liste der Befehle 44

NAMES OF TR/Q Liste von Texten (mit Voreinstellung erste 5Zeichen benutzt)

mit Q = Lange des Textes, z.B. NAMES/12 [siehe 3.2.5]oder bei ANOVA:

Q = Faktorsymbol und Lange des Textes , z.B. NAMES/T12

CHECKS Liste von Prufgliednummern oder * [siehe 3.2.6]bei ANOVA mit Qualifier Faktorsymbol, z.B. CHECKS/T 24

CSV/Q Liste von funf Identifikatoren [siehe 3.2.7]mit Q = E fur englisches csv-Format (Dezimalpunkt und Komma)

= G fur deutsches csv-Format (Dezimalkomma und Strichpunkt)

INDEX 1 X4=-0.5*X1-1.33*X2+0.77*X3+100X11=MC(X2,1,2,3) [siehe 8.2]

PLOT/Q X1.X2 X5.X2 X3.X3 ! als Beispiele [siehe 8.3]mit Q = 1 ein Diagramm je Seite (Voreinstellung)

= 2 zwei Diagramme je Seite= 3 drei Diagramme je Seite

PPLOT/n Xi.Xj [siehe 8.4]PostScript-Scatterdiagramm fur Xi auf Xjn = n-tes Zeichen im Pedigree wird statt einer Nummer gezeichnet

ERROR P n [siehe 8.5]mit P = Symbol des Faktors der Einzelversuche

(oder Zahl der Versuche mit DFE- und SE-Zeilen)n = Spalte, in der DFE, .. in den Daten steht (Voreinstellung 12)

OMISSListe von NVAR Zahlen [siehe 8.6]

RUN [siehe 3.2.8]nach RUN folgt der eigentliche Datensatz

EOD [siehe 3.2.9]STOP [siehe 3.2.10]

Page 45: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

ANHANG B Beispiele 45

ANHANG B Beispiele

Mehrere Datenbeispiele sind in drei Dateien zu finden:1. Beispiele mit BASIC in der Datei psdbasc.dat

PSDBASC-1 = Einfaches Beispiel mit PLOTPSDBASC-2 = mit KorrelationsmatrixPSDBASC-3 = Test zur multiplen Regression (Amer. Statist. 1984)PSDBASC-4 = Multiple lineare Regress. (SNEDECOR und COCHRAN, 1980, S. 336)PSDBASC-5 = Polynomiale Regression (SNEDECOR und COCHRAN, 1980, S. 399)PSDBASC-6 = Orthogonale Polynome (SNEDECOR und COCHRAN, 1980, S. 405)PSDBASC-7 = Regression durch den Nullpunkt (SNEDECOR und C., 1980, S. 173)PSDBASC-8 = Spearman’s correlation (SNEDECOR und C., 1980, S. 192)

2. Beispiele mit LATTICE in der Datei psdlatt.datPSDLATT-1 = Zweisatzgitter (COCHRAN und COX, S. 406 and 413)PSDLATT-2 = Randomisierter vollstandiger Blockversuch (RCB)

mit CALCULATE, CHECKS, INDEX und PLOTPSDLATT-3 = Dreisatz-Rechteckgitter (COCHRAN und COX, S. 418)PSDLATT-4 = Dreisatz-Rechteckgitter (FEDERER, 1955, S. 347)

mit Gebrauch von QualifierPSDLATT-5 = 10*8 Generalisiertes GitterPSDLATT-6 = Dreisatzgitter mit verschiedenen Arten von fehlenden WertenPSDLATT-7 = Randomisierter vollstandiger Blockversuch (RCB)

mit verschiedenen Arten von fehlenden WertenPSDLATT-8 = 5*5 Zweisatzgitter (SCHNELL, 1957)PSDLATT-9 = 7*3 Generalisiertes Gitter mit 3 Wiederholungen

3. Beispiele mit ANOVA in der Datei psdanov.datPSDANOV-1 = Spaltanlage (SNEDECOR and COCHRAN, 1980, S. 327)PSDANOV-2 = Randomisierter vollstandiger Blockversuch (RCB)

mit CALCULATE, CHECKS, INDEX und PLOTPSDANOV-3 = 3-faktorielles Experiment (SNEDECOR and COCHRAN, 1980, S. 318)

mit TBT TAB und MEANSPSDANOV-4 = Unterteilung einer Zweifaktor-Interaktion, phanotyp. Stabilitatsanalyse,

(YATES and COCHRAN, 1938)PSDANOV-5 = North Carolina Design IPSDANOV-6 = Versuchsserie bei Roggen

mit ERROR und INDEXPSDANOV-7 = Berechnung von Erwartungswerten der MQ

in einer Spaltanlage uber Orte und Jahre

4. Beispiele mit UNREP in der Datei psdunrep.dat

PSDUNREP = Beispielsdaten fur Standardanlagen und gleitende Mittelwerte

Page 46: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

ANHANG C MODEL-Zeilen fur einige Versuchsanlagen 46

ANHANG C MODEL-Zeilen fur einige Versuchsanlagen

1. Einfaktorieller vollstandig randomisierter Blockversuch

mit Varianten und Wiederholungen; event. uber Orte, Jahre und Regionen

Einzelversuch: MODEL W + V + WV

Serie uber Orte: MODEL O + W:O + V + VO + WVO

Serie uber Orte MODEL J + O + JO + W:JO

und Jahre: + V + VJ + VO + VJO + WVJO

Serie uber Regionen: MODEL R + O:R + W:RO

+ V + VR + VO:R + WVRO

Serie uber Regionen MODEL J + R + JR + O:R + JO:R + W:JRO

und Jahre: + V + VJ + VR + VJR + VO:R + VJO:R

+ WVJRO

2. Zweifaktorieller Versuch in vollstandig randomisierter Blockanlage

Faktor A, Faktor T, die A.T Kombinationen innerh. Wiederh. voll randomisiert;event. uber Orte, Jahre und Regionen

Einzelversuch: MODEL W + A + T + AT + WAT

Serie uber Orte: MODEL O + W:O + A + T + AT

+ AO + TO + ATO + WATO

Serie uber Orte MODEL J + O + JO + W:JO

und Jahre: + A + T + AT + AJ + TJ + ATJ

+ AO + TO + ATO + AJO + TJO + ATJO

+ WATJO

Serie uber Regionen: MODEL R + O:R + W:RO

+ A + T + AT + AR + TR + ATR

+ AO:R + TO:R + ATO:R + WATRO

Serie uber Regionen MODEL J + R + JR + O:R + JO:R + W:JRO

und Jahre: + A + T + AT + AJ + TJ + ATJ

+ AR + TR + ATR + AJR + TJR + ATJR

+ AO:R + TO:R + ATO:R

+ AJO:R + TJO:R + ATJO:R + WATJRO

Page 47: PLABSTAT - uni-hohenheim.de · 1 WAS PLABSTAT IST 3 1 Was PLABSTAT ist PLABSTAT kann als Kurzel f¨ ur ”PLAnt Breeding STATistical program” oder auch als¨ ”PLAnned Block experiments

ANHANG C MODEL-Zeilen fur einige Versuchsanlagen 47

3. Zweifaktorielle Spaltanlage

Faktor A in Großteilstucken, Faktor T in Kleinteilstucken innerh. Großteilstucken;event. uber Orte, Jahre und Regionen

Einzelversuch: MODEL W + A + WA/ + T + AT + WAT

Serie uber Orte: MODEL O + W:O + A + AO + WA:O/+ T + AT + TO + ATO + WATO

Serie uber Orte MODEL J + O + JO + W:JO

und Jahre: + A + AJ + AO + AJO + WA:JO/

+ T + TJ + TO + TJO

+ AT + ATJ + ATO + ATJO + WATJO

Serie uber Regionen: MODEL R + O:R + W:RO

+ A + AR + AO:R + WA:RO/

+ T + TR + TO:R

+ AT + ATR + ATO:R + WATRO

Serie uber Regionen MODEL J + R + JR + O:R + JO:R + W:JRO

und Jahre: + A + AJ + AR + AJR + AO:R + AJO:R

+ WA:JRO/

+ T + TJ + TR + TJR + TO:R + TJO:R

+AT +ATJ +ATR +ATJR +ATO:R +ATJO:R

+ WATJRO

4. Zweifaktorielle Streifenanlage

Faktor A in Großteilstucken, Faktor T in dazu ”gekreuzten” Großteilstucken;event. uber Orte, Jahre und Regionen

Einzelversuch: MODEL W + A + WA/ + T + WT/ + AT + WAT

Serie uber Orte: MODEL O + W:O + A + AO + WA:O/

+ T + TO + WT:O/+ AT + ATO + WATO

Serie uber Orte MODEL J + O + JO + W:JO

und Jahre: + A + AJ + AO + AJO + WA:JO/

+ T + TJ + TO + TJO + WT:JO/

+ AT + ATJ + ATO + ATJO + WATJO

Serie uber Regionen: MODEL R + O:R + W:RO

+ A + AR + AO:R + WA:RO/

+ T + TR + TO:R + WT:RO/

+ AT + ATR + ATO:R + WATRO

Serie uber Regionen MODEL J + R + JR + O:R + JO:R + W:JRO

und Jahre: + A + AJ + AR + AJR + AO:R + AJO:R

+ WA:JRO/

+ T + TJ + TR + TJR + TO:R + TJO:R

+ WT:JRO/

+ AT +ATJ +ATR +ATJR +ATO:R +ATJO:R

+ WATJRO