Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des...

158
O–G–U¨ M F ¨ E I ¨ A Diplomarbeit Folgeregelung nichtminimalphasiger nichtlinearer Regelstrecken eingereicht im: September 1997 von: Thomas Schauer geboren am 04. Januar 1974 in Magdeburg

Transcript of Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des...

Page 1: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

O––G–U M

F E

I A

Diplomarbeit

Folgeregelung nichtminimalphasiger nichtlinearer Regelstrecken

eingereicht im: September 1997

von: Thomas Schauer

geboren am 04. Januar 1974

in Magdeburg

Page 2: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

Kurzreferat

Das Problem der Folgeregelung nichtlinearer nichtminimalphasiger Regelstrecken wird übereinen Entwurf mit zwei Freiheitsgraden gelöst. Eine Vorwärtssteuerung generiert durch Inver-sion der Regelstrecke eine explizite Trajektorie für die nominale Stellgröße und die nominalenZustände. Entlang dieser Trajektorien wird die Regelstrecke durch einen Regler stabilisiert. DerEntwurf dieses Reglers erfolgt an einem zeitvarianten linearen Modell. Dieses resultiert aus derLinearisierung der Regelstrecke entlang der nominalen Trajektorien. Für die stabile Inversionnichtminimalphasiger Regelstrecken werden verschiedeneVerfahren vorgestellt und analysiert.Der neue Ansatz wird anhand von zwei technischen Anwendungsbeispielen, dem Entwurf einesAutopiloten für einen Lenkflugkörper und der Regelung einesBioreaktors, demonstriert.

Abstract

The tracking problem for nonlinear nonminimum phase plantsis solved by a two degree of free-dom design. A feedforward part generates an explicit trajectory for the nominal input and statesby inversion of the plant. A feedback controller stabilisesthe plant around these trajectories. Thedesign of the controller is based on a linear time-varying model, which results from linearisationof the plant about the nominal trajectories. Different techniques for the stable inversion of thenonminimum phase plants are described and analysed. The newapproach is demonstrated ontwo technical examples. These are the design of an autopilotfor a missile and the control of abioreactor.

Page 3: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

Ich versichere, daß ich diese Diplomarbeit selbständig verfaßt und keine anderen als die ange-gebenen Hilfsmittel verwendet habe.Gleichzeitig erkläre ich, daß alle Rechte an dieser Arbeit an das Institut für Automatisierungs-technik übergehen.

Magdeburg, den 3. September 1997

Page 4: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

Inhaltsverzeichnis

1 Einleitung 9

2 Inversion nichtlinearer Eingrößensysteme 112.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2 Normalform nichtlinearer Systeme . . . . . . . . . . . . . . . . . .. . . . . . 122.3 Systeminversion und Nulldynamik . . . . . . . . . . . . . . . . . . .. . . . . 182.4 Inversion von Systemen mit instabiler Nulldynamik . . . .. . . . . . . . . . . 35

2.4.1 Inversion durch Ausnutzung flacher Systemausgänge . .. . . . . . . . 362.4.1.1 Ansätze zur Übertragung des Inversionsproblems auf den fla-

chen Ausgang . . . . . . . . . . . . . . . . . . . . . . . . . 372.4.1.2 Existenzbedingung für einen flachen Ausgang . . . . . .. . 46

2.4.2 Inversion schwach nichtminimalphasiger Systeme . . .. . . . . . . . 572.4.3 Inversion von Systemen mit schneller instabiler Nulldynamik . . . . . 712.4.4 Inversion maximalphasiger Systeme . . . . . . . . . . . . . . .. . . . 80

3 Folgeregelung 913.1 Grundlegende Betrachtungen . . . . . . . . . . . . . . . . . . . . . . .. . . . 91

3.1.1 Streckenmodell und Vorwärtssteuerung . . . . . . . . . . . .. . . . . 913.1.2 Stabilisierung um die Solltrajektorie . . . . . . . . . . . .. . . . . . . 93

3.2 Standardfehlermodell . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . 953.3 Integral erweitertes Fehlermodell . . . . . . . . . . . . . . . . .. . . . . . . . 963.4 Anforderungen an den unterlagerten Regelkreis . . . . . . .. . . . . . . . . . 983.5 Übersicht geeigneter Regler . . . . . . . . . . . . . . . . . . . . . . .. . . . 1023.6 Gain-Scheduling-Regler . . . . . . . . . . . . . . . . . . . . . . . . . .. . . 1123.7 Parametervariante Zustandsregelung . . . . . . . . . . . . . . .. . . . . . . . 122

3.7.1 Analyse linearer parametervarianter Systeme . . . . . .. . . . . . . . 1223.7.2 Entwurf der parameterabhängigen Zustandsregelung .. . . . . . . . . 125

4 Zusammenfassung 130

Literaturverzeichnis 132

A Lenkflugkörper-Modell 135A.1 Spezifikation der Regelkreiseigenschaften . . . . . . . . . .. . . . . . . . . . 142A.2 Verhalten an stationären Arbeitspunkten . . . . . . . . . . . .. . . . . . . . . 143

4

Page 5: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

B Bioreaktor-Modell 146B.1 Formulierung des Regelungsproblems . . . . . . . . . . . . . . . .. . . . . . 152

C Invariante Mannigfaltigkeiten linearer und nichtlinear er Systeme 153

Page 6: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

Symbolverzeichnis

6

Page 7: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

ad Lie-Klammerazf Normalbeschleunigung des LenkflugkörpersBW Bandbreitec1 Zellkonzentrationc2 NährstoffkonzentrationCz aerodynamischer Koeffizient der KraftCm aerodynamischer Koeffizient des MomentesE Menge aller Gleichgewichtspunkte eines SystemsFP Menge aller zulässiger Parametertrajektorieng ErdbeschleunigungFzf resultierende aerodynamische KraftIyy Trägheitsmoment des Lenkflugkörpers (Nickachse)J GütefunktionalK ReglerL Lie-Ableitungm MasseM MachzahlMy resultierendes aerodynamisches Moment (Nickachse)n Ordnung der RegelstreckeN Anzahl der linearen Modelle beim Gain-Scheduling-ReglerP ParameterraumQ Staudruckr relativer Gradℜ RealteilR+ Menge der positiven reellen ZahlenR Menge der reellen Zahlens Anzahl der Parameter des integral erweiterten FehlermodellsS Oberfläche des Lenkflugkörperst Zeitu Stellgrößeuf b korrektive Stellgrößevs Schallgeschwindigkeitx Systemzustandsvektorxe Regelfehler der Systemzuständey Regelgrößeyd gefilterte Referenzgröße

Page 8: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

8

yr ungefilterte Referenzgrößey∗ flacher Systemausgang

ˆ(.) Approximation einer Größe oder Funktion(.)e Wert einer Größe an einem Gleichgewichtspunkt˙(.) erste Ableitung einer Größe nach der Zeit

(.)(i) i-te zeitliche Ableitung einer Größe(.)d nominaler Wert einer Größe

β Wachstumsrate der ZellenΓ Schrumpfungsrate der Nährstoffe∆ Distributionζ Vektor der geordneten zeitlichen Ableitungen der Regelgrößeη Zustandsvektor der Nulldynamikµ unnormierte Gültigkeitsfunktionξ Zustandsvektor des integral erweiterten Fehlermodellsρi i-ter Parameter des integral erweiterten Fehlermodellsρi obere Beschränkung des Parametersρi

ρi

untere Beschränkung des Parametersρi

σ IntegratorzustandΣ RegelstreckeΣ approximierte RegelstreckeΣ−1 Inversion der approximierten RegelstreckeΣobs BeobachterΣre f ReferenzmodellΦ KoordinatentransformationΦρ Zustandstransitionsmatrix des integral erweiterten Fehlermodellsψ normierte Gültigkeitsfunktionω Kreisfrequenz

KS KoordinatensystemLMI Linear Matrix InequalityLPV linear parametervariant

Page 9: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

1 Einleitung

Die Folgeregelung nichtlinearer Systeme stellt ein zentrales Problem der Regelungstechnik dar.Die Aufgabe besteht darin, am Ausgang einer Regelstrecke ein extern gegebenes Referenzsignalzu erzeugen. Ein Beispiel für eine Folgeregelung ist der Autopilot eines Lenkflugkörpers.

Ende der achtziger Jahre wurden unter Verwendung geometrischer Methoden neue nichtlinea-re Ansätze zur Lösung des Folgeregelungsproblems bei nichtlinearen Regelstrecken entwickelt.Ein bekanntes Verfahren stellt die exakte Ein-/Ausgangs-Linearisierung dar [16]. Ein wesent-licher Nachteil dieser Methode ist, daß bei ihrer Anwendungauf nichtminimalphasige Regel-strecken der Regelkreis instabil wird.

Nichtminimalphasigkeit ist ein Konzept, das nur das Ein-/Ausgangs-Verhalten und nicht dieEigendynamik von Systemen betrifft. Das charakteristische Merkmal solcher Systeme ist dasallpaßartige Übertragungsverhalten. Aus der linearen Regelungstheorie ist bekannt, daß Nicht-minimalphasigkeit zu Einschränkungen in der Regelgüte führt.Viele praktisch relevante technische Regelstrecken, so z.B. das Modell der Längsdynamik ei-nes Lenkflugkörpers, weisen nichtminimalphasiges Verhalten auf. Aufgrund der Nichtanwend-barkeit vieler nichtlinearer Ansätze werden zur Regelung solcher Systeme fast ausschließlichRegler eingesetzt, die auf linearen Methoden beruhen. Die erreichbare Regelgüte ist dadurchpraktisch begrenzt. Das Finden geeigneter nichtlinearer Ansätze zur Folgeregelung nichtlinearernichtminimalphasiger Systeme ist aufgrund dieser Tatsache ein aktuelles Gebiet der Forschung.

In dieser Arbeit wird eine Regelungsstruktur mit zwei Freiheitsgraden vorgestellt, die einenLösungsansatz für diese Problematik darstellt. Der prinzipielle Regelkreis ist in Abbildung 1.1wiedergegeben. Ein solcher Strukturvorschlag ist ansatzweise unter anderem in [39, 18, 7] zufinden. Das grundlegende Prinzip des Ansatzes wird nachfolgend vorgestellt.

Der Ausgangy der Regelstrecke soll der Referenzgrößeyd unmittelbar folgen. Der Block Tra-jektoriengenerierung stellt den ersten Freiheitsgrad derFolgeregelung dar. Er berechnet die zumErzeugen der Ausgangsgrößey = yd notwendige nominale Stellgrößeud sowie die nominalenSystemzuständexd für die nominale Regelstrecke. Zur Ermittlung dieser Größen ist die Inversi-on des Streckenverhaltens notwendig. Im zweiten Kapitel werden die Grundlagen der Inversionnichtlinearer dynamischer Systeme mittels geometrischerMethoden behandelt. Das Vorgehenbei der Inversion nichtminimalphasiger Regelstrecken steht dabei im Mittelpunkt der Betrach-tungen. Da eine exakte stabile kausale Inversion solcher Systeme nicht möglich ist, werden Ver-fahren vorgestellt, entwickelt und analysiert, die eine exakte nichtkausale oder approximativeInversion nichtminimalphasiger Systeme erlauben.

Auf Grund von Modellungenauigkeiten, unterschiedlichen Initialisierungen von Prozeß und Mo-dell sowie auf die Strecke einwirkenden externen Störungenwird der Systemausgang bei An-

9

Page 10: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

10

generierungTrajektorien-

x(t)xd(t)

y(t)u(t)ud(t)yd(t)

uf b(t)

Regelstrecke

Regler

Abbildung 1.1: Folgeregelung mit zwei Freiheitsgraden

wendung der nominalen Stellgröße nicht exakt der gewünschten Referenzgröße folgen. Derzweite Freiheitsgrad der Folgeregelung hat die Aufgabe, die durch die eben genannten Grün-de verursachten Abweichungen von der gewünschten Ausgangsgrößentrajektorie auszuregeln.Der zweite Freiheitsgrad ist somit der sich in der Rückkopplungsschleife befindliche Regler.Dieser Regler ist zwingend erforderlich, wenn die Regelstrecke instabil ist und folglich durchRückkopplung stabilisiert werden muß. Als Eingangsgröße des Reglers dient nach Abbildung1.1 die Abweichung der realen Zustandstrajektoriex von der nominalen Zustandstrajektoriexd.Dieses Vorgehen setzt die Meßbarkeit bzw. Beobachtbarkeitder Systemzustände voraus. DasHauptanliegen des dritten Kapitels ist die Beschreibung und der Entwurf von Reglern, die dieoben genannten Aufgaben erfüllen. Da durch den ersten Freiheitsgrad der nichtlineare Charakterder Regelstrecke bereits erfaßt wird, erfolgt der Entwurf der Regler an der linearisierten Regel-strecke. Die Regelstrecke wird dabei nicht an einem Gleichgewichtspunkt, sondern entlang dernominalen Zustands- und Stellgrößentrajektorie linearisiert. Das zum Reglerentwurf zu verwen-dende Modell stellt in diesem Fall ein lineares zeitvariantes System dar. Mögliche Ansätze zurRegelung solcher Systeme werden entwickelt, beschrieben und analysiert.

Da sich die Untersuchungen in bisherigen Arbeiten [39, 18, 7] auf einen der beiden Freiheits-grade konzentrierten, ist ein wichtiges Anliegen dieser Arbeit, die Kombination beider Freiheits-grade und somit das komplette Verhalten der Folgeregelung zu untersuchen. Anhand mehrererBeispiele soll die Tauglichkeit der in dieser Arbeit vorgestellten Methoden gezeigt werden. ImMittelpunkt stehen dabei zwei technische Anwendungsbeispiele, die Folgeregelung eines Lenk-flugkörpers und eines Bioreaktors. Beide Systeme sind nichtlinear und nichtminimalphasig. Dieerzielten Ergebnisse werden im Kapitel 4 zusammengefaßt und bewertet.

Page 11: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2 Inversion nichtlinearer Eingrößensysteme

2.1 Einführung

Da eine Behandlung des Themas Inversion für die komplette Klasse der nichtlinearen dynami-schen Systeme zu aufwendig ist, wird eine Beschränkung auf die große Gruppe der kontinuierli-chen, zeitinvarianten nichtlinearen Eingrößensysteme vorgenommen. Dabei wird angenommen,daß die Regelstrecke durch das Zustandsraummodell

x(t) = f (x(t)) + g(x(t))u(t)

y(t) = h(x(t)) (2.1)

mit dem Zustandsvektorx ∈ Rn, der Stellgrößeu ∈ R und der Ausgangsgrößey ∈ R beschrie-ben wird. Die Stellgrößeu geht affin in die Zustandsgleichung ein. Bei den Ausdrückenf undg handelt es sich um Vektorfelder bzw. Vektorfunktionen. EinVektorfeld ist dabei wie folgtdefiniert.

Definition 2.1.1 (Vektorfeld,Vektorfunktion)Eine Abbildung f : D → Rn, wobei D ⊂ Rn ein Gebiet des n-dimensionalen EuklidischenRaumes ist, wird als Vektorfeld aufD bezeichnet. Ein Vektorfeld ist einen-dimensionale Spalte.

Genaugenommen sind die Vektorfelder in (2.1) n-dimensionale Spaltenvektoren, deren Elemen-te Funktionen der Zuständex sind. Die skalare Funktionh stellt eine Abbildungh : D → Rdar. Es sei im folgenden vorausgesetzt, daß alle Funktionenglatt in ihren Argumenten sind, d.h.es existieren kontinuierliche partielle Ableitungen bis zu einer gewissen Ordnung. Des weiterenwird festgelegt, daß gilt:

xe = 0, ue = 0, ye = 0, f (0) = 0, h(0) = 0, (2.2)

wobei xe ∈ D einen Gleichgewichtspunkt des Systems repräsentiert. Es sei darauf hingewiesen,daß (2.2) keine Einschränkung der Allgemeinheit darstellt. Die Untersuchungen des Systemsgelten lokal in der UmgebungD des Punktesxe.Die Inversion eines Systems besteht nun in der Aufgabe, für einen vorgegebenen Verlauf derAusgangsgrößeyd(t) die notwendige Stellgrößeud(t) und die daraus resultierenden Zuständexd(t) zu berechnen, so daß die gewünschte Ausgangsgröße erzeugtund Gleichung (2.1) erfülltwird:

xd(t) = f (xd(t)) + g(xd(t))ud(t), xd(0) = xd0

yd(t) = h(xd(t)). (2.3)

11

Page 12: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.2 Normalform nichtlinearer Systeme 12

Der Anfangszustand wird so festgelegt, daß das System (2.1)bei gleicher Initialisierung zumZeitpunktt = 0 am Ausgang die geforderte Ausgangsgrößeyd(t = 0) erzeugt.

Die Generierung der gesuchten Größen hat möglichst online zu erfolgen, d.h. der Funktionsbau-stein Trajektoriengenerierung in Abbildung 1.1 liefert zum Zeitpunktt für die aktuelle Vorgabeyd(t) die Größenud(t)und xd(t). Kann dieses erreicht werden, so entspricht der Trajektorienge-nerator dem exakten inversen System von (2.1).In diesem Kapitel soll nun gezeigt werden, wann und wie ein System der Form (2.1) exakt in-vertiert werden kann. Für den Fall, daß eine Inversion nach den obigen Vorgaben nicht möglichist, werden Alternativen vorgestellt. Des weiteren wird die Klasse der Ausgangssignale ange-geben, die durch das System (2.1) prinzipiell erzeugt werden kann und somit als Vorgabeyd(t)überhaupt in Frage kommt.Als Ausgangspunkt der Untersuchungen wird zunächst eine geeignete Beschreibungsform desSystems, die Normalform nichtlinearer Systeme, vorgestellt. Anhand dieser Form werden grund-legende Begriffe und Eigenschaften nichtlinearer Systeme erklärt. So werden die Begriffe re-lativer Grad, Nulldynamik und reduziertes inverses Systemeingeführt. Die Eigenschaften derNulldynamik bestimmen entscheidend das Vorgehen bei der Inversion. Bei linearen Systemenentspricht die Existenz einer solcher Dynamik dem Vorhandensein von Nullstellen in der Über-tragungsfunktion.

2.2 Normalform nichtlinearer Systeme

Die Lösung des Inversionsproblems fordert die Verwendung einer geeigneten Beschreibungs-form für das E/A-Verhalten des Systems. So hat sich bei linearen Eingrößensystemen die Über-tragungsfunktion als geeignet erwiesen. Um einen funktionellen Zusammenhang zwischen derAusgangsgröße und der Stellgröße zu gewinnen, bietet es sich an, die Ausgangsgröße mehrmalsnach der Zeit zu differenzieren. Führt man diese Berechnung durch, so erhält man

y =∂h(x)∂x

∂x∂t=∂h(x)∂x

( f (x) + g(x)u)

=∂h(x)∂x

f (x) +∂h(x)∂xg(x)u

y(2) =∂

∂x

(

∂h(x)∂x

f (x)

)

∂x∂t+

∂x

(

∂h(x)∂xg(x)

)

∂x∂t

u

+∂h(x)∂xg(x)

∂u∂t. (2.4)

Zur Vereinfachung wurde die explizite Abhängigkeit der Ausgangs- und Stellgröße sowie derZustandsgrößen von der Zeit nicht dargestellt. Die partielle Ableitung der skalaren Funktionh(x) nach dem Vektorx wird Differential der Funktionh genannt und ist wie folgt definiert.

Definition 2.2.1 (Differential)Es seih eine skalare Funktion, die die Abbildungh : D → R beschreibt. Das Differential vonh

Page 13: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.2 Normalform nichtlinearer Systeme 13

ist ein Kovektorfeld, das wie folgt definiert ist:

dh=∂h(x)∂x

=

[

∂h(x)∂x1

, · · · , ∂h(x)∂xn

]

. (2.5)

Die allgemeine Definition eines Kovektorfeldes lautet:

Definition 2.2.2 (Kovektorfeld, Kovektorfunktion)Die Transponierte eines Vektorfeldes wird als Kovektorfeld bezeichnet. Ein Kovektorfeld isteinen-dimensionale Zeile.

Das Produkt eines Kovektorfeldes mit einem Vektorfeld wirdals inneres Produkt bezeichnet. Esist mit dem Skalarprodukt zweier Vektoren vergleichbar.

Definition 2.2.3 (Inneres Produkt)Wenn f undw ein Vektorfeld und ein Kovektorfeld repräsentieren, dann ist das innere Produktdefiniert als

〈w, f〉 = w(x) f (x) =n∑

i=1

wi(x) fi(x). (2.6)

Bei weiterem Differenzieren der Ausgangsgröße wird das Gleichungssystem (2.4) sehr unüber-sichtlich. Die Verwendung der Lie-Ableitung [16] vereinfacht die Darstellung von (2.4) stark.

Definition 2.2.4 (Lie-Ableitung)Die Ableitung einer skalaren zustandsabhängigen Funktionρ(x) entlang einer Vektorfunktionf (x) wird Lie-Ableitung genannt und ist definiert als

L fρ(x) =∂ρ(x)∂x

f (x).

Die Lie-AbleitungL fρ(x) ist wieder eine skalare Funktion. Folglich ist sie rekursivanwendbar,und es gilt

Lkfρ(x) = L f (L

k−1f ρ(x)) mit L0

fρ(x) = ρ(x).

Beispiel 2.2.1Es ist ein nichtlineares System der Form (2.1) mit den Vektorfunktionen

f (x) =

−x1 + x2

−3x2 + x31

x1 − 2x3

−x4 + x23

, g(x) =

02+ sin2 x4

00

(2.7)

und der skalaren Funktion

h(x) = x1 − 3x3 (2.8)

Page 14: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.2 Normalform nichtlinearer Systeme 14

gegeben [7]. Für dieses System sind die Lie-AbleitungenL f h(x), L2f h(x), Lgh(x) und LgL f h(x)

zu berechnen.

h(x) = x1 − 3x3

L f h(x) =∂h(x)∂x

f (x)

=(

∂h(x)∂x1

∂h(x)∂x2

∂h(x)∂x3

∂h(x)∂x4

)

f (x)

=(

1 0 −3 0)

−x1 + x2

−3x2 + x31

x1 − 2x3

−x4 + x23

= −x1 + x2 − 3(x1 − 2x3) = −4x1 + x2 + 6x3

L2f h(x) =

∂L f h(x)

∂xf (x)

= −4(−x1 + x2) − 3x2 + x31 + 6(x1 − 2x3)

Lgh(x) =∂h(x)∂xg(x) = 0

LgL f h(x) =∂L f h(x)

∂xg(x)

= 2+ sin2 x4 (2.9)

Für (2.4) ergibt sich unter Verwendung der Lie-Ableitung:

y = L f h(x) + Lgh(x)u

y(2) = L2f h(x) + LgL f h(x)u+ L f Lgh(x)u+ L2

gh(x)u2 + Lgh(x)u. (2.10)

...

Es stellt sich nun die Frage, wie oft man die Ausgangsgröße nach der Zeit ableiten muß, damitdie Stellgröße explizit erscheint. Aus (2.10) ist ersichtlich, daß, wenn der AusdruckLgh(x) , 0ist, die erste Ableitung vony eine Funktion vonu ist. Ist nunLgh(x) = 0, so ist in der zweitenAbleitung der Ausgangsgröße der TermL f Lgh(x)u + L2

gh(x)u2 + Lgh(x)u nicht vorhanden, daer die zeitliche Ableitung vonLgh(x)u repräsentiert. Die Größey(2) hängt nun explizit von derStellgröße ab, wenn die Lie-AbleitungLgL f h(x) , 0 ist. Trifft auch dieses nicht zu, so hat manweiter abzuleiten und zu prüfen, wann das erste Mal ein Ausdruck LgLk−1

f h(x) , 0 wird. DieZahl k gibt dabei an, wie oft die Ausgangsgröße nach der Zeit abgeleitet wurde. Die kleinstenatürliche Zahlr, für die LgLr−1

f h(x) , 0 gilt, gibt somit an, nach wieviel Differentiationendes Ausganges man den Eingang des Systems „sehen” kann. Diese Zahlr wird relativer Gradgenannt und ist wie folgt definiert:

Definition 2.2.5 (relativer Grad)Der relative Grad eines Systems der Form (2.1) ist gegeben durch die kleinste natürliche Zahlrfür die in einer gewissen UmgebungD des Punktesxe gilt

LgLkf h(x) = 0, für k < r − 1 und LgL

r−1f h(x) , 0.

Page 15: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.2 Normalform nichtlinearer Systeme 15

Nicht immer läßt sich ein relativer Grad für ein System nach dieser Definition angeben. Diestrifft z.B. für folgende Fälle zu:

1. Die Lie-AbleitungLgLkf h(x) ist Null für k = 1, 2, · · · . Der Systemausgang wird dann nicht

von der Stellgröße beeinflußt.

2. Die Lie-AbleitungLgLr−1f h(x) ist in der Umgebung des Punktesxe ungleich Null, aber am

Punktxe gleich Null.

Trifft einer dieser Fälle zu, so besitzt das System keinenwohl definierten relativen Grad. Es seiim folgenden angenommen, daß für die zu betrachtenden Regelstrecken der relative Grad wohldefiniert ist. Eine geeignete Beschreibung des Systems für die spätere Inversion wird nun durchfolgende Koordinatentransformation erzielt:

z1 = y = h(x) = φ1(x)

z2 = y(1) = L f h(x) = φ2(x)

z3 = y(2) = L2f h(x) = φ3(x)

...

zr = y(r−1) = Lr−1f h(x) = φr (x)

zr+1 = φr+1(x)...

zn = φn(x). (2.11)

Die erstenr neuen Koordinaten entsprechen der Ausgangsgröße und den (r −1)-ten Ableitungender Ausgangsgröße, auf die die Stellgröße keinen Einfluß hat. Die restlichenn− r neuen Zustän-de sind zu wählende Funktionen der alten Systemzustände. Inder Regel wird die nichtlineareKoordinatentransformation durch

z = Φ(x) (2.12)

mit der Vektorfunktion

Φ(x) =

φ1(x1, x2, · · · , xn)...

φn(x1, x2, · · · , xn)

(2.13)

beschrieben. Die einzige Forderung an die Transformation ist, daß sie einen lokalen Diffeomor-phismus darstellt.

Definition 2.2.6 (Lokaler Diffeomorphismus)Eine Transformationz = Φ(x) stellt einen lokalen Diffeomorphismus dar, wenn sie in der Um-gebungD des Punktesxe glatt ist und ihre Inversex = Φ−1(z) existiert und ebenfalls glatt ist.

Angenommen die Transformation ist glatt, so ist sie in einerUmgebungN des Punktesxe inver-tierbar, wenn die Jakobimatrix der Transformation für den Punkt xe den vollen Rangn besitzt.

Page 16: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.2 Normalform nichtlinearer Systeme 16

Die Jakobimatrix ist gegeben durch:

∂Φ(x)∂x

=

∂φ1(x)∂x1

· · · ∂φ1(x)∂xn

.... . .

...∂φn(x)∂x1

· · · ∂φn(x)∂xn

. (2.14)

Eine hinreichende Bedingung dafür, daß eine glatte Transformation einen lokalen Diffeomor-phismus darstellt ist somit, daß die Jakobimatrix vonΦ am Punktxe nicht singulär ist. DieBegründung dafür liefert das Theorem inverser Funktionen [19].Letztendlich hat man die noch zu wählenden Zuständezi , i = r + 1, · · · , n so festzulegen, daßder Rang von (2.14) am Punktxe gleich n ist. In [16] wird bewiesen, daß dies immer möglichist. Die angewandte Transformation ergibt folgendes Zustandsraummodell in Normalform [16]:

z1 = z2

z2 = z3

...

zr−1 = zr

zr = Lrf h(x) + LgL

r−1f h(x)u

zr+1 = L fφr+1(x) + Lgφr+1(x)u...

zn = L fφn(x) + Lgφn(x)u

y = z1. (2.15)

Zum besseren Verständnis des Entstehens der rechten Seite von (2.15) sei die ausführliche Be-rechnung für die i-te Zeile von (2.15) angegeben:

∂zi

∂t=∂φi(x)∂x

∂x∂t=∂φi(x)∂x

f (x)︸ ︷︷ ︸

L f φi(x)

+∂φi(x)∂xg(x)

︸ ︷︷ ︸

Lgφi(x)

u. (2.16)

Es ist zu erkennen, daß die erstenr Gleichungen von (2.15) eine einfache Kette von Integratorendarstellen. Der Ausgang dieser Kette ist die Ausgangsgrößey und der Eingang ist die nichtli-neare FunktionLr

f h(x) + LgLr−1f h(x)u. Es bietet sich an, den transformierten Zustandsvektor in

die zwei folgenden Vektoren aufzuspalten:

ζ = [z1, · · · , zr ]T =

[

y, · · · , y(r−1)]T

η = [zr+1, · · · , zn]T . (2.17)

Page 17: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.2 Normalform nichtlinearer Systeme 17

Die Elemente des Vektorsζ sind die Ausgangsgrößey und deren (r −1)-ten Ableitungen. Inζ, ηKoordinaten erhält die Normalform folgendes Aussehen:

ζ1 = ζ2

ζ2 = ζ3

...

ζr−1 = ζr

ζr = Lrf h(x = Φ−1(ζ, η)) + LgL

r−1f h(x = Φ−1(ζ, η))u

η1 = L fφr+1(x = Φ−1(ζ, η)) + Lgφr+1(x = Φ−1(ζ, η))u...

ηn−r = L fφn(x = Φ−1(ζ, η)) + Lgφn(x = Φ−1(ζ, η))u. (2.18)

Das Zustandsraummodell (2.18) läßt sich kompakter durch

ζ1 = ζ2

...

ζr−1 = ζr

ζr = α(ζ, η) + β(ζ, η)u

η = s(ζ, η, u)

y = ζ1 (2.19)

mit

α(ζ, η) = Lrf h(x = Φ−1(ζ, η))

β(ζ, η) = LgLr−1f h(x = Φ−1(ζ, η))

s(ζ, η, u) =

L fφr+1(x = Φ−1(ζ, η)) + Lgφr+1(x = Φ−1(ζ, η))u...

L fφn(x = Φ−1(ζ, η)) + Lgφn(x = Φ−1(ζ, η))u

(2.20)

darstellen. Die Vektorfunktions hat als Argumente die Zustandsvektorenζ, η sowie die Stellgrö-ßeu. Wenn die Stellgrößeu nicht explizit in die Vektorfunktions eingeht, dann liegt das Systemin Byrnes-Isidori-Normalform vor. Dieses kann durch geeignete Wahl der Transformationsglei-chungenφi(x), i = r + 1, · · · , n erreicht werden. Betrachtet man (2.18), so läßt sich erkennen,daß die Stellgröße nicht in die Vektorfunktion eingeht, wenn folgendes gilt:

Lgφr+1(x) = 0...

Lgφn(x) = 0. (2.21)

Die Ermittlung der Byrnes-Isidori-Normalform setzt die Lösung des partiellen Differentialglei-chungssystems (2.21) für die Funktionenφi(x), i = r + 1, · · · , n voraus, was keinesfalls trivial

Page 18: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 18

ist. Laut [16] existiert jedoch immer eine Lösung dieses Problems bei Systemen mit wohl defi-niertem relativen Grad. Abbildung 2.1 zeigt die Struktur der Normalform (2.19).

η = s(ζ, η, u)

yy

u

y(r)

ζ

ζ

∫ ∫ ∫u

η

α(ζ, η) + β(ζ, η)u

Abbildung 2.1: Normalform

2.3 Systeminversion und Nulldynamik

Mit der Normalform wurde ein analytischer Zusammenhang zwischen der Ausgangsgröße so-wie deren Ableitungen und der Stellgröße geschaffen. Am Ausgang des Systems soll nun dasReferenzsignalyd reproduziert werden. Es sind die dazu notwendige Stellgröße ud und die ausdieser Stellgröße resultierenden Systemzuständexd zu bestimmen. Als erstes ist zu überlegen,wie der Anfangswertxd(t0) des Systemzustandes und die Stellgrößeud zu wählen sind, damitder Systemausgangy gleich der Vorgabeyd ist.Da die erstenr Zustände der Normalform (2.19) die Ausgangsgröße und deren(r − 1)-ten Ab-leitungen darstellen, sind sie wie folgt festgelegt:

ζi = ζdi = y

d(i−1), i = 1, · · · , r. (2.22)

Sie werden der vorgegebenen Ausgangsgrößeyd und deren Ableitungen gleichgesetzt. Fügt man(2.22) in die Normalform (2.19) ein, so erkennt man, daß die Stellgrößeu die Bedingung

ζdr ≡ α(ζd, η) + β(ζd, η)u (2.23)

mit

ζd =[

yd, yd(1), · · · , yd(r−1)]T

, ζdr = y

d(r)(2.24)

erfüllen muß, damit am Systemausgangyd generiert wird. Aus Gleichung (2.23) ergibt sich alsnotwendige Stellgröße

ud =1

β(ζd, η)(ζd

r − α(ζd, η)). (2.25)

Wendet man das Stellgesetz (2.25) auf das System (2.19) an und setzt voraus, daß zum Zeitpunktt0 die Bedingungζ(t0) = ζd(t0) erfüllt ist, so läßt sich folgendes erkennen: Im E/A-Verhalten von

Page 19: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 19

(2.19) werden die Nichtlinearitäten kompensiert. Des weiteren entsteht eine vom Ausgang ausnicht mehr beobachtbare Dynamik

η = s(ζd, η, ud), (2.26)

welche als Nulldynamik bezeichnet wird. Das nun E/A-linearisierte System ist in Abbildung 2.2dargestellt.

∫ ∫ ∫

ζd

yd(r)yd yd

η = s(ζd, η, ud)ud

Abbildung 2.2: E/A-linearisiertes System

Der Begriff Nulldynamikhat folgenden Ursprung: Anfangs wurde das Problem des Nullhaltensdes Ausganges diskutiert [16], d.h. die Frage, wie die Stellgröße und der Anfangszustand desSystems zu wählen sind, damit der Ausgang des Systems exakt Null wird. Dabei soll nichtnur die Triviallösungx(t0) = 0 und u(t0) = 0 ermittelt werden. Da im Gleichgewichtspunktdes Systemsf (xe) = 0, h(xe) = 0, xe = 0, ue = 0 gilt, folgt, daß die ersten r Koordinatenζi = zi , i = 1, · · · , r der Normalform am Arbeitspunkt Null sind. Um das System an diesemPunkt zu halten, ist nach (2.25) die Stellgröße

ud = −α(ζd = 0, η)

β(ζd = 0, η)(2.27)

notwendig. Die resultierende unbeobachtbare Dynamik des Systems (2.19) bei Anwendung desStellgesetzes lautet

η = s(0, η, ud). (2.28)

Das dynamische System (2.28) wird als Nulldynamik bezeichnet. Später wurde der Begriff Null-dynamik einfach auf die beim Reproduzieren anderer Ausgangsgrößen entstehende unbeobacht-bare Dynamik (2.26) übertragen.Der Ausgangy des Systems (2.19) folgt dem Referenzausgangyd exakt, wenn die Anfangsini-tialisierungζ(t0) = ζd(t0) erfüllt ist und das Stellgesetz (2.23) angewendet wird. Esist ersicht-lich, daß der Anfangszustand der Nulldynamik frei wählbar ist. Durch Anwendung der inversenZustandstransformationΦ−1 ergibt sich für den notwendigen Anfangswert der Originalsystem-zustände

xd(t0) = Φ−1(ζd(t0), η(t0)). (2.29)

Page 20: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 20

Durch (2.29) wird einen− r dimensionale Hyperfläche im n-dimensionalen EuklidischenRaumbeschrieben, wobeiη(t0) den frei wählbaren Anfangszustand der Nulldynamik darstellt.In Analogie zu den linearen Systemen spricht man von minimalphasigen bzw. nichtminimalpha-sigen Systemen, wenn die resultierende Nulldynamik stabilbzw. instabil ist. Die exakte Bestim-mung der Stellgröße durch (2.25) und der Originalzustände durch

xd = Φ−1(ζd, η) (2.30)

erfordert die Lösung der Differentialgleichung (2.26) unter Berücksichtigung gegebener Start-werte. Die Gleichungen (2.26), (2.30) und (2.25) bilden dasreduzierte inverse System[22] von(2.1)

η = s(ζd, η, ud(η, ζd, ζdr ))

xd = Φ−1(ζd, η)

ud =1

β(ζd, η)(ζd

r − α(ζd, η), (2.31)

wobei xd sowie ud die Ausgangsgrößen undζd und ζdr die Eingangsgrößen sind. Im Gegen-

satz zum System 2.1 besitzt das System 2.31r Zustände weniger, was den Namen reduziertesinverses System erklärt. In Abbildung 2.3 ist das reduzierte inverse System (2.31) dargestellt.

ζd

ζdr = y

d(r)

1

β(ζd, η)(ζd

r − α(ζd, η))

η = s(ζd, η, ud)

ηud

ud

η

ζd

xd

Φ−1(ζd, η)

Abbildung 2.3: Reduziertes inverses System

Bei näherer Betrachtung des reduzierten inversen Systems wird folgendes deutlich:

1. Soll die Referenzgrößeyd(t) am Systemausgang reproduziert werden, so benötigt man weiter-hin r Ableitungen des Signalsyd(t). Damit die resultierende Stellgrößeud sowie die Zustands-größenxd beschränkt sind, müssen auf jeden Fall die Eingangsgrößen des inversen Systemsbeschränkt sein. Dieses ist erfüllt, wenn dier Ableitungen des geforderten Verlaufes der Aus-gangsgröße existieren und beschränkt sind. Die Voraussetzung für die Beschränktheit derr-ten

Page 21: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 21

Ableitung des Signalsyd(t) ist, daß die Ableitungenyd(t), yd(t), · · · , yd(r−1)(t) existieren und ste-tig sind. Besitzt ein Signalw(t) mindestensk Ableitungen und sind diese stetig, so wird dieserFakt durchw(t) ∈ Ck beschrieben. Eine wichtige Forderung anyd(t) ist somit, daßyd(t) ∈ Cr−1

erfüllt ist. Diese Tatsache schränkt die Klasse der erzeugbaren Ausgangssignale ein. Folglich istdie Vorgabe eines idealen Sprunges für den Systemausgang nicht möglich, da die Ableitung indiesem Fall nicht stetig ist. Der Grund der Forderungyd(t) ∈ Cr−1 kann auch wie folgt erklärtwerden: Aufgrund der Trägheit eines technischen Systems kann der Ausgang und dessen Ab-leitungen bis zu einer Ordnungr − 1 nicht springen. Es ist somit unsinnig, einen Verlaufyd(t)vorzugeben, der praktisch nicht realisierbar ist. Wird dasReferenzsignal von einem Leitrechnergeliefert, so müssen die Ableitungen durch numerische Differentiation ermittelt werden. Diesesist bekanntlich problematisch bei verrauschten Vorgaben.In dieser Arbeit wird die Referenzgrö-ßeyd(t) ∈ Cr−1 wie folgt generiert:Eine beschränkte Vorgabeyr (t) für die Ausgangsgrößey(t) wird auf ein lineares Zustandsraum-modell der Ordnungr gegeben:

x = Ax + byr , x(t0) =[

yd(t0), yd(t0), · · · , yd(r)(t0)

]

yd

yd

...

yd(r)

=

cT

cT A...

cT Ar−1

cT Ar

x +

00...

0cT Ab

u (2.32)

mit

A =

0 1 0 · · · 00 0 1 · · · 0...

......

. . ....

0 0 0 · · · 1−a0 −a1 −a2 · · · −ar−1

, b =

00...

0a0

cT = [1, 0, · · · , 0]. (2.33)

Die Ausgänge und Zustände des Zustandsraummodells sind dieReferenzgrößeyd(t) ∈ Cr−1

sowie derenr beschränkte Ableitungen. Die Übertragungsfunktion zwischen der ungefiltertenund der gefilterten Referenzgröße lautet

G(s) =yd(s)yr(s)

=a0

sr + ar−1sr−1 + · · · + a1s+ a0. (2.34)

Um beschränkte Signale zu erhalten, sind die Koeffizientenai , i = 0, · · · , r −1 so zu wählen, daß(2.34) stabil ist.

2. In den meisten Fällen läßt sich für die inverse nichtlineare Zustandstransformation keine ana-lytische Lösung angeben. In einem solchen Fall sind numerische Verfahren zur Lösung nichtli-nearer Gleichungssysteme erforderlich. Die Beschreibungsolcher Methoden soll nicht Gegen-stand dieser Arbeit sein. Gängige Verfahren sind unter anderem in [4] beschrieben. Die Auswahl

Page 22: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 22

der Verfahren und ihre konkrete Anwendung ist in der Regel sehr problemspezifisch. Es sollteimmer durch geeignete Wahl der Koordinatenzi = φi(x), i = r + 1, · · · , n versucht werden, eineTransformation zu finden, die sich analytisch invertieren läßt.

3. Eventuell vorhandene Beschränkungen der Stell- bzw. derZustandsgrößen sind bisher nichtberücksichtigt worden. Bei der Vorgabe des Verlaufesyd(t) können Verletzungen dieser Be-schränkungen auftreten. Soll sich der Systemausgang schnell ändern, so ist dafür in der Regeleine große Stellgröße erforderlich.

4. Das reduzierte inverse System ist im Block Trajektoriengenerierung in Abbildung 1.1 ent-halten. Erfüllt das Originalsystem (2.1) die Anfangswertbedingung (2.29), d.h. am Ausgang dernominalen Regelstrecke wird zum Zeitpunktt0 die gewünschte Ausgangsgrößeyd(t0) erzeugt,so generiert das reduzierte inverse System die Stellgrößeud(t) zu jedem Zeitpunkt so, daß derAusgang der Regelstrecke exakt der Vorgabeyd(t) folgt. Durch die Steuerung, d.h. das inver-se System, wird die komplette Systemdynamik der Regelstrecke exakt kompensiert. Dieses istvergleichbar mit der kompletten Pol- und Nullstellenkompensation bei einem linearen System.Unter der Annahme der Existenz eines stabilisierenden Reglers weist der Regelkreis nun sta-biles Ein-/Ausgangs-Verhalten auf. Die interne Stabilität des Regelkreises ist abhängig von derStabilität der Systeminversen. Für minimalphasige Regelstrecken liegt Stabilität und für nicht-minimalphasige Regelstrecken Instabilität vor. Liegt eininstabiles reduziertes inverses Systemvor, so sind die Ausgangsgrößenud und xd dieses Systems unbeschränkt. Der Regelkreis weistfolglich keine interne Stabilität auf. Im Abschnitt (2.4) werden für nichtminimalphasige Regel-strecken neue Verfahren vorgestellt, die zu einer stabilen, wenn zum Teil auch approximativen,Systeminversen führen und somit das obige Problem umgehen.

Nulldynamik in Originalkoordinaten

Für ein besseres physikalisches Verständnis der Nulldynamik bei einer Anwendung ist es häufigsinnvoll, daß es sich bei den Koordinaten der Nulldynamik umOriginalkoordinaten handelt.Um dieses zu erreichen, wählt man als Zustände der Nulldynamik n− r Systemzustände aus undfaßt diese in dem Vektorx ∈ Rn−r zusammen. Die restlichen Systemzustände bilden den Vektorx ∈ Rr . Die Erzeugung der Vektoren kann man sich durch die Aufspaltung eines umsortiertenSystemzustandsvektors veranschaulichen:

(

xx

)

= Px. (2.35)

Die Matrix P stellt eine Permutationsmatrix dar, die die Elemente des Vektorsx in neuer Reihen-folge anordnet. Es ist nun zu überprüfen, ob die Jakobimatrix der so gewählten Transformationmit η = x den vollen Rangn besitzt:

rang∂Φ(x)∂x

= rang

∂[φ1(x),··· ,φr(x)]T

∂x∂[φ1(x),··· ,φr (x)]T

∂x∂[φr+1(x),··· ,φn(x)]T

∂x = 0 ∂[φr+1(x),··· ,φn(x)]T

∂x

= n. (2.36)

Page 23: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 23

Anhand der Struktur von (2.36) und dem Fakt rang∂[φr+1(x),··· ,φn(x)]T

∂x= n − r ist zu erkennen,

daß die Invertierbarkeit der Transformation vorliegt, wenn

rang

∂[φ1(x), · · · , φr(x)]T

∂x

= rang

∂h(x)∂x1

· · · ∂h(x)∂xr

∂L f h(x)∂x1

· · · ∂L f h(x)∂xr

...

∂Lr−1f h(x)

∂x1· · · ∂Lr−1

f h(x)

∂xr

= r (2.37)

gilt. Die in Gleichung (2.36) vorgenommene Umordnung der Spalten der Jakobimatrix ist zu-lässig, da sie nicht den Rang der Matrix ändert. Falls (2.37)nicht erfüllt ist, sind für den Vektorx andere Systemzustände auszuwählen.Bei geeigneter Wahl des Vektorsx ist die Nulldynamik in Originalkoordinaten dann durch

η1 = x1 = f 1(x) + g1(x)ud

...

ηn−r = xn−r = f n−r (x) + gn−r (x)ud (2.38)

mit

f

f

= P f ,

g

g

= Pg (2.39)

gegeben. Unter Verwendung von Gleichung (2.25) und (2.20) ergibt sich für das Stellgesetz inOriginalkoordinaten

ud =1

LgLr−1f h(x)

(y(r) − Lrf h(x)). (2.40)

Die vollständige inverse Transformation erhält man durch Auflösen des Gleichungssystems

ζ1 = y = h(x)...

ζr = y(r−1) = Lr−1f h(x)

η = x (2.41)

nach den Zuständen des Vektorsx

x = Φ−1(x, ζ). (2.42)

Page 24: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 24

Für die Nulldynamik in Originalkoordinaten ergibt sich dann durch Einsetzen von (2.40) und(2.42) in (2.38)

x1 =

f 1(x) + g1(x)

1

LgLr−1f h(x)

(y(r) − Lrf h(x))

∣∣∣∣∣∣∣x=Φ−1

(x,ζd)

...

xn−r =

f n−r (x) + gn−r (x)

1

LgLr−1f h(x)

(y(r) − Lrf h(x))

∣∣∣∣∣∣∣x=Φ−1

(x,ζd)

. (2.43)

Beispiel 2.3.1Für ein lineares Eingrößensystem, welches durch die Übertragungsfunktion

G(s) = Ksm+ bm−1sm−1 + · · · + b1s+ b0

sn + an−1sn−1 + · · · + a1s+ a0(2.44)

bzw. die minimale Realisierung

x = Ax + bu

y = cT x (2.45)

mit

A =

0 1 0 · · · 00 0 1 · · · 0...

......

. . ....

0 0 0 · · · 1−a0 −a1 −a2 · · · −an−1

b =

00...

0K

cT =(

b0 b1 · · · bm−1 1 · · · 0)

(2.46)

beschrieben wird, soll der relative Grad, die Normalform und die Nulldynamik bestimmt werden[16]. Zur Bestimmung des relativen Grades wird der Ausgangy des Systems so lange nach derZeit differenziert, bis die Eingangsgrößeu explizit erscheint.

y = cT x = b0x1 + b1x2 + · · · + bn−r−1xm+ xm+1

y = cT Ax = b0x2 + b1x3 + · · · + bn−r−1xm+1 + xm+2

...

y(n−m−1) = cT An−m−1x = b0xn−m + b1xn−m+1 + · · · + bn−r−1xn−1 + xn

y(n−m) = cT An−mx + cT An−m−1bu

= b0xn−m+1 + b1xn−m+2 + · · · + bn−r−1xn

−a0x1 − a1x2 − · · · − an−1xn + Ku (2.47)

Page 25: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 25

Nachn−mZeitableitungen des Ausganges erscheint das erste Mal die Größeu. Der relative Gradeines linearen Eingrößensystems ist somitr = n−m. Dieses ist jedoch gerade die Differenz desGrades von Nenner- und Zählerpolynom der Übertragungsfunktion (2.44).Es ist leicht zu erkennen, daß mitf (x) = Ax, g(x) = b undh(x) = cT x gilt:

Lkf h(x) = cT Akx

LgLkf h(x) = cT Akb. (2.48)

Der relative Gradr erfüllt bei einem linearen System nach Definition (2.2.5) somit die Bedin-gung

cT Akb = 0,∀k < r − 1 und cT Ar−1b , 0. (2.49)

Um das System (2.46) in Normalform zu transformieren, wird folgende Koordinatentransforma-tion verwendet:

zi = ζi = y(i−1) = Li−1f h(x) = cT Ai−1x, i = 1, · · · , r

zr+i = ηi = xi , i = 1, · · · , n− r. (2.50)

In Vektorschreibweise bekommt die TransformationΦ folgendes Aussehen:

z =(

ζ

η

)

= Φ(x) =

cT

cT A...

cT Ar−1(

I[n−r,n−r ] 0[n−r,r ]

)

(

xx

)

. (2.51)

Der Systemzustandsvektor läßt sich ohne Umsortieren aufspalten in die Vektorenx undx, wobei

der Vektorx die Koordinaten der Nulldynamik, also die Systemzuständex1, . . . , xn−r , beinhaltet.Es gilt somitη = x. Durch Aufstellen der JakobimatrixJΦ der Transformation läßt sich leichterkennen, daß die in Gleichung (2.50) getroffene Wahl der Koordinatenzr+1, · · · , zn zulässig ist.Die Matrix JΦ ergibt sich wie folgt:

JΦ =∂Φ(x)∂x

=

cT

cT A...

cT Ar−1(

I[n−r,n−r ] 0[n−r,r ]

)

=

(

J11 [r,n−r ] J12 [r,r ]

J21 [n−r,n−r ] J22 [n−r,r ]

)

. (2.52)

Wie in Gleichung (2.52) angedeutet ist, kannJΦ in vier Teilmatrizen eingeteilt werden. Aus denGleichungen (2.47) und (2.50) erhält man konkret für die Jakobimatrix

JΦ =

b0 b1 · · · br−2 br−1 · · · bm−2 bm−1

0 b0 · · · br−3 br−2 · · · bm−3 bm−2

..

....

. . ....

..

. · · ·...

..

.

0 0 · · · b0 b1 · · · br−1 br

0 0 · · · 0 b0 · · · br−2 br−1

︸ ︷︷ ︸

J11

1 0 · · · 0 0bm−1 1 · · · 0 0...

..

.. . .

..

....

br+1 br+2 · · · 1 0br br+1 · · · bm−1 1

︸ ︷︷ ︸

J12

J21 = I[n−r,n−r] J22 = 0[n−r,r]

.(2.53)

Page 26: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 26

Es ist ersichtlich, daß die DreiecksmatrixJ12 und die EinheitsmatrixJ21 den vollen Rang haben,da sie nur Einsen in ihrer Hauptdiagonalen aufweisen. Aufgrund dieser Tatsache besitzt auchJΦden vollen Rang, d.h. die Transformation ist invertierbar.Die Transformation angewandt, liefertfolgende Normalform

ζi = ζi+1, i = 1, · · · , r − 1

ζr = cT Ar x + Ku = pTζ + qTη + Ku

η = Rζ + Sη. (2.54)

Soll der Ausgangyd reproduziert werden, so ist die Stellgröße

ud =1K

(ζdr − pTζd − qTη) (2.55)

nötig. Die Nulldynamik ist dann

η = Rζd + Sη (2.56)

und ausführlicher

η1 = x1 = x2 = η2

...

ηn−r−1 = xn−r−1 = xn−r = ηn−r

ηn−r = xn−r = xn−r+1 = −b0x1 − · · · − bn−r−1xn−r + ζd1

= −b0η1 − · · · − bn−r−1ηn−r + ζd1 . (2.57)

Der in der letzten Zeile von Gleichung (2.57) verwendete Ausdruck für xn−r+1 ergibt sich direktaus der ersten Zeile von (2.47). Das Aussehen der MatrixS läßt sich aus Gleichung (2.57)ablesen:

S =

0 1 0 · · · 00 0 1 · · · 0...

......

. . ....

0 0 0 · · · 1−b0 −b1 −b2 · · · −bn−r−1

. (2.58)

Aufgrund der Form dieser Matrix kann man erkennen, daß derenEigenwerte mit den Nullstellendes Zählerpolynoms der Übertragungsfunktion übereinstimmen.

Beispiel 2.3.2Für die im Anhang A beschriebene Längsdynamik eines Lenkflugkörpers soll im folgenden derrelative Grad, die Normalform und die Nulldynamik bestimmtwerden. Des weiteren wird dasdynamische Verhalten der Nulldynamik untersucht. Die Systemgleichungen lassen sich in derForm

x = f (x) + g(x)u

y = h(x) (2.59)

Page 27: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 27

mit

f (x) =

180π

1Mvsm

Fzf (x1, x3,M) cos(πx1180

)

+ x2180π

My(x1,x3,M)Iyy

x4

−ω2ax3 − 2ζωax4

, g(x) =

000ω2

a

h(x) =1m

Fzf (x1, x3,M) (2.60)

angeben. Hinter den Zuständen, der Ein- und der Ausgangsgröße stehen folgende physikalischeGrößen:

• x1 Anstiegswinkel

• x2 Nickrate

• x3, x4 Zustände der Stellglieddynamik

• u Höhenruderausschlag

• y Normalbeschleunigung.

Die aerodynamische KraftFzf und das MomentMy sind nichtlineare Funktionen der Zuständex1 und x3 sowie der MachzahlM. Diese wird als konstant angenommen.

Fzf = Q(M)SCz(x1, x3,M)

Cz(x1, x3,M) = sign(x1)(az|x1|3 + bz|x1|2 + cz(2−M3

)|x1|) + dzx3

= Czx1(x1,M) + dzx3

My = Q(M)S dCm(x1, x3,M) (2.61)

Cm(x1, x3,M) = sign(x1)(am|x1|3 + bm|x1|2 + cm(−7+8M3

)|x1|) + dmx3

= Cmx1(x1,M) + dmx3

Die physikalischen Hintergründe dieser Gleichungen und der darin vorkommenden Parameterwerden ausführlich im Anhang erläutert.Zur Bestimmung des relativen Grades wird der Ausgang des Systems nach der Zeit differenziert.

y = h(x) =1m

Fzf (x1, x3,M)

y = L f h(x) + Lgh(x)u (2.62)

Rechnet man die in Gleichung (2.62) vorkommenden Lie-Ableitungen aus, so erhält man für

Page 28: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 28

diese

L f h(x) =1m

∂Fzf (x1, x3,M)

∂x1

(

180π

Fzf (x1, x3,M)

Mvsmcos

(πx1

180

)

+ x2

)

+1m

∂Fzf (x1, x3,M)

∂x3x4

Lgh(x) = 0. (2.63)

Da der AusdruckLgh(x) = 0 ist, beeinflußt die Stellgröße nicht die erste Ableitung vony. Eineweitere Differentiation nach der Zeit liefert

y(2) = L2f h(x) + LgL f h(x)u (2.64)

mit

LgL f h(x) =1m

∂Fzf (x1, x3,M)

∂x3ω2

a =1m

Q(M)S dzω2a

L2f h(x) =

1m

∂2Fzf (x1, x3,M)

∂x21

(

180π

Fzf (x1, x3,M)

Mvsmcos

(πx1

180

)

+ x2

)

+

(∂Fzf (x1, x3,M)

∂x1

)2180π

1Mvsm

cos(πx1

180

)

−∂Fzf (x1, x3,M)

∂x1

Fzf (x1, x3,M)

Mvsmsin

(πx1

180

)]

·(

180π

Fzf (x1, x3,M)

Mvsmcos

(πx1

180

)

+ x2

)

+1m

∂Fzf (x1, x3,M)

∂x1

180π

My(x1, x3,M)

Iyy

+1m

∂Fzf (x1, x3,M)

∂x1

180π

∂Fzf (x1, x3,M)

∂x3

1Mvsm

cos(πx1

180

)

x4

+1m

∂Fzf (x1, x3,M)

∂x3

(

−ω2ax3 − 2ζωax4

)

. (2.65)

Das Ableiten der KraftFzf nach dem Zustandx1 erfordert die Differentiation von Signum- undBetragsfunktion. In beiden Fällen ist der Wert der Ableitung für x1 = 0 nicht definiert. DieVoraussetzung genügender Glattheit der Systemgleichungen ist somit verletzt. Der Punktx1 = 0sei zunächst unbeachtet. Auf die Folgen der Unstetigkeit wird später näher eingegangen. Fürx1 , 0 ergeben sich die gesuchten Ableitungen der Kraft wie folgt:

∂Fzf (x1, x3,M)

∂x1= Q(M)S(3az|x1|2 + 2bz|x1| + cz(2−

M3

)

∂Fzf (x1, x3,M)

∂x3= Q(M)S dz

∂2Fzf (x1, x3,M)

∂x21

= Q(M)S sign(x1)(6az|x1| + 2bz). (2.66)

Page 29: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 29

Wie man sieht, ist der AusdruckLgL f h(x) eine Konstante, die ungleich Null ist. Damit wirddie Eingangsgröße nach zweifachem Ableiten der Normalbeschleunigung sichtbar. Folglich istder relative Gradr = 2. Mit dieser Erkenntnis sind die ersten beiden Zustände der Normalformdurch

z1 = y = φ1(x) = h(x) =1m

Fzf (x1, x3,M)

z2 = y = φ2(x) = L f h(x)

=1m

∂Fzf (x1, x3,M)

∂x1

(

180π

Fzf (x1, x3,M)

Mvsmcos

(πx1

180

)

+ x2

)

+1m

∂Fzf (x1, x3,M)

∂x3x4 (2.67)

festgelegt. Es handelt sich dabei um die Normalbeschleunigung und deren Ableitung. Da derLenkflugkörper ein System der Ordnungn = 4 ist, müssen zwei weitere Zustände der Normal-form festgelegt werden. Dabei besitzt man einige Freiheiten. Wie jedoch schon erwähnt wurde,muß die resultierende Transformation lokal invertierbar sein. Des weiteren ist es wünschens-wert, daß es sich bei denn− r noch zu wählenden Zuständen um Originalzustände des Systemshandelt, da dadurch eine bessere physikalische Interpretierbarkeit der Nulldynamik gesichert ist.Die letztenn− r Zustände der Normalform entsprechen natürlich den Zuständen der Nulldyna-mik. Setzt man für den Lenkflugkörper

z3 = φ3(x) = x1

z4 = φ4(x) = x2 (2.68)

an, so hat man nach Abschnitt 2.3 zu prüfen, daß

rang

∂[φ1(x), · · · , φr(x)]T

∂x

= r (2.69)

erfüllt ist. Im jetzigen Fall istx = [x3, x4] und x = [x1, x2]. Für Gleichung (2.69) erhält mandann

rang

∂φ1(x)∂x3

∂φ1(x)∂x4

∂φ2(x)∂x3

∂φ2(x)∂x4

= r

rang

1m

∂Fzf (x1,x3,M)

∂x30

∂φ2(x)∂x3

1m

∂Fzf (x1,x3,M)

∂x3

= r. (2.70)

Der Term 1m

∂Fzf (x1,x3,M)

∂x3= 1

mQ(M)S dz ist eine Konstante, die ungleich Null ist. Folglich istGleichung (2.70) erfüllt und die Transformation lokal invertierbar. Die inverse Transformation

Page 30: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 30

lautet

x1 = z3

x2 = z4

x3 =1dz

(

mz1Q(M)S

−Czx1(z3,M)

)

x4 =1dz

[

mz2Q(M)S

−∂Czx1

(z3,M)

∂z3·

·(

180π

z1

Mvscos

(πz3

180

)

+ z4

)]

. (2.71)

Nicht immer läßt sich eine analytische Lösung für die inverse Transformation wie in diesem Fallangeben. In der Regel wird man mittels numerischer Lösungsverfahren den Zustandsvektorxbei einem gegebenen Vektorz bestimmen. Wie leicht zu überprüfen ist, hätten auchx3 und x4

als Koordinaten der Nulldynamik verwendet werden können. In diesem Fall liegt auch globaleInvertierbarkeit der Transformation vor, jedoch müssen kubische Gleichungen zur Gewinnungder inversen Transformation gelöst werden. Unter Verwendung der Methode von Cardano würdedie analytische Lösung sehr unübersichtlich werden. Dieses Beispiel macht deutlich, wie wichtigdie geschickte Auswahl der Koordinaten der Nulldynamik ist. Eine geeignete Strategie zur Lö-sung dieses Problems existiert leider nicht, so daß sich längeres Probieren nicht vermeiden läßt.Des weiteren zeigt sich, daß das Berechnen der Lie-Ableitungen und der inversen Transformati-on von Hand recht mühselig und fehleranfällig ist. Man ist somit praktisch auf die Unterstützungsymbolischer Mathematikprogramme, wie z.B.M, MPAD oderD, angewiesen. DasZustandsraummodell der Längsdynamik in Normalform kann nun angegeben werden:

z1 = z2

z2 = L2f h(x = Φ−1(z)) + LgL f h(x = Φ−1(z))u

= L2f h(x = Φ−1(z)) +

1m

Q(M)S dzω2au

z3 = x1 =

(

180π

1Mvsm

Fzf (x1, x3,M) cos(πx1

180

)

+ x2

)∣∣∣∣∣∣x=Φ−1

(z)

=180π

z1

Mvscos

(πz3

180

)

+ z4

z4 = x2 =180π

My(x1, x3,M)

Iyy

∣∣∣∣∣∣x=Φ−1

(z)

=180π

Q(M)S dIyy

[

Cmx1(z3,M) +

dm

dz

(

mz1Q(M)S

−Czx1(z3,M)

)]

. (2.72)

Genaugenommen liegt hier die Byrnes-Isidori-Normalform vor, da die Stellgrößeu nicht indie letztenn − r Gleichungen von (2.72) eingeht. Bei Verwendung der Bezeichnungenζ =

Page 31: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 31

[z1, z2]T ,η = [z3, z3]T undα(ζ1, ζ2, η1, η2) = L2f h(x = Φ−1(z)) wird (2.72) zu

ζ1 = ζ2

ζ2 = α(ζ1, ζ2, η1, η2) +1m

Q(M)S dzω2au

η1 =180π

ζ1

Mvscos

(πη1

180

)

+ η2

η2 =180π

Q(M)S dIyy

[

Cmx1(η1,M) +

dm

dz

(

mζ1

Q(M)S−Czx1

(η1,M)

)]

. (2.73)

Die nun erhaltene Beschreibungsform stellt einen Ausgangspunkt für die Inversion der Regel-strecke Lenkflugkörper dar. Es läßt sich aus (2.73) unmittelbar angeben, welche Stellgröße auf-gebracht werden muß, um die gewünschte Normalbeschleunigung yd am Ausgang zu erzeugen.Das Stellgesetz lautet in diesem Fall

ud =ζd

2 − α(ζd1 , ζ

d2 , η1, η2)

1mQ(M)S dzω

2a

. (2.74)

Es ist eine Funktion der gewünschten Normalbeschleunigungyd = ζd1 sowie deren erster und

zweiter Ableitungyd = ζd2 , y

d(2)= ζd

2 und der Zuständeη1 undη2, welche Lösungen der Nulldy-namik

η =

180π

ζd1

Mvscos

(πη1180

)

+ η2

180π

Q(M)S dIyy

[

Cmx1(η1,M) + dm

dz

(mζd

1Q(M)S −Czx1

(η1,M))]

sind. Durch die Anwendung des Stellgesetzes (2.74) wird dieNulldynamik vom Systemausgangaus unbeobachtbar. Zur Untersuchung der Stabilität der Nulldynamik in der Umgebung vonGleichgewichtspunktenze wird diese linearisiert. Das Ergebnis lautet

∆η =∂s(ζ, η)∂η

∣∣∣∣∣∣z=ze

∆η +∂s(ζ, η)∂ζ

∣∣∣∣∣z=ze∆ζ, (2.75)

wobei∆ζ = ζ − ζe,∆η = η − ηe ist.

∂s(ζ, η)∂η

∣∣∣∣∣∣z=ze

=

− ζe1

Mvssin

(πηe

1180

)

1

180π

Q(M)S dIyy

(dCmx1

(η1,M)

dη1− dm

dz

dCzx1(η1,M)

dη1

)∣∣∣∣∣η1=η

e1

0

(2.76)

Die Matrix (2.76) läßt sich beispielsweise durch den stationären Anstiegswinkelηe1 = xe

1 und dieMachzahlM parametrisieren. In diesem Fall ergibt sich die stationäreNormalbeschleunigungζe

1 = ye durch die im Anhang angegebene Formel (A.15). Anhand der Eigenwerteλ1, λ2 derMatrix (2.76) kann nun die Stabilität von (2.73) in der Umgebung der Gleichgewichtspunkteüberprüft werden. Abbildung 2.4 zeigt den Realteil der Eigenwerte in Abhängigkeit vom Ar-beitspunkt.

Page 32: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 32

−20 −10 0 10 20−40

−20

0

20

40

−20 −10 0 10 20−40

−20

0

20

40

−20 −10 0 10 20−40

−20

0

20

40

−20 −10 0 10 20−40

−20

0

20

40

xe1 = α

e in degxe1 = α

e in deg

xe1 = α

e in degxe1 = α

e in deg

ℜ{λ

1},ℜ{λ

2}

ℜ{λ

1},ℜ{λ

2}

ℜ{λ

1},ℜ{λ

2}

ℜ{λ

1},ℜ{λ

2}

M = 1.5 M = 2.0

M = 2.5 M = 3.0

Abbildung 2.4: Realteil der Eigenwerteλ1 (gestrichelte Linie) undλ2 (durchgezogene Linie) derMatrix (2.76) der linearisierten Nulldynamik in Abhängigkeit vom Arbeitspunkt.(xe

1,M), M = 1.5, 2, 2.5, 3

Es ist zu erkennen, daß die Nulldynamik in der Umgebung allerArbeitspunkte instabil ist, dastetsℜ{λ1} > 0 ist. Vergleicht man die im Anhang berechneten Nullstellen der durch Linearisie-rung des Zustandsraummodells (2.60) gewonnenen Übertragungsfunktion mit den Eigenwertender linearisierten Nulldynamik, so stellt man fest, daß diese übereinstimmen. Zur Überprüfungder Stabilität der Nulldynamik an einem Arbeitspunkt ist esfolglich einfacher, zuerst das Origi-nalsystem (2.1) zu linearisieren und das erhaltene System anschließend auf Minimalphasigkeithin zu untersuchen. Sollte dieses minimalphasig sein, so ist die Nulldynamik lokal stabil, an-dernfalls ist sie lokal instabil. Der Beweis dafür wird in [16] geliefert.

Beispiel 2.3.3Betrachtet man das nichtlineare Zustandsraummodell (2.77) des im Anhang B beschriebenenBioreaktors, so erkennt man, daß dieses bereits in Normalform vorliegt.

x1 = x1a(x2) − x1u

x2 = x1a(x2)b(x2) − x2u

y = x1

mit

a(x2) = (1− x2)ex2/Γ

b(x2) = (1+ β)/(1+ β − x2) (2.77)

Page 33: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 33

Der Ausgangy des Systems ist der Systemzustandx1. Dieser ist die Konzentration der Zellenim Reaktortank. Für den ersten Zustand der Normalform folgtsomit z1 = ζ = y = x1. Nacheinmaligem Ableiten der Ausgangsgrößey erscheint die Stellgrößeu, der Reaktorzufluß. Derrelative Grad dieses Systems der Ordnungn = 2 ist somitr = 1. Die Nulldynamik besitzt alsZustand die Konzentration der Nährstoffez2 = η = x2. Das Zustandsraummodell (2.77) läßt sichin der Form

ζ = ζa(η) − ζuη = ζa(η)b(η) − ηuy = ζ (2.78)

darstellen. Laut der im Anhang B.1 verfaßten Regelungsaufgabe soll eine Folgeregelung fürdie Zellkonzentration entworfen werden. Folglich ist man an der Inversion des E/A-Verhaltenszwischen dem Durchflußu und der Zellkonzentrationy = x1 interessiert. Ist der gewünschteVerlauf der Konzentrationζd = yd und deren Ableitungζd = yd gegeben, so ergibt sich aus derersten Zeile von (2.78) die entsprechende nominale Stellgröße

ud =1

ζd

(

ζd − ζda(η))

. (2.79)

Nach dem Einsetzen des Stellgesetzes in (2.78) erhält man als Nulldynamik:

η = ζda(η)b(η) − η

ζd

(

ζd − ζda(η))

η = ζda(η)b(η) + ηa(η) − η

ζdζd. (2.80)

Das Stellgesetz enthält als Argument unter anderem auch denZustand der Nulldynamik. Diesersoll später durch Lösen der Differentialgleichung (2.80) ermittelt werden. Dabei ist es entschei-dend, ob die Nulldynamik stabil oder instabil ist. Für das nichtlineare System (2.80) erster Ord-nung kann die Stabilität in der Umgebung eines Arbeitspunktes leicht geprüft werden. Bei einerpositiven Abweichung vom Arbeitspunkt (η − ηe > 0) muß das System in den Gleichgewichts-punkt zurückgetrieben werden. Dieses ist erfüllt, wenn dieAbleitung η des Systemzustandesnegativ ist. Folglich muß bei einer negativen Abweichung vom stationären Zustand (η − ηe < 0)die Ableitungη positiv sein. Die Nulldynamik ist somit asymptotisch stabil, wenn

η > 0 für η < ηe,

η < 0 für η > ηe undη = 0 für η = ηe

(2.81)

erfüllt ist. Zur Untersuchung des Verhaltens an einem Arbeitspunkt wirdζd = xe1 undζd = xe

1 = 0verwendet. Der zu erzeugende Ausgang ist somit der stationäre Wert der Zellkonzentration aneinem Gleichgewichtspunkt des Systems. Für die Nulldynamik ergibt sich damit folgende Glei-chung:

η = ζea(η)b(η) + ηa(η). (2.82)

Page 34: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.3 Systeminversion und Nulldynamik 34

Wie im Anhang B gezeigt, besitzt der Bioreaktor eine nicht eindeutige statische Inverse. Für einevorgegebene stationäre Zellkonzentration existieren zwei mögliche Werte für die Nährstoffkon-zentration und somit zwei mögliche Arbeitspunkte für die Nulldynamik. Die einer Sollkonzen-trationζd = xe

1 der Zellen zugeordneten Gleichgewichtspunkte der Nulldynamik sind

ηe1,2 = xe

21,2=

1+ β2±

(1+ β)2

4− (1+ β)xe

1.

Laut Spezifikation soll der Reaktor an dem Arbeitspunkt mit der höheren Nährstoffkonzentrationbetrieben werden. Der technisch interessierende Gleichgewichtspunkt der Nulldynamik ist somitηe

1. Um die Stabilität anhand der Aussage (2.81) überprüfen zu können, ist in Abbildung 2.5ηals Funktion vonη für ausgewählte Betriebspunkte dargestellt. Durch die Symbole × und ◦werden die Gleichgewichtspunkte(ηe

1, ηe1 = 0) und (ηe

2, ηe2 = 0) gekennzeichnet. Es ist deutlich

zu erkennen, daß für die Arbeitspunkteηe2 Aussage (2.81) zutrifft. Die Nulldynamik ist in der

Umgebung dieser Punkte somit stabil. Für die Arbeitspunkteηe1 wird Aussage (2.81) jedoch

verletzt.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

η

η

Abbildung 2.5: Stabilitätsuntersuchung der Nulldynamik des Bioreaktors

Page 35: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 35

2.4 Inversion von Systemen mit instabiler Nulldynamik

Im Abschnitt 2.3 wurde gezeigt, daß für nichtminimalphasige Systeme, d.h. für Systeme mit in-stabiler Nulldynamik, das resultierende inverse System instabil ist. Um die interne Stabilität desRegelkreises zu sichern, ist jedoch eine stabile Inverse notwendig. Es existieren nun grundle-gende Ideen, wie man eine stabile, möglicherweise approximative, Inverse einer nichtminimal-phasigen Regelstrecke erhalten kann.

Eine Möglichkeit zum Umgehen des Problems der Nichtminimalphasigkeit ist das Einführeneiner neuer Ausgangsfunktion, bezüglich derer das System minimalphasiges Verhalten aufweist[20, 24, 27, 39, 41]. Um eine approximative Inversion des nichtminimalphasigen Systems an-hand des neuen fiktiven Systemausganges durchführen zu können, muß der Zusammenhangzwischen dem echten und dem neuen Ausgang geklärt werden. In[20, 41] wird dieser Zu-sammenhang über das Konzept statisch äquivalenter Ausgänge hergestellt. Wie später gezeigtwird, gestaltet sich die Inversion bei einem Systemausgang, für den keine Nulldynamik exi-stiert, relativ einfach. Aus diesem Grund wird im Abschnitt2.4.1 untersucht, wann ein solcherSystemausgang existiert und ob über ihn das originale Inversionsproblem gelöst werden kann.

Eine Veränderung der Ausgangsfunktion wird ebenfalls erreicht, wenn ein weiteres dynami-sches System parallel zum Originalsystem geschaltet wird [34]. Als neue Ausgangsfunktionwird die Summe beider Systemausgänge betrachtet. Die Herleitung allgemein gültiger Aussa-gen bezüglich des Zusammenhanges zwischen neuem und echtemSystemausgang ist jedochkaum möglich. Des weiteren ist der in [34] beschriebene Ansatz auf Systeme mit linearer Aus-gangsfunktion beschränkt.

Analog zu linearen Systemen ist eine weitere Idee zur approximativen Inversion nichtminimal-phasiger Systeme, das nichtlineare System in einen minimalphasigen Anteil und einen Allpaß-anteil zu zerlegen. Gegenüber linearen Systemen ist eine solche Faktorisierung bisher nur nä-herungsweise für eine beschränkte Klasse von Systemen möglich [20, 8, 13, 38, 41]. In denAbschnitten 2.4.2 bis 2.4.4 werden drei Verfahren vorgestellt, die eine näherungsweise Bestim-mung eines minimalphasigen Anteils der Regelstrecke erlauben. Als approximative Inverse desnichtminimalphasigen Originalsystems wird letztendlichdie Inverse des erhaltenen minimalpha-sigen Anteils verwendet.

Das Verfahren der exakten stabilen Inversion [6, 7, 15] stellt einen gänzlich anderen Ansatz dar.Über ein Iterationsverfahren wird für die im reduzierten inversen System enthaltene instabileNulldynamik eine nichtkausale stabile Lösung ermittelt. Die Voraussetzung für die Anwendbar-keit dieser Methode ist, daß die Nulldynamik einen hyperbolischen Gleichgewichtspunkt besitzt,d.h. die Linearisierung der Nulldynamik keine Eigenwerte auf der imaginären Achse hat. DasFinden einer stabilen Lösung und somit einer beschränkten nominalen Stellgröße sowie nomi-naler Zustände erfordert eine Beschränkung des Referenzsignals. Zur Ermittlung der gesuchtenGrößen muß theoretisch der gesamte Verlauf des Referenzsignals yd über der Zeit bereits be-kannt sein. Außerdem wird gefordert, daß fürt → −∞ und t → +∞ das vorgegebene Referenz-signal der am Gleichgewichtspunkt vorliegenen Ausgangsgröße entspricht. Da in den meistenFällen eine solche Beschränkung der Referenzsignale nichtzu erfüllen ist und häufig der zu-künftige Verlauf der Sollwerte unbekannt ist, wird auf eineweitere Verfolgung dieses Ansatzes

Page 36: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 36

verzichtet.

2.4.1 Inversion durch Ausnutzung flacher Systemausgänge

Betrachtet man die Herleitung der Normalform, so wird deutlich, daß das konkrete Aussehen derNormalform bzw. der Nulldynamik von der Wahl des Systemausgangesy = h(x) abhängt. EinSystem kann für eine Ausgangsfunktiony = h1(x) minimalphasiges und für eine Ausgangsfunk-tion y = h2(x) nichtminimalphasiges E/A-Verhalten aufweisen. Besitzt das Eingrößensystem beieinem Ausgang keine Nulldynamik, so wird der entsprechendeAusgangflachgenannt. In die-sem Fall ist der relative Gradr gleich der Systemordnungn. Die Koordinatentransformation aufNormalform ist dann vollständig festgelegt, da dien Zustände der Normalform die Ausgangs-größey und deren (n− 1) Ableitungen sind.

ζ = z = Φ(x) =

h(x)L f h(x)...

Ln−2f h(x)

Ln−1f h(x)

=

y

y...

y(n−2)

y(n−1)

(2.83)

Wie in [16] gezeigt wird, stellt diese Transformation einenlokalen Diffeomorphismus dar. DurchAnwendung der Transformation erhält man folgende Normalform:

ζ1 = ζ2

...

ζn−1 = ζn

ζn = Lnf h(x = Φ−1(ζ)) + LgL

n−1f h(x = Φ−1(ζ))u. (2.84)

Zum Erzeugen der gewünschten Ausgangsgrößeyd ist die Stellgröße

ud =1

β(ζd)(ζd

n − α(ζd)) (2.85)

mit α(ζd) = Lnf h(x = Φ−1(ζd)) undβ(ζd) = LgLn−1

f h(x = Φ−1(ζd)) notwendig. Diese ist eine

Funktion der vorgegebenen Ausgangsgrößeζ1 = ζd1 = y

d und deren Ableitungen. Durch Lösendes nichtlinearen Gleichungssystems (2.83) erhält man dieSystemzuständexd = Φ−1(ζd). DieInversion des Systems führt in diesem Fall zur Lösung eines rein algebraischen Problems.Durch die Koordinatentransformation (2.83) und das Stellgesetz (2.85) wird im Falln = r nichtnur das E/A-Verhalten von (2.1), sondern auch der Einfluß der Eingangsgröße auf die Zustands-größen vollständig linearisiert. Dieses erfolgt natürlich nur unter der Annahme, daß die Bedin-gungζ(t0) = ζd(t0) erfüllt ist. Das resultierende Systemverhalten, eine Kette vonn Integratoren,ist in Abbildung 2.6 dargestellt. In der Regel werden die natürlichen Systemausgänge nicht flachsein. Es sei angenommen, daß sich für den realen Ausgang der Regelstrecke nichtminimalpha-siges Verhalten ergibt. Es stellen sich nun folgende Fragen:

Page 37: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 37

∫ ∫ ∫ ydyd(n)yd

Abbildung 2.6: Eingangs-/Zustands-Linearisiertes System

1. Besitzt das zu betrachtende System neben dem realen Ausgang einen fiktiven flachen Aus-gang?

2. Kann das ursprüngliche Inversionsproblem auf den flachenAusgang übertragen werden,wenn er existiert?

Lassen sich diese Fragen mit ja beantworten, so führt dies zueiner wesentlichen Vereinfachungdes Inversionsproblems. Wie bereits dargestellt, wird beieinen sogenannten flachen Ausgang(engl.: flat output)die Inversion zu einem rein algebraischen Problem. Die Stellgrößeud unddie Zuständexd sind Funktionen der geforderten Ausgangsgröße und deren Ableitungen. DasErgebnis ist somit eine stabile Systeminverse für den flachen Ausgang.Die fiktive Ausgangsfunktion wird im folgenden mity∗(t) = λ(x(t)) bezeichnet.

2.4.1.1 Ansätze zur Übertragung des Inversionsproblems au f den flachen Ausgang

Eine exakte Übertragung des ursprünglichen Inversionsproblems auf den neuen flachen Ausgangwürde bedeuten, daß eine eineindeutige Funktion existiert, die den originalen Systemausgangyauf den fiktiveny∗ oder umgekehrt abbildet. Bei der eineindeutigen Abbildungeines Systemaus-ganges auf einen neuen Ausgang bleiben die strukturellen und dynamischen Eigenschaften desSystems jedoch unverändert. Es existiert somit niemals eine eineindeutige Abbildung zwischenzwei Systemausgängen, für die ein System unterschiedlicheDynamik und Struktur aufweist.Folglich ist nur eine näherungsweise Übertragung der ursprünglichen Inversionsaufgabe auf denflachen Ausgang möglich. Es bleibt festzuhalten, daß für dieInversion des flachen AusgangesnAbleitungen des vorgegebenen Verlaufesy∗d existieren und beschränkt sein müssen.

Einschränkung der Klasse der reproduzierbaren Ausgangsgr ößentrajektorien

Zur Beurteilung der Frage, ob und wie das Inversionsproblemauf den flachen Ausgang über-tragen werden kann, bietet es sich an, den wahren Systemausgangy(t) = h(x(t)) als Funktiondes fiktiven Systemausgangesy∗(t) = λ(x(t)) und dessen Ableitungen darzustellen. Dieses wird

Page 38: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 38

erreicht, indem die Koordinatentransformation

ζ∗ = Φ(x) =

λ(x)L fλ(x)

...

Ln−2f λ(x)

Ln−1f λ(x)

=

y∗

y∗

...

y∗(n−2)

y∗(n−1)

(2.86)

auf das Zustandsraummodell (2.1) angewendet wird. Das Ergebnis lautet:

ζ∗1 = ζ∗2...

ζ∗n−1 = ζ∗nζ∗n = Ln

fλ(x = Φ−1(ζ∗)) + LgLn−1f λ(x = Φ−1(ζ∗))u

y = h(x = Φ−1(ζ∗)). (2.87)

Die Zuständeζ∗1 bisζ∗n sind der flache Ausgangy∗ und dessenn−1 Ableitungen. Da angenommenwird, daß das System (2.1) bzw. (2.87) den relativen Gradr besitzt, kann der Ausgangy nur eineFunktion der Koordinatenζ∗1 bis ζ∗n−r+1 sein:

y = h(x = Φ−1(ζ∗)) = h(ζ∗1, ζ∗2, · · · , ζ∗n−r+1) = h(y∗, y∗, · · · , y∗(n−r)

). (2.88)

Würden mehr Ableitungen des flachen Ausganges Argumente derskalaren Funktionh sein, sowürde schon bei weniger alsr Ableitungen des Ausgangesy die Stellgrößeu explizit erscheinen.Anhand der Gleichung (2.88) kann nun untersucht werden, ob es eine Klasse von Trajektorieny∗ gibt, die zu einer Abbildung

y ≈ k(y∗) (2.89)

führt. In der Regel wird dies durch die Annahme erreicht, daßdie Beträge der Ableitungen desflachen Ausganges klein sind. Für eine sich genügend langsamändernde Referenztrajektorieyd(t) ∈ Cn−1 kann dann mittels der inversen Abbildung von (2.89) die entsprechende Referenz-trajektoriey∗d des flachen Ausganges ermittelt werden:

y∗d = k−1(yd). (2.90)

„Genügend langsam” bedeutet dabei, daß der Betrag der Ableitungen eines Signals zu jedemZeitpunkt genügend klein ist. Nachdem der Verlaufy∗d(t) ermittelt ist, kann die Inversion desSystems (2.1) approximativ durch die Inversion des Systems

˙x(t) = f (x(t)) + g(x)u

y∗(t) = λ(x), (2.91)

welches den flachen Ausgangy∗ besitzt, durchgeführt werden. Wendet man die durch Inversionerhaltene Stellgröße ˆud auf das Originalsystem (2.1) mit der Initialisierungx(0) = x(0) an, so istbei hinreichend langsamer Änderung der Vorgabeyd(t) die Abweichung des Systemausgangesy(t) von dieser gering.

Page 39: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 39

Beispiel 2.4.1Es sei das lineare Zustandsraummodell

x1 = x2

x2 = −x1 − 2x2 + u

y = h(x) = −0.5x1 + x2 (2.92)

gegeben. Die entsprechende Übertragungsfunktion lautet:

G(s) =s− 0.5

s2 + 2s+ 1. (2.93)

Für die Ausgangsfunktiony = h(x) besitzt das System den relativen Gradr = 1 und eineinstabile Nulldynamik. Die Übertragungsfunktion weist eine instabile Nullstelle beis= 0.5 auf.Ein flacher Systemausgang wäre beispielsweise

y∗ = λ(x) = x1. (2.94)

Die ÜbertragungsfunktionG∗(s) bei Verwendung des flachen Ausganges ist dann:

G∗(s) =1

s2 + 2s+ 1. (2.95)

Es soll nun der Ausgangy als Funktion des flachen Ausganges und deres Ableitungen dargestelltwerden. Wendet man die Koordinatentransformationζ∗1 = y

∗ = x1, ζ∗2 = y

∗ = x2 auf (2.92) an,so ergibt sich:

ζ∗1 = ζ∗2ζ∗2 = −ζ∗1 − 2ζ∗2 + u

y = h(ζ∗) = −0.5ζ∗1 + ζ∗2 = −0.5y∗ + y∗. (2.96)

Unter der Annahme, daß der Betrag der Ableitungy∗ sehr klein ist, gilt

y ≈ k(y∗) = −0.5y∗.

Für langsame Vorgabenyd(t) kann nun eine approximative Inversion des Systems (2.92) durchdie Inversion des Systems

˙x1 = x2

˙x2 = −x1 − 2x2 + u

y∗ = λ(x) = x1. (2.97)

erreicht werden. Die Eingangs- und Ausgangsgröße sowie dieZustände der verwendeten mi-nimalphasigen Approximation werden zur Unterscheidung von den Größen des nichtminimal-phasigen Originalsystems, wenn nötig, nachfolgend immer durch das hochgestellte Zeichenˆgekennzeichnet. Wählt man eine Referenztrajektorieyd(t) mit ‖yd(t)‖∞ < δ aus und legt den ge-forderten Verlauf des flachen Ausganges durchy∗d(t) = k−1(yd(t)) = −2yd(t) fest, so ergibt sich

Page 40: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 40

bei Anwendung der durch Inversion erhaltenen Stellgrößeud auf das System (2.1) für die maxi-male Abweichung der Trajektorieny(t) undyd(t) folgende Beschränkung:‖y(t) − yd(t)‖∞ < 2δ.Man erhält dieses Ergebnis, indem man in der letzten Zeile von (2.96) den flachen Ausgangy∗

und dessen Ableitungy∗ durch die Vorgabey∗d = −2yd und deren Ableitungy∗d = −2yd ersetzt:

y(t) = −0.5y∗(t) + y∗(t) = yd(t) − 2yd(t)

y(t) − yd(t) = −2yd(t)

‖y(t) − yd(t)‖∞ = 2‖yd(t)‖∞ < 2δ. (2.98)

Eine kleinere positive reelle Zahlδ führt zu einer besseren approximativen Inversion. Gleichzei-tig wird jedoch die Klasse der möglichen Referenzsignale eingeschränkt. Es können nur nochlangsame Verläufe vorgegeben werden, was zu einer Verringerung der Güte der Folgeregelungführt.

Abbildung 2.7 zeigt das Ergebnis der approximativen Inversion für zwei unterschiedlich schnelleVorgabenyd(t). Die Abweichung von der Referenztrajektorie ist, wie erwartet, für den langsa-meren Verlaufyd(t) kleiner. Da die Regelstrecke stabil ist, war bei der Simulation kein Reglernotwendig.

0 5 10 15 20 25 30−2

−1

0

1

2

3

0 5 10 15 20 25 30−2

−1

0

1

2

3

t

yd(t

),y(t

)y

d(t

),y(t

)

Abbildung 2.7: Approximative Inversion des Systems (2.92)für zwei unterschiedlich schnelleVorgabenyd(t). Der langsamere Verlauf führt zu einem kleineren Inversions-fehler (untere Abbildung). Der Ausgang der Regelstreckey(t) (durchgezogeneLinie) weicht in diesem Fall weniger von der Vorgabeyd(t) (gestrichelte Linie)ab.

Page 41: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 41

Unmittelbare Nähe von wahrem und flachem Systemausgang

Liegen die Trajektorien von wahrem und flachem Systemausgang in unmittelbarer Nähe, sokann die Inversionsaufgabe auf den flachen Ausgang übertragen werden. Als Beispiel sei einmobiler Roboter mit zwei Achsen betrachtet, bei dem diex− und y−Position geregelt werdensoll. Nur die Vorderachse ist beweglich gelagert. Als körperfester Punkt, für den man die Bahndes Roboters festlegt, würde sich die Mitte der Hinterachseanbieten, da diex− undy−Positiondieses Punktes flache Ausgänge darstellen [39]. Die Inversion und die damit verbundene Ermitt-lung der nominalen Stellgröße gestaltet sich dann relativ einfach. Will man den mobilen Roboterrückwärts an eine Laderampe fahren, so erscheint diese Wahldes Punktes auch natürlich. Ist derRoboter vorwärts durch eine Tür zu manövrieren, so wäre ein Referenzpunkt an der Front desFahrzeuges besser. Diex− undy−Position eines solchen Punktes sind jedoch keine flachen Aus-gänge. Aufgrund der Geometrie des Roboters besteht eine feste Lagebeziehung zwischen demPunkt mit den flachen Ausgängen und dem Punkt an der Front des mobilen Roboters. Ist derAbstand beider Punkte klein, so kann der Punkt auf der Hinterachse auf der für den Punkt an derFront des Roboters vorgegebenen Bahn geführt werden. Die Position des Punktes an der Frontdes Roboters wird mit einem durch die Geometrie des Robotersbegrenzten Fehler der vorgege-benen Bahn folgen. Die Ausgänge beider Punkte befinden sich praktisch in unmittelbarer Nähe,wenn der Abstand der Punkte gering ist.Mathematisch läßt sich für Eingrößensysteme der Fakt der unmittelbaren Nähe der Systemaus-gänge wie folgt beschreiben: Es wird angenommen, daß der ursprüngliche Ausgangy als Sum-me des flachen Ausganges und einer skalaren Funktion, die vonden originalen Systemzuständenabhängt, dargestellt werden kann:

y(t) = y∗(t) + l(x(t)). (2.99)

Der Betrag der skalaren Funktionl(x) läßt sich durch eine kleine obere Schranke‖l(x(t))‖∞ < δ

abschätzen. In diesem Fall liegt die Trajektorie des wahrenSystemausganges in einem Schlauchy∗(t) − δ < y(t) < y∗(t) + δ. Dieser Sachverhalt ist in Abbildung 2.8 wiedergegeben. Ist δ ge-nügend klein, so kann das ursprüngliche Inversionsproblemauf den neuen Ausgang übertragenwerden. Setzt man die Referenztrajektorieny∗d(t) undyd(t) gleich, so ist die maximal möglicheAbweichung des Ausgangesy(t) von seiner Vorgabe‖y(t) − yd(t)‖∞ < δ. Die Voraussetzung fürden letzten Schritt ist, daßy∗d(t) = yd(t) ∈ Cn−1 gilt. In der Mechanik existieren zahlreiche Bei-spiele, die flache Ausgänge besitzen und bei denen die Annahme (2.99) zutrifft. Da es sich beiden meisten in der Literatur beschriebenen Systemen um Mehrgrößensysteme handelt, soll einedetaillierte Darstellung hier nicht gegeben werden. Dazu kommt, daß die Begriffe Nulldynamikund flacher Ausgang für Mehrgrößensysteme etwas anders zu interpretieren sind. Ein Mehrgrö-ßensystem wird differentiell flach genannt, wenn man eine Anzahl von Ausgängen (gleich derAnzahl der Eingänge) finden kann, so daß alle Zustände und Stellgrößen von diesen Ausgängenund deren Ableitungen aus ohne Integration bestimmt werdenkönnen. Hat das System also dieZuständex ∈ Rn und die Eingangsgrößenu ∈ Rm, dann ist das System differential flach, wennman Ausgängey ∈ Rm finden kann in der Form

y = y(x, u, u, · · · , u(p)), (2.100)

Page 42: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 42

t

y∗(t) + δ

y∗(t) − δ

y∗(t) = y∗d(t) = yd(t)

y(t)

Abbildung 2.8: Trajektorien des originalen und fiktiven flachen Systemausganges unter der An-nahmey(t) = y∗(t) + l(x(t)) und‖l(x)‖∞ < δ

so daß

x = x(y, y, · · · , y(q))

u = u(y, y, · · · , y(q)) (2.101)

gilt. Es ist zu erkennen, daß im Ausgangsraum geplante Trajektorien direkt in den Eingangsraumabgebildet werden können. Die Inversion ist somit wie im Eingrößenfall ein rein algebraischesProblem. Die Theorie der differentiellen Flachheit wird ausführlich in [39] behandelt.Einen„Katalog” mechanischer Systeme, die differential flach sind und deren Invertierbarkeit dadurchverbessert wird, findet man in [27]. Nachfolgend wird ein Beispiel für ein differential flachesSystem vorgestellt, das [24] entnommen ist. Es handelt sichdabei um ein senkrecht startendesund landendes Flugzeug. Die Systemgleichungen dieser Regelstrecke gleichen denen des in [39]beschriebenen Modells einer Schubvektorsteuerung.

Beispiel 2.4.2Es wird das vereinfachte Modell eines senkrecht startendenund landenden Flugzeuges betrach-tet. Die Frontansicht des Flugzeuges ist in Abbildung 2.9 dargestellt. Die Koordinatensystemeund deren Bezeichnungen entsprechen den in der Flugregelung gebräuchlichen Koordinaten-systemen (y − z : erdlotfestes Koordinatensystem,y f − zf : flugzeugkörperfestes Koordina-tensystem, siehe auch A). Die Regelungsaufgabe besteht darin, den MasseschwerpunktPm des

Page 43: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 43

Flugzeuges auf einer vorgegebenen Trajektorie in derz− y-Ebene zu führen. Die Ausgangsgrö-ßen sind somit diez− undy−Position des Masseschwerpunktes. Stellgrößen sind die SchubkraftT und das resultierende RollmomentM, welches durch die KräfteF1 = F und F2 = F erzeugtwird. Beide Kräfte sind flugzeugkörperfest. Der Schnittpunkt der Wirkungslinien befindet sichauf derzf -Achse. Die Bewegungsgleichungen des Flugzeuges lauten unter Vernachlässigung

y

z

zf

y f

T

F1

F2

Pm

Pc

φ

mg

δ

δ

Abbildung 2.9: Senkrecht startendes und landendes Flugzeug

aerodynamischer Kräfte:

my = T sinφ − 2F sinδ cosφ

mz = −T cosφ +mg − 2F sinδ sinφ

Jφ = 2lF cosδ, (2.102)

wobei m die Masse,J das Trägheitsmoment,g die Erdbeschleunigung undl der Abstand derAngriffspunkte der KräfteF1, F2 vom Masseschwerpunkt ist. Das resultierende Rollmoment ist

M = 2lF cosδ. (2.103)

Page 44: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 44

Gleichung (2.102) läßt sich in der Form

my = T sinφ − εM cosφ

mz = −T cosφ − εM sinφ +mg

Jφ = M (2.104)

mit

ε =tanδ

l(2.105)

darstellen. Der Betrag der Größeεwird klein angenommen, da der Winkelδ sehr klein ist. Durchden Betrag vonε wird die Kopplung zwischen dem Rollmoment und den seitlichen Beschleuni-gungen des Flugzeuges beschrieben. Ein positives Rollmoment erzeugt eine Beschleunigung desFlugzeuges nach rechts oben. In Gleichung (2.104) besteht bereits ein funktioneller Zusammen-hang zwischen den Ableitungen der Ausgangsgrößen und den Stellgrößen. Löst man die ersteund zweite Zeile nach den Systemeingängen auf, so sindM undT Funktionen der Beschleuni-gungenz und y und des Zustandesφ. Setzt man die erhaltene Funktion für das RollmomentMin die letzte Zeile von (2.104) ein, so erhält man die Nulldynamik des Systems:

Jφ +mεy cosφ +

zsinφ − mεg sinφ = 0. (2.106)

Zur Bestimmung der Stellgrößen ist die Integration der Nulldynamik erforderlich. Für den Ar-beitspunktφ = 0, φ = 0 ist die Nulldynamik jedoch instabil. In [24] wurde nun untersucht, wiesich Eigenschaften der Nulldynamik bei der Verwendung anderer Systemausgänge verändern.Als neue Systemausgänge wurden diey− und z−Position von verschiedenen flugzeugkörper-festen Punkten verwendet. Es zeigte sich, daß ein körperfester PunktPc oberhalb des Masse-schwerpunktesPm existiert, für den keine Nulldynamik existiert. Der Punkt liegt dabei auf derzf Achse und hat den AbstandεJ

m vom Masseschwerpunkt. Die Lage des entsprechenden kör-perfesten PunktesPc ist in Abbildung 2.9 eingetragen. Die Position des PunktesPc läßt sich inBezug zum Massenschwerpunkt in flugzeugkörperfesten Koordinaten wie folgt ausdrücken:

y∗f = y f

z∗f = zf −εJm. (2.107)

Zur Kennzeichnung der flachen Ausgänge und zur Unterscheidung von der Position des Masse-schwerpunktes wird das hochgestellte Zeichen∗ verwendet. In erdlotfesten Koordinaten ist diePosition vonPc in Bezug zum Masseschwerpunkt:

y∗ = y +εJm

sinφ

z∗ = z− εJm

cosφ. (2.108)

Daß keine Nulldynamik für den PunktPc existiert, läßt sich überprüfen, indem manz = z∗ +εJm cosφ undy = y∗ − εJ

m sinφ in (2.106) einsetzt. Das Ergebnis lautet

y∗ cosφ + z∗ sinφ − g sinφ = 0. (2.109)

Page 45: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 45

Der Winkelφ läßt sich nun direkt aus den Ableitungen der neuen flachen Ausgangsgrößen be-rechnen. Die StellgrößenT undM erhält man anschließend aus den Bewegungsgleichungen desSystems mit den flachen Ausgängen. Die Übertragung des Inversionsproblems auf die neuenAusgängey∗ undz∗ mittels (2.108) ist nicht exakt möglich, da der Verlauf des Zustandesφ nichtbekannt ist, sondern ermittelt werden soll. Eine approximative Inversion ist jedoch durchführbar,wenn der PunktPc nicht weit vom MasseschwerpunktPm entfernt ist. Werden Solltrajektorienfür einen solchen Punkt vorgegeben, so liegt die Trajektorie des Masseschwerpunktes natür-lich in der Nähe dieser Vorgaben. Bei einer geringen Kopplung zwischen dem Rollmoment undden seitlichen Beschleunigungen ist die Entfernung der beiden Punkte klein genug, so daß eineapproximative Inversion zulässig sein sollte. Wird die Referenztrajektorie(yd, zd) des Masse-schwerpunktes verwendet, so kann unter der Annahmecosφ ≈ 1 und sinφ ≈ 0 für den PunktPc die Referenztrajektorie(y∗d = yd, z∗d = zd − εJ

m ) festgelegt werden. Führt man die Inversiondurch und ermittelt die nominalen GrößenTd, Md und φd, dann ergibt sich die resultierendeTrajektorie des Masseschwerpunktes durch:

y(t) = yd(t)︸︷︷︸

y∗d(t)

−εJm

sinφd(t)

z(t) = zd(t) − εJm

︸ ︷︷ ︸

z∗d(t)

+εJm

cosφd(t). (2.110)

Die Abweichung der Position des Massepunktes von der vorgegebenen Bahn(yd, zd) ist um sokleiner, desto kleinerεJ

m ist.

Bestimmung der Vorgabe des flachen Ausganges durch Minimier ung einesGütefunktionals

Eine weitere Idee für die Übertragung des Inversionsproblems auf den flachen Ausgag ist folgen-de: Es wird der spezielle Fall betrachtet, bei dem die Referenztrajektorieyd(t) im Zeitintervall[t1, t2] den Übergang des Systems von einem stationären Arbeitspunkt yd(t1) = h(xe

1) zu einemstationären Arbeitspunktyd(t2) = h(xe

2) beschreibt. Die Menge aller Arbeitspunkte des Systems

x = f (x) + g(x)u

seiE =

{

(x, u) ∈ Rn+1| f (x) + g(x)u = 0)}

.

Ein Arbeitspunktxe ∈ E ist unabhängig vom Systemausgang. Es lassen sich somit zu den Zeit-punktent1 und t2 eindeutige Vorgabeny∗d(t1) = λ(xe

1) undy∗d(t2) = λ(xe2) für den fiktiven Aus-

gang angeben. Ist der flache Ausgangy∗(t) des Systems gleichλ(xe) und sind die Ableitungenvony∗(t) Null, so ergibt sich für die Zustände des Systemsx(t) = xe. Da 2.86 einen lokalen Dif-feomorphismus darstellt, existiert, wenn auch nur lokal, zu jedem Vektor [y∗, y∗, · · · , y∗(n−1)]T

genau ein Zustandsvektorx. An den stationären Arbeitspunkten entspricht der wahre Ausgangdes Systems somit der Vorgabeyd = h(xe). Gibt man für die Referenztrajektoriey∗d(t) einen

Page 46: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 46

Verlauf an, der das System vom stationären Zustandxe1 in den stationären Zustandxe

2 überführt,so ist darauf zu achten, daßy∗d(t) ∈ Cn−1 gelten muß. Führt man die Inversion für den flachenAusgang anschließend durch, so erhält man folgendes Ergebnis (siehe Abbildung 2.10):

• Zu den Zeitpunktent1 undt2 befindet sich das System an stationären Arbeitspunkten. DieVorgaben für den wahren und den flachen Systemausgang werdenerfüllt.

• Außerhalb der Gleichgewichtspunkte weicht der Verlauf derAusgangsgrößey(t) von derVorgabeyd(t) ab.

Van Nieuwstadt [39] schlägt vor, die Freiheiten bei der Wahlder Trajektoriey∗d(t) dafür zunutzen, daß die Abweichung der Trajektorieny(t) undyd(t), die durch das Gütefunktional

J =∫ t2

t=t1‖y(t) − yd(t)‖2dt (2.111)

beschrieben ist, minimiert wird. Die Ermittlung der Referenztrajektoriey∗d(t) für den fiktivenAusgang erfolgt dann durch die Lösung des folgenden nichtlinearen Minimierungsproblems mitBeschränkungen:

y∗d(t) = arg miny∗d(t)∈Cn−1,t=[t1,t2]

J

y∗d(t1) = λ(xe1)

y∗d(t2) = λ(xe2)

y∗d(t) ∈ Cn−1. (2.112)

In das Gütefunktional (2.111) kann weiterhin ein Anteil aufgenommen werden, der einen zugroßen Stellaufwand bestraft [39]. Der durch van Nieuwstadt beschriebene Ansatz besitzt fol-gende Nachteile:

1. Der zukünftige gewünschte Verlaufyd(t) der Ausgangsgrößey(t) muß bekannt sein odergeschätzt werden.

2. Das Minimierungsproblem (2.112) ist ein nichtkonvexes nichtlineares Minimierungspro-blem. Die Auswahl eines geeigneten Optimierungsverfahrens, das die Konvergenz gegenein globales Minimum garantiert, ist schwierig.

Die Nähe dieses Verfahrens zur prädiktiven Regelung ist deutlich sichtbar.

2.4.1.2 Existenzbedingung für einen flachen Ausgang

Nachdem mögliche Ansätze für die Übertragung des Inversionsproblems auf den flachen Aus-gang vorgestellt wurden, soll im folgenden die Frage nach der Existenz eines flachen Ausgangesgeklärt werden.Soll der relative Grad des Systems für den neuen Ausgang gleich der Systemordnung sein, so

Page 47: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 47

t

y∗(t) = y∗d(t)

yd(t)

y(t)yd = h(xe1)

y∗d = λ(xe1)

yd = h(xe2)

y∗d = λ(xe2)

t1 t2

Abbildung 2.10: Übertragung der Inversionsaufgabe auf denflachen Ausgang

muß nach der Definition des relativen Grades in einer Umgebung Dx ⊂ Rn des Punktesxe

folgendes erfüllt sein:

LgLkfλ(x) = 0, für k < n− 1 (2.113a)

LgLn−1f λ(x) , 0. (2.113b)

Durch (2.113) wird ein System partieller Differentialgleichungen höherer Ordnung beschrieben.Die unbekannte Funktionλ(x) wird dabein mal differenziert. Die Bedingung (2.113b) schließtdie triviale Lösungλ(x) = 0 aus. Ein flacher Ausgang des Systems (2.1) ist folglich die Lösungdes Gleichungssystems (2.113a), wobei (2.113b) erfüllt sein muß. Dem Vorgehen in [16] ent-sprechend, wird untersucht, wann eine Lösungλ(x) existiert.In einem ersten Schritt wird (2.113) in ein einfacheres System von partiellen Differentialglei-chungen erster Ordnung fürλ(x) überführt. Anschließend kann mittels des Theorems von Fro-benius die notwendige und hinreichende Bedingung für die Existenz einer Lösung angegebenwerden. Um den ersten Schritt durchführen zu können, ist zunächst die Einführung eines neuenOperators, die Lie-Klammer, notwendig.

Definition 2.4.1 (Lie-Klammer)Die Lie-Klammer zweier Vektorfunktionenf (x) undg(x) ist definiert durch

[ f , g](x) = adf g(x) =∂g

∂xf (x) − ∂ f

∂xg(x),

wobei ∂g∂x und ∂ f

∂x Jakobi-Matrizen darstellen. Das Ergebnis der Lie-Klammer-Operation ist wie-

Page 48: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 48

der eine Vektorfunktion. Folglich kann die Operation rekursiv angewendet werden, und es gilt

ad0f g(x) = g(x)

adf g(x) = [ f , g](x)

ad2f g(x) = [ f , adf g](x)

...

adkf g(x) = [ f , adk−1

f g](x).

Die Lie-Klammer besitzt folgende Eigenschaften:

• Jakobi-Identität:L[ f ,g]λ(x) = L f Lgλ(x) − LgL fλ(x),

• Schiefsymmetrie: [f , g](x) = −[g, f ](x).

Beispiel 2.4.3Es sind die Vektorfelderf undg gegeben:

f (x) =

(

x1a(x2)x1a(x2)b(x2)

)

, g(x) =

(

−x1

−x2

)

a(x2) = (1− x2)ex2/Γ

b(x2) = (1+ β)/(1+ β − x2). (2.114)

Die Berechnung der Lie-Klammer[f , g

](x) der gegebenen Vektorfelder liefert folgendes Ergeb-

nis:

[f , g

](x) = adf g(x) =

∂g

∂xf (x) − ∂ f

∂xg(x)

=

(

−1 00 −1

) (

x1a(x2)x1a(x2)b(x2)

)

a(x2) x1da(x2)

dx2

a(x2)b(x2) x1da(x2)b(x2)

dx2

(

−x1

−x2

)

=

x1x2da(x2)

dx2

x1x2da(x2)b(x2)

dx2

mit

da(x2)dx2

=1Γ

ex2Γ (1− Γ − x2)

da(x2)b(x2)dx2

=1Γ

ex2Γ (1− Γ − x2)

1+ β1+ β − x2

.

Es läßt sich nun zeigen, daß die Bedingung (2.113) als ein System von einfachen Lie-Ableitungender skalaren Funktionλ(x) und einigen rekursiven Lie-Klammern der Vektorfunktionen f (x)undg(x) dargestellt werden kann. Aus der Gleichung

L[ f ,g]λ(x) = L f Lgλ(x) − LgL fλ(x)

Page 49: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 49

und der BedingungLgλ(x) = 0 folgt, daß die beiden Bedingungen

L[ f ,g]λ(x) = 0 undLgL fλ(x) = 0

äquivalent sind. Diese Tatsache und die Beziehung

Lad2f gλ(x) = L[ f ,adf g]λ(x) = L f Ladf gλ(x) − Ladf gL fλ(x)

nutzend, ergibt sich, daß fürLgλ(x) = LgL fλ(x) = 0 die Bedingungen

Lad2f gλ(x) = 0 undLgL

2f λ(x) = 0

übereinstimmen. Führt man diese Überlegungen weiter fort,so erkennt man, daß letztendlichdie Bedingungen (2.113a) und (2.113b) den Bedingungen

Lgλ(x) = Ladf gλ(x) = Lad2f gλ(x) = · · · = Ladn−2

f gλ(x) = 0 (2.115a)

undLadn−1

f gλ(x) , 0 (2.115b)

entsprechen.

In Erinnerung an die Definition der Lie-Ableitung kann die Bedingung (2.115a) in den folgendenFormen dargestellt werden:

∂λ(x)∂x

(

g(x) adf g(x) · · · adn−2f g(x)

)

= 0T ,

∂λ(x)∂x

adif g(x) = 0, i = 1, · · · , n− 2. (2.116)

Es ist zu erkennen, daß es sich dabei um partielle homogene Differentialgleichungen erster Ord-nung fürλ(x) handelt. Die Bedingung für die Lösung solcher Differentialgleichungen wird durchdas Theorem von Frobenius angegeben. Bevor dieses Theorem angewandt werden kann, sind ei-nige Definitionen notwendig.

Definition 2.4.2 (Distribution)Es seienf1, f2, · · · , fk Vektorfelder aufD ⊂ Rn. Für einen festen Punktx ∈ D sindf1(x), f2(x), · · · , fk(x) Vektoren inRn und

∆(x) = span{ f1(x), f2(x), · · · , fk(x)}

ist ein Unterraum vonRn. Zu jedem Punktx ∈ D existiert ein Unterraum∆(x). Die Distribution∆ ist die Gesamtheit der Vektorräume∆(x) für alle x ∈ D und wird wie folgt beschrieben:

∆ = span{ f 1, f2, · · · , fk}.

Die Dimension von∆(x), welche wie folgt definiert ist:

dim(∆(x)) = rang(f 1(x), f2(x), · · · , fk(x)),

Page 50: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 50

kann in Abhängigkeit vonx variieren. Istdim(∆(x)) = k unabhängig vonx, d.h. die Vektorenf1(x), f2(x), · · · , fk(x) sind linear unabhängig für allex ∈ D, dann wird die Distribution∆nichtsingulär genannt. Aus der Glattheit der Vektorfelderfolgt, daß jedesg ∈ ∆ durch

g(x) =k∑

i=1

ci(x) f i(x),

dargestellt werden kann, wobeici(x) glatte skalare Funktionen sind.

Es ist erkennbar, daß die in Gleichung (2.116) vorkommendenVektorfunktionen eine Distribu-tion erzeugen. Diese sei im folgenden durchD gekennzeichnet:

D = span{g, adf g, · · · , adn−2f g}. (2.117)

Eine wichtige Eigenschaft einer Distribution ist die Involutivität.

Definition 2.4.3 (Involutive Distribution)Eine Distribution wird involutiv genannt, wenn folgendes gilt:

g1 ∈ ∆ undg2 ∈ ∆⇒ span{g1, g2} ∈ ∆.

Ist∆ eine nichtsinguläre Distribution aufD, erzeugt durch die Vektorfelderf1, f2, · · · , fk, dannist ∆ involutiv, wenn und nur wenn

[ f i , f j ] ∈ ∆, ∀ 1 ≤ i, j ≤ k (2.118)

gilt.

Anders ausgedrückt bedeutet die Involutivität einer nichtsingulären Distribution∆, die durch dieVektorfelder f1, f2, · · · , fk erzeugt wurde, daß sich die Lie-Klammer zweier beliebiger Vektor-felder der Distribution durch eine Linearkombination der gesamten Vektorfelderf1, f2, · · · , fkdarstellen läßt:

[ f i(x), f j(x)] =k∑

l=1

αi jk (x) f l(x), ∀ 1 ≤ i, j ≤ k. (2.119)

Dieses ist gleichzusetzen mit der Tatsache, daß die Matrizen

( f 1(x), f 2(x), · · · , fk(x), [ f i , f j](x)), 1 ≤ i, j ≤ k (2.120)

für alle x ∈ D den Rangk haben. Die letzte Formulierung der Bedingung (2.118) eignet sichbesonders zum Test auf Involutivität.

An einem Beispiel, das [19] entnommen ist, soll der Umgang mit den neuen Begriffen verdeut-licht werden.

Page 51: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 51

Beispiel 2.4.4Es sei das GebietD = {x ∈ R3|x2

1 + x23 , 0} und die Distribution∆ = span{ f 1, f2} gegeben. Die

Vektorfelder f1 und f2 sind:

f1 =

2x3

−10

, f2 =

−x1

−2x2

x3

Die Vektoren f 1(x) und f2(x) sind für allex ∈ D linear unabhängig, folglich istdim(∆(x)) = 2für alle x ∈ D. Es handelt sich somit um eine nichtsinguläre Distribution. Zur Untersuchungder Involutivität von∆ = span{ f 1, f2} werden als erstes alle Lie-Klammen berechnet, die sichaus zwei verschiedenen Vektorfeldern der Distribution bilden lassen. Die Lie-Klammer zweiergleicher Vektorfelder ist immer ein Nullvektor.

[ f 1, f2] =∂ f2

∂xf 1 −

∂ f1

∂xf2 =

−4x3

20

[f 2, f1

]= −[ f 1, f2] (2.121)

Nun ist der Rang der Matrizen (2.120) zu berechnen, nachdem alle in den Matrizen vorkommen-den Spaltenvektoren bekannt sind. Das Ergebnis lautet für alle x ∈ D:

rang(f 1(x), f2(x), [ f1, f2](x)) = rang

2x3 −x1 −4x3

−1 −2x1 20 x3 0

= 2

rang(f 1(x), f2(x), [ f2, f1](x)) = rang(f 1(x), f2(x), [ f 1, f 2](x)). (2.122)

Die Matrizen mit den Lie-Klammern zweier gleicher Vektorfunktionen besitzen natürlich denRangk = dim(∆(x)) = 2. Da der Rang aller Matrizen somitk = 2 ist, liegt hier eine involutiveDistribution vor.

Die Orthogonalität zweier Distributionen ist vergleichbar mit der Orthogonalität zweier Vektor-unterräume.

Definition 2.4.4 (Orthogonales Komplement einer Distribution)Es sei eine Distribution∆ gegeben. Das orthogonale Komplement∆⊥ der Distribution∆ ist wiefolgt definiert:

∆⊥ = {w ∈ (Rn)∗| 〈w, u〉 = 0, ∀u ∈ ∆},wobei(Rn)∗ der n-dimensionale Raum von Zeilenvektoren ist. Das orthogonale Komplement derDistribution∆ ist selbst eine Distribution.

Es ist ersichtlich, daßw ∈ ∆⊥ ein Kovektorfeld darstellt.

Die Lösbarkeit der partiellen Differentialgleichung (2.116) ist es nun gleichzusetzen mit derForderung, daß die DistributionD komplett integrierbar ist. Was komplette Integrierbarkeit füreine nichtsinguläre Distribution bedeutet, gibt die folgende Definition an.

Page 52: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 52

Definition 2.4.5 (Komplette Integrierbarkeit)Es sei∆ eine nichtsinguläre Distribution auf D, erzeugt durch die Vektorfelder f 1, f2, · · · , fk.Die Distribution wird als komplett integrierbar für jedesx0 ∈ D bezeichnet, wenn eine Um-gebungN von x0 und n − k skalare, glatte Funktionenh1(x), · · · , hn−k(x) existieren und dieFunktionenh1(x), · · · , hn−k(x) die partiellen Differentialgleichungen

∂h j(x)

∂xf i(x) = 0, ∀1 ≤ i ≤ k und1 ≤ j ≤ n− k.

erfüllen und die Kovektorfunktionendhj (x) =∂hj (x)∂x linear unabhängig sind. Das orthogonale

Komplement von∆ ist dann∆⊥ = span{dh1, · · · , dhn−k}.

Das Theorem von Frobenius gibt letztendlich die notwendigeBedingung dafür, wann eine Dis-tribution komplett integrierbar ist.

Theorem 2.4.1 (Frobenius)Eine nichtsinguläre Distribution∆ ist komplett integrierbar, wenn und nur wenn die Distribution∆ involutiv ist.

Zunächst soll der Begriff komplette Integrierbarkeit und das Theorem von Frobenius durch einBeispiel aus [19] unterlegt werden.

Beispiel 2.4.5Es sei das folgende System von partiellen Differentialgleichungen gegeben.

2x3∂h∂x1− ∂h∂x2

= 0

−x1∂h∂x1− 2x2

∂h∂x2+ x3

∂h∂x3

= 0 (2.123)

Es soll untersucht werden, ob eine Funktionh(x) existiert, die die Lösung dieses Systems ist.Definiert man die Vektorfelder

f1 =

2x3

−10

, f2 =

−x1

−2x2

x3

,

so kann (2.123) geschrieben werden als:

∂h∂x

f i(x) = 0, i = 1, 2.

Im Beispiel 2.4.4 wurde gezeigt, daß die Distribution∆ = span{ f 1, f2} im GebietD = {x ∈R

3|x21 + x2

3 , 0} involutiv ist. Nach dem Theorem von Frobenius ist die Distribution ∆ somitkomplett integrierbar. Es existiert für jedesx(t = 0) eine Lösungh(x) mit dh(x) , 0, die dasSystems partieller Differentialgleichungen (2.123) befriedigt. Ausn − k = 3 − 2 = 1 folgt, daßes nur eine Lösung gibt.

Page 53: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 53

Damit die Bedingung (2.113a) bzw. (2.115a) erfüllt wird, muß nach dem Theorem von Frobeniussomit die DistributionD involutiv sein.Als nächstes ist zu zeigen, wann die Bedingung (2.115b)

Ladn−1f gλ(x) , 0

erfüllt ist. Die linke Seite von Gleichung (2.115b) stellt das innere Produkt⟨

dλ(x), adn−1f g(x)

der Kovektorfunktiondλ(x) und der Vektorfunktionadn−1f g(x) dar. Ist die DistributionD invo-

lutiv und ist λ(x) eine Lösung von (2.116), dann ist nach der Definition der kompletten Inte-grierbarkeitdλ ∈ D⊥, wobei die DistributionD⊥ das orthogonale Komplement vonD darstellt.Kann man zeigen, daß in einer UmgebungDx ⊂ D ⊂ Rn die Annahmeadn−1

f g(x) < D gilt, soist folglich

Ladn−1f gλ(x) =

dλ(x), adn−1f g(x)

, 0.

Besitzt die MatrixG = (g, adf g, · · · , adn−1

f g) (2.124)

in der UmgebungDx den Rangn, dann bedeutet dies, daß sich die Vektorfunktionadn−1f g(x)

nicht als Linearkombination der Vektorfelderg, adf g, · · · , adn−2f g darstellen läßt. Nach der De-

finition der DistributionD gilt somit

adn−1f g(x) < D.

Die Bedingung (2.115b) ist somit erfüllt, wenn rang(G) = n zutrifft.Das folgende Theorem gibt zusammenfassend an, wann eine Funktion λ(x) existiert.

Theorem 2.4.2 (Existenz eines flachen Ausganges)Das System (2.1) besitzt einen flachen Ausgang, für den der resultierende relative Gradr in derUmgebungDx ⊂ D gleich der Systemordnungn ist, wenn und nur wenn1. die MatrixG = (g, adf g, · · · , adn−1

f g) den Rangn hat für allex ∈ Dx und

2. die DistributionD = span{g, adf g, · · · , adn−2f g} in Dx involutiv ist.

Sind die Bedingungen in Theorem 2.4.2 erfüllt und somit die Existenz eines flachen Ausgangesgesichert, kann die Funktionλ(x) konkret bestimmt werden. Aus der Herleitung der Existenzbe-dingung wurde erkennbar, daß dafür ein System partieller homogener Differentialgleichungenerster Ordnung zu lösen ist. Dieses lautet:

Lgλ(x) = Ladf gλ(x) = Lad2f gλ(x) = · · · = Ladn−2

f gλ(x) = 0. (2.125)

Für ein System der Ordnungn = 2 ergibt sich aus (2.125) eine einzige partielle Differentialglei-chung der Form

Lgλ(x) =∂λ(x)∂x1

g1(x) +∂λ(x)∂x2

g2(x) = 0. (2.126)

Es ist selbstverständlich, daß die Lösung partieller Differentialgleichungen kein triviales Pro-blem ist. Die Suche nach einem flachen Ausgang ist somit mit erheblichem Rechenaufwand

Page 54: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 54

verbunden.

Anhand eines konkreten Beispiels soll das beschriebene Vorgehen demonstriert werden. AlsBeispiel dient dabei der im Anhang vorgestellte Bioreaktor.

Beispiel 2.4.6Der Bioreaktor (siehe Anhang B) ist ein System zweiter Ordnung. Die in der Zustandsgleichung

x = f (x) + g(x)u (2.127)

vorkommenden Vektorfelder lauten

f (x) =

(

x1a(x2)x1a(x2)b(x2)

)

, g(x)

(

−x1

−x2

)

(2.128)

a(x2) = (1− x2)ex2/Γ

b(x2) = (1+ β)/(1+ β − x2). (2.129)

Im Beispiel 2.3.3 wurde bereits gezeigt, daß das System für den ursprünglichen Ausgangy =h(x) = x1 den relativen Gradr = 1 besitzt.Anhand von Theorem 2.4.2 soll nun überprüft werden, ob sich ein Systemausgangy∗ = λ(x) fin-den läßt, für den der relative Grad des Systemsr = n = 2 ist. Die Untersuchungen werden in derUmgebungD = {x ∈ R2|0 ≤ x1, x2 ≤ 1} durchgeführt. Diese Beschränkung des Zustandsraumesergibt sich aus der Tatsache, daß es sich bei den beiden Zuständen um Konzentrationen handelt.Der Test der Involutivitätsbedingung ist für ein System zweiter Ordnung immer erfolgreich, dadie DistributionD nur durch das Vektorfeldg erzeugt wird und eine nichtsinguläre Distributionder Dimension1 stets involutiv ist. Zur Aufstellung der im Theorem 2.4.2 definierten MatrixGbenötigt man die Lie-Klammeradf g. Diese wurde im Beispiel 2.4.3 bereits berechnet. Um zuüberprüfen, ob die Matrix

G(x) = [g(x), adf g(x)] =

−x1 x1x2da(x2)

dx2

−x2 x1x2da(x2)b(x2)

dx2

(2.130)

den vollen Rangn besitzt, wurde untersucht, wann die Determinante vonG singulär wird. DieBerechnung der Determinante liefert:

det

−x1 x1x2da(x2)

dx2

−x2 x1x2da(x2)b(x2)

dx2

= −x21x2

da(x2)b(x2)dx2

+ x1x22da(x2)

dx2. (2.131)

Durch Nullsetzen von (2.131) ergibt sich, daß für

x1 =x2a(x2)

da(x2)b(x2)dx2

, x1 = 0 und x2 = 0 (2.132)

die Determinante vonG Null wird und somitG nicht den vollen Rang besitzt. In Abbildung2.11 sind die Punkte der Zustandsebene, an denen die Bedingung rang(G) = n nicht erfüllt ist,dargestellt.

Page 55: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 55

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x1

x 2

Abbildung 2.11: Punkte der Zustandsebene, für die die 1. Bedingung des Theorems 2.4.2 fürden Bioreaktor verletzt wird

Mit dieser Erkenntnis läßt sich das Gebiet angeben, in dem Theorem 2.4.2 erfüllt ist:

Dx =

x ∈ R2|x1 , 0, x2 , 0, x1 ,x2a(x2)

da(x2)b(x2)dx2

, 0 < x1 ≤ 1, 0 < x2 ≤ 1

.

In Dx existiert nun eine Lösungλ(x) der partiellen Differentialgleichung

Lgλ(x) =∂λ(x)∂xg(x) = −x1

∂λ(x)∂x1

− x2∂λ(x)∂x2

= 0. (2.133)

Wendet man den in [4] angegebenen Lösungsansatz für die obige Differentialgleichung an, soerhält man als Lösung

y∗ = λ(x) = λ

(

x1

x2

)

.

Die neue Ausgangsfunktion ist eine beliebige Funktion des Argumentsx1x2

. Eine konkrete Lösungwäre beispielsweise

y∗ = λ(x) =x1

x2.

Um zu untersuchen, ob der flache Ausgang zur Inversion genutzt werden kann, wird der Origi-nalausgang als Funktion des flachen Ausganges und dessen Ableitung dargestellt. Wendet mandie Koordinatentransformation

y∗ =x1

x2(2.134a)

y∗ = y∗a(x2) − (y∗)2a(x2)b(x2) (2.134b)

auf das Zustandsraummodell (2.128) mit dem Ausgangy = x1 an, so läßt sich leider keine ana-lytische Funktiony = h(y∗, y∗) angeben, da keine analytische Inverse der Transformation (2.134)

Page 56: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 56

existiert. Es wird angenommen, daß sich der Verlauf des flaches Ausganges sehr langsam ändertund somity∗ ≈ 0 gilt. Mit y∗ = 0 undb(x2) = 1+β

1+β−x2bekommt nach einigen Umformungen von

(2.134b) fürx2 folgendes Ergebnis:

0 = y∗a(x2) − (y∗)2a(x2)b(x2)

= 1− (y∗)b(x2)

= (1+ β − x2) − (y∗)(1+ β)

x2 = (1+ β) − (y∗)(1+ β). (2.135)

Der wahre Systemausgangy = x1 läßt sich dann wie folgt darstellen:

y∗ ≈ 0⇒ y = x1 = y∗x2 ≈ (1+ β)y∗ − (1+ β)(y∗)2. (2.136)

Bei der Vorgabe eines sich langsam ändernden Verlaufes der Referenzgrößeyd = xd1 kann das In-

versionsproblem approximativ über den flachen Ausgang gelöst werden. Istyd konstant, so wirddie statische Inversion exakt gelöst, da dann die Annahmey∗ ≈ 0 erfüllt ist. Bei der Berech-nung der Trajektoriey∗d(t) aus dem Verlaufyd(t) liefert (2.136) zwei Lösungen. Aufgrund dertechnologischen Anforderungen ist die Trajektorie auszuwählen, die einer höheren Nährstoff-konzentrationx2 entspricht. Das Verfahren von van Nieuwstadt würde sich fürdieses Beispielauch anbieten. Ein Vorteil dieses Ansatzes wäre beim Bioreaktor, daß die vorhandenen Stell-und Zustandsgrößenbeschränkungen in das Minimierungsproblem einfließen können.

Das letzte Beispiel zeigt, daß die schwierige Suche nach einem flachen Ausgang, auch wenn sieerfolgreich ist, noch lange nicht zur einer starken Vereinfachung des Inversionsproblems führt.

Page 57: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 57

2.4.2 Inversion schwach nichtminimalphasiger Systeme

Das folgende Verfahren zur Inversion nichtminimalphasiger Systeme wurde erstmals in [13]beschrieben und dort auf das im Beispiel 2.4.2 vorgestellteModell des senkrecht startenden undlandenden Flugzeuges angewandt. Eine verbesserte Darstellung und Analyse des Verfahrensfindet man in [37, 15]. Den Ausgangspunkt der Überlegungen stellt die Theorie der singulärgestörten Nulldynamik [17] dar. Dabei werden nichtlineareSysteme der Form

x = f (x, ε) + g(x, ε)u

y = h(x, ε) (2.137)

betrachtet, die von einem reellen Parameterε abhängen. Das zu dem Wertε = 0 korrespondie-rende System wird als ungestörtes System bezeichnet. JedesSystem, für das der Parameterεungleich Null ist, wird gestörtes System genannt. Hierbei handelt es sich um die real vorliegen-de Regelstrecke. Das System (2.137) besitzt den relativen Grad r(ε), der folgende Eigenschaftaufweist:

r(ε) = r ∀ε , 0

r(0) = r + d. (2.138)

Der relative Grad eines solchen Systems ändert sich abrupt an der Stelleε = 0. Die Zahlr istder relative Grad des gestörten Systems und die Zahlr + d der relative Grad des ungestörtenSystems. Ein System, das diese Eigenschaft aufweist, besitzt nach [17] eine singulär gestörteNulldynamik. Die Nulldynamik des ungestörten Systems hatd Zustände weniger als die Null-dynamik des gestörten Systems. Anders ausgedrückt besitztdie Linearisierung des ungestörtenSystemsd Nullstellen weniger als die Linearisierung des gestörten Systems. Nach der Definitiondes relativen Grades ist der Übergang vonr(ε) = r zu r(0) = r + d gleichzusetzen damit, daß inder Umgebung des Punktesxe folgendes gilt:

Lgh(x, ε) = · · · = LgLr−2f h(x, ε) = 0 ∀ε

LgLr−1f h(x, 0) = · · · = LgL

r+d−2f h(x, 0) = 0

LgLr−1f h(x, ε) = · · · = LgL

r+d−2f h(x, ε) , 0, ∀ε , 0

LgLr+d−1f h(x, ε) , 0, ∀ε. (2.139)

Es wird davon ausgegangen, daß der Parameterε so in die Systemgleichungen und somit in dieden relativen Grad mitbestimmenden Lie-AbleitungenLgLr−1+k

f h(x, ε), k = 0, · · · , d−1 eingeht,

daß der Betrag der Lie-AbleitungenLgLr−1+kf h(x, ε), k = 0, · · · , d−1 für kleineε relativ klein ist.

Das ist sicherlich der Fall, wenn die entsprechenden Lie-Ableitungen wie folgt vom Parameterε abhängen:

LgLr−1+kf h(x, ε) = εψk(x), k = 0, · · · , d − 1. (2.140)

Liegt dann ein System (2.137) mit einem kleinenε vor, so ist folglich der relative Gradr(ε) desSystems gleichr, aber beinaher + d. Die Nulldynamik des gestörten Systems läßt sich dannin zwei Zeithorizonte einteilen. Wichtig ist die Tatsache,daß die langsame Nulldynamik des

Page 58: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 58

gestörten Systems durch die Nulldynamik des ungestörten Systems approximiert wird [17]. DasSystem (2.137) wird im folgenden alsschwach nichtminimalphasigbezeichnet, wenn folgendesgilt:

1. Die originale Regelstrecke bzw. das gestörte System ist nichtminimalphasig.

2. Das ungestörte System ist minimalphasig.

3. Die dominierende Eigendynamik der Regelstrecke (2.137)ist langsamer als der schnelleAnteil der Nulldynamik des gestörten Systems.

Läßt sich die Eigendynamik ebenfalls in zwei Zeithorizonteeinteilen, so ist der dominierendeAnteil der Eigendynamik der langsamere Anteil. Eine solcheTrennung in zwei Zeithorizontetritt häufig auf, wenn die schnelle Stellglieddynamik in dasRegelstreckenmodell integriert wird.Ist die Regelstrecke schwach nichtminimalphasig, so rührtdie Instabilität der Nulldynamik nurvom schnellen Anteil der Nulldynamik her. Dieser Anteil tritt beim ungestörten System jedochnicht auf. Für schwach nichtminimalphasige Systeme kann das ungestörte System folglich alsinvertierbare Approximation genutzt werden, da dieses System minimalphasig ist.Im linearen Fall würde schwach nichtminimalphasig bedeuten, daß die Übertragungsfunktiondes ungestörten Systems sehr schnelle, zum Teil instabile,Nullstellen und langsame stabileNullstellen besitzt. Des weiteren sind die schnellen Nullstellen viel weiter entfernt von derimaginären Achse als die dominierenden langsamen Polstellen und restlichen Nullstellen. Ei-ne mögliche minimalphasige Approximation der Regelstrecke würde wie folgt aussehen: Dieschnellen Nullstellen werden vernachlässigt und die statische Verstärkung des Systems wird andie des originalen Systems angepaßt. Das resultierende minimalphasige System könnte zur ap-proximativen Inversion verwendet werden.Analog zum linearen Fall wird im nichtlinearen Fall vorgegangen, wenn das ungestörte Sy-stem als Approximation dient. Der schnelle instabile Anteil der Nulldynamik wird vernachläs-sigt. Im Gegensatz zum linearen Analogon ist eine exakte Faktorisierung der Nulldynamik ineinen schnellen und langsamen Anteil nicht möglich. Verwendet man das ungestörte System alsApproximation, so weist dies zwar keine schnelle instabileNulldynamik mehr auf, dafür wirdjedoch auch die Eigendynamik, die verbleibende langsame Nulldynamik und die Statik des Sy-stems geringfügig verändert.

Wie erkennt man nun in der Praxis, daß ein System eine singulär gestörte Nulldynamik besitztund schwach nichtminimalphasig ist? Der einfachste Weg ist, das entsprechende System an deninteressierenden Gleichgewichtspunkten zu linearisieren und die resultierenden Nullstellen undPolstellen des linearen Systems zu betrachten. Sind einigeNullstellen viel weiter entfernt vonder imaginären Achse als die restlichen Nullstellen und dominierenden Polstellen, so deutet diesauf eine singulär gestörte Nulldynamik hin. Wenn die langsamen Nullstellen des weiteren stabilsind, könnte das System schwach nichtminimalphasig sein. Als nächstes wird man einen Pa-rameterε suchen, der einem Modellparameter oder einer Kombination von Modellparameternentspricht und zu einer Systemdarstellung in der Form (2.137) führt. Dieser Schritt wird in derRegel sehr zeitaufwendig sein. Meist handelt es sich beiε um einen Modellparameter, der die

Page 59: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 59

Stärke des Einflusses der Stellgröße auf die Zustandsgleichungen und oder Ausgangsgleichungbeschreibt. Letztendlich ist es jedoch immer erforderlich, zu überprüfen, wie stark sich Statikund Dynamik des gestörten und ungestörten Systems unterscheiden.Daß eine Approximation des gestörten nichtminimalphasigen Systems durch das ungestörte mi-nimalphasige System zulässig sein kann, erkennt man, wenn man die Normalformen für beideSysteme aufstellt. Es sei im folgenden angenommen, daß die Annahme (2.140) zutrifft und nurdie dort beschriebenen Lie-Ableitungen vom Parameterε abhängen. Für die Transformation desgestörten Systems auf Normalform wird die folgende Koordinatentransformation verwendet:

(

ζ

η

)

= Φ(x) =

ζ1 = h(x)ζ2 = L f h(x)...

ζr = Lr−1f h(x)

η1 = Lrf h(x)

...

ηd = Lr+d−1f h(x)

ηd+1 = φ1(x)...

ηn−r = φn−r−d(x)

. (2.141)

Für ein genügend kleinesε lassen sich immer Funktionenφi(x), i = 1, · · · , n− r − d finden, sodaß (2.141) einen lokalen Diffeomorphismus darstellt [13]. Man erhält für die Normalformdesgestörten Systems:

ζ1 = ζ2

ζ2 = ζ3

...

ζr = η1 + εψ0(ζ, η)u

η1 = η2 + εψ1(ζ, η)u...

ηd−1 = ηd + εψd−1(ζ, η)u

ηd = Lr+df h(x) + LgL

r+d−1f h(x)u

ηd+1 = L fφ1(x) + Lgφ1(x)u...

ηn−r = L fφn−r−d(x) + Lgφn−r−d(x)u. (2.142)

Die Normalform des ungestörten Systems ergibt sich durch Nullsetzen des Parametersε in(2.142). Ist der Parameterε genügend klein und das System (2.137) schwach nichtminimal-phasig, so kann das ungestörte minimalphasige System zur approximativen Inversion des nicht-minimalphasigen gestörten Systems genutzt werden. Zur Transformation des ungestörten Sy-

Page 60: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 60

stems auf die Normalform wird somit ebenfalls die Koordinatentransformation (2.141) verwen-det. Werden die Zustände der Normalform wie folgt bezeichnet:

(

ζ

η

)

= Φ(x) =

ζ1 = h(x)ζ2 = L f h(x)...

ζr = Lr−1f h(x)

ζr+1 = Lrf h(x)

...

ζr+d = Lr+d−1f h(x)

η1 = φ1(x)...

ηn−r−d = φn−r−d(x)

, (2.143)

so lautet die Normalform des ungestörten Systems:

˙ζ1 = ζ2

˙ζ2 = ζ3

...˙ζr = ζr+1

˙ζr+1 = ζr+2

...˙ζr+d−1 = ζr+d

˙ζr+d = Lr+df h(x) + LgL

r+d−1f h(x)u

˙η1 = L fφ1(x) + Lgφ1(x)u...

˙ηn−r−d = L fφn−r−d(x) + Lgφn−r−d(x)u

y = ζ1. (2.144)

Der Vektorζ enthält die Ausgangsgröße des ungestörten Systems und deren r + d− 1 Ableitun-gen. Da der relative Grad des Systems (2.143) gleichr + d ist, muß die Referenztrajektorie desAusganges so gewählt werden, daß derenr + d Ableitungen existieren und beschränkt sind.

Angenommen das gestörte System sei schon minimalphasig, sobietet es sich dennoch an, dieInversion anhand des ungestörten Systems durchzuführen. Der Grund dafür ist, daß der Betragder nominalen Stellgröße bei kleinemε sehr groß werden kann. Die Stellgröße des gestörtenSystems (2.142), die zur Erzeugung des gewünschten Verlaufesyd(t) der Ausgangsgröße not-wendig ist, ergibt sich nämlich wie folgt:

ud =1

εψ0(ζd, η)

(

ζdr − η1

)

. (2.145)

Page 61: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 61

Wie das folgende Beispiel zeigt, kann der im Anhang A beschriebene Lenkflugkörper als Systemmit singulär gestörter Nulldynamik betrachtet werden.

Beispiel 2.4.7Im folgenden wird das Modell des Lenkflugkörpers ohne Stellglieddynamik betrachtet. Das Sy-stem besitzt als Zustände den Anstiegswinkelx1 und die Nickratex2. Die Eingangsgrößeu istder Höhenruderausschlag. Betrachtet man das Zustandsraummodell (2.146) der Regelstrecke, soist zu erkennen, daß die Stellgröße direkt auf den Systemausgang wirkt.

x1 =180π

1Mvsm

Fzf (x1, u,M) cos(x1π

180) + x2

x2 =180π

My(x1, u,M)

Iyy

y =1m

Fzf (x1, u,M) (2.146)

Das Zustandsraummodell (2.146) ist somit nicht in der Standardform (2.1). Es läßt sich jedochallgemein wie folgt darstellen:

x = f (x) + g(x)u

y = h(x) + l(x)u. (2.147)

Das System (2.147) besitzt den relativen Gradr = 0, wenn die skalare Funktionl(x) ungleichNull ist für alle x in der Umgebung des Arbeitspunktesxe. Die in diesem Abschnitt bishergemachten Überlegungen lassen sich ohne weiteres auf das System (2.147) mit dem relativenGradr = 0 übertragen. Um das Zustandsraummodell des Lenkflugkörpersauf die Form (2.147)zu bringen, werden die KraftFzf und das MomentMy wie folgt dargestellt:

Fzf = Q(M)SCzx1(x1,M) + Q(M)S dzu

Czx1(x1,M) = sign(x1)(az|x1|3 + bz|x1|2 + cz(2−

M3

)|x1|)My = Q(M)S dCmx1

(x1,M) + Q(M)S ddmu

Cmx1(x1,M) = sign(x1)(am|x1|3 + bm|x1|2 + cm(−7+

8M3

)|x1|). (2.148)

Die Vektorfunktionenf undg sowie die skalaren Funktionenh und l ergeben sich für den Lenk-

Page 62: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 62

flugkörper wie folgt:

f (x) =

f1(x)

f2(x)

=

180π

1Mvsm

Q(M)SCzx1(x1,M) cos(πx1

180) + x2

180π

Q(M)S dCmx1(x1,M)

Iyy

g(x) = g(x, ε) =

g1(x, ε)

g2

=

180π

1Mvsm

Q(M)Sε cos(πx1180)

180π

Q(M)S ddmIyy

h(x) = h(x) =1m

Q(M)SCzx1(x1,M)

l(x) = l(ε) =1m

Q(M)Sε, (2.149)

wobei der Parameterε dem aerodynamischen Koeffizientendz entspricht. Die Linearisierungdes Lenkflugkörpers ohne Stellglieddynamik im Anhang A zeigte, daß die beiden Nullstellenweiter von der imaginären Achse entfernt sind als die Polstellen. Dieses läßt vermuten, daß derLenkflugkörper ein System mit singulär gestörter Nulldynamik ist. Durch zweifaches Ableitendes Ausganges ist erkennbar, daß bei einer Vernachlässigung des Einflusses der Stellgröße aufdie KraftFzf der relative Grad des Systemsr +d = 2 ist. Die Stärke der Kopplung vonu undFzf

wird durch den Koeffizientendz beschrieben. Der nominale Betrag dieses Koeffizienten beträgt|ε| = 0.034und ist somit relativ klein. Setzt mandz gleich Null, so springt der relative Grad desSystems (2.146) von Null auf Zwei. Der Parameterdz = ε geht wie folgt in die Systemgleichun-gen der Regelstrecke ein:

x = f (x) + g(x, ε)u

y = h(x) + l(ε)u. (2.150)

Um zu zeigen, daß die oben getroffenen Behauptungen zutreffen, wird der Ausgang des Systemszweifach nach der Zeit abgeleitet:

y = h(x) + l(ε)u

y = L f h(x) + Lgh(x, ε)u+ l(ε)u

y = L2f h(x) + LgL f h(x, ε)u

+L f Lgh(x, ε)u+ L2gh(x, ε)u2 + Lgh(x, ε)u+ l(ε)u. (2.151)

Bei der skalaren Funktionl(ε) und den Lie-AbleitungenLgh(x, ε), L f Lgh(x, ε), L2gh(x, ε) läßt

sichε ausklammern, so daß fürε = 0 folgendes gilt:

l(0) = Lgh(x, 0) = L f Lgh(x, 0) = L2gh(x, 0) = 0. (2.152)

Durch Nullsetzen vonε ergibt sich aus (2.151) das System

y = h(x)˙y = L f h(x)

y(2) = L2f h(x) + LgL f h(x, 0)u, (2.153)

Page 63: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 63

welches den relativen Gradr + d = 2 hat und die Normalform des ungestörten Lenkflugkör-pers darstellt. Da keine Nulldynamik existiert, ist eine stabile Inversion des ungestörten Sy-stems möglich. Um beurteilen zu können, ob eine Approximation des gestörten Systems durchdas ungestörte System zulässig ist, ist noch zu prüfen, wie sich der Betrag der Lie-AbleitungLgL f h(x, ε) in Abhängigkeit vonε ändert. Berechnet man die Lie-Ableitung, so erhält man eineBeziehung der Form:

LgL f h(x, ε) = ε(

180π

1Mvsm

Q(M)S cos(πx1

180)∂L f h(x)

∂x1

)

+∂L f h(x)

∂x2g2. (2.154)

Für ein genügend kleinesε ist folglich LgL f h(x, ε) ≈ LgL f h(x, 0). Das ungestörte System

˙x = f (x) + g(x, 0)u

y = h(x) (2.155)

kann somit als minimalphasige Approximation genutzt werden. In der Abbildung 2.12 sind fürverschiedene Werte des Parametersdz die Sprungantworten des Lenkflugkörpers dargestellt. Esist zu sehen, daß die Statik vom Betrag der Konstantedz abhängt. Je kleinerdz bzw.ε ist, destobesser ist die Approximation durch (2.155).

0 1 2 3 4 5 6 7 8 9 10−1

0

1

2

3

4

5

6

7

8

t in s

yin

g

Abbildung 2.12: Sprungantwort des Lenkflugkörpers fürdz = −0.034 (gestrichelte Linie),dz = −0.017 (gepunktete Linie) unddz = 0 (durchgezogene Linie) bei einemStellgrößensprung von 0 deg auf 5 deg zum Zeitpunktt = 0.

Im folgenden wird die Inversion des Lenkflugkörpers anhand des ungestörten Systems durchge-führt. Abbildung 2.13 zeigt die dabei verwendete Simulationsumgebung. Sie besteht aus einerReihenschaltung der approximativen Inversen und der originalen Regelstrecke. Die Stellglied-dynamik ist bei der Regelstrecke berücksichtigt. Anhand dieser Anordnung soll die Güte der

Page 64: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 64

approximativen Inversion beurteilt werden. Die Änderung der Machzahl wird durch die im An-hang A angegebene Differentialgleichung beschrieben. Da der Lenkflugkörper größtenteils sta-bil ist, wurde keine stabilisierende Regelung implementiert. Der ungefilterte Referenzverlaufyr

Machzahl-profil

StatischeKorrektur

Referenz-modell

Approx.Inverse

Stellglieddyn.+Regelstrecke

yryr

yd

yd(2)

ud

xd

y = azf

M

x1 = α

Abbildung 2.13: Reihenschaltung des reduzierten inversenSystems der minimalphasigen Ap-proximation des Lenkflugkörpers und des wahren Systems mit Stellglied-dynamik. Diese Anordnung entspricht einer reinen Steuerung der Regelstrecke.Das gewünschte Ein-/Ausgangsverhalten wird durch ein Referenzmodell fest-gelegt.

des Ausgangesy der originalen Regelstrecke ist als externes Signal gegeben. Aus diesem Si-gnal wird eine Vorgabeyr für den Ausgangy des minimalphasigen Systems (2.155) geschaffen.Soll anhand des ungestörten Systems das Originalsystem exakt statisch invertiert werden, soist die Referenzgrößeyr des ungestörten Systems so zu wählen, daß die durch Inversion be-stimmte Stellgrößeud statisch die gewünschte Ausgangsgrößeyr erzeugt. Das Innenleben desBlockes„Statische Korrektur” ist in der Abbildung 2.14 detailliert dargestellt. Von der Vorgabeyr wird angenommen, daß es sich um einen stationären Wertyr = ye handelt. Als erstes wirddie entsprechende stationäre Stellgrößeue für das Originalsystem berechnet. Anschließend wirdermittelt, welche stationäre Ausgangsgrößeye das ungestörte System (2.155) bei Anwendungder stationären Eingangsgrößeue = ue besitzt. Diese Ausgangsgrößeye wird als Vorgabeyr

für das ungestörte System verwendet, so daß eine statisch exakte Streckeninversion erfolgt. Esist zu beachten, daß sowohl die Abbildungye ⇒ ue als auch die Abbildungue ⇒ ye von derMachzahl abhängig ist. Der Verlaufyr wird auf ein lineares Referenzmodell gegeben. Diesesbeschreibt das gewünschte Übertragungsverhalten des späteren Regelkreises auf Vorgabenyr .Die Ordnung des Referenzmodells (siehe Gleichungen (2.32)bis (2.34)) wird so gewählt, daßdie Signaleyd, ˙yd und yd(2) beschränkt sind. Für den Lenkflugkörper lautet die entsprechendeÜbertragungsfunktion des Referenzmodells

Gre f (s) =100

s2 + 2 · 0.7 · 10s+ 100, (2.156)

Page 65: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 65

wobei eine Anstiegszeit unter 0.35s und ein Überschwingen von weniger als 5 Prozent ein-gehalten wird. Der Block„Approximative Inverse”enthält das reduzierte inverse Systems der

yr = ye ue = ueye = yr

M

Abbildung 2.14: Bestimmung der ungefilterten Referenzgröße yr (t) für das gestörte System ausder Vorgabeyr (t) des Originalsystems, so daß eine statisch exakte Inversion derRegelstrecke erfolgt.

minimalphasigen Approximation (2.155) des Lenkflugkörpers. Die nominalen Zuständexd1 und

xd2 ergeben sich durch Lösung des folgenden Gleichungssystems:

yd = h(xd)

=1m

QSCzx1(xd

1,M) (2.157a)

˙yd = L f h(xd)

=1m

QS∂Czx1

(xd1,M)

∂xd1

180π

1Mvsm

QSCzx1(xd

1,M) cos

xd1π

180

+ xd2

. (2.157b)

Gleichung (2.157a) liefert die Lösung fürxd1. Leider läßt sich diese Gleichung nicht analytisch

nach dem gesuchten Zustand auflösen. Für die Simulation wurde xd1 zu jedem Zeitpunkt über

eine Look-Up-Table bestimmt. Hat man den Zustandxd1 ermittelt, so erhält man durch einfaches

Umstellen von (2.157b) den gesuchten nominalen Zustandxd2. Die zum Erzeugen der gewünsch-

ten Ausgangsgrößeyd notwendige Stellgrößeud liefert das Stellgesetz

ud =yd(2) − L2

f h(xd)

LgL f h(xd, 0)(2.158)

Page 66: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 66

mit den Lie-Ableitungen

L f h(xd) =1m

Q(M)S∂Czx1

(xd1,M)

∂xd1

180π

1Mvsm

Q(M)SCzx1(xd

1,M) cos(πxd

1

180) + xd

2

∂L f h(xd)

∂xd1

=Q(M)S

m

∂2Czx1(xd

1,M)

∂xd2

1

180π

Q(M)SMvsm

Czx1(xd

1,M) cos

xd1π

180

+ xd2

+180π

Q(M)2S2

Mvsm2

∂Czx1(xd

1,M)

∂xd1

2

cos

xd1π

180

−Q(M)2S2

Mvsm2

∂Czx1(xd

1,M)

∂xd1

Czx1(xd

1,M) sin

xd1π

180

∂L f h(xd)

∂xd2

=Q(M)S

m

∂Czx1(xd

1,M)

∂xd1

LgL f h(xd, 0) =∂L f h(xd)

∂xd1

g1(xd, 0)+∂L f h(xd)

∂xd2

g2(xd) =∂L f h(xd)

∂xd2

g2(xd)

L2f h(xd) =

∂L f h(xd)

∂xd1

f1(xd) +∂L f h(xd)

∂xd2

f2(xd). (2.159)

Das Stellgesetz ist nicht stetig, daf (xd) nicht in C2 ist. Die erste und zweite Ableitung derin f (xd) vorkommenden FunktionCzx1

(xd1,M) ist an der Stellexd

1 = 0 nicht definiert und so-mit nicht stetig (siehe Beispiel 2.3.2). Abbildung 2.15 zeigt die zweite Ableitung der FunktionCzx1

nach dem Zustandxd1. Betrachtet man die Lie-AbleitungenL2

f h(xd) und LgL f h(xd, 0), so

erkennt man, daß die Ableitung∂2Czx1

(xd1,M)

∂xd21

nur Einfluß auf die Lie-AbleitungL2f h(xd) hat. Geht

der Zustandxd1 über Null, so springt der Betrag der Lie-AbleitungL2

f h(xd) und somit die Stell-

größeud. Aufgrund der Beziehung (2.157a) ist dies gleichzusetzen mit der Tatsache, daß derReferenzausgangyd Null wird. In Abbildung 2.16 ist die Lie-AbleitungL2

f h(xd = Φ−1(yd, ˙yd))

in Abhängigkeit vonyd und ˙yd für M = 2 dargestellt. Man erkennt, daß bei einer „langsamenÜberquerung” des Punktesyd = 0, d.h. bei kleinem Betrag der Ableitungyd, die Lie-Ableitungund somit die Stellgröße nicht so stark springt wie bei einem„schnellen Übergang”.

Die Abbildung 2.17 zeigt den durch Simulation ermittelten Verlauf der Ausgangsgrößey und derungefilterten Vorgabeyr . Zum Zeitpunktt = 0 hatte der Lenkflugkörper den AnfangszustandxT = (0, 0). Da die Inversion nicht exakt ist, kann das gewünschte Übergangsverhalten nichteingehalten werden. Der Verlauf der MachzahlM(t) ist in der Abbildung 2.18 dargestellt.

Man kann deutlich in der Abbildung 2.19 sehen, daß es im Fallyd = 0 zu einem Springen derStellgröße kommt. Zu den Zeitpunktent ≈ 1.2 undt ≈ 3.2 geht die Vorgabeyd(t) durch Null, sodaß die Stellgröße springt und ihr Vorzeichen wechselt. Beieinem langsameren Übergang vonnegativen zu positiven Vorgaben für die Beschleunigung oder umgekehrt wird der Betrag desSprunges verkleinert. Eine andere Maßnahme wäre, eine Approximation für die FunktionCzx1

zu finden, die zweifach nach dem Zustandxd1 differenziert werden könnte und deren Ableitun-

Page 67: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 67

−10 −8 −6 −4 −2 0 2 4 6 8 10−0.02

−0.015

−0.01

−0.005

0

0.005

0.01

0.015

0.02

xd1 in deg

∂2C

z x1

(xd 1,M

)

∂xd2 1

Abbildung 2.15: Zweifache Ableitung der FunktionCzx1

(xd1,M) nach dem Zustand ˆxd

1für M = 2

−10−5

05

10 −100−50

050

100−400

−300

−200

−100

0

100

200

300

400

yd in g ˙yd in g/s

L2 fh

(xd=Φ−1

(yd,˙ yd

))

Abbildung 2.16: Darstellung der Lie-AbleitungL2

f h(xd= Φ−1(yd, ˙yd)) in Abhän-

gigkeit von der Vorgabe ˆyd undderen Ableitungyd für M = 2.

0 0.5 1 1.5 2 2.5 3 3.5 4−20

−10

0

10

20

30

40

t in s

y(t

)in

g,y

r (t)

ing

Abbildung 2.17: Verlauf der Regelgrößey(t)(durchgezogene Linie) und derungefilterten Referenzgrößeyr (t)(gestrichelte Linie).

0 0.5 1 1.5 2 2.5 3 3.5 42.2

2.3

2.4

2.5

2.6

2.7

2.8

2.9

3

t in s

M(t

)

Abbildung 2.18: Machzahlprofil

gen stetig wären. Die sprunghafte Änderung der Stellgröße zu den Zeitpunktent = 0, 1, 2, 3sist eine Folge der sprunghaften Änderung der zweiten Ableitung vonyd(t). Durch Wahl einesReferenzmodells höherer Ordnung wird dieser Effekt beseitigt. Die Abbildung 2.20 zeigt diedurch Inversion ermittelten nominalen Zustandstrajektorien.

Page 68: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 68

0 0.5 1 1.5 2 2.5 3 3.5 4−50

−40

−30

−20

−10

0

10

20

30

40

t in s

ud(t

)in

deg

Abbildung 2.19: Durch Inversion des ungestörtenSystems (2.155) ermittelte Stell-größeud(t).

0 0.5 1 1.5 2 2.5 3 3.5 4−100

−50

0

50

100

150

200

250

t in s

xd 1(t

)in

deg

,xd 2(t

)in

deg/

s

Abbildung 2.20: Aus der Inversion des ungestör-ten Systems (2.155) resultierendeZustandstrajektorien ˆxd

1(t) (durch-gezogene Linie) und ˆxd

2(t) (gestri-chelte Linie).

Eine einfache Strategie zur Findung einer minimalphasigen Approximation einesschwach nichtminimalphasigen Systems

Die Bestimmung des Parametersε ist häufig sehr aufwendig. Hat man es mit einem Systemzu tun, das scheinbar schwach nichtminimalphasig ist, so liefert die nachfolgende Idee eineeinfache Strategie, wie eine Approximation des System mit einem größeren relativen Grad undeiner möglicherweise stabilen Nulldynamik gefunden werden kann. Die Idee ist folgende:

Der Ausgang des Systems wird systematisch nach der Zeit abgeleitet. Dabeiwird geprüft, ob Terme der Ableitungen vernachlässigt werden können, so daßdies zu einer Erhöhung des relativen Grades führt.

Besitzt das originale System (2.1) z.B. die Ordnungn = 2 und den relativen Grad r=1, so lautetdie erste und zweite Ableitung des Ausganges:

y = L f h(x) + Lgh(x)u

y = L2f h(x) + LgL f h(x)u+ L2

gh(x)u2 + L f Lgh(x)u+ Lgh(x)u. (2.160)

Wenn der Betrag der Lie-AbleitungLgh(x) relativ klein ist und des weiteren

‖L2gh(x)u2 + L f Lgh(x)u+ Lgh(x)u‖∞ ≪ ‖LgL f h(x)‖∞ (2.161)

gilt, so kann folgende Näherung für das System angenommen werden:

˙y = L f h(x)¨y = L2

f h(x) + LgL f h(x)u. (2.162)

Page 69: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 69

Der relative Grad des Systems (2.162) istr = 2. Da keine Nulldynamik mehr existiert, verein-facht sich das Inversionsproblem. Es ist jedoch schwer einzuschätzen, ob die gemachten An-nahmen zulässig sind. In der Regel muß für jedes konkrete Beispiel überprüft werden, ob diegetroffenen Vereinfachungen zu einer guten Approximation des originalen System führen. Ne-ben der Reduktion der Nulldynamik wird die Statik und Dynamik des Systems geändert. Anhandeines linearen Systems sollen mögliche Fälle von schwach nichtminimalphasigen Systemen her-ausgefunden werden, für die ein solches Vorgehen nicht möglich ist.

Beispiel 2.4.8Es wird das lineare Eingrößensystem mit der Übertragungsfunktion

y(s)u(s)

= G(s) = Ks+ b0

s2 + a1s+ a0(2.163)

betrachtet. Eine entsprechende minimale Realisierung lautet:

x = Ax + bu

y = cT x

Ax = f (x) =

(

0 1−a0 −a1

)

x

b = g(x) = [0 K]T

cT x = h(x) = [b0 1]x. (2.164)

Das System hat den relativen Gradr = 1 und besitzt eine Nullstelle beis= −b0.

Es soll überprüft werden, ob eine Approximation des Systemsmit dem relativen Gradr = 2gefunden werden kann. Als erstes wird dazu der Ausgang des Systems zweifach nach der Zeitabgeleitet. Die in (2.160) vorkommenen Lie-Ableitungen lauten für das System (2.164):

Lgh(x) = cT b = K

LgL f h(x) = cT Ab = (b0 − a1)K

L f h(x) = cT Ax

L2f h(x) = cT A2x

L f Lgh(x) = 0

L2gh(x) = 0. (2.165)

Die Ableitungen (2.160) bekommen somit folgende konkrete Form:

y = cT Ax + Ku

y = cT A2x + (b0 − a1)Ku+ Ku. (2.166)

Ist die Lie-AbleitungLgh(x) = K des Systems genügend klein und gilt des weiteren

‖LgL f h(x)u‖∞ ≫ ‖Lgh(x)u‖∞‖(b0 − a1)Ku‖∞ ≫ ‖Ku‖∞, (2.167)

Page 70: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 70

so könnte man annehmen, daß (2.164) durch

˙y = L f h(x) = cT Ax

y(2) = L2f h(x) + LgL f h(x)u

= cT A2x + cT Abu (2.168)

approximiert werden kann. Die Hoffnung besteht nun darin, daß für schwach nichtminimalpha-sige Systeme diese Annahme erfüllt ist und somit eine gute minimalphasige Approximationgefunden wurde. Es werden im folgenden drei Fälle betrachtet, für die das System (2.164) alsschwach nichtminimalphasig bezeichnet werden kann:

1. Das System besitzt eine schnelle instabile Nullstelle und zwei dominierende Polstellen.Die Polstellen befinden sich wesentlich näher an der imaginären Achse als die Nullstelle.Aufgrund dieser Konstellation gilt|b0| ≫ |a1| (Der Koeffizienta1 des Polynomss2+a1s+a0 ist die Summe der Realteile beider Polstellen.). Die Annahme (2.167) ist erfüllt, da|b0|sehr groß ist.

2. Das System besitzt eine schnelle instabile Nullstelle, eine dominierende langsame Pol-stelle und eine schnelle Polstelle, deren Betrag des Realteils annähernd gleich dem derNullstelle ist. Aufgrund dieser Konstellation gilt|b0| ≈ |a1|. Die Annahme (2.167) wirderfüllt, wenn die schnelle Polstelle stabil und daher|b0 − a1| groß ist. Ist die schnelle Pol-stelle instabil, so wird|b0−a1| annähernd Null und die Annahme (2.167) ist folglich nichterfüllt.

3. Das System besitzt eine schnelle instabile Nullstelle, eine dominierende langsame Pol-stellen und eine schnelle Polstelle, deren Betrag des Realteils viel größer ist als der derNullstelle. Aufgrund dieser Konstellation gilt|b0| ≪ |a1|. Die Annahme (2.167) ist erfüllt,da |a1| sehr groß ist.

Es ist interessant, daß für den zweiten Fall die Annahme (2.167) nicht unbedingt zutrifft, ob-wohl das System nach den Betrachtungen aus Abschnitt 2.4.2 schwach nichtminimalphasig ist.Für alle drei Fälle unterscheiden sich die Approximationensehr. Wendet man auf (2.168) dieZustandstransformation

(

y˙y

)

=

(

cT

cT A

)

x (2.169)

an, so bekommt man als Ergebnis für die letzte Zeile des Zustandsraummodelles:

y(2) = cT A2(

cT

cT A

)−1 (

y˙y

)

+ cT Abu (2.170)

y(2) + a1 ˙y + a0y = cT Abu = (b0 − a1)Ku. (2.171)

Die Übertragungsfunktion der Approximation lautet folglich:

y(s)u(s)= G(s) = K

b0 − a1

s2 + a1s+ a0. (2.172)

Page 71: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 71

Wie man sieht, stimmt die Eigendynamik von ursprünglichem und approximiertem System über-ein. Für die statische VerstärkungV des originalen Systems und die statische VerstärkungV derApproximation ergibt sich jedoch:

V = Kb0

a0, V = K

b0 − a1

a0.

Nur für den ersten Fall weist die Approximation annähernd die gleiche Verstärkung wie dasOriginalsystem auf, da|b0| ≫ |a1| gilt. Im Fall der Annahmen zwei und drei ist die statischeVerstärkung von Originalsystem und Approximation sehr unterschiedlich. Bei Vorhandenseineines oder mehrerer schneller Pole hat man folglich den Eindruck, daß eine Approximationzulässig ist, was im Grunde aber nicht stimmt.

Das Beispiel 2.4.8 läßt vermuten, daß die vorgeschlagene Strategie bei Regelstrecken, die einenAnteil in der Eigendynamik haben, welcher gleich schnell oder schneller als der schnelle Anteilder Nulldynamik ist, scheitert. Wendet man die vorgeschlagene Strategie blindlings an, so kanndie Analyse der Ableitungen des nichtlinearen Systems zu der falschen Annahme führen, daßeine Approximation möglich ist. Ein Einsatz des Verfahrenssollte nur erfolgen,

wenn der schnelle Teil der Nulldynamik viel schneller ist als die komplette Ei-gendynamik und die verbleibende Nulldynamik, d.h. wenn dieschnellen Null-stellen der durch Linearisierung der Regelstrecke erhaltenen Übertragungs-funktion viel weiter von der imaginären Achse entfernt sindals die restlichenlangsamen Nullstellen und Polstellen.

Ist eine sehr schnelle Stellglieddynamik in das Modell der Regelstrecke integriert, so sollte diesevor der Anwendung der beschriebenen Strategie möglichst entfernt werden.

2.4.3 Inversion von Systemen mit schneller instabiler Null dynamik

Im vorherigen Abschnitt wurden schwach nichtminimalphasige Systeme behandelt. Dabei wur-de angenommen, daß sich die Nulldynamik in zwei Zeithorizonte einteilen läßt. Bei der verwen-deten Approximation des Systems wurde der schnelle Anteil der Nulldynamik vernachlässigt.War der verbleibende Anteil der Nulldynamik stabil, so konnte die Approximation stabil inver-tiert werden. Da eine exakte Abspaltung der schnellen Nulldynamik von der restlichen Dynamikdes Systems nicht möglich ist, entsprechen die Eigendynamik, Statik und langsame Nulldyna-mik der Approximation nicht exakt der des Originalsystems.Selbst wenn das System nur eineschnelle Nulldynamik besitzt, wie zum Beispiel der Lenkflugkörper ohne Stellglieddynamik,tritt dieser Effekt bei Anwendung des Verfahrens auf.Für Systeme

Σ :x = f (x) + g(x)uy = h(x)

(2.173)

mit Nulldynamik wird nun ein Verfahren entwickelt, das ein SystemΣ erzeugt, welches an jedemGleichgewichtspunkt folgende Eigenschaften besitzt:

Page 72: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 72

• Die Statik vonΣ undΣ stimmen überein.

• Die Pole der Jakobi-Linearisierung vonΣ entsprechen den Polen der Jakobi-Linearisierungdes OriginalsystemsΣ, d.h. die Eigendynamik der SystemeΣ und Σ ist identisch.

• Das SystemΣ besitzt keine Nulldynamik, d.h. die Jakobi-Linearisierung von Σ hat keineNullstellen.

Ist die Nulldynamik der nichtlinearen Regelstrecke sehr schnell gegenüber der Eigendynamik,d.h. sind die Nullstellen der durch Linearisierung des nichtlinearen SystemsΣ erhaltenen Über-tragungsfunktion weiter von der imaginären Achse entferntals die Polstellen, so stellt das ge-wonnene SystemΣ eine akzeptable Approximation des OriginalsystemsΣ dar. Die Nulldyna-mik des SystemsΣ wird vernachlässigt, Statik und Eigendynamik bleiben hingegen unverän-dert. Um das SystemΣ zu konstruieren, bietet es sich an, das nichtlineare SystemΣ in derFliess-Normalform bzw. in der Beobachtungsnormalform [9]darzustellen. Der Vorteil dieserDarstellung ist, daß durch Linearisierung dieser Normalform an einem Gleichgewichtspunkt dasZähler- und Nennerpolynom der Übertragungsfunktion separat erscheinen. Es lassen sich so-mit gezielt Veränderungen an der Beobachtungsnormalform in der Art und Weise vornehmen,daß nur die Nullstellen der Linearisierung und nicht gleichzeitig auch die Polstellen verändertwerden. Ein solches Vorgehen ist anhand der Byrnes-Isidori-Normalform beispielsweise nichtmöglich. Ähnlich wie bei der Herleitung der Normalform (2.19) wird der Systemausgang suk-zessive nach der Zeit abgeleitet. Jedoch wird jetzt nach derr-ten Ableitung fortgefahren biszur n-ten Ableitung. Die Zustände der Beobachtungsnormalform sind die Ausgangsgrößey undderenn− 1 Ableitungen. Bestimmt man diese Ableitungen, so erhält man:

y = L f h(x) = φ1(x)...

y(r−1) = Lr−1f h(x) = φr (x)

y(r) = Lrf h(x) + LgL

r−1f h(x)u = φr+1(x, u)

y(r+1) = Lr+1f h(x) + LgL

rf h(x)u+ L2

gLr−1f h(x)u2 + L f LgL

r−1f h(x)u+ LgL

r−1f h(x)u

= φr+2(x, u, u)...

y(n−1) = φn(x, u, u, · · · , u(n−r−1)). (2.174)

Die Stellgröße u erscheint ab derr-ten Ableitung, wobeir der wohl definierte relative Grad desSystems (2.173) ist. Die KoordinatentransformationΦ ist abhängig vom Zustandx des Systemsund der Stellgrößeu und derenn− r − 1 Ableitungen.

Die neuen Zustände werden in dem Vektorζ zusammengefaßt:

ζT =(

y, y, · · · , y(n−1))

= ΦT(x, u, u, · · · , u(n−r−1)). (2.175)

Page 73: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 73

Wendet man die KoordinatentransformationΦ auf das System (2.173) an, so erhält man dieBeobachtungsnormalform:

ζ1 = ζ2

ζ2 = ζ3

...

ζn−1 = ζn

ζn = y(n) = F(ζ, u, u, · · · , u(n−r)). (2.176)

Die Linearisierung des Zustandsraummodells (2.176) an einem stationären Arbeitspunkt lautet:

ζ1 = ζ2

ζ2 = ζ3

...

ζn−1 = ζn

ζn = −a0ζ1 − a1ζ2 − · · · − an−1ζn

+b0u+ b1u+ · · · + bn−ru(n−r)

y = ζ1, (2.177)

wobei sich die Koeffizientenai undbi wie folgt ergeben:

ai = −∂F∂ζi+1

∣∣∣∣∣0, i = 0, · · · , n− 1 bi =

∂F

∂u(i)

∣∣∣∣∣0, i = 0, · · · , n− r. (2.178)

Der Index 0 bedeutet, daß die Ableitungen an der Stelle

[ζT , u, u, · · · , u(n−r)] = [y, y, · · · , y(n−1), u, u, · · · , u(n−r)] = [0, 0, · · · , 0, 0, 0, · · · , 0]

berechnet wurden. Es wird somit angenommen, daß der betrachtete Gleichgewichtspunkt desSystems im Ursprung liegt. Diese Annahme stellt keine Einschränkung der Allgemeinheit dar.Eine Verschiebung jedes Gleichgewichtspunktes in den Ursprung ist stets möglich. Die zumZustandsraummodell (2.177) korrespondierende Übertragungsfunktion lautet:

G(s) =y(s)u(s)=

bn−r sn−r + · · · + b1s+ b0

sn + an−1sn−1 + · · · + a1s+ a0. (2.179)

Man erkennt, daß das Zählerpolynom und Nennerpolynom der Übertragungsfunktion bereitsin (2.177) direkt erscheinen. Das SystemΣ ist durch die beschriebenen Eigenschaften nichteindeutig festgelegt. Setzt man in der Beobachtungsnormalform (2.176) alle Ableitungen der

Page 74: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 74

Stellgrößeu Null, so hat man eine mögliche Realisierung des SystemsΣ gefunden:

˙ζ1 = ζ2

˙ζ2 = ζ3

Σ :...

˙ζn−1 = ζn

˙ζn = F(ζ, u, 0, 0, · · · , 0)

y = ζ1. (2.180)

Die vorgenommene Veränderung an der FunktionF hat folgende Auswirkungen:

1. Die Koeffizienten des Nennerpolynoms der Übertragungsfunktion der Linearisierung desSystemsΣ entsprechen denen der Übertragungsfunktion (2.179), da

ai =∂F(ζ, u, u, · · · , u(n−r))

∂ζi+1

∣∣∣∣∣∣0

=∂F(ζ, u, 0, · · · , 0)

∂ζi+1

∣∣∣∣∣0, i = 0, · · · , n− 1

gilt. Die Eigendynamik bleibt somit unverändert. Die Ableitungen der FunktionF nachden Zuständenζi werden im Arbeitspunkt entwickelt. Dort sind die Ableitungen der Stell-größe stets Null. Es ist praktisch egal, ob man zuerst die Funktion F nach den Zuständenζi ableitet und anschließend die Ableitungen der Stellgröße Null setzt oder ob man zuerstdie Ableitungen der Stellgröße in der FunktionF Null setzt und dann die FunktionF nachden Zuständenζi ableitet. Für den Koeffizientenb0 gelten die gleichen Überlegungen undes folgt:

b0 =∂F(ζ, u, u, · · · , u(n−r))

∂u

∣∣∣∣∣∣0

=F(ζ, u, 0, · · · , 0)

∂u

∣∣∣∣∣0.

2. Durch das Nullsetzen der Ableitungen vonu in F wird die Statik nicht geändert, da imGleichgewichtspunkt die Ableitungen der Stellgröße Null sind.

F(ζ, u, u, · · · , u(n−r))|Gl = 0 = F(ζ, u, 0, · · · , 0)|Gl

Der IndexGl bedeutet, daß die Funktion im Gleichgewichtspunkt entwickelt wird.

3. Die Koeffizientenbi , i = 1, · · · , n − r des Zählerpolynoms werden Null, wenn die Ablei-tungen der Stellgrößeu in der FunktionF nicht mehr erscheinen.

bi =F(ζ, u, 0, · · · , 0)

∂u(i)

∣∣∣∣∣= 0, i = 1, · · · , n− r

Die Übertragungsfunktion der Linearisierung des SystemsΣ lautet demzufolge:

G(s) =y(s)u(s)=

b0

sn + an−1sn−1 + · · · + a1s+ a0. (2.181)

Page 75: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 75

Die statische VerstärkungV = b0a0

entspricht der statischen Verstärkung der Übertragungsfunkti-

on (2.179). Des weiteren besitzen (2.179) und (2.181) das gleiche Nennerpolynomsn+an−1sn−1+

· · ·+a1s+a0 und somit die gleichen Polstellen. Jedoch sind bei der Übertragungsfunktion (2.181)die Koeffizientenbi , i = 1, · · · , n − r gleich Null und somit keine Nullstellen mehr vorhanden.Die für das SystemΣ definierten Eigenschaften liegen somit vor.Ein Problem tritt auf, wenn die Transformation (2.174) nicht analytisch invertierbar ist und folg-lich die FunktionF nicht explizit angegeben werden kann. Die inverse Transformation

x = Φ−1(ζ, u, u, · · · , u(n−r−1))

kann in diesem Fall zu jedem Zeitpunkt nur durch numerischesLösen des Gleichungssystems(2.174) ermittelt werden.Was bedeutet in diesem Fall des Nullsetzen der Ableitungen der Stellgröße in der FunktionF?Die n-te Ableitung der Ausgangsgrößey ist eine Funktion der Zuständex und der Stellgrößeusowie derenn− r Ableitungen.

y(n) = y(n)(x = Φ−1(ζ, u, u, · · · , u(n−r−1)), u, u, · · · , u(n−r)) (2.182)

Das Nullsetzen der Ableitungen vonu in F ist somit gleichzusetzen mit dem Nullsetzen derAbleitungen vonu in (2.182):

F(ζ, u, 0, · · · , 0) ≡ y(n)(x = Φ−1(ζ, u, 0, · · · , 0), u, 0, · · · , 0).

Der durchx = Φ−1(ζ, u, 0, · · · , 0) (2.183)

festgelegte Zustand ˆx kann als eine Approximation des Systemzustandesx aufgefaßt werden.An einem stationären Arbeitspunkt, an dem die Ableitungen der Stellgröße gleich Null sind,stimmenx und x überein.Das Vorgehen bei der Simulation des SystemsΣ ohne explizit gegebene FunktionF bzw. ohneanalytische Inverse der TransformationΦ ist das folgende:Zu jedem Zeitpunkt wird das Gleichungssystemζ = Φ(x, u, 0, · · · , 0) numerisch nach dem Zu-standx aufgelöst. Der Wert vonx ist abhängig von der aktuellen Stellgröße ˆu des SystemsΣ undden Zuständenζ der Beobachtungsnormalform (2.180). Der Wert der Ableitung des Zustandesζn wird im Anschluß daran nach der Beziehung

˙ζn = y(n)(x, u, 0, · · · , 0) (2.184)

berechnet. Für die restlichen Ableitungen der Zustände derBeobachtungsnormalform gilt:

˙ζ1 = ζ2

˙ζ2 = ζ3

...˙ζn−1 = ζn. (2.185)

Bei der Simulation fällt somit immer eine Approximation ˆx des Systemzustandesx an.

Page 76: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 76

Es sei nun angenommen, daß das SystemΣ nichtminimalphasig ist und somit keine stabile In-verse existiert. Das SystemΣ wird zur approximativen Inversion des SystemsΣ genutzt. Da dieStatik der beiden Systeme gleich ist, wird als Referenztrajektorie des SystemsΣ die Referenz-trajektorie vonΣ verwendet:

yd(t) = yd(t) ∈ Cn−1.

Die n Ableitungen des Signalsyd(t) müssen existieren und beschränkt sein. Die Beobachtungs-normalform (2.180) des SystemsΣ stellt eine Kette vonn Integratoren dar. Erfüllt der Anfangs-zustandζ(0) der Integratoren die Bedingung

ζ(0) = ζd(0) = [yd(0), ˙yd(0), · · · , yd(n−1)(0)]T

und wird die EingangsgrößeF(ζd, u, 0, 0, · · · , 0) des ersten Integrators der Kette wie folgt ge-wählt:

yd(n) ≡ F(ζd, ud, 0, 0, · · · , 0), (2.186)

so wird am Ausgang ˆy des SystemsΣ die gewünschte Vorgabe ˆyd(t) erzeugt. Die zum Erzeugender gewünschten Ausgangsgröße ˆyd(t) notwendige Stellgröße ˆud(t) wird durch die Gleichung(2.186) festgelegt. Es ist in keiner Art und Weise garantiert, daß sich die Gleichung (2.186)analytisch nach ˆud auflösen läßt und daß es überhaupt eine Lösung gibt. Des weiteren kann dieGleichung (2.186) mehrere mögliche Stellgrößen liefern, was ein weiteres Problem darstellt. Dienominalen Zuständexd ergeben sich durch:

xd= Φ−1(ζ

d, ud, 0, · · · , 0). (2.187)

Läßt sich die Inverse vonΦ und somit die FunktionF nicht analytisch angeben, so sind die zumErzeugen der Ausgangsgröße notwendige Stellgröße ˆud und die Zuständexd zu jedem Zeitpunktdurch Lösen des Gleichungssystems

yd = φ1(xd)...

yd(r−1) = φr (xd)

yd(r) = φr+1(xd, ud)

yd(r+1) = φr+2(xd, ud, 0)...

yd(n−1) = φn(xd, ud, 0, · · · , 0)

yd(n) = yd(n)(xd, ud, 0, · · · , 0) (2.188)

zu ermitteln.

Zusammenfassend läßt sich folgendes sagen: Dieses Verfahren liefert für Systeme mit schnellerNulldynamik eine ApproximationΣmit dem relativen Gradr = n. Die Inversion dieses Systems,das in Beobachtungsnormalform vorliegt, gestaltet sich jedoch schwieriger als die Inversion

Page 77: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 77

eines Systems in der Normalform (2.19). Weitere theoretische Untersuchungen zur Lösbarkeitdes Gleichungsystems (2.188) und zur Eignung von ˆx als Approximation des Systemzustandesx von (2.173) sind zwingend notwendig.

Beispiel 2.4.9Am Beispiel des Lenkflugkörpers ohne Stellglieddynamik soll das in diesem Abschnitt ent-wickelte Verfahren demonstriert werden. Wie im Beispiel 2.4.7 gezeigt, läßt sich das Modell desLenkflugkörpers ohne Stellglieddynamik nicht in der Form (2.173) darstellen. Die Systemglei-chungen der Regelstrecke Lenkflugkörper entsprechen der Form

x = f (x) + g(x)u

y = h(x) + l(x)u. (2.189)

Das konkreten Aussehen der Vektorfelderf (x) undg(x) sowie die skalaren Funktionenl(x) undh(x) ist im Beispiel 2.4.7 angegeben. Der relative Gradr eines Systems der Form (2.189) istNull, wenn die skalare Funktionl(x) die Bedingungl(x) , 0,∀x ∈ D erfüllt. Dieses ist für denLenkflugkörper der Fall. Die Anwendung des in diesem Abschnitt beschriebenen Verfahrens istohne weiteres für Systeme der Form (2.189) mit dem relativenGradr = 0 möglich. In einem er-sten Schritt wird das Systems (2.189) auf die Beobachtungsnormalform transformiert, wobei dieOrdnung der Regelstrecke Lenkflugkörpern = 2 beträgt. Die dazu notwendige TransformationΦ lautet:

(

ζ1

ζ2

)

=

(

y

y

)

= Φ(x, u, u) =

(

φ1(x, u)φ2(x, u, u)

)

. (2.190)

Die neuen Zuständeζ1 und ζ2 sind die Ausgangsgrößey und die erste Ableitungy der Aus-gangsgröße. Für den Lenkflugkörper erhält man konkret folgende Transformation:

y = h(x) + l(x)u = φ1(x, u)

=Q(M)S

mCzx1

(x1,M) +Q(M)S dz

mu

y = L f h(x) + Lgh(x)u+ Lgl(x)u2 + L f l(x)u+ l(x)u = φ2(x, u, u)

=1m

Q(M)S∂Czx1

(x1,M)

∂x1

[

180π

Q(M)SMvsm

Czx1(x1,M) cos

( x1π

180

)

+ x2

]

+Q(M)S

m

∂Czx1(x1,M)

∂x1

[

180π

Q(M)S dz

Mvsmcos

( x1π

180

)]

u

+1m

Q(M)S dzu. (2.191)

Das Gleichungssystem (2.191) läßt sich nicht analytisch nach den Originalzuständen auflösen.Wendet man die Transformation (2.190) auf (2.189) an, so erhält man die Beobachtungsnormal-

Page 78: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 78

form:

ζ1 = ζ2

ζ2 = y(2) =(L2

f h(x) + LgL f h(x)u+ L f Lgh(x)u+ L2gh(x)u+ Lgh(x)u

Σ : +L2gl(x)u3 + L f Lgl(x)u2 + 2Lgl(x)2u

+LgL f l(x)u2 + L2f l(x)u+ L f l(x)u+

L f l(x)u+ Lgl(x)uu+ l(x)u(2))∣∣∣x=Φ−1

(ζ ,u,u)

= F(ζ, u, u, u(2)). (2.192)

Die FunktionF kann im Falle des Lenkflugkörpers nicht explizit angeben werden, da keineanalytische Inverse der TransformationΦ existiert. Die minimalphasige ApproximationΣ erhältman durch Nullsetzen der Ableitungen der Stellgröße in der Beobachtungsnormalform (2.192):

˙ζ1 = ζ2

Σ : ˙ζ2 = y(2) =(L2

f h(x) + LgL f h(x)u+ L f Lgh(x)u+ L2gh(x)u

+L2gl(x)u3 + L f Lgl(x)u2

+LgL f l(x)u2 + L2f l(x)u

)∣∣∣∣x=Φ−1

(ζ,u,0)(2.193)

Die in der letzten Zeile von (2.193) vorkommenden Lie-Ableitungen lauten:

L2f h(x) =

Q(M)Sm

∂2Czx1(x1,M)

∂x21

[

180π

Q(M)SMvsm

Czx1(x1,M) cos

( x1π

180

)

+ x2

]

+

(∂Czx1

(x1,M)

∂x1

)2180π

Q(M)SMvsm

cos( x1π

180

)

−∂Czx1

(x1,M)

∂x1

Q(M)SMvsm

sin( x1π

180

)]

·[

180π

Q(M)SMvsm

Czx1(x1,M) cos

( x1π

180

)

+ x2

]

+Q2(M)S2d

mIyy

∂Czx1(x1,M)

∂x1

180π

Cmx1(x1,M)

LgL f h(x) =Q(M)S

m

∂2Czx1(x1,M)

∂x21

[

180π

Q(M)SMvsm

Czx1(x1,M) cos

( x1π

180

)

+ x2

]

+

(∂Czx1

(x1,M)

∂x1

)2180π

Q(M)SMvsm

cos( x1π

180

)

−∂Czx1

(x1,M)

∂x1

Q(M)SMvsm

sin( x1π

180

)]

·[

180π

Q(M)S dz

Mvsmcos

( x1π

180

)]

+180π

Q(M)2S2ddm

mIyy

∂Czx1(x1,M)

∂x1

L f Lgh(x) =Q(M)2S2dz

Mvsm2

180π

∂2Czx1(x1,M)

∂x21

cos( x1π

180

)

−∂Czx1

(x1,M)

∂x1sin

( x1π

180

)

·[

180π

Q(M)SMvsm

Czx1(x1,M) cos

( x1π

180

)

+ x2

]

(2.194)

Page 79: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 79

L2gh(x) =

Q(M)2S2dz

Mvsm2

180π

∂2Czx1(x1,M)

∂x21

cos( x1π

180

)

−∂Czx1

(x1,M)

∂x1sin

( x1π

180

)

·180π

Q(M)S dz

Mvsmcos

( x1π

180

)

(2.195)

L2gl(x) = L f Lgl(x) = Lgl(x) = LgL f l(x) = L2

f l(x) = L f l(x) = 0. (2.196)

Will man die Ableitung ˙ζ2 in (2.193) aus den Zuständenζ und der Stellgrößeu berechnen, soist in einem Zwischenschritt vorerst der Vektorx zu bestimmen. Diesen erhält man durch Lösendes Gleichungssystems

ζ = Φ(x, u, 0).

Um die Güte der Approximation beurteilen zu können, wurden die Sprungantworten des origi-nalen SystemsΣ und der ApproximationΣ verglichen. Das Ergebnis ist in der Abbildung 2.21dargestellt. Der Anfangszustand beider Systeme war zum Zeitpunkt t = 0 gleich Null. Die Ab-bildung 2.22 zeigt den Verlauf der Systemzuständex und deren Approximationx.Die approximative Inversion des Lenkflugkörpers anhand desSystemsΣ gestaltet sich proble-matisch. Da die TransformationΦ analytisch nicht invertierbar ist, müssen die Stellgrößeud

und die Zuständexd bei gegebenen Vorgabenζd1 = y

d, ζd2 =

˙yd und ˙ζd2 = y

d(2) durch Lösen desGleichungssystems

yd = φ1(xd, ud)˙yd = φ2(xd, ud, 0)

yd(2) = L2f h(xd) + LgL f h(xd)ud + L f Lgh(xd)ud + L2

gh(xd)ud (2.197)

ermittelt werden. Aufgrund der Tatsache, daß einige Lie-Ableitungen in (2.197) nicht stetigsind, ist die Anwendung vieler numerischer Verfahren zur Lösung des Problems nicht geeignet.Die Unstetigkeit der Lie-Ableitungen beruht auf der Eigenschaft der FunktionCzx1

(xd1,M), an

der Stelle xd1 = 0 nicht differenzierbar zu sein. Versuche, das Gleichungssystem (2.197) zu

lösen, führten weiterhin zu der Erkenntnis, daß es für einige Vorgaben (z.B.yd(t) ≈ 0 und˙yd(t) groß) keine Lösung gibt. Dieses Beispiel zeigt deutlich, daß zwar eine gute Approximationgefunden wurde, aber die Inversion dieser Approximation problematisch ist. Es wird erwartet,daß für Systeme (2.173) oder (2.189) mit beliebig oft differenzierbaren Systemgleichungen dieLösbarkeit des Gleichungssystems (2.197) besser ist.

Page 80: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 80

0 1 2 3 4 5 6 7 8 9 10−1

0

1

2

3

4

5

6

7

8

t in s

yin

g,y

ing

Abbildung 2.21:Sprungantwort (gestrichelte Linie)der Approximation (2.189) des Lenk-flugkörpers im Vergleich mit derSprungantwort des wahren Systems(durchgezogene Linie) bei einemStellgrößensprung von 0deg auf 5degzum Zeitpunktt = 0.

0 1 2 3 4 5 6 7 8 9 10−50

−40

−30

−20

−10

0

10

20

30

40

t in s

x,x

Abbildung 2.22:Systemzuständex (gestrichelte Li-nien) des Lenkflugkörpers und de-ren Approximation ˆx (durchgezogeneLinien) bei einem Stellgrößensprungvon 0deg auf 5deg zum Zeitpunktt =0.

2.4.4 Inversion maximalphasiger Systeme

Es existieren zahlreiche lineare Regler, deren Entwurf aufeinem inversen Modell der linearenRegelstrecke beruht. Ein bekanntes Verfahren istInternal Model Control[26]. Eine wichtigeForderung beim Reglerentwurf ist, daß die Systeminverse stabil ist. Im Falle nichtminimalpha-siger Regelstrecken, für die keine exakte stabile Inversion möglich ist, besteht nun die Aufgabedarin, eine invertierbare Approximation der Regelstreckezu finden. In der Regel wird die Ap-proximation dadurch erhalten, daß die lineare Regelstrecke in einem minimalphasigen Anteilund einen Allpaß faktorisiert wird. Der Reglerentwurf erfolgt dann an der Inversen des minimal-phasigen Anteils. Der Allpaß verbleibt als begrenzendes Element im resultierenden Regelkreis,so daß das geregelte System nichtminimalphasiges Verhalten aufweist. In [26] wird gezeigt, daßdieses Vorgehen bei linearen Systemen zu einer optimalen Sprungantwort im Sinne des ISE-Kriteriums führt.Für allgemeine nichtlineare Systeme der Form (2.1) existieren nur begrenzte Ergebnisse für eineähnliche Faktorisierung des Systems in einen minimalphasigen AnteilΣ und einen „nichtlinea-ren Allpaß” [20, 41, 38]. So wird beispielsweise in [20] für Eingrößensysteme zweiter Ordnungeine Lösung vorgestellt. Für flache Eingrößensysteme wird in [41] ein Lösungsansatz beschrie-ben, der jedoch nur für Systeme mit dem relativen Gradr = n − 1 akzeptabel ist. Der hiervorgestellte Ansatz ist [8] entnommen und beschreibt die Konstruktion eines minimalphasigenAnteils Σ für lokal maximalphasige nichtlineare Systeme der Form

Page 81: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 81

Σ :x = f (x) + g(x)uy = h(x)

(2.198)

mit dem wohl definierten relativen Gradr. Lokal maximalphasig bedeutet, daß an den betrachte-ten Gleichgewichtspunkten die unangeregte Nulldynamik des Systems keine stabile und zentraleMannigfaltigkeit aufweist (siehe Anhang C). Für lineare Systeme heißt maximalphasig, daß nurNullstellen in der geschlossenen rechten Hälfte der s-Ebene existieren. Ist das System (2.198)maximalphasig, so besitzt seine Jakobi-Linearisierung aneinem stationären Arbeitspunkt nurinstabile Nullstellen. Durch die Betrachtungen im linearen Fall angeregt, wird in [8] vorge-schlagen, eine minimalphasige ApproximationΣ zu konstruieren, welche an den betrachtetenGleichgewichtspunkten fest definierte Eigenschaften aufweist und für nichtminimalphasige li-neare Systeme dem beschriebenen minimalphasigen Anteil entspricht.

Definition 2.4.6 (Eigenschaften der minimalphasigen Approximation Σ)1. Die Pole der Jakobi-Linearisierung vonΣ entsprechen exakt den Polen der Jakobi-Linearisierung

des OriginalsystemsΣ.

2. Die Jakobi-Linearisierung des SystemsΣ besitzt stabile Nullstellen, die mit den stabilenNullstellen der Linearisierung des SystemsΣ übereinstimmen.

3. Die Jakobi-Linearisierung des SystemsΣ besitzt stabile Nullstellen, die der Spiegelungder instabilen Nullstellen der Linearisierung des SystemsΣ an der imaginären Achse ent-sprechen.

4. Die Statik vonΣ undΣ stimmen überein.

5. Die Eigendynamik der SystemeΣ und Σ ist identisch.

Die Übertragungsfunktion der Linearisierung vonΣ entspricht exakt dem minimalphasigen An-teil der Linearisierung des OriginalsystemsΣ an dem entsprechenden Gleichgewichtspunkt.Durch die genannten Eigenschaften ist das SystemΣ natürlich nicht eindeutig festgelegt. ZurKonstruktion des SystemsΣ bietet sich wie im Beispiel 2.4.9 an, zuerst die Beobachtungsnor-malform von (2.198) zu ermitteln. Diese Darstellungsform wird durch Anwendung der Koordi-natentransformationζ = Φ(x, u, u, · · · , u(n−r−1)) erzielt, wobeiζ die Ausgangsgrößey und derenn− 1 Ableitungen enthält:

ζ1 = ζ2

ζ2 = ζ3

Σ...

ζn−1 = ζn

ζn = y(n)(x, u, u, · · · , u(n−r))∣∣∣x=Φ−1

(ζ ,u,u,··· ,u(n−r−1))

= F(ζ, u, u, · · · , u(n−r)). (2.199)

Page 82: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 82

Die Linearisierung von (2.199) an einem Gleichgewichtspunkt ergibt die Übertragungsfunktion

G(s) =y(s)u(s)=

bn−r sn−r + · · · + b1s+ b0

sn + an−1sn−1 + · · · + a1s+ a0(2.200)

mit den Koeffizientenai undbi , die wie folgt bestimmt werden (siehe auch Abschnitt 2.4.9):

ai = −∂F∂ζi+1

∣∣∣∣∣0, i = 0, · · · , n− 1 bi =

∂F

∂u(i)

∣∣∣∣∣0, i = 0, · · · , n− r. (2.201)

Es wird angenommen, daß der betrachtete Gleichgewichtspunkt, an dem linearisiert wird, imUrsprung liegt. Ist die Strecke (2.198) maximalphasig, so liegen alle (n − r) Nullstellen desZählerpolynoms von (2.200) in der geschlossenen rechten Hälfte der s-Ebene. Die Approxima-tion Σ ist nach den definierten Eigenschaften so zu bestimmen, daß ihre Linearisierung an denGleichgewichtspunkten die gleichen Pole besitzt wie (2.200) und die an der imaginären Ach-se gespiegelten Nullstellen von (2.200). Des weiteren solldie Statik unverändert bleiben. DieÜbertragungsfunktionG(s) der Linearisierung vonΣ soll zunächst bestimmt werden. Das Zäh-lerpolynom vonG(s) läßt sich als Produkt wie folgt darstellen:

bn−r sn−r + · · · + b1s+ b0 = bn−rΠn−ri=1(s− zi), (2.202)

wobei aufgrund der Maximalphasigkeit allezi einen positiven Realteil besitzen. Faktorisiert manG(s) in einem minimalphasigen Anteil und einem Allpaß, so erhält man

G(s) =bn−rΠ

n−ri=1 (s− zi)

sn + an−1sn−1 + · · · + a1s+ a0

=bn−r (−1)n−rΠn−r

i=1(s+ zi)

sn + an−1sn−1 + · · · + a1s+ a0︸ ︷︷ ︸

minimalphasiger Anteil

Πn−ri=1(s− zi)

(−1)n−rΠn−ri=1 (s+ zi)

︸ ︷︷ ︸

Allpaß

. (2.203)

Der minimalphasige Anteil vonG(s) entspricht der gesuchten ÜbertragungsfunktionG(s):

G(s) =bn−r (−1)n−rΠn−r

i=1 (s+ zi)

sn + an−1sn−1 + · · · + a1s+ a0

=(−1)n−rbn−r sn−r + (−1)n−r−1bn−r−1sn−r−1 + · · · − b1s+ b0

sn + an−1sn−1 + · · · + a1s+ a0

=bn−r sn−r + bn−r−1sn−r−1 + · · · + b1s+ b0

sn + an−1sn−1 + · · · + a1s+ a0. (2.204)

Durch Ersetzen der Ableitungen vonu in der Beobachtungsnormalform (2.199) durchu(i) ≡(−1)iu(i) ergibt sich eine mögliche Realisierung des SystemsΣ, deren Linearisierung die Über-

Page 83: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 83

tragungsfunktion (2.204) liefert:

˙ζ1 = ζ2

˙ζ2 = ζ3

Σ :...

˙ζn−1 = ζn

˙ζn = y(n)(x, u,− ˙u, · · · , (−1)n−r u(n−r))∣∣∣x=Φ−1

(ζ ,u,− ˙u,··· ,(−1)n−r−1u(n−r−1))

= F(ζ, u,− ˙u, · · · , (−1)n−r u(n−r)). (2.205)

Der in (2.205) vorkommende Vektor ˆx kann als Approximation des Systemzustandesx aufgefaßtwerden:

x = Φ−1(ζ, u,− ˙u, · · · , (−1)n−r−1u(n−r−1)). (2.206)

Sind die Ableitungen der Stellgröße gleich Null, so giltx = x. Das System (2.205) besitzt diegeforderten Eigenschaften fürΣ, da folgendes gilt:

1. Die Pole der Linearisierung vonΣ undΣ stimmen überein, da die Linearisierung an einemGleichgewichtspunkt erfolgt und somit

ai =∂F(ζ, u, u, · · · , u(n−r))

∂ζi+1

∣∣∣∣∣∣0

=∂F(ζ, u,−u, · · · , (−1)n−ru(n−r))

∂ζi+1

∣∣∣∣∣∣0

, i = 0, · · · , n− 1

gilt. Das charakteristische Polynom bleibt folglich unverändert.

2. Die Linearisierung des Systems (2.198) besitzt keine stabilen Nullstellen.

3. Die Nullstellen der Linearisierung von (2.205) hängen von den Koeffizienten

bi =∂F(ζ ,u,−u,··· ,(−1)n−r u(n−r )

∂u(i)

∣∣∣∣∣0

ab. Wird das System an einem Gleichgewichtspunkt lineari-

siert, so ergibt sich fürbi , i = 1, · · · , n− r:

bi =∂F(ζ, u,−u, · · · , (−1)n−ru(n−r))

∂u(i)

∣∣∣∣∣∣0

= (−1)i∂F(ζ, u, u, · · · , u(n−r))

∂u(i)

∣∣∣∣∣∣0

= (−1)ibi .

Folglich besitzt die Übertragungsfunktion der Linearisierung von (2.205) das Zählerpoly-nom Z(s):

Z(s) = (−1)n−rbn−r sn−r + (−1)n−r−1bn−r−1sn−r−1 + · · · − b1s+ b0.

Die Nullstellen dieses Polynoms sind nach (2.204) die an derimaginären Achse gespie-gelten instabilen Nullstellen der Linearisierung vonΣ.

4. Die Statik der SystemeΣ undΣ ist identisch. Da im Gleichgewichtspunkt die Ableitungender Stellgröße Null sind, gilt:

F(ζ, u, u, · · · , u(n−r))|Gl = F(ζ, u,−u, · · · , (−1)n−ru(n−r))|Gl = F(ζ, u, 0, · · · , 0)|Gl = 0.

Der IndexGl bedeutet, daß die Funktion im Gleichgewichtspunkt entwickelt wird.

Page 84: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 84

5. Die Eigendynamik, die durchy(n) = F(ζ, 0, 0, · · · , 0) beschrieben ist, wird durch die Sub-stitutionu(i) ≡ (−1)iu(i) nicht geändert.

Die Substitutionu(i) ≡ (−1)iu(i) kann auch als Zeitumkehr der unangeregten Nulldynamik von(2.198) interpretiert werden. Da der Gleichgewichtspunktder unangeregten Nulldynamik nur ei-ne instabile Mannigfaltigkeit aufweist, wird die Mannigfaltigkeit durch Zeitumkehr stabil (sieheAnhang C). Die Spiegelung instabiler Nullstellen an der imaginären Achse im linearen Fall ent-spricht im nichtlinearen Fall der Zeitumkehr der instabilen Mannigfaltigkeit. Besäße der Gleich-gewichtspunkt der Nulldynamik auch eine stabile Mannigfaltigkeit, so würde durch die Substi-tution u(i) ≡ (−1)iu(i) die stabile Mannigfaltigkeit zu einer instabilen Mannigfaltigkeit gemacht.Dieser Effekt erklärt die Beschränkung des Verfahrens auf maximalphasige Systeme.

Page 85: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 85

Inversion der gewonnenen Approximation

Die Inversion des Originalsystems kann nun approximativ anhand des Systems (2.205) erfolgen.Betrachtet man das SystemΣ, so fällt auf, daß es sich um eine nichtminimale Realisierung mit2n− r Zuständen handelt. Um die Inversion dieses Systems durchzuführen, wäre eine Möglich-keit, zuerst eine minimale Realisierung zu finden, die keineAbleitungen der Stellgröße aufweist,und anschließend die Inversion daran vorzunehmen. Unter welchen Bedingungen eine minimaleRealisierung gefunden werden kann und wie diese zu bestimmen ist, wird unter anderem in [10]beschrieben. Einfacher ist der folgende Weg: Die Stellgröße u und derenn − r − 1 Ableitun-gen werden als Zustände der Nulldynamik betrachtet. Als neue Stellgröße wird die (n − r)-teAbleitung der Stellgröße festgelegt:

η1 = u

η2 = ˙u...

ηn−r = u(n−r−1)

uneu = u(n−r). (2.207)

Wendet man (2.204) auf (2.205) an, so erhält man das SystemΣ in der im Abschnitt 2.2 einge-führten Normalform (2.19):

˙ζ1 = ζ2

˙ζ2 = ζ3

...˙ζn−1 = ζn

˙ζn = y(n)(x, η1,−η2, · · · , (−1)n−r uneu)∣∣∣x=Φ−1

(ζ ,η1,−η2,··· ,(−1)n−r−1ηn−r )

= F(ζ, η1,−η2, · · · , (−1)n−r−1uneu)˙η1 = η2

˙η2 = η3

...

˙ηn−r = uneu

y = ζ1. (2.208)

Die neue Eingangsgröße ˆuneu geht stets linear in die FunktionF(ζ, η1,−η2, · · · , (−1)n−r−1uneu)ein. Es läßt sich somit die Inversion des Systems (2.208) nach dem im Abschnitt 2.2 beschrie-benen Verfahren durchführen. Da der relative Grad des Systems Σ (2.208) gleichn ist, müssenn − 1 Ableitungen des Referenzsignals ˆyd existieren und beschränkt sein. Setzt man ˆyd demReferenzsignalyd gleich, so muß gelten:

yd = yd ∈ Cn−1.

Page 86: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 86

Aus dem durch Inversion ermittelten nominalen Verlauf der Zuständeη und der Stellgröße ˆudneu

muß letztendlich noch der Verlauf der ursprünglichen Stellgrößeud und xd bestimmt werden.Aus (2.207) folgt für die Stellgröße ˆud:

ud = η1. (2.209)

Die Trajektorie der Approximation des nominalen Systemzustandes ergibt sich wie folgt:

xd = Φ−1(ζd, η1,−η2, · · · , (−1)n−r−1ηn−r ). (2.210)

Existiert für die Inverse der TransformationΦ keine analytische Lösung, so ist der Vektor ˆxd zujedem gewünschten Zeitpunkt durch numerisches Lösen des Gleichungssystems

ζd= Φ(xd, η1,−η2, · · · , (−1)n−r−1ηn−r ) zu ermitteln.

Beispiel 2.4.10Der im Anhang B beschriebene Bioreaktor entspricht einem System zweiter Ordnung. Im Bei-spiel 2.3.3 wurde gezeigt, daß diese Regelstrecke den relativen Gradr = 1 besitzt. In der Um-gebung der technologisch interessierenden Arbeitspunkte(siehe Anhang B) liegt eine instabileNulldynamik vor. Das System Bioreaktor ist folglich lokal maximalphasig, so daß der in diesemAbschnitt vorstellte Ansatz zur Gewinnung einer Approximation Σ der Regelstrecke angewen-det werden kann. Das SystemΣ besitzt dann an den interessierenden Gleichgewichtspunktenminimalphasiges Verhalten. Die Systemgleichungen liegenin der Form (2.198) vor, wobei dieVektorfunktionenf (x) undg(x) sowie die skalare Funktionh(x) wie folgt lauten:

f (x) =

(

x1a(x2)x1a(x2)b(x2)

)

, g(x)

(

−x1

−x2

)

h(x) = x1

a(x2) = (1− x2)ex2/Γ, b(x2) = (1+ β)/(1+ β − x2). (2.211)

Die bei den Ableitungen der Ausgangsgrößey anfallenden Lie-Ableitungen haben für den Bio-reaktor folgendes Aussehen:

h(x) = x1,

L f h(x) = x1a(x2), Lgh(x) = −x1

L2f h(x) = x1a(x2)2 +

da(x2)dx2

x21a(x2)b(x2), L f Lgh(x) = −x1a(x2)

L2gh(x) = x1, LgL f h(x) = −x1a(x2) − x1x2

da(x2)dx2

. (2.212)

Die notwendige Transformation zur Überführung des Systems(2.211) auf Beobachtungsnor-malform lautet:

ζ1 = h(x) = φ1(x)

ζ2 = L f h(x) + Lgh(x)u = φ2(x, u), (2.213)

Page 87: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 87

wobei die neuen Zuständeζ1 und ζ2 die Ausgangsgrößey und deren erste Ableitung sind. DieTransformation angewendet, liefert folgende Beobachtungsnormalform für den Bioreaktor:

ζ1 = ζ2

ζ2 =(

L2f h(x) + LgL f h(x)u+ L2

gh(x)u2

+L f Lgh(x)u+ Lgh(x)u)∣∣∣∣x=Φ−1

(ζ ,u). (2.214)

Da sich die TransformationΦ nicht analytisch invertieren läßt, kann eine Funktionζ2 = F(ζ, u)nicht explizit angegeben werden. Eine minimalphasige Approximation Σ nach der Definition2.4.6 erhält man durch die Substitutionu ≡ −u in der Beobachtungsnormalform (2.214):

˙ζ1 = ζ2

˙ζ2 =(

L2f h(x) + LgL f h(x)u+ L f Lgh(x)u

+L2gh(x)u2 + Lgh(x)(− ˙u)

)∣∣∣∣x=Φ−1

(ζ ,u). (2.215)

Um das System (2.215) invertieren zu können, wird mittels der Festlegung (2.207) zuerst eineDarstellung in der Normalform (2.19) erzielt:

˙ζ1 = ζ2

˙ζ2 =(

L2f h(x) + LgL f h(x)η1 + L f Lgh(x)η1

+L2gh(x)η2

1 + Lgh(x)(−uneu))∣∣∣∣x=Φ−1

(ζ ,η1)

˙η1 = uneu. (2.216)

Die neue Eingangsgrößeuneu entspricht der Ableitungu. Der Zustandη1 der Nulldynamik istdie Stellgrößeu. Es seien die Referenzgrößeyd sowie deren erste und zweite Ableitung˙yd undyd(2) gegeben. Die notwendige Stellgrößeud

neu zum Erzeugen der Ausgangsgrößeyd erhält mandurch das Stellgesetz

udneu =

1

−Lgh(xd)

(

yd(2) − L2f h(xd) − L f Lgh(x)η1

− L2gh(xd)η2

1 − LgL f (xd)η1

∣∣∣∣∣∣∣xd=Φ

−1(yd, ˙yd,η1)

(2.217)

˙η1 = udneu

=1

−Lgh(xd)

(

yd(2) − L2f h(xd) − L f Lgh(x)η1

− L2gh(xd)η2

1 − LgL f (xd)η1

∣∣∣∣∣∣∣xd=Φ

−1(yd, ˙yd,η1)

. (2.218)

Page 88: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 88

Zur Bestimmung vonudneumuß die nun lokal stabile Nulldynamik (2.218) integriert werden. Die

Approximation xd der nominalen Systemzuständexd und die Approximationud der nominalenStellgrößeud ergeben sich aufgrund von (2.210) und (2.209) wie folgt:

xd= Φ

−1(yd, ˙yd, η1) (2.219)

ud = η1. (2.220)

Das Gleichungssystem (2.219) läßt sich nur nachxd1 analytisch auflösen und zwar in der Form

xd1 = yd.

Den Zustandxd2 erhält man durch numerisches Lösen der Gleichung

a(xd2) =

1

yd( ˙yd + ydη1).

Referenz-modell

Approx.Inverse Regelstrecke

yr = yr

yd = yd

yd(2) = yd(2)

ud

xd

y = x1u

uf b = −kT xe

xe

x

u f b

Abbildung 2.23: Regelung des Bioreaktors: Zur Generierungder approximativen nominalenStellgröße ˆud und Zustandstrajektorie ˆxd dient die Inverse der Systemappro-ximation (2.215). Als stabilisierender Regler wird ein fester linearer Zustands-regler eingesetzt.

Um die Eignung der approximativen Inversion des Bioreaktors anhand der Approximation (2.215)beurteilen zu können, wurde eine Regelung unter Verwendungder Inversen von (2.215) imple-mentiert. Das Blockschaltbild der verwendeten Reglerstruktur mit zwei Freiheitsgraden ist inAbbildung 2.23 dargestellt. Externe Eingangsgröße der Regelung ist das ungefilterte Referenz-signalyr . Das gewünschte Übertragungsverhalten des Regelkreises auf Änderungen inyr wirddurch ein Referenzmodell zweiter Ordnung beschrieben. DieÜbertragungsfunktion des Refe-renzmodells lautet:

yd(s)yr (s)

= G(s)re f =0.72

s2 + 2 · 0.7s+ 0.72, (2.221)

wobeiyd der Verlauf ist, der am Systemausgang erzeugt werden soll. Das Referenzmodell (sie-he Gleichungen (2.32) und (2.33)) liefert weiterhin die fürdie Inversion benötigte erste und

Page 89: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 89

zweite Ableitung des Signalsyd. Die Inversion der Regelstrecke wird approximativ mit derInversen des approximierten Systems (2.215) durchgeführt. Um Abweichungen des System-zustandesx von der Trajektoriexd auszuregeln und um die instabile Regelstrecke Bioreaktorzu stabilisieren, wurde ein linearer Zustandsregler verwendet. Dieser wurde an einem linea-ren Modell der Regelstrecke entworfen, welches durch Linearisierung im Gleichgewichtspunktxe

1 = 0.1207, xe2 = 0.75, ue = 0.75 gewonnen wurde. Als Entwurfsverfahren diente die Polvor-

gabe, wobei schnellere Pole vorgegeben wurden als die des Referenzmodells (2.221). Eingangs-größe des Reglers ist die Abweichungxe des wahren Systemzustandesx von der gefordertennominalen Trajektoriexd. Die Stellgröße u ergibt sich wie folgt:

u = ud + uf b

uf b = −kT(x − xd), (2.222)

wobeiuf b die Ausgangsgröße des linearen Reglers ist.

0 10 20 30 40 50 60 700.05

0.1

0.15

0.2

0.25

t in s

y,y

d=y

d

Abbildung 2.24: Verlauf der Ausgangsgrößey (durchgezogene Linie) und der Vorgabe ˆyd = yd

(gestrichelte Linie)

In der Abbildung 2.24 ist der Verlauf der Vorgabeyd und der geregelten Ausgangsgröße dar-gestellt. Zum Zeitpunktt = 0 befindet sich die Regelstecke im Gleichgewichtspunktx1(0) =xe

1 = 0.1207, x2(0) = xe2 = 0.75, u(0) = ue = 0.75. Der Anfangszustandη1 des inversen Systems

wurde dem entsprechend mitη1 = ud = ue = 0.75 festgelegt. Man erkennt, daß die Ausgangs-größey sehr gut der Vorgabeyd folgt. Das das nichtminimalphasige Systemverhalten bestehtweiterhin. Über einen großen Arbeitsbereich besitzt das geregelte System annähernd linearesÜbertragungsverhalten. Abweichungen der Trajektoriex von xd werden erfolgreich durch denlinearen Regler ausgeregelt. Die entsprechenden Verläufeder Zustände und Stellgrößen sind inden Abbildungen 2.25 und 2.26 wiedergegeben.

Page 90: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

2.4 Inversion von Systemen mit instabiler Nulldynamik 90

0 10 20 30 40 50 60 700

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

t in s

x(t),xd

(t)

Abbildung 2.25: Systemzuständex (durchgezoge-ne Linien) und deren nominaleVorgabexd (gestrichelte Linie)

0 10 20 30 40 50 60 70

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

t in s

ud(t

),u

fb(t

)

Abbildung 2.26: Nominale Stellgröße ˆud (durchge-zogene Linie) und vom linearenRegler gelieferte korrektive Stell-größeuf b (gestrichelte Linie)

Page 91: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3 Folgeregelung

3.1 Grundlegende Betrachtungen

3.1.1 Streckenmodell und Vorwärtssteuerung

Die Zielstellung ist der Entwurf einer Folgeregelung für nichtlineare nichtminimalphasige Re-gelstrecken. Der Begriff Folgeregelung bedeutet, daß der Ausgang der Regelstrecke,entspre-chend getroffener Spezifikationen, einem extern gegebenen Referenzsignal folgt. Im ersten Ka-pitel wurde zur Lösung dieses Problems eine Regelungsstruktur mit zwei Freiheitsgraden vor-geschlagen. Diese Struktur enthält als einen Freiheitsgrad eine Steuerung mit der Inversen derRegelstrecke. Für ein gegebenes Referenzsignalyd wird mittels der inversen Regelstrecke dieStellgröße bestimmt, die notwendig ist, um am Systemausgang y das geforderte Referenzsignalyd zu erzeugen. Die Stellgröße wird auf die Regelstrecke gegeben. Durch die verwendete Steue-rung wird der nichtlineare Charakter des zu regelnden Prozesses erfaßt. Ist die Regelstreckeungestört und stabil, so wird die Folgeregelungsaufgabe nur durch die Steuerung allein zufrie-denstellend gelöst.Im folgenden wird eine Zusammenfassung der bisherigen Erkenntnisse vorgenommen und dieNotwendigkeit des zweiten Freiheitsgrades, d.h. der stabilisierenden unterlagerten Regelung be-gründet. Die im zweiten Kapitel behandelte Inversion der Regelstrecke erfolgte allgemein fürEingrößensysteme der Form

x = f (x) + g(x)uy = h(x)

(3.1)

mit einem wohl definierten relativen Gradr und genügend oft differenzierbaren Systemgleichun-gen. Wie gezeigt, lassen sich einige Inversionsverfahren auch auf Systeme der Form

Σ :x = f (x) + g(x)uy = h(x) + l(x)u

(3.2)

anwenden, wenn der Ausdruckl(x) für alle x im betrachteten Arbeitsbereich ungleich Null ist.Im weiteren Verlauf werden deshalb RegelstreckenΣ der Form (3.2) betrachtet, die (3.1) alseinen Spezialfall enthält. Es sei angenommen, daß mit Hilfeder im zweiten Kapitel vorgestell-ten Verfahren das Inversionsproblem exakt oder näherungsweise gelöst werden kann. Der zu-künftige Verlauf der Referenzgrößeyd sei nicht bekannt. Unter dem Inversionsproblem ist dabeidie Aufgabe zu verstehen, eine beschränkte Eingangsgrößentrajektorieud und eine sich darausergebene nominale, beschränkte Zustandsgrößentrajektorie xd so zu erzeugen, daß am Ausgang

91

Page 92: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.1 Grundlegende Betrachtungen 92

des Systems ein vorgegebener Referenzverlaufyd erzeugt wird. Dieser Fakt wird durch

xd = f (xd) + g(xd)ud

yd = h(xd) + l(xd)ud (3.3)

beschrieben. Die Berechnung der gesuchten Größen kann aufgrund der Tatsache, daß der zu-künftige Verlauf des Referenzsignalsyd nicht bekannt ist, erst zum aktuellen Zeitpunktt erfol-gen. Für nichtminimalphasige Regelstrecken ist eine Ermittlung beschränkter Größenud undxd in diesem Fall nicht möglich. Eine exakte kausale Lösung kann für das Problem (3.3) beiSystemen mit instabiler Nulldynamik folglich nicht gefunden werden. Wie im zweiten Kapitelgezeigt, läßt sich jedoch in einigen Fällen (schwach nichtminimalphasige Systeme, maximalpha-sige Systeme, Systeme mit flachem Ausgang und Systeme mit vernachlässigbar schneller Null-dynamik) eine minimalphasige ApproximationΣ des nichtminimalphasigen SystemsΣ finden,deren Inverse als approximative Inverse des SystemsΣ genutzt werden kann. Die Entscheidung,welches Approximationsverfahren angewandt werden kann, wird vorrangig anhand der Linea-risierung der Regelstrecke an einem Gleichgewichtspunkt getroffen. Für spätere Betrachtungensei angenommen, daß das SystemΣ den relativen Grad ˆr besitzt und folgende Form hat:

Σ :˙x = f (x) + g(x)uy = h(x) + l(x)u

. (3.4)

Ist der relative Grad ˆr ≥ 1, so ist der Ausdruckl(x) für alle x im betrachteten Arbeitsbereichgleich Null. Die Anzahl der Systemzustände vonΣ stimmt mit der des Systems (3.2) überein.Wendet man die gleiche Stellgröße auf die SystemeΣ und Σ mit der Anfangsbedingungx(0) =x(0) an, so sei angenommen, daß sich die resultierenden Lösungen beider Systeme nur gering-fügig unterscheiden und statisch annähernd identisch sind. Der Abstand der Trajektorien ˆx undx bzw.y und y soll folglich klein sein. Das Inversionsproblem (3.3) läßtsich dann approximativdurch das Inversionsproblem

˙xd = f (xd) + g(xd)ud

yd = h(xd) + l(xd)ud (3.5)

ersetzen, wobei nach dem zweiten Kapitel für die Vorgabe ˆyd folgende Überlegungen gelten:Das reduzierte inverse System von (3.4) liefert die gesuchten beschränkten Approximationenud und xd der nominalen Stellgrößeud und der nominalen Zustandsgrößentrajektoriexd. Wich-tig ist, daß als Eingangsgrößen des reduzierten inversen Systems neben der Vorgabe ˆyd noch rbeschränkte Ableitungen der Referenzgröße ˆyd benötigt werden. Dies schränkt die Klasse derreproduzierbaren Ausgangssignale ein. Es muß folglich ˆyd ∈ Cr−1 gelten.

Dies kann dadurch erreicht werden, daß ein extern gegebenesbeschränktes Referenzsignalyr

zunächst auf ein ReferenzmodellΣre f gegeben wird. Dieses Modell beschreibt das durch dieSpezifikation geforderte Übertragungsverhalten der Folgeregelung und liefert als Ausgangsgrö-ßen die genügend glatte Vorgabeyd = yd sowie die geforderten Ableitungen dieser Vorgabe.Die Struktur der Folgeregelung mit zwei Freiheitsgraden ist unter Berücksichtigung der getrof-fenen Überlegungen in der Abbildung 3.1 wiedergegeben. DerInhalt der schwarzen Box stelltdie Vorwärtssteuerung dar.

Page 93: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.1 Grundlegende Betrachtungen 93

yr

Σre fyd = yd, ˙yd, · · ·

Σ−1 ud u

uf b

xe

xd x

Σy

K

Abbildung 3.1: Struktur der Folgeregelung mit zwei Freiheitsgraden

3.1.2 Stabilisierung um die Solltrajektorie

Der gewünschte Verlaufyd der Ausgangsgröße kann für nichtminimalphasige Regelstreckennicht exakt erzeugt werden, da in der Steuerung nur eine approximative Inverse der Regelstreckeverwendet wird, so daß eine exakte Kompensation des E/A-Verhaltens bei der Reihenschaltungvon Σ−1 undΣ nicht möglich ist. Des weiteren wird eine zusätzliche Abweichung der Trajektoriey von der Trajektorieyd erzeugt, wenn folgendes zutrifft:

• Die Regelstrecke ist Parameterschwankungen unterworfen und die bei der Inversion ver-wendete nominale Regelstrecke liegt somit nicht mehr vor.

• Die Anfangsbedingungen des reduzierten inversen Systems und der Regelstrecke stimmennicht überein.

• Es wirken Störungen auf die Regelstrecke ein.

• Die Regelstrecke ist instabil. Eine Stabilisierung durch Rückkopplung ist zwingend not-wendig.

• Es existiert eine unmodellierte schnelle Dynamik.

Um diese Abweichungen zu begrenzen, ist der Einsatz einer zusätzlichen unterlagerten Rege-lung notwendig. Bei dem unterlagerten Regelkreis kann es sich um eine Ausgangsregelung oderZustandsregelung handeln. Im folgenden soll der Entwurf von Zustandsreglern näher betrachtet

Page 94: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.1 Grundlegende Betrachtungen 94

werden. Hierzu sei angenommen, daß die Zustände der Streckemeßbar oder zumindest beob-achtbar sind. Als indirektes Maß für die Abweichung vony undyd kann dann die Abweichungder Zustandstrajektorienx und xd verwendet werden. Diese Abweichung wird alsxe = x − xd

bezeichnet.Die Beschränktheit vonxe bedeutet eine beschränkte Abweichung vony undyd. Da sich die Sy-stemeΣ undΣ unterscheiden, bedeutetxe = x− xd = 0 nicht automatisch, daßy−yd Null ist. DieForderung, den Fehlerxe besonders klein zu machen, ist nicht unbedingt sinnvoll, dadie Vor-gaben ˆxd für die Systemzustände möglicherweise nicht durch die Regelstrecke realisiert werdenkönnen. Eine solche Forderung kann, wie später gezeigt wird, zu einer Verstärkung des nicht-minimalphasigen Verhaltens der Folgeregelung führen. Istdie Regelstrecke stabil, so kann dienominale Stellgröße ˆud zuerst auf das nominale Modell der Regelstrecke gegeben werden undanschließend die resultierenden Zustandstrajektorien des nominalen Modells der Regelstreckeals Referenz für die Systemzustände verwendet werden. Die geforderten Verläufe der Zuständewären dann wenigstens für die nominale Regelstrecke praktisch realisierbar. Da die in dieserArbeit verwendeten Regelstrecken Lenkflugkörper und Bioreaktor in einigen Arbeitsbereicheninstabil sind, ist ein solches Vorgehen nicht möglich, da eine Stabilisierung des nominalen Mo-dells der Regelstrecke notwendig wäre.

Es soll nun ein Zustandsregler K entworfen werden, der die RegelstreckeΣ stabilisiert. Dies istgleichzusetzen mit der Forderung, daß der Fehlerxe für t → ∞ beschränkt ist. Für konstan-te Signalexd und ud, die einen Gleichgewichtspunkt des SystemsΣ repräsentieren, soll durchdie Regelung ein asymptotisch stabiler Gleichgewichtspunkt erzeugt werden. Die dem Gleichge-wichtspunkt entsprechende Referenzausgangsgrößeyd = ye kann nur statisch exakt am Ausgangder Regelstrecke reproduziert werden, wenn die Regelstrecke ungestört und die ApproximationΣweiterhin statisch exakt ist. Treffen diese Annahmen nicht zu, so ist eine statische Abweichungzu erwarten.Um diesen Fakt zu umgehen, ist die Regelstrecke um einen Integrator zu erweitern. Eingangs-größe des Integrators ist die Abweichung der gemessenen Ausgangsgrößey vom Referenzsignalyd. Der Zustand des Integrators stellt einen neuen Streckenzustand dar, der beim Entwurf derZustandsregelung berücksichtigt werden muß. Daß mit dieser Maßnahme stationäre Genauig-keit erreicht werden kann, wird im Abschnitt 3.3 gezeigt.Als Eingangsgröße des Zustandsreglers wird für den Fall ohne Integrator die Abweichungxe ver-wendet. Die Ausgangsgrößeuf b bildet additiv mit der approximativen nominalen Stellgröße ud

die letztendlich auf den Prozeß angewendete Stellgrößeu. In Abbildung 3.1 ist der unterlagerteRegelkreis als graue Box gekennzeichnet. In den nächsten beiden Abschnitten werden zunächstModelle angegeben, die das Verhalten des Regelfehlers für die ursprüngliche Regelstrecke undfür die integral erweiterte Regelstrecke beschreiben. Anschließend werden im Abschnitt 3.4grundlegende Anforderungen an den unterlagerten Regelkreis diskutiert, so z.B. wie schnell derRegelkreis auszulegen ist. Eine Übersicht möglicher Regler wird im Abschnitt 3.5 gegeben,wobei im Fall der Regelstrecke Lenkflugkörper der Entwurf der Folgeregelung bzw. des unter-lagerten Regelkreises mittels eines einfachen linearen Zustandsreglers demonstriert wird. Diekonkrete Beschreibung modernerer Regelungsverfahren undder Entwurf der Folgeregelung fürdas Anwendungbeispiel Bioreaktor erfolgt in den Abschnitten 3.6 bis 3.7.

Page 95: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.2 Standardfehlermodell 95

3.2 Standardfehlermodell

Um einen Reglerentwurf durchführen zu können, muß zunächstein Modell für den Fehlerxe

aufgestellt werden. Dazu wird die Steuerung nun vernachlässigt. Es sei angenommen, daß dieapproximative nominale Stellgröße ˆud und die nominale Zustandstrajektorie ˆxd gegeben sind.Der resultierende unterlagerte Regelkreis ist in Abbildung 3.2 separat dargestellt. Für das Feh-lermodell ˙xe = x − ˙xd ergibt sich mit (3.1) und (3.5) folgende Beziehung:

xe = x − ˙xd

= f (x) + g(x)u− ( f (xd) + g(xd)ud). (3.6)

Das nichtlineare Zustandsraummodell ist schlecht für den Reglerentwurf geeignet, da sich dierechte Seite von (3.6) im allgemeinen nur schwer als Funktion des Zustandesxe darstellen läßt.Ein prinzipielles Problem ist, daß bei einigen der im zweiten Kapitel vorgestellten Inversions-verfahren keine minimalphasige Approximation in der Form (3.3) angegeben werden kann. Wienachfolgend gezeigt wird, liefert eine Linearisierung von(3.6) ein besser zum Reglerentwurf ge-eignetes Fehlermodell. Das genaue Aussehen des SystemsΣmuß dabei nicht unbedingt bekanntsein. Entscheidend ist nur, daß das Inversionsverfahren die Größen ˆud und xd unmittelbar liefert.Zur Vereinfachung des nichtlinearen Fehlermodells (3.6) wird dieses entlang der Trajektorie(xd, ud) der nominalen Stell- und Zustandsgrößen linearisiert.

xd

x

x

xe uf b

ud

u

K x = f (x) + g(x)u

Abbildung 3.2: Unterlagerte Zustandsregelung

Das linearisierte Fehlermodell ergibt sich dadurch, daß bei der Aufstellung des Fehlermodellsxe = x− ˙xd als Regelstrecke die Linearisierung der RegelsteckeΣ entlang der Trajektorie (xd, ud)verwendet wird. Die Linearisierung der RegelsteckeΣ am Punktx = xd undu = ud lautet dabei:

x ≈ f (xd) + g(xd)ud + A(xd, ud)(x − xd) + b(xd)(u− ud)

y ≈ h(xd) + l(xd)ud + cT(xd, ud)(x − xd) + d(xd)(u− ud) (3.7)

Page 96: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.3 Integral erweitertes Fehlermodell 96

mit

A(xd, ud) =∂( f (x) + g(x)u)

∂x

∣∣∣∣∣xd

, ud

b(xd) =∂( f (x) + g(x)u)

∂u

∣∣∣∣∣xd

, ud= g(xd)

cT(xd, ud) =∂(h(x) + l(x)u)

∂x

∣∣∣∣∣xd

, ud

d(xd) =∂(h(x) + l(x)u)

∂u

∣∣∣∣∣xd

, ud= l(xd). (3.8)

Mit (3.5), der an der Referenztrajektorie linearisierten Strecke (3.7) und der Annahmeu = ud + uf b

ergibt sich dabei die folgende lineare Näherung für das Fehlermodell:

xe ≈ A(xd, ud)xe+ b(xd)uf b + z1(xd, ud) (3.9)

z1(xd, ud) = f (xd) + g(xd)ud − ( f (xd) + g(xd)ud). (3.10)

Die rechte Seite von (3.9) ist nun eine Funktion des Zustandes xe, wobei (3.9) ein lineares pa-rametervariantes System darstellt. Die SystemmatrixA(xd, ud) und der Vektorb(xd) sind Funk-tionen der sich mit der Zeit ändernen Größen bzw. Parameterxd und ud. Eingangsgröße desSystems ist die vom Regler K gelieferte korrektive Stellgrößeuf b. Der in (3.9) vorkommendeTerm z1(xd, ud) kann als Störung interpretiert werden. Sind die SystemeΣ und Σ identisch, soverschwindet die Störungz1(xd, ud). Je ähnlicher sichΣ undΣ sind, desto kleiner ist folglich dieStörung. Die Form der Störung ist maßgeblich vom Verlauf derReferenztrajektorie abhängig.Ist z1 klein und befindet sich der Zustand der Regelstrecke in der Nähe der Referenztrajektorie,d.h. ist xe klein, so kann der Reglerentwurf an dem linearen parametervarianten Fehlermodell(3.9) erfolgen.

3.3 Integral erweitertes Fehlermodell

Eine wichtige Anforderung an eine Folgeregelung ist die Gewährleistung der stationären Ge-nauigkeit. Häufig wird zwischen verschiedenen Gleichgewichtspunkten der Regelstrecke umge-schaltet. Die Regelung hat dann einen Übergang in den neuen Gleichgewichtspunkt zu ermög-lichen. Die gewünschte Ausgangsgröße soll stationär genauerzeugt werden, auch unter demEinfluß von Parameterschwankungen der Regelstrecke und externen Störungen. Wird ein Regleran dem Fehlermodell (3.9) entworfen, so ist für die Folgeregelung nur stationäre Genauigkeitzu erwarten, wenn die RegelstreckeΣ und die verwendete minimalphasige Approximation derRegelstreckeΣ die gleiche Statik besitzen. Des weiteren muß die nominale Regelstrecke ohneStörungen vorliegen.Es wird nun ein Fehlermodell hergeleitet, dessen Stabilisierung für kleine langsame Parameter-schwankungen der RegelstreckeΣ und für den Fall, daß sich die Statik vonΣ und Σ geringfügigunterscheidet, stationäre Genauigkeit der Folgeregelunggarantiert.

Page 97: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.3 Integral erweitertes Fehlermodell 97

Soll stationär die Vorgabeyd = ye durch die Folgeregelung erzeugt werden, so sei angenommen,daß die RegelstreckeΣ einen entsprechenden Gleichgewichtspunkt mit der gewünschten Aus-gangsgröße besitzt. Der Gleichgewichtspunkt wird durch das Paarxe,ue charakterisiert und esgilt:

0 = f (xe) + g(xe)ue

0 = h(xe) + l(xe)ue− ye. (3.11)

Im betrachteten Arbeitsbereich seixe,ue die einzige Lösung des Gleichungssystems (3.11). Eswird nun der Regelfehlery − yd integriert:

σ = y − yd. (3.12)

Das neue Fehlermodell ergibt sich durch Hinzufügen des Integrators (3.12) zum Fehlermodell(3.6). Man kann sich den Integrator ebenso als Bestandteil der Regelstrecke vorstellen. UnterZuhilfenahme von (3.1) und (3.5) erhält man dann für das Fehlermodell:

(

xe

σ

)

=

(

x − ˙xd

y − yd

)

=

(

f (x) + g(x)u− ( f (xd) + g(xd)ud)h(x) + l(x)u− (h(xd) + l(xd)ud)

)

. (3.13)

Es wird nun ein Regler für (3.13) entworfen, der bei konstantem Referenzsignalyd = ye undsomit konstanter nominaler Stellgröße ˆud = ue und konstanten nominalen Zuständen ˆxd = xe

für das System (3.13) einen Gleichgewichtspunkt mitxe = xee = xe − xe undσ = σe erzeugt.

Hierbei wird durchxe und ue der Gleichgewichtspunkt der ApproximationΣ gekennzeichnet,der zu der Ausgangsgröße ˆy = ye führt.Bei Verwendung des integral erweiterten Fehlermodells zumEntwurf des unterlagerten Regel-kreises kann die Robustheit der Folgeregelung wie folgt erklärt werden:Der Regler erzeugt bei ˆxd = xe und ud = ue für das Fehlermodell einen asymptotisch stabilenGleichgewichtspunkt. An diesem Punkt müssen alle Signale konstant sein. Damit der Integra-tor σ = y − ye ein konstantes Ausgangssignalσ generiert, muß der Eingang des Integrators,d.h. der Regelfehlery − ye, gleich Null sein. Durch die Verwendung des Integrators wird derRegelfehlery − ye am Gleichgewichtspunkt folglich zu Null gemacht. Parameterstörungen derRegelstrecke werden den Gleichgewichtspunkt des Fehlermodells zwar ändern, die Bedingungy − ye = 0 bleibt aber erhalten. Voraussetzung dafür ist, daß auch bei Störungen das geregelteSystem asymptotisch stabil bleibt. Der resultierende unterlagerte Regelkreis ist in Abbildung3.3 dargestellt. Als zusätzliche Eingangsgröße des Reglers K kommt nun der Integratorausgangσ hinzu. Zur Bildung der Differenzy − ye muß die wirklich gemessene und nicht die aus denZustandsgrößen berechnete Ausgangsgröße verwendet werden. Nur so können Veränderungender Funktionenh und l des SystemsΣ wahrgenommen werden.Um einen Reglerentwurf durchführen zu können, ist eine Vereinfachung des nichtlinearen Feh-lermodells (3.13) notwendig. Die Linearisierung von (3.13) entlang der Referenztrajektorie lau-tet unter Verwendung von (3.7), (3.5) und der Annahmeu = ud + uf b:

(

xe

σ

)

≈(

A(xd, ud) 0cT(xd, ud) 0

) (

xe

σ

)

+

(

b(xd)d(xd)

)

uf b +

(

z1(xd, ud)z2(xd, ud)

)

(3.14)

Page 98: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.4 Anforderungen an den unterlagerten Regelkreis 98

xd

x

xxe

uf b

ud

u

y

y

Kx = f (x) + g(x)u

y = h(x) + l(x)u

yd = yd∫

σ

Abbildung 3.3: Unterlagerter Regelkreis bei Verwendung der integral erweiterten Regelstrecke(3.14)

z2(xd, ud) = h(xd) + l(xd)ud − (h(xd) + l(xd)ud). (3.15)

Der in (3.14) vorkommende Störtermz1 ist durch Gleichung (3.10) gegeben. Das Zustandsraum-modell (3.14) läßt sich kompakt durch

ξ = A(xd, ud)ξ + b(xd)uf b + z(xd, ud) (3.16)

mit

ξ =

(

xe

σ

)

, z =(

z1

z2

)

(3.17)

und

A(xd, ud) =

(

A(xd, ud) 0cT(xd, ud) 0

)

, b(xd) =

(

b(xd)d(xd)

)

(3.18)

darstellen. Es handelt sich hierbei um ein lineares parametervariantes bzw. zeitvariantes Zu-standsraummodell. Die Parameter der SystemmatrixA(xd, ud) und des Vektorsb(xd) sind xd

undud. In Abhängigkeit von der Referenztrajektorie ändert sich das Systemverhalten. Aufgrundder vorgenommenen Linearisierung ist dieses Modell nur lokal in der Umgebung der Referenz-trajektorie gültig.

3.4 Anforderungen an den unterlagerten Regelkreis

In diesem Abschnitt sollen die Grundanforderungen an den unterlagerten Regelkreis beschriebenund analysiert werden. Da in der Praxis die statische Genauigkeit der Folgeregelung häufig einewichtige Forderung darstellt, beziehen sich die weiteren Betrachtungen auf den Regelkreis mit

Page 99: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.4 Anforderungen an den unterlagerten Regelkreis 99

integral erweiterter Strecke.Es sei angenommen, daß sich der Zustand der Regelstrecke in der Nähe der Referenztrajektoriebefindet und somit das linearisierte zeitvariante Fehlermodell (3.14) zum Entwurf des Reglersverwendet werden kann.Der Regler ist so zu entwerfen, daß der Regelfehlerxe für alle möglichen Trajektorien undbeschränkten Störungenz1 und z2 ebenfalls beschränkt ist. Es würde z.B. genügen, die L2-Stabilität der Regelung zu beweisen. Eine wichtige zusätzliche Forderung an den Regler ist,daß im Falle konstanter Parameter ˆxd, ud und yd für den Regelkreis ein asymptotisch stabilerArbeitspunkt erzeugt wird. Nach Abschnitt 3.3 führt dies zueiner asymptotischen Abnahme desRegelfehlersy − yd.Es soll nun untersucht werden, wie schnell der unterlagerteRegelkreis auszulegen ist. Dazubetrachten wir eine lineare Regelstrecke der Form

x = Ax + bu

y = cT x + du. (3.19)

Das integral erweitere Fehlermodell (3.16) ist in diesem Fall ein zeitinvariantes lineares Systemund lautet:

(

xe

σ

)

=

(

A 0cT 0

)

︸ ︷︷ ︸

A

(

xe

σ

)

+

(

bd

)

︸︷︷︸

b

uf b +

(

z1(xd, ud)z2(xd, ud)

)

. (3.20)

Wählt man einen linearen Zustandsregler der Form

uf b = −kT(

xe

σ

)

, (3.21)

so kann man, wenn das Paar (A, b) stabilisierbar ist, durch entsprechende Wahl vonkT dascharakteristische Polynom der neue Systemmatrix

A∗ = A − bkT (3.22)

zu einem Hurwitz-Polynom machen und somit das Fehlermodell(3.20) stabilisieren. Der unter-lagerte Regelkreis ist mit dem linearen Zustandsregler undder linearen Strecke in Abbildung3.4 dargestellt.

Für die nachfolgenden Betrachtungen ist es sinnvoll, den Integrator als Bestandteil des Reglersaufzufassen.Bei dem Regelkreis handelt es sich um eine Mehrgrößenregelung. Es läßt sich der Vektor derReferenzgrößen

r =(

xd

yd

)

und ein Vektor der Ausgangsgrößen

y =

(

xy

)

Page 100: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.4 Anforderungen an den unterlagerten Regelkreis 100

xd x

−kTx = Ax + bu

yd = yd∫

y = cT x + duy

ud

uf b

R(s) G(s)

Abbildung 3.4: Unterlagerter Regelkreis mit Integrator bei Vorliegen einer linearen Regelstrecke

definieren. Am Ausgang des Systems sollen die Referenzgrößen erzeugt werden. Die komple-mentäre EmpfindlichkeitsfunktionT(s), d.h. die Übertragungsfunktion vonr nachy, stellt eineÜbertragungsfunktionsmatrix der Dimension (n + 1) × (n + 1) dar. Als Maß für der Schnellig-keit, mit der die Regelung am Streckenausgang die gegebenenReferenzsignale erzeugt, wirddie Bandbreite der Regelung verwendet. Diese ist für das vorliegende Mehrgrößensystem durchdie Singulärwerte der FrequenzgangsmatrixT( jω) festgelegt. Die Verstärkung vonT( jω) läßtsich anhand des kleinsten und größten Singulärwertes der frequenzabhängigen MatrixT( jω)abschätzen [23]. Mit der Übertragungsfunktionsmatrix desReglers

R(s) = −(

k1 · · · kn1skn+1

)

und der Übertragungsfunktionsmatrix der Regelstrecke (Ausgänge sind alle Zustände und diewahre Ausgangsgröße)

G(s) =

(

IcT

)

(sI − A)−1b +(

0d

)

erhält man für die komplementäre EmpfindlichkeitsfunktionT(s) folgende Beziehung:

T(s) = (I + G(s)R(s))−1G(s)R(s).

Die komplementäre Empfindlichkeitsfunktion läßt sich auchals

T(s) = S(s)G(s)R(s)

darstellen, wobeiS(s) = (I + G(s)R(s))−1 die Empfindlichkeitsfunktion des Regelkreises ist.Durch S(s) wird die Empfindlichkeit des Regelkreises gegenüber Ausgangsstörungen und Pa-rameterschwankungen beschrieben. Im vorliegenden Fall existiert nur eine Stellgröße. DaG(s)einen Spaltenvektor undR(s) einen Zeilenvektor darstellen, ist der Rang der MatrixG(s)R(s)

Page 101: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.4 Anforderungen an den unterlagerten Regelkreis 101

folglich Eins. Die MatrixmultiplikationS(s)G(s)R(s) ergibt dann eine Matrix mit dem RangEins. Die MatrixT( jω) besitzt aus diesem Grund den Rang Eins. Hat eine Matrix den RangEins, so existiert nur ein von Null verschiedener positiverSingulärwert. Die BandbreiteBWdesunterlagerten Regelkreises ist nun definiert durch

1√(2)= σ(T( jBW)),

wobei σ der einzige positive frequenzabhängige Singulärwert der Matrix T( jω) ist und eineobere Abschätzung für die Verstärkung der MatrixT( jω) darstellt. Der Regler ist nun so zu ent-werfen, daß die soeben definierte BandbreiteBW des Reglerkreises innerhalb einer unteren undoberen Begrenzung liegt. Es gelten die üblichen Beschränkungen des klassischen Reglerentwur-fes [23], wobei durch die Rückkopplung des Ausganges das nichtminimalphasige Verhalten derRegelstecke weiterhin zu beachten ist. Für die untere Begrenzung der Bandbreite des Regelkrei-ses gelten folgende Überlegungen:

1. Um Abweichungen von den Referenztrajektorien überhauptverringern zu können, mußder Regelkreis schneller sein als die extern auf den Regelkreis einwirkenden Größen ˆxd, ud

und yd.

2. Ist die Strecke instabil, so muß der geschlossene Kreis eine minimale Bandbreite aufwei-sen, um eine Stabilisierung der Regelstrecke zu gewährleisten.

Für die obere Begrenzung der Bandbreite des Regelkreises gelten folgende Überlegungen:

1. Bei nichtminimalphasigen Regelstrecken ist die Bandbreite des geregelten Systems prak-tisch nach oben begrenzt, da eine hohe Bandbreite zu schlechten Empfindlichkeits- undRobustheitseigenschaften bei hohen Frequenzen führt [23,11].

2. Um die Regelung gegenüber unmodellierter schneller Dynamik sowie hochfrequentenMeßrauschen robust zu machen, ist des weiteren eine Begrenzung der Bandbreite not-wendig.

3. Eine zu große Bandbreite führt zu großen Stellgrößenamplituden.

Eine sehr konstruktive Forderung an die Bandbreite stellt der erste Punkt der Überlegungen fürdie obere Begrenzung der Bandbreite dar. Die Bandbreite desReferenzmodells kann als direk-tes Maß für die Schnelligkeit der externen Eingangssignalebenutzt werden. Verwendet manPolvorgabe zum Reglerentwurf, so hat sich gezeigt, daß es sinnvoll ist, den Betrag des Realteilder Polstellen des unterlagerten Regelkreises eineinhalb- bis zweifach so groß zu wählen wie derBetrag des Realteils der dominierenden Pole des Referenzmodells, um der Forderung gerecht zuwerden.Für nichtlineare Regelstrecken sind die Anforderungen an die Schnelligkeit des unterlagertenRegelkreises analog. Zum Test der erzielten Geschwindigkeit und Regelkreiseigenschaften emp-fiehlt es sich, den Regelkreis an ausgewählten Punkten zu linearisieren und anhand der Emp-findlichkeitsfunktion sowie der komplementären Empfindlichkeitsfunktion die Regelkreiseigen-schaften zu beurteilen.

Page 102: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 102

3.5 Übersicht geeigneter Regler

In diesem Abschnitt soll eine Übersicht über mögliche Regler angegeben werden, die das zeitva-riante bzw. parametervariante Fehlermodell (3.16) stabilisieren und die im vorherigen Abschnittgenannten Anforderungen an den unterlagerten Regelkreis erfüllen.

Der einfachste Weg ist, das nichtlineare Fehlermodell (3.12) an einem Gleichgewichtspunkt(xe, ue) zu linearisieren und für das resultierende lineare zeitinvariante Fehlermodell einen Reg-ler zu entwerfen. Die Linearisierung entspricht natürlichdem linearen parametervarianten Feh-lermodell (3.16) mit konstanten Parameternxd

= xe, ud = ue:

ξ = A(xe, ue)ξ + b(xe)uf b + z(xe, ue). (3.23)

Wird ein linearer fester Zustandsregler der Form

uf b = −kTξ (3.24)

verwendet, so ergibt sich für das geregelte System:

ξ = (A(xe, ue) − b(xe)kT)ξ + z(xe, ue). (3.25)

Unter der Annahme, daß das Paar (A(xe, ue), b(xe)) stabilisierbar ist, kann mittels bekannter Ver-fahren des Zustandsraums wie z.B. Polvorgabe oder LQR der Verstärkungsvektor so bestimmtwerden, daß das System (3.25) stabil ist. Die Einhaltung dervorgeschriebenen Bandbreite istmittels Polvorgabe leicht zu steuern, da durch die Plazierung der Eigenwerte der neuen System-matrix A∗(xe, ue) = A(xe, ue) − b(xe)kT ein direkter Bezug zum Zeitbereich vorliegt. Der resul-tierende lineare Regler stabilisiert das nichtlineare Fehlermodell (3.12) mitu = ud+uf b auf jedenFall für genügend langsame Trajektorien in der Nähe des betrachteten Gleichgewichtspunktes.Für den Lenkflugkörper wird im Anschluß an den Überblick der verschiedenen Regleransätzein diesem Abschnitt ein linearer zeitinvarianter Zustandsregler entworfen. Dabei zeigt sich, daßder resultierende Regler zur Lösung des kompletten Regelungsproblems ausreichend ist.

Um eine Erweiterung des traditionellen Linearisierungsansatzes zu erreichen, wird, wie bereitsbeschrieben, das nichtlineare Fehlermodell (3.12) entlang der Referenztrajektorie linearisiert.Als Ergebnis erhält man das zeitvariante bzw. parametervariante lineare Fehlermodell (3.16).Ein Ansatz zum Reglerentwurf wäre, einen parameterabhängigen Regleruf b = −kT(xd, ud)ξ zubestimmen, der das charakteristische Polynom der Matrix

A∗(xd, ud) = A(xd, ud) − b(xd)kT(xd, ud)

für alle möglichen Parameterxd, ud zu einem Hurwitz-Polynom macht. Diese Technik, bei derdie Reglerverstärkung in Abhängigkeit von Parametern verändert wird, bezeichnet man als Gain-Scheduling [19, 35, 32, 36]. Die Parameter, die die Streckeneigenschaften beschreiben und denReglerverstärkung verstellen, werden Scheduling-Variablen genannt. Es sind im vorliegendenFall die approximative nominale Zustands- und Stellgrößentrajektorie. Wichtig ist festzustellen,daß das Finden eines Gain-Scheduling-Reglers nicht garantiert, daß der zeitvariante Regelkreis

Page 103: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 103

stabil ist. Nur für einen konstanten Parametersatz (xd, ud) ist die Stabilität des Regelkreises ge-währleistet. In [36] wird gezeigt, daß Stabilität auch für den zeitvarianten Regelkreis vorliegt,wenn sich die Parameter genügend langsam ändern. Die analytische Berechnung eines ReglerskT(xd, ud) ist sehr schwierig und stark problemabhängig.Eine einfachere Version der Gain-Scheduling-Technik ist folgende:

• Es wird für eine feste Anzahl von Parametersätzen (xdi , u

di ), i = 1, · · · ,N ausgewählt. Je-

der Parametersatz charakterisiert die Dynamik und Statik des parametervarianten linearenSystems (3.16) für Trajektorien (xd, ud) nahe dem Punkt (xd

i , udi ). Es ist wichtig festzuhal-

ten, daß die ausgewählten Parametersätze nicht nur Gleichgewichtspunkte des Systemsrepräsentieren müssen.

• Für die zu den ausgewählten Parametersätzen zugehörigen linearen zeitinvarianten Fehler-modelle werden lineare zeitinvariante Regler nach den Anforderungen aus Abschnitt 3.4entworfen. Voraussetzung zum Entwurf ist, daß die linearenFehlermodelle stabilisierbarsind.

• Die einzelnen linearen Regler werden zu einem gesamten nichtlinearen Regler kombi-niert. Dies kann zum Beispiel durch Interpolation geschehen. Die Trajektorienxd und ud

werden als Scheduling-Variablen genutzt. Entlang einer Referenztrajektorie wird weichzwischen den einzelnen linearen Reglern umgeschaltet. Dasbedeutet, daß an einem Punkt(xd, ud), der einen Entwurfspunkt entspricht, nur der an diesem Punkt entworfene Regleraktiv ist. Verlaufen hingegen die aktuellen nominalen Trajektorien xd und ud zwischenden Entwurfspunkten, so ist eine Kombination von Reglern aktiv, die an den in der Nähebefindlichen Entwurfspunkten berechnet wurden.

Im Abschnitt 3.6 wird diese Variante genauer beschrieben und zum Entwurf der Folgerege-lung des Bioreaktors genutzt. Obwohl der Stabilitätsbeweis für den Gain-Scheduling-Reglerim allgemeinem nicht angegeben werden kann, findet diese Technik in der Industrie großenZuspruch. Eine Vielzahl von realen industriellen Anwendungen beweist dies. Allgemeine Aus-sagen, wie z.B. die Stabilität der Regelung für genügend langsame Änderung der Scheduling-Variablen, wurden aus praktischen Erfahrungen gewonnen. Erst viel später erfolgte der Beweisvieler grundlegender Aussagen durch [36]. Gegenüber einemlinearen festen Zustandsreglerwird mit Gain-Scheduling der Arbeitsbereich der Regelung wesentlich vergrößert.

In den letzten Jahren wurden zahlreiche Verfahren entwickelt, die sich mit der Analyse linea-rer parametervarianter Systeme (LPV-Systeme)beschäftigen [2, 42, 25]. Das parametervarianteFehlermodell (3.16) stellt ein solches LPV-System dar. Manhat untersucht, wie sich die Stabili-tät und Güte solcher Systeme effizient ermitteln läßt. Diese Erkenntnisse können beispielsweisezum Beweis der Stabilität des Regelkreises aus parametervariantem Fehlermodell (3.16) und li-nearem Regler (3.24) genutzt werden. Es wurden des weiterenRegelungsansätze beschrieben,die eine Stabilisierung der Regelstrecke unter Erzielung einer vorgegebenen Güte des Regelkrei-ses ermöglichen. Dabei wurde auch die Frage der Stabilisierbarkeit von LPV-Systemen geklärt.Der Test der Stabilität oder auch der Reglerentwurf führen zur Lösung linearer Matrixunglei-chungen(engl.: Linear Matrix Inequalities, LMI). Mit der LMI C T [25] oder dem

Page 104: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 104

LMITOOL [21] 1 für das Entwurfssystem M stehen effiziente numerische Verfahren zumLösen von LMI’s zur Verfügung, was diese neue Theorie sehr attraktiv macht. Im Abschnitt3.7 werden die grundlegenden Ideen bei der Analyse linearerparametervarianter Systeme wie-dergegeben. Im Rahmen dieser Arbeit gemachte Erfahrungen weisen des weiteren auf bereitsbekannte Grenzen dieser Verfahren hin. Der Vorteil gegenüber den bisher vorgestellten Ansät-zen ist, daß ein Regler, wenn er gefunden werden kann, die Stabilität des geregelten zeitvariantenRegelkreises sichert.

Beispiel 3.5.1 (Folgeregelung des Lenkflugkörpers)Für das im Anhang A vorgestellte Anwendungsbeispiel Lenkflugkörper wird eine Folgerege-lung für die Normalbeschleunigungy = azf entworfen, wobei die Stellgröße der Höhenruder-ausschlag ist. Zum Entwurf wird das Streckenmodell (2.147)bis (2.149) ohne Stellglieddynamikverwendet. Die Inversion der Regelstrecke erfolgt nach demim Abschnitt 2.4.2 beschriebenenVorgehen. Im Beispiel 2.4.7 wurde die Inversion des Lenkflugkörpers bereits ausführlich behan-delt. Gegenüber dem dort praktizierten Vorgehen wurden hier zwei Veränderungen vorgenom-men, die ein Springen der nominalen Stellgrößeud verhindern sollen:

• Es wurde ein neues ReferenzmodellΣre f gewählt, das das Übertragungsverhalten der Fol-geregelung auf das externe Referenzsignalyr beschreibt. Um ein Springen der Stellgrößezu unterbinden, wurde ein lineares Referenzmodell dritterOrdnung mit dem relativenGrad 3 angesetzt. Dieses garantiert, daß bei sprungförmigen Änderungen des Signalsyr

die ersten beiden Ableitungen des Ausgangs des Referenzmodells nicht springen. Die Ein-gangsgrößen des reduzierten inversen Systems des Lenkflugkörpers springen somit nicht,was eine Grundvoraussetzung für eine sich nicht sprungförmig ändernde Stellgröße ist.Weiterhin wurde das ReferenzmodellΣre f so gewählt, daß die im Anhang A getroffenenAnforderungen an das Übertragungsverhalten der Folgeregelung erfüllt werden, d.h. eineAnstiegszeit von weniger als0.35s und ein maximales Überschwingen von10 Prozentvorliegt. Die Übertragungsfunktion des neuen Referenzmodells lautet:

Σre f : Gre f (s) =100· 50

(s2 + 2 · 0.7 · 10 · s+ 100)(s+ 50). (3.26)

• Wie im Beispiel 2.4.7 gezeigt, wird durch die ungenügende Differenzierbarkeit der inden Systemgleichungen des Lenkflugkörpers vorkommenden Funktion Czx1

(x1,M) dasStellgesetz, welches die approximative nominale Stellgröße ud generiert, unstetig. Diesführt zu einem Springen der Stellgröße an singulären Punkten. Um diesen unerwünschtenEffekt zu beseitigen, wurde die FunktionCzx1

(x1,M) im interessierenden Arbeitsbereichdurch ein Polynom fünften Grades approximiert. Zur Inversion wird nun das Modell desLenkflugkörpers mit der nun genügend glatten Approximationder FunktionCzx1

(x1,M)verwendet.

Ein Springen der Stellgröße ist nach der sich im Anhang A.1 dargestellten Spezifikation nichtzulässig. Um den Entwurf des unterlagerten Regelkreises durchführen zu können, wird das no-minale Modell des Lenkflugkörpers ohne Stellglieddynamik entlang der Trajektorienxd und ud

1Diese Software ist verfügbar über: http://www.ensta.fr/uer/gropco/index.html

Page 105: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 105

linearisiert. Die in dem resultierenden parametervarianten Fehlermodell (3.14) bei Verwendungeines Integrators vorkommenden Matrizen und Vektoren lauten für den Lenkflugkörper:

Page 106: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 106

A(xd, ud,M) =

180π

1Mvsm

Q(M)S∂Czx1

(x1,M) cos(πx1180)

∂x1

∣∣∣∣∣xd

1

1

180π

Q(M)S dIyy

∂Cmx1(x1,M)

∂x1

∣∣∣∣∣xd

1

0

+

− 1Mvsm

Q(M)S dz sin(πxd

1180) 0

0 0

ud

b(xd,M) =

180π

1Mvsm

Q(M)S dz cos(πxd

1180)

180π

Q(M)S ddmIyy

cT(xd,M) =(

1mQ(M)S

∂Czx1(x1,M)

∂x10)

d(xd,M) =1m

Q(M)S dz, (3.27)

wobei als zusätzlicher die Systemdynamik formender Parameter die MachzahlM in Erschei-nung tritt. Dieser Parameter ändert sich langsam und kann direkt gemessen werden.Es wird nun ein fester linearer Zustandsregler der Form (3.24) verwendet, der an einem Gleich-gewichtspunkt entworfen wird. Die Gleichgewichtspunkte des Lenkflugkörpers lassen sich durchden Zustandx1 und die MachzahlM parametrisieren (siehe Anhang A.2). Als Entwurfspunktwurde xe

1 = 0 und M = 2 verwendet. Diese Wahl erfolgte willkürlich. Eine andere Möglich-keit wäre gewesen, einen Gleichgewichtspunkt zu wählen, der in der Mitte des Arbeitsbereichesliegt. Da die Dynamik der linearen Modelle des Lenkflugkörpers an den Gleichgewichtspunk-ten symmetrisch zuxe

1 = 0 ist, wäre bei einem kompletten Bereich von−20 ≤ xe1 ≤ 20 und

1.5 ≤ M ≤ 3 der Entwurfspunktxe1 = 10,M = 2.25zu verwenden. Die Symmetrie bedeutet, daß

z.B. die linearen Modelle der Gleichgewichtspunktexe1 = 10,M = 2.25undxe

1 = −10,M = 2.25übereinstimmen.Der gewählte Gleichgewichtspunkt wird durchxe undue beschrieben. Das lineare zeitinvarianteFehlermodell ergibt sich aus (3.14) bzw. (3.16) mit den konstanten Parameternxd

= xe, ud = ue.Der Regler wurde mittels Polvorgabe entworfen. Da die Ordnung des Lenkflugkörpers ohneNulldynamikn = 2 ist, besitzt das lineare zeitinvariante Fehlermodell (3.23) die Ordnungn+ 1.Es sind somit dien + 1 Eigenwerte der neuen SystemmatrixA∗(xe, ue) = A(xe, ue) − b(xe)kT

zu plazieren. Die Eigenwerte des Referenzmodells, welchesin Form des Zustandsraummodells(2.32) bis (2.33) implementiert wurde, lauten

λre f 1,2 = −7.0000± 7.1414j, λre f 3 = −50.

Gemäß Abschnitt 3.4 werden die Eigenwerte des unterlagerten linearisierten Regelkreises eineinhalb-bis zweifach schneller als die dominierenden Eigenwerte des ReferenzmodellsΣre f gewählt. Diehier verwendete Wahl für die Eigenwerte des unterlagerten linearisierten Regelkreises ist:

λ1 = −11, λ2 = −12, λ3 = −13.

Für die Regler erhält man dann folgendes Ergebnis:

kT =(

−6.6548 −0.6818 5.3206)

.

Page 107: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 107

Nach erfolgtem Entwurf der zwei Freiheitsgrade der Folgeregelung wird die Regelung simulativgetestet und geprüft, ob die Spezifikationen erfüllt werden.

yr

M

y = azf

xe σ∫

u∗yr

yd

yd

yd(2)

ud

uf b

x1

x2

xxd

Σ−1 Σ

Σre f

Σre f Σact

−kT

Σobs

Machzahl-profil

StatischeKorrektur

Abbildung 3.5: Struktur der Folgeregelung des Lenkflugkörpers

Die vollständige Simulationsumgebung der Folgeregelung ist in Abbildung 3.5 dargestellt. Zudem Strukturbild sei folgendes bemerkt:

• Es erfolgte eine Berücksichtigung der StellglieddynamikΣact. Die letztendlich auf dieRegelstreckeΣ einwirkende Stellgröße ist durchu∗ gekennzeichnet.

• Die Änderung der Machzahl wurde nach der im Anhang A angegebenen Differentialglei-chung berücksichtigt. Eingangsgrößen der Differentialgleichung sind der Zustandx1 derRegelstrecke und die Normalbeschleunigungy = azf . Der Anfangswert der Machzahl beiden Simulationen warM(0) = 3. Während der Simulationen wurde der aktuelle Wert desParametersM bei der RegelstreckeΣ, der statischen Korrektur (siehe Beispiel 2.4.7), derapproximativen InversenΣ−1 und dem BeobachterΣobs berücksichtigt. Einen qualitativenVerlauf des Machprofiles zeigt Abbildung 2.16 im Beispiel 2.4.7.

• Da der Zustandx1 der Regelstrecke nicht meßbar ist, muß er durch den Beobachter Σobs

ermittelt werden. Durch numerisches Lösen der Ausgangsgleichung

y =1m

Q(M)SCzx1(x1,M) +

1m

Q(M)S dzu∗

Page 108: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 108

des Lenkflugkörpers ohne Stellglieddynamik kann der gesuchte Zustand zu jedem Zeit-punkt berechnet werden, da die MachzahlM, die Normalbeschleunigungy und die Stell-größeu∗ meßbar sind.

• Da die verwendete Approximation statisch nicht exakt ist, wurde im Beispiel 2.4.7 dieVerwendung einer statischen Korrektur vorgeschlagen. Dies hat zur Folge, daßyd ungleichyd ist. Die zur Bildung des Regelfehlers der Ausgangsgröße notwendige Referenzyd mußsomit, wie in Abbildung 3.5 dargestellt, erzeugt werden.

• Bei allen Simulationen war der Anfangszustand der RegelstreckeΣ gleich Null.

Die Abbildung 3.6 zeigt das Ergebnis der Folgeregelung für einen sich sprungförmig ändern-den Verlauf der Referenzgrößeyr . Wie man sieht, wird über den kompletten Arbeitsbereich dasvorgegebene Übertragungsverhalten der Regelung eingehalten. Nach außen verhält sich die Fol-geregelung wie das vorgegebene lineare Referenzmodell. Aufgrund der getroffenen Maßnahmenkommt es nicht mehr zu einem Springen der Stellgröße. Der Verlauf der approximativen nomi-nalen Stellgrößeud und der korrektiven Stellgrößeuf b ist in der Abbildung 3.7 dargestellt. DieAusgangsgröße weist weiterhin eine nichtminimalphasige Charakteristik auf, d.h. beim Sprungder Referenzgrößeyr bewegt sich die Ausgangsgröße zunächst in die entgegengesetzte Richtungdes Sprunges.

0 0.5 1 1.5 2 2.5 3 3.5 4−20

−10

0

10

20

30

40

t in s

y(t

),y

d(t

),y

r (t)

ing

Abbildung 3.6: Verlauf des externen Referenzsi-gnals yr (Strich-Punkt-Linie), derdirekten Vorgabeyd für die Regel-größe (gestrichelte Linie) und derRegelgrößey (durchgezogene Li-nie)

0 0.5 1 1.5 2 2.5 3 3.5 4−20

−10

0

10

20

30

40

t in s

ud(t

),u

fb(t

)in

deg

Abbildung 3.7: Verlauf der approximativen nomi-nalen Stellgröße ˆud (durchgezogeneLinie) und der korrektiven Stellgrö-ßeuf b (gestrichelte Linie)

Man erkennt, daß sich nach einem Sprung der Referenzgröße sowohl ud als auchuf b in diegleiche Richtung bewegen. Der Versuch des Reglers, die nichtminimalphasige Charakteristikder Ausgangsgröße auszuregeln, verstärkt somit diesen Effekt nur. Legt man den unterlagerten

Page 109: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 109

Regelkreis schneller aus, um den Regelfehler des Ausgangesund der Zustände schneller zu ver-ringern, so verstärkt man die nichtminimalphasige Charakteristik der Ausgangsgröße, d.h. manmacht die instabile Nulldynamik der Folgeregelung schneller. Dies führt zu einem größeren Ein-bruch der Ausgangsgrößey in die verkehrte Richtung bei Sprüngen der Referenzgrößeyr . DerVerlauf der approximativen nominalen Zustandstrajektorien xd und der Zustandstrajektorienxist in Abbildung 3.8 wiedergegeben.Es wurde die Robustheit der Regelung gegenüber Parameterschwankungen entsprechend der

0 0.5 1 1.5 2 2.5 3 3.5 4−150

−100

−50

0

50

100

150

200

t in s

xd(t

),x(

t)

x2, xd2

x1, xd1

Abbildung 3.8: Approximative nominale Zustand-strajektorie xd (durchgezogene Li-nien) und Systemzustandstrajekto-rie x (gestrichelte Linien)

0 0.5 1 1.5 2 2.5 3 3.5 4−20

−10

0

10

20

30

40

t in s

y(t

),y

r (t)

ing

Abbildung 3.9: Verhalten der Folgeregelung ge-genüber Parameterschwankungen.Es wurden die Koeffizienten(am, bm, cm) und dm unabhängigvoneinander um ±25 Prozentvariiert.

Spezifikation getestet. Dazu wurden die drei Koeffizientenaz, bz, cz und der Koeffizient dz umjeweils ±25 Prozent unabhängig voneinander variiert. Das Simulationsergebnis in Abbildung3.9 zeigt, daß die verwendete Struktur der Folgeregelung sehr robust gegenüber den Parameter-schwankungen ist. Durch den Integrator wird stationäre Genauigkeit erzielt. Das vorgegebeneÜbertragungsverhalten kann selbst unter den simulierten Parameterschwankungen eingehaltenwerden.Es wurden des weiteren auch zusätzliche Schwankungen der inder FunktionCz vorkommendenKoeffizientenaz, bz, cz, dz betrachtet, wobei eine maximale Änderung der Werte um±10Prozentangenommen wurde. Im Beobachter wurden dabei stets die nominalen Werte aller Parameterverwendet. Auch gegenüber diesen Parameterschwankungen verhält sich die Regelung sehr ro-bust.Die Abbildung 3.11 zeigt die Winkelgeschwindigkeitu des Höhenruders bei einem Sollwert-sprung vonyr um 1g. Der laut Spezifikation maximale erlaubte Wert von25deg/s wird ein-gehalten. In der Spezifikation wurde des weiteren gefordert, daß die Verstärkung des offenenRegelkreises, mit der Auftrennung vor dem Stellglied, für die linearisierte Regelstrecke eineVerstärkung von weniger als−30dB bei der Frequenz vonω = 300rad/s aufweist. Diese For-

Page 110: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 110

derung soll den Einfluß unmodellierter schneller Dynamik auf die Regelung reduzieren. ZurBestimmung der Übertragungsfunktion des offenen Kreises sei die Abbildung 3.10 betrachtet.Dort ist der vor dem Stellglied aufgeschnittene Regelkreisaus dem linearen zeitinvarianten Feh-lermodell, dem Regler und dem Stellglied dargestellt. Die Übertragungsfunktion des offenen

−kT

uf b1 uf b2

Gact(s) ξ = Aξ + bu∗f b + z

z

u∗f b

ξ

Regler Stellglied Fehlermodell (3.16)

Abbildung 3.10: Vor dem Stellglied aufgeschnittener Regelkreis

Regelkreises ergibt sich wie folgt:

L(s) =uf b1(s)

uf b2(s)= −kT(sI − A(xe, ue))−1b(xe)Gact(s), (3.28)

wobeiGact(s) durch (A.17) gegeben ist. Für den in der Mitte des Arbeitsbereiches gelegendenGleichgewichtspunkt(xe

1 = 10,M = 2.25) ist die Verstärkung des offenen Kreises in Abbildung3.12 dargestellt. Wie zu erkennen ist, wird die Spezifikation erfüllt.

Page 111: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.5 Übersicht geeigneter Regler 111

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−15

−10

−5

0

5

10

15

20

25

30

t in s

u(t)

inde

g/s

Abbildung 3.11: Ableitung der Stellgrößeu∗ bei ei-nem Sollwertsprung vonyr um 1g

10−2

10−1

100

101

102

103

104

−140

−120

−100

−80

−60

−40

−20

0

20

40

60

80

ω in rad/s

|L(jω

)|in

dB

Abbildung 3.12: Verstärkung des offenen Regel-kreises

Page 112: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 112

3.6 Gain-Scheduling-Regler

Motiviert durch das nächste Beispiel 3.6.1, wird nachfolgend der in Abschnitt 3.5 vorgestellteGain-Scheduling-Ansatz konkretisiert. Bei dem Beispiel handelt es sich um die Folgeregelungdes Bioreaktors. Es wird demonstriert, daß die Verwendung eines einzelnen linearen Reglersbeim Entwurf des unterlagerten Regelkreises Beschränkungen in der Güte der Folgeregelungnach sich zieht. Wie später gezeigt wird, können diese Beschränkungen durch den Einsatz derGain-Scheduling-Technik beseitigt werden.

Beispiel 3.6.1Für den im Anhang B vorgestellten Bioreaktor wird nun eine Folgeregelung entworfen. Dabeiwird das im Abschnitt 2.4.4 beschriebene und im Beispiel 2.4.10 auf den Bioreaktor angewandteInversionsverfahren für maximalphasige Regelstrecken eingesetzt. Die Regelung soll im Bereichder Gleichgewichtspunkte

0.08≤ xe1 ≤ 0.24

xe2 = xe

21=

1+ β2+

(1+ β)2

4− (1+ β)xe

1 (3.29)

arbeiten. Die Einschränkung des in der Spezifikation B.1 angegebenen Arbeitsbereiches auf dasGebiet (3.29) hat folgende Gründe:

1. Die Gleichgewichtspunkte im Bereich (3.29) besitzen nureine instabile Mannigfaltig-keit. Dieses ist eine Voraussetzung zur Anwendbarkeit des Inversionsverfahrens. Da dieGleichgewichtspunkte an den Rändern des im Anhang B.1 angegebenen Gebietes zentraleMannigfaltigkeiten besitzen, mußte der Randbereich ausgeklammert werden.

2. Bei sehr kleinen Vorgabenyd < 0.08 für die Ausgangsgröße werden bei der Inversionapproximative nominale Zustands- und Stellgrößentrajektorien xd und ud generiert, diedie vorhandenen Beschränkungen des Zustandsraumes und derStellgröße verletzen.

Für das Übertragungsverhalten der Folgeregelung im kompletten Arbeitsbereich wurde ein li-neares Referenzmodell zweiter Ordnung mit zwei gleichen Zeitkonstanten angesetzt:

Σre f : G(s) =1

(1.42s+ 1)2. (3.30)

Zur Erzielung stationärer Genauigkeit wird ein unterlagerter Regelkreis mit Integrator verwen-det. Die im resultierenden parametervarianten Fehlermodell (3.14) vorkommenden Matrizen und

Page 113: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 113

Vektoren lauten für den Bioreaktor:

A(xd, ud) =

−ud + a(xd2) xd

1da(x2)

dx2

∣∣∣∣x2=xd

2

a(xd2)b(xd

2) −ud + xd1

da(x2)b(x2)dx2

∣∣∣∣x2=xd

2

b(xd) =

(

−xd1

−xd2

)

c =

(

10

)

d = 0. (3.31)

Als erstes wurde ein linearer Zustandsregler der Form (3.24) entworfen. Der Entwurf erfolgtan dem in der Mitte des Arbeitsbereiches befindlichen Gleichgewichtspunkt, der durchxe

1 =

0.16, xe2 = 0.8213undue = 0.9891gekennzeichnet ist. Die Pole des unterlagerten Regelkreises

mit Integrator wurden beip1 = −3, p2 = −2, p3 = −1 plaziert. Sie sind somit schneller als diedoppelte Polstellepre f 1,2 = −0.7 des Referenzmodells. Das Simulationsergebnis der Folgere-gelung bei sprungförmigen Änderungen der externen Referenzgrößeyr ist in Abbildung 3.13dargestellt. Der komplette Arbeitsbereich wird durch die Referenztrajektorieyd erfaßt. Die Re-gelung vermag dabei den Bioreaktor zu stabilisieren.Es sei bemerkt, daß die Dynamik des Bioreaktors in dem betrachteten Bereich stark schwankt.So findet ein Übergang von stabilem zu instabilem Systemverhalten und umgekehrt statt. Desweiteren besitzt die ungeregelte Strecke stark oszillierendes Verhalten.Das geforderte Übertragungsverhalten der Folgeregelung kann bei dem Sprung der Referenz-größeyr auf die Konzentration0.24 nicht exakt eingehalten werden. Die Ausregelung der Ab-weichungen erfolgt zu langsam.Als Gegenmaßnahme wurde ein neuer linearer Zustandsreglerentworfen, der die Pole des un-terlagerten Regelkreises weiter von der imaginären Achse entfernt plaziert. Die nun schnellerenPole lauten:

p1 = −5, p2 = −4, p3 = −3.

Wie das in Abbildung 3.14 dargestellte Simulationsergebnis der Folgeregelung zeigt, wird derunterlagerte Regelkreis nun bei dem großen Sollwertsprunginstabil. Dieses zeigt, daß es schwie-rig ist, mit einem einzelnen linearen Regler den Bioreaktorim kompletten Arbeitsbereich zustabilisieren und das für die Folgeregelung spezifizierte Übertragungsverhalten zu erzielen.

Page 114: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 114

0 10 20 30 40 50 60 700

0.05

0.1

0.15

0.2

0.25

t in s

y(t

),y

d(t

)

Abbildung 3.13: Verlauf der Regelgrößey (durch-gezogene Linie) und der gefilter-ten Vorgabeyd (gestrichelte Linie)bei der Polvorgabep1 = −3, p2 =

−2, p3 = −1 für den linearisiertenRegelkreis.

0 10 20 30 40 50 60 700

0.05

0.1

0.15

0.2

0.25

t in s

y(t

),y

d(t

)

Abbildung 3.14: Verlauf der Regelgrößey (durch-gezogene Linie) und der gefilter-ten Vorgabeyd (gestrichelte Linie)bei der Polvorgabep1 = −5, p2 =

−4, p3 = −3 für den linearisiertenRegelkreis.

Page 115: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 115

Entsprechend den Überlegungen von Abschnitt 3.5 wird nun ein Gain-Scheduling-Regler vor-gestellt, der die spezifizierte Güte der Folgeregelung übereinen größeren Arbeitsbereich sichernsoll. Ausgangspunkt der Überlegungen ist das zu regelnde lineare parametervariante Fehlermo-dell (3.16). Zur Vereinfachung der Darstellung werden die Parameterxd und ud im Parameter-vektor

ρ =

(

xd

ud

)

(3.32)

zusammengefaßt. Der Vektorρ kann noch weitere Parameter, die das sich mit der Zeit änderndeSystemverhalten des Fehlermodells repräsentieren, so z.B. die Machzahl beim Lenkflugkörper,enthalten. Der ParameterraumP ∈ Rs stelle einen geschlossenen Unterraum dar, wobeis dieAnzahl der Parameter ist. Enthältρ nur den nominalen Zustandsvektor und die nominale Stell-größe, so ists = n + 1. Die Menge aller zulässigen Parametertrajektorien seiFP. Als Grund-voraussetzung für den Entwurf des Gain-Scheduling-Reglers wird angenommen, daß durchFPdie Menge aller genügend langsamen Trajektorien der Parameter im RaumP ∈ Rs beschriebenwird. Im folgenden wird durch die Notationρ ∈ FP eine Vektorfunktion bezeichnet, die einenmöglichen Verlauf der Parameter beschreibt, währendρ ∈ P ein konkreter Parametervektor ist.Die Grundlage des Reglerentwurfes stellt eine Anzahl vonN linearen zeitinvarianten Fehlermo-dellen

ξ = A(ρi)ξ + b(ρi)uf b + z(ρi), i = 1, · · · ,N (3.33)

mit festen Parametervektorenρi ∈ P, i = 1, · · · ,N dar. Diese Modelle beschreiben das Verhaltendes zeitvarianten Fehlermodells (3.16) für langsame Parametertrajektorienρ ∈ FP in der Näheder Punkteρi ∈ P des Parameterraums. Die Auswahl der Punkte hat so zu erfolgen, daß entlangder tatsächlich verfahrenen Trajektorieρ ∈ FP immer gültige lineare zeitinvariante Modelle vor-liegen. Da der spätere Verlauf der Parametertrajektorie nicht bekannt ist, wird folgende Strategiefür die Auswahl der Entwurfspunkte vorgeschlagen:

• Es wird angenommen, daß der Parameterraum durch

ρi≤ ρi ≤ ρi , i = 1, · · · ,N. (3.34)

begrenzt ist. Die Größenρi

bzw. ρi stellen die untere bzw. obere Beschränkung für denWert des i-ten Parameters dar.

• In den geschlossenens-dimensionalen Parameterraum, der nun einen Hyperquader reprä-sentiert, wird ein reguläres Gitter gelegt. Die linearen zeitinvarianten Modelle werden anden Gitterpunkten bestimmt. Der Abstand der Gitterpunkte in Bezug auf einen Parameterrichtet sich nach

– der Stärke des Einflusses des betreffenden Parameters auf die Systemdynamik und

– dem Wertebereich des Parameters.

Page 116: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 116

Dieses Vorgehen sichert die Beschreibung des Systemverhaltens von (3.16) für langsame Ände-rungen der Parameter durch lineare zeitinvariante Modellein Abhängigkeit vom aktuellen Para-metervektor. Nachteilig ist, daß bei einer Erhöhung der Parameteranzahl, d.h. bei Regelstreckenhöherer Ordnung, die Anzahl der Entwurfspunkte exponentiell steigt. Wird jeder Parameter mitr Werten berücksichtigt, so bedeutet diesN = rs lineare Modelle.An denN Modellen (3.33) werden nunN lineare Regler Ki , i = 1, · · · ,N entworfen. Es werdenhier N lineare Zustandsregler der Form

uf b,i = −kTi ξ, i = 1, · · · ,N (3.35)

mittels Polvorgabe bestimmt. Beim Entwurf kann die unterschiedliche Dynamik der einzelnenModelle z.B. durch verschiedene Polvorgaben berücksichtigt werden. Es muß jedoch daran ge-dacht werden, daß der Entwurf eines nichtlinearen Reglers das endgültige Ziel ist. Der optimaleEntwurf der einzelnen Regler führt dabei nicht unbedingt zueinem optimalen nichtlinearen Reg-ler.Die resultierenden linearen Regler werden nach dem Entwurfzu einem gesamten, nichtlinearenRegler kombiniert. Dieses erfolgt durch Interpolation. Umdiesen Schritt durchführen zu kön-nen, wird jedem derN Regler Ki , i = 1, · · · ,N eine Gültigkeitsfunktion (Basisfunktion)ψi(ρ)zugeordnet. Diese Funktion beschreibt die Gültigkeit eines linearen Reglers in Abhängigkeitvom aktuellen Parametervektorρ ∈ P, d.h von den Scheduling-Variablen. Es wird festgelegt,

• daß der Wert der Gültigkeitsfunktion nahezu Eins ist, wenn sich der durch den aktuellenParametervektor beschriebene Punkt in der Nähe des Entwurfspunktes des Reglers befin-det, und

• daß der Wert der Gültigkeitsfunktion gegen Null geht, wenn sich der durch den aktuel-len Parametervektor beschriebene Punkt vom Entwurfspunktdes entsprechenden Reglersentfernt.

Für alle möglichen Parametervektoren soll die totale Gültigkeit aller Regler des weiteren Einssein:

N∑

i=1

ψi(ρ) = 1, ∀ρ ∈ P. (3.36)

Diese Bedingung kann immer durch Normierung erreicht werden. Ist ein Satz unnormierter Ba-sisfunktionenµi(ρ), i = 1, · · · ,N gegeben, so ergibt sich die die normierte Gültigkeitsfunktionψi(ρ) wie folgt:

ψi(ρ) =µi(ρ)

∑Nj=1 µ j(ρ)

. (3.37)

Der Normierungsschritt führt zusätzlich zu einem Generalisierungseffekt bei der Extrapolationvon Reglern in Regionen des ParameterraumesP, die weit von den Entwurfspunkten entferntsind.

Page 117: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 117

Als konkrete Realisierung der unnormierten Gültigkeitsfunktion µi(ρ) kann eine Gauß-Funktionverwendet werden:

µi(ρ) = e

(

− 12 (ρ−ρi )

TW−1i (ρ−ρi )

)

, (3.38)

wobei der Entwurfspunktρi ∈ P das Zentrum der Gauß-Funktion darstellt. Mittels der positivdefiniten DiagonalmatrixWi kann die Form der Basisfunktion variiert werden. In den Abbildun-gen 3.15 und 3.16 sind unnormierte und normierte Gültigkeitsfunktionen für den Fall von zweiParametern dargestellt. Die Entwurfspunkte entsprechen in diesem Fall nicht den Gitterpunkteneines regulären Gitters.

00.2

0.40.6

0.81

0

0.2

0.4

0.6

0.8

10

0.2

0.4

0.6

0.8

1

ρ1

ρ2

µi(ρ)

Abbildung 3.15: Unnormierte Gültigkeitsfunktio-nen

00.2

0.40.6

0.81

0

0.2

0.4

0.6

0.8

10

0.2

0.4

0.6

0.8

1

ρ1

ρ2

ψi(ρ)

Abbildung 3.16: Normierte Gültigkeitsfunktionen

Den nichtlinearen Regler erhält man wie folgt durch Kombination der linearen Regler unterNutzung der Basisfunktionen:

uf b = −N∑

i=1

ψi(ρ)kTi ξ =

N∑

i=1

ψi(ρ)uf b, i . (3.39)

Man erkennt, daß der Ausgang des Gain-Scheduling-Reglers die Summe der mit den Gültig-keitsfunktionenψi(ρ) gewichteten Ausgangsgrößenuf b, i der linearen Regler ist. Dieser Sach-verhalt ist in Abbildung 3.17 dargestellt. Der gewählte Regleransatz entspricht dem in [14] be-schriebenen Gain-Scheduling-Verfahren. Eine spezielle Bezeichnung für diese Art von Gain-Scheduling-Regler ist Local-Controller-Network [14].

Page 118: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 118

ψ1 ψ2 ψN

ρ

ξ

uf b

K1

K2

KN

uf b,1

uf b,2

uf b,N

xd

ud

Scheduling-variablen

Abbildung 3.17: Gain-Scheduling-Regler

Beispiel 3.6.2Für den unterlagerten Regelkreis bei der Folgeregelung derBioreaktors wird nun im Gegensatzzum Beispiel 3.6.1 ein Gain-Scheduling-Regler verwendet.Die Scheduling-Variablen des Reg-lers sind die Parameterρ1 = xd

1, ρ2 = xd2 und ρ3 = ud des parametervarianten Fehlermodells

(3.16). Die Grenzen des Parameterraumes ergeben sich aus den bei der Inversion im Beispiel3.6.1 angefallenen minimalen und maximalen Werten für die Parameter. Konkret lauten die Be-schränkungen des ParameterraumesP:

0.08 ≤ xd1 ≤ 0.24

0.60 ≤ xd2 ≤ 0.95

0.4 ≤ ud ≤ 1.4 (3.40)

Bei der Erzeugung des regulären Gitters der Entwurfspunktewurden die Abständedi der Gitter-punkte in Bezug auf die einzelnen Parameter wie folgt gewählt:

d1 = 0.04, d2 = 0.05, d3 = 0.1. (3.41)

Page 119: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 119

Es wurden somit folgende Werte der Parameter für die Konstruktion des Gitters verwendet:

xd1 = ρ1 ∈ {0.08, 0.12, 0.16, 0.20, 0.24}

xd2 = ρ2 ∈ {0.55, 0.60, 0.65, 0.70, 0.75, 0.80, 0.85, 0.90, 0.95}

ud2 = ρ3 ∈ {0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, 1.4}. (3.42)

Das resultierende Gitter besitztN = 495 Gitterpunkte, d.h. es werden 495 lineare Modelleverwendet. Die einzelnen Regler für die linearen Modelle wurden mit Polvorgabe entworfen,wobei die Pole der einzelnen linearen Regelkreise wie folgtplaziert wurden:

p1 = −5, p2 = −4, p3 = −3.

Dies entspricht der Vorgabe, die bei einem einzigen linearen Zustandsregler zur Instabilität derFolgeregelung führte.Als Basisfunktionen wurden Gauß-Funktionen der Form (3.38) verwendet. Die DiagonalmatrixWi wurde für alle Gültigkeitsfunktionen mit

W =

0.0144 0 00 0.0180 00 0 0.0361

(3.43)

gleich gewählt, da es sich um ein reguläres Gitter handelt. Die Bestimmung der Diagonalele-mente der MatrixW erfolgte so, daß der Wert einer Gültigkeitsfunktion auf denGitterlinien beihalbem Abstand zu den Zentren der benachbarten Basisfunktionen 0.5 beträgt. In den Abbildun-gen 3.18 und 3.19 sind für einen Ausschnitt des Parameterraumes die resultierenden normiertenGültigkeitsfunktionen dargestellt. Um eine Darstellung überhaupt zu ermöglichen, wurde einParameter konstant gehalten.

0.10.12

0.140.16

0.18

0.7

0.75

0.80

0.2

0.4

0.6

0.8

1

xd1 = ρ1

xd2 = ρ2

ψi(ρ)

Abbildung 3.18: Normierte Gültigkeitsfunktionenfür einen Ausschnitt des Parame-terraumes (ρ3 = ud = 1).

0.1 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.180.7

0.71

0.72

0.73

0.74

0.75

0.76

0.77

0.78

0.79

0.8

xd1

xd 2

Abbildung 3.19: Konturlinien (ψi(ρ) = 0.5) dernormierten Gültigkeitsfunktionenfür einen Ausschnitt des Parame-terraumes (ρ3 = ud = 1). Die Ent-wurfspunkte sind durch das Sym-bol ♦ gekennzeichnet.

Page 120: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 120

Die Abbildungen 3.20 bis 3.22 zeigen das Ergebnis der Folgeregelung bei Implementierung desGain-Scheduling-Reglers für die nominale Reglestrecke. Das Resultat bei um minus 20 Prozentveränderten Streckenparameternβ und Γ ist in den Abbildungen 3.23 bis 3.25 dargestellt. Inbeiden Fällen kann durch Verwendung des Gain-Scheduling-Reglers die Stabilität der Folgere-gelung unter Erzielung der spezifizierten Güte erreicht werden.Die Abweichung des Systemausgangesy von der gefilterten Referenztrajektorieyd ist wesent-lich kleiner als bei Verwendung des linearen Reglers im Beispiel 3.6.1.

0 10 20 30 40 50 60 700.05

0.1

0.15

0.2

0.25

0.3

t

y(t

),y

d(t

)

Abbildung 3.20: Verlauf der gefilterten Referenz-größeyd (gestrichelte Linie) undAusgangsgrößey der Regelstrecke(durchgezogene Linie)

0 10 20 30 40 50 60 700

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

t in s

x(t),xd

(t)

Abbildung 3.21: Approximative nominale Zustand-strajektorie xd (gestrichelte Lini-en) und Systemzustandstrajektoriex (durchgezogene Linien)

Page 121: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.6 Gain-Scheduling-Regler 121

0 10 20 30 40 50 60 70

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

t in s

ud(t

),u

fb

Abbildung 3.22: Verlauf der approximativen nomi-nalen Stellgröße ˆud (durchgezo-gene Linie) und der korrektivenStellgrößeuf b (gestrichelte Linie)

0 10 20 30 40 50 60 700.05

0.1

0.15

0.2

0.25

0.3

t

y(t

),y

d(t

)

Abbildung 3.23: Verlauf der gefilterten Referenz-größeyd (gestrichelte Linie) undAusgangsgröße y der Regel-strecke (durchgezogene Linie) beiStreckenparameterschwankungen

0 10 20 30 40 50 60 700

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

t in s

x(t),xd

(t)

Abbildung 3.24: Approximative nominale Zustand-strajektorie xd (gestrichelte Lini-en) und Systemzustandstrajekto-rie x (durchgezogene Linien) beiStreckenparameterschwankungen

0 10 20 30 40 50 60 70

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

t in s

ud(t

),u

fb

Abbildung 3.25: Verlauf der approximativen nomi-nalen Stellgröße ˆud (durchgezo-gene Linie) und der korrektivenStellgrößeuf b (gestrichelte Linie)bei Streckenparameterschwankun-gen

Page 122: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.7 Parametervariante Zustandsregelung 122

3.7 Parametervariante Zustandsregelung

3.7.1 Analyse linearer parametervarianter Systeme

Bei den in den Abschnitten 3.2 und 3.3 aufgestellten Fehlermodellen (3.9) und (3.16) handelt essich um lineare parametervariante Systeme (LPV-Systeme) [2, 42]. Im folgenden sollen grundle-gende Eigenschaften solcher Systeme behandelt und ein Regelungsansatz herausgearbeitet wer-den.Die Dynamik des LPV-Systems wird von sich ändernen Parametern beeinflußt. Es sei angenom-men, daß diese Parameter in Echtzeit gemessen werden könnenoder auf andere Art und Weisein Echtzeit zur Verfügung stehen. Im Falle der Fehlermodelle (3.9) und (3.16) sind die Parameterdes LPV-Systems die Ausgangsgrößen ˆxd undud des reduzierten inversen Systems der approxi-mierten RegelstreckeΣ.Für die Analyse von LPV-Systemen ist es notwendig, die Mengeder möglichen Parameter-änderungen zu beschränken. Dazu wird eine MengeFP aller zulässiger Parametertrajektoriendefiniert:

Definition 3.7.1Es sei der geschlossene UnterraumP ∈ Rs gegeben. Die MengeFP beschreibt die Mengealler stückweise stetigen Vektorfunktionen, die eine Abbildung der ZeitR+ in den UnterraumPbeschreiben, und eine endliche Anzahl von Unstetigkeiten in jedem Intervall aufweisen.

Die Definition besagt, daß sich für dies Parameter des Systems untere und obere Schrankenangeben lassen. Alle stückweise stetigen Funktionen, die den Verlauf der Parameter in Abhän-gigkeit von der Zeit beschreiben und die Grenzen des Parameterraumes nicht verletzen, sinderlaubt. Dabei können sich die Parameter beliebig schnell ändern und sogar springen. Im fol-genden wird durch die Notationρ ∈ FP eine Vektorfunktion bezeichnet, die einen möglichenVerlauf der Parameter beschreibt, währendρ ∈ P ein konkreter Parametervektor ist. Nach [2]läßt sich ein LPV-System unter Nutzung der Definition 3.7.1 wie folgt definieren:

Definition 3.7.2Ein linear parametervariantes Systemn-ter Ordnung ist gegeben durch einen geschlossenen Un-terraumP ∈ Rs und stetige Funktionen

• A : Rs→ Rn×n,

• B : Rs→ Rn×nd,

• C : Rs→ Rne×n und

• D : Rs→ Rne×nd.

Die Dynamik des LPV-Systems wird charakterisiert durch(

x(t)e(t)

)

=

(

A(ρ(t)) B(ρ(t))C(ρ(t)) D(ρ(t))

) (

x(t)d(t)

)

(3.44)

mit ρ(t) ∈ FP.

Page 123: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.7 Parametervariante Zustandsregelung 123

Die FunktionenA, B,C, D sind Matrizen, deren Elemente stetige Funktionen ders Parameterρi(t), i = 1, · · · , s sind. Der Vektorx ∈ Rn beinhaltet die n Systemzustände. Extern auf das Sy-stem einwirkende Störungen werden im Vektord ∈ Rnd erfaßt. Der Vektore ∈ Rne umfaßt alleFehlersignale, durch die ausgewählte Eigenschaften, wie z.B. die Güte des Systems, beschrie-ben werden. Stellt das LPV-System z.B. einen geschlossenenRegelkreis dar, so sind typischeexterne Störungen z.B. Meßrauschen, Referenzsignale und auf das System einwirkende richtigeStörungen. Signale ine, die für die Regelung von Bedeutung sind, können z.B. der Regelfehlerund der Stellaufwand sein. Die durch die Definition 3.7.1 beschriebene Beschränkung der Para-metertrajektorien garantiert die Existenz und Eindeutigkeit der Lösung von (3.44). Im folgendenwird das LPV-System nach Definition durchΣ(P, A, B,C, D) oderΣP bezeichnet. Für eine spe-zielle Vektorfunktionρ ∈ FP wird das durch Gleichung (3.44) charakterisierte System mit Σρbezeichnet. Mit der ZustandstransitionsmatrixΦρ(t, t0) des SystemsΣρ läßt sich der kausale,lineare OperatorGρ angeben:

e(t) =∫ t

0C(ρ(τ))Φρ(t, t0)B(ρ(τ)d(τ)dτ + D(ρ(t))d(t). (3.45)

DurchGρ wird die Abbildung der Störungd auf den Fehlere beschrieben fürx(t0 = 0) = 0. DieMengeGFP aller existierender OperatorenGρ ist

GFP ={

Gρ : ρ ∈ FP}

. (3.46)

Der OperatorGρ stellt eine Matrix dar, deren Elemente Funktionen der Zeit sind.

Grundlegende Systemeigenschaften

Quadratische Stabilität

Die wichtigste Systemeigenschaft ist die Stabilität. Wannein LPV-System (3.44) stabil ist, sollnun geklärt werden. Dazu wird die homogene Differentialgleichung

x(t) = A(ρ(t))x(t) (3.47)

betrachtet. Die Lösungx(t) dieser Differentialgleichung ist durch

x(t) = Φρ(t, t0)x0, x(t0) = x0 (3.48)

gegeben, wobeiΦρ(t, t0) die Zustandstransitionsmatrix des Systems für eine konkrete Parame-tertrajektorieρ ∈ FP ist. Nach [2] ist der Gleichgewichtspunkt des Systems (3.44) asymptotischstabil, wenn und nur wenn für alleρ ∈ FP die Zustandstransitionsmatrix die Ungleichung

‖Φρ(t, t0)‖ ≤ γ1e−γ2(t−t0) (3.49)

für zwei positive Konstantenγ1, γ2 > 0 erfüllt. Ist die Bedingung (3.49) erfüllt, so spricht manvon exponentieller Stabilität des Systems. Zum Test der Stabilität ist die Ungleichung (3.49)kaum geeignet, da die Zustandstransitionsmatrix für alle möglichen Parametertrajektorien be-trachtet werden muß. Nach [2] ist das System jedoch exponentiell stabil, wenn quadratischeStabilität vorliegt. Diese Form der Stabilität ist wie folgt definiert:

Page 124: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.7 Parametervariante Zustandsregelung 124

Definition 3.7.3 (Quadratische Stabilität)Es sei ein geschlossener UnterraumP ∈ Rs und die stetige FunktionA : Rs → Rn×n gegeben.Die Funktion A ist quadratisch stabil über dem ParameterraumP, wenn eine symmetrische,positiv definite MatrixP ∈ Rn×n, P = PT > 0 existiert, so daß für alleρ ∈ P gilt:

AT(ρ)P + PA(ρ) < 0. (3.50)

Die Stabilitätsanalyse erfolgt anhand einer einzigen Lyapunov-Funktion. Es wird die quadrati-sche Form

V(x) = xT Px

angesetzt, wobei die MatrixP symmetrisch und positiv definit ist. Die in Definition 3.7.3 for-mulierte Bedingung für die quadratische Stabilität ist nureine hinreichende Bedingung für dieexponentielle Stabilität. Läßt sich keine MatrixP finden, die Beschränkung (3.50) für alleρ ∈ Perfüllt, so muß das System (3.47) nicht instabil sein. Möglicherweise ist der gewählte quadrati-sche Ansatz für die Struktur der Lyapunov-Funktion nicht geeignet.Im allgemeinen ist der Test auf quadratische Stabilität sehr konservativ. In [42] wird durch eineEinschränkung der zulässigen Parametertrajektorien und durch die Verwendung parameterab-hängiger Lyapunov-Funktionen dieser Konservatismus reduziert. Es wird dabei angenommen,daß sich jeder Parameter nur mit einer maximalen Geschwindigkeit ändern kann.

Wie hat man nun den Test der Stabilität anhand der in Definition 3.7.3 angegebenen Bedingun-gen konkret durchzuführen?

Die Beschränkung (3.50) stellt eine lineare Matrixungleichung in Bezug auf die frei wählbarenElemente der MatrixP dar. Da die MatrixA kontinuierlich von den Parameternρi , i = 1, · · · , sabhängt, ist zum Beweis der Stabilität eine symmetrische, positiv definite MatrixP zu ermitteln,die ein System von unendlich vielen Beschränkungen (3.50) erfüllt.

Praktisch reicht es aus, wenn man in den Parameterraum ein genügend dichtes Gitter legt undfordert, daß nur für die Gitterpunkte die lineare Matrixungleichung (3.50) erfüllt sein muß. Esist sinnvoll, zuerst ein groberes Gitter zu verwenden und die die Matrix P zu ermitteln. Aneinem feineren Gitter kann dann getestet werden, ob die Bedingung (3.50) immer noch erfülltist. Dieses Vorgehen bietet sich an, da die Ermittlung der Matrix P wesentlich rechenintensiverist als der Test der Bedingung (3.50) bei gegebener MatrixP.

Eine starke Vereinfachung des Stabilitätstests tritt auf,wenn der Parameterraum ein konvexesPolytop darstellt undρ affin in die Matrix A eingeht, d.h.

A(ρ) = A0 +

s∑

i=1

Aiρi (3.51)

ist. In diesem Fall reicht es aus, wenn die LMI (3.50) für die Eckpunkte des konvexen Polytopserfüllt ist. Für eine gefundene MatrixP ist die Matrixungleichung (3.50) dann auch für die rest-lichen Punkte des Parameterraums erfüllt.Zur Lösung der Systeme linearer Matrixungleichungen stehen mittlerweile effiziente numerischeVerfahren zur Verfügung [25, 21]. Es sei noch bemerkt, daß der Rechenaufwand beim Lösen von

Page 125: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.7 Parametervariante Zustandsregelung 125

LMI’s wesentlich stärker von der Dimension der gesuchten Matrix abhängt als von der Anzahlder Beschränkungen bzw. Matrixungleichungen.Die getroffenen Überlegungen zum Test der Stabilitätsbedingung gelten analog für alle weiterenin den folgenden Abschnitten aufgestellten Bedingungen inForm linearer Matrixungleichungen.

Induzierte L2-Norm

Als Gütemaß für ein LPV-System kann die induzierteL2-Norm verwendet werden. Für ein qua-dratisch stabiles LPV-SystemΣP mit der Initialisierungsbedingungx(0) = 0 ist die induzierteL2-Norm wie folgt definiert:

‖GFp‖i,2 = supρ∈Fp

supd∈L2

‖d‖2,0

‖e‖2‖d‖2

(3.52)

Die induzierte L2-Norm repräsentiert das größte Verhältnis der Norm von Fehler e und Störungd über die Menge aller linearer kausaler Operatoren, die durch das LPV-System beschriebenwerden. Für ein stabiles LPV-System ist diese Norm stets begrenzt. Das folgende Theorem [2]gibt die hinreichende Bedingung an, um zu prüfen, ob die induzierte L2-Norm eines Systemskleiner oder gleich einem vorgeschriebenen Wert ist.

Theorem 3.7.1Es ist das LPV-SystemΣ(P, A, B,C, D) und eine positive Konstanteγ > 0 gegeben. Existierteine symmetrische, positiv definite MatrixX = XT > 0, so daß für alleρ ∈ P die lineareMatrixungleichung

AT(ρ)X + XA(ρ) XB(ρ) γ−1CT(ρ)BT(ρ)X −I γ−1DT(ρ)γ−1C(ρ) γ−1D(ρ) −I

< 0 (3.53)

erfüllt ist,

• dann ist das SystemΣ(P, A, B,C, D) quadratisch stabil über dem ParameterraumP und

• es gibt eine positive Konstanteβ < γ, so daß‖GFp‖i,2 ≤ β gilt.

Wieder liegt die zu testende Bedingung in Form einer LMI vor.

3.7.2 Entwurf der parameterabhängigen Zustandsregelung

Nachdem grundlegende Eigenschaften von LPV-Systemen beschrieben wurden, steht nun dieFrage im Vordergrund, wie man durch die Regelung eines LPV-Systems diese Eigenschaftenverbessern oder erreichen erreichen kann. Dazu wird eine verallgemeinerte RegelstreckeΣol

Page 126: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.7 Parametervariante Zustandsregelung 126

betracht, wobei der Indexol für open loop steht. In kompakter Matrixschreibweise hat dieseRegelstrecke folgendes Aussehen:

Σol :

(

xe

)

=

(

A(ρ) B1(ρ) B2(ρ)C1(ρ) 0 D12(ρ)

)

xdu

. (3.54)

Eingangsgrößen vonΣol sind die Stellgrößenu ∈ Rnu sowie externe Störungend ∈ Rnd. Aus-gangsgrößen der Regelstrecke sind die Systemzuständex ∈ Rn und der Fehlervektore ∈ Rne. Essoll eine Zustandsregelung bestimmt werden,

• die das SystemΣol stabilisiert und

• für den geschlossenen Regelkreis eine vorgegebene obere Schranke fürL2-Norm garan-tiert.

Der Entwurf einer Zustandsregelung bietet sich an, da die Zustände der zu regelnden Fehler-modelle meßbar sind. Das Problem der Ausgangsregelung wirdin [2] behandelt. Der Regler istabhängig vom aktuellen Parametervektorρ und hat folgende Form:

u = F(ρ)x, (3.55)

wobei F : Rs→ Rnu×n eine stetige Funktion ist.

Σol

d(t)e(t)

u(t)x(t)

F(ρ)

Abbildung 3.26: Regelkreis aus verallgemeinerterRegelstreckeΣol und parameterab-hängigem Regler

Σclp d(t)e(t)

Abbildung 3.27: Ein- und Ausgangssignale des ge-schlossenen RegelkreisesΣclp

In Abbildung 3.26 ist die Verbindung von Regelstrecke und Regler dargestellt. Der geschlosseneRegelkreis (siehe Abbildung 3.27) besitzt als Eingangsgrößen dann die Störungd und als Aus-gang den Fehlere. Für den geschlossenen RegelkreisΣclp ergibt sich aus (3.54) und (3.55) wiefolgt:

Σclp :

(

xe

)

=

(

Aclp(ρ) Bclp(ρ)Cclp(ρ) Dclp(ρ)

) (

xd

)

(3.56)

Page 127: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.7 Parametervariante Zustandsregelung 127

mit

Aclp(ρ) = A(ρ) + B2(ρ)F(ρ)

Bclp(ρ) = B1(ρ)

Cclp(ρ) = C1(ρ) + D12(ρ)F(ρ)

Dclp(ρ) = 0. (3.57)

Nach Theorem 3.7.1 ist das SystemΣclp quadratisch stabil und hat eine obere Schranke für dieinduzierteL2-Norm ‖Σclp‖i,2 < γ mit γ > 0, wenn eine symmetrische, positiv definite MatrixZ = ZT > 0 existiert, so daß für alleρ ∈ P die lineare Matrixungleichung

ATclp(ρ)Z + Z Aclp(ρ) ZB1(ρ) γ−1CT

clp(ρ)BT

1 (ρ)Z −Ind 0γ−1Cclp(ρ) 0 −Ine

< 0 (3.58)

erfüllt ist. Es ist nun eine kontinuierliche FunktionF(ρ) und eine symmetrische, positiv definiteMatrix Z so zu bestimmen, daß (3.58) für alleρ ∈ P erfüllt ist. Um die Bedingung für dieExistenz eines Reglers angeben und die Bestimmung des Reglers durchführen zu können, isteine Vereinfachung der verallgemeinerten Regelstrecke notwendig. Es wird angenommen, daßdas System (3.54) in der folgenden Form vorliegt:

xe1

e2

=

A(ρ) B1(ρ) B2(ρ)C11(ρ) 0 0C12(ρ) 0 Ine2

xdu

, (3.59)

wobei der Fehlervektore in die Vektorene1 ∈ Rne1 unde2 ∈ Rne2 aufgespaltet wird. Die Dimen-sion des Vektorse2 entspricht der Dimension des Vektorsu. Eine solche Darstellungform kannimmer erreicht werden, wenn die MatrixD12 in (3.54) den vollen Spaltenrang für alleρ ∈ Pbesitzt.

Ist dies der Fall, so kann das System (3.54) durch eine die Norm sichernde Transformationdes Fehlerse und eine invertierbare Transformation der Stellgrößeu in die Form (3.59) über-führt werden [2]. Die Forderung nach vollem Spaltenrang derMatrix D12 wird im allgemeinendadurch erfüllt, daß man als einen Teil der Fehlersignale die skalar gewichteten Stellgrößen de-finiert. Im folgenden wird angenommen, daß das SystemΣol in der Form (3.59) vorliegt. Dasfolgende Theorem [2] gibt nun die hinreichende und notwendige Bedingung für die Existenzeines parameterabhängigen Zustandsreglers an:

Theorem 3.7.2Es existiert ein parameterabhängiger Zustandsregler der Form (3.55) ,

• der das SystemsΣol quadratisch stabilisiert und

• der eine obere positive Schrankeγ für die L2-Norm ‖Σclp‖i,2 < γ des geschlossenen Re-gelkreisesΣclp sicherstellt,

Page 128: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.7 Parametervariante Zustandsregelung 128

wenn und nur wenn eine symmetrische, positiv definite MatrixX = XT > 0 existiert, so daß füralleρ ∈ P die lineare Matrixungleichung

X AT(ρ) + AX − B2(ρ)B2(ρ)T XCT

11(ρ) γ−1B1(ρ)C11(ρ)X −Ine1 0γ−1BT

1 (ρ) 0 −Ind

< 0 (3.60)

mit

A(ρ) = A(ρ) − B2(ρ)C12(ρ) (3.61)

erfüllt ist.

Ist die Existenzbedingung für einen Regler erfüllt, so ergibt sich der Zustandsregler unter Ver-wendung der ermittelten MatrixX wie folgt:

F(ρ) = −(BT2 (ρ)X−1 + CT

12(ρ)). (3.62)

Im Rahmen dieser Arbeit wurde versucht, für das parametervariante Fehlermodell (3.16) einenparameterabhängigen Zustandsregler nach dem beschriebenen Ansatz zu entwerfen.Als erstes muß das Fehlermodell (3.16) in die Form (3.54) derverallgemeinerten Regelstreckegebracht werden. Dazu wurden die Störungenz1 undz2 des Fehlermodells im Vektord der Stö-rungen zusammengefaßt. Der Zustand der verallgemeinertenRegelstrecke ist mit dem Zustanddes Fehlermodells identisch:

x = ξ =(

xe

σ

)

.

Als Fehler werden der gewichtete Regelfehlerxe und die gewichtete Stellgrößeuf b definiert.Die Stellgrößeu der RegelstreckeΣol entspricht der Stellgrößeuf b des Fehlermodells.Zur Ermittlung des Reglers muß die resultierende verallgemeinerte Regelstrecke in die Form(3.59) transformiert werden.Für die Anwendungsbeispiele Lenkflugkörper und Bioreaktorwurde nun versucht, einen Reg-ler zu bestimmen. In beiden Anwendungsfällen geht der Parametervektorρ nicht affin in dieMatrizen der verallgemeinerten Regelstrecke (3.59) ein. Folglich muß ein Gitter in den Parame-terraum gelegt und für die Gitterpunkte die Bedingung (3.60) geprüft werden. Die Entwurfspa-rameter der Regelung sind die verwendeten Wichtungsfaktoren und die obere Schrankeγ für dieL2-Norm. Das Ergebnis der Reglerentwurfes läßt sich für beideAnwendungsbeispiele wie folgtzusammenfassen:

• Bei Verwendung des kompletten praktisch interessierendenParameterraumes konnte füreine sinnvolle Wahl der Entwurfsparameter keine MatrixX ermittelt werden. Für denkompletten ParameterraumP läßt sich somit kein Regler finden.

• Bei Verwendung eines eingeschränkten Parameterraums läßtsich ein Regler finden. Esist jedoch kein Zusammenhang zwischen den Entwurfsparametern und den Eigenschaf-ten des geschlossenen Regelkreises erkennbar. Die vorliegenden Spezifikationen, wie z.B.minimale und maximale Bandbreite, konnten nicht in eine geeignete Wahl der Wichtungs-faktoren und der oberen Schrankeγ für die L2-Norm übersetzt werden.

Page 129: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

3.7 Parametervariante Zustandsregelung 129

Die Ergebnisse zeigen, daß dieser Regleransatz sehr konservativ und wenig transparent ist. Esmuß geprüft werden, ob das Verwenden parameterabhängiger Lyapunov-Funktionen zu besserenErgebnissen führt [42].

Page 130: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

4 Zusammenfassung

Im Rahmen dieser Arbeit konnte erfolgreich gezeigt werden,daß mit der vorgestellten Rege-lungsstruktur aus zwei Freiheitsgraden das Folgeregelungsproblem für eine große Anzahl nicht-minimalphasiger Regelstrecken gelöst werden kann.Eine Grundvoraussetzung ist, daß mit den vorgestellten Verfahren eine stabile approximativeInversion der Regelstrecke durchführbar ist.Zum besseren Verständnis dieses Entwurfsschrittes wurdendie Grundlagen der Inversion nichtli-nearer Systeme zusammengefaßt. Es wurde nachgewiesen, daßein kausales reduziertes inversesSystem der Regelstrecke existiert, das bei Vorgabe eines Referenzsignals und einigen Ableitun-gen des Referenzsignals die gesuchte nominale Stellgröße und die nominalen Zustandsgrößenliefert. Die Analyse dieses inversen Systems ergab, daß nurgenügend glatte Referenzsignaleam Systemausgang praktisch erzeugt werden können und daß für nichtminimalphasige Regel-strecken das reduzierte inverse System instabil ist.Ausgehend von einer umfassenden Literaturanalyse wurde ein Überblick über mögliche Ver-fahren zur stabilen Inversion nichtminimalphasiger Regelstrecken erarbeitet. Die erfolgverspre-chendsten Verfahren wurden analysiert, verglichen und zumTeil erweitert. Bei der Auswahlder vorgestellten Ansätze wurde darauf geachtet, daß die Inversion der Regelstrecke in Echtzeitmöglich ist. Die Tauglichkeit der Inversionsverfahren wurde weitestgehend an Anwendungs-beispielen untersucht. Im Hinblick auf den Entwurf der Folgeregelung gelang es dabei, für diebeiden technischen Anwendungsbeispiele ein geeignetes Inversionsverfahren auszuwählen. Umdem Anwender die Auswahl des richtigen Verfahrens für seinen konkreten Anwendungsfall zuerleichtern, wurde ein lineares Analogon des entsprechenden Ansatzes angegeben.

Der Entwurf des zweiten Freiheitsgrades der Folgeregelungwurde beschrieben und bewertet.Die Untersuchungen zeigten, daß es für den Reglerentwurf ausreichend ist, die an der nominalenStell- und Zustandsgrößentrajektorie linearisierte Regelstrecke zu betrachten. Anhand der Simu-lationen der Folgeregelungen für die AnwendungsbeispieleLenkflugkörper und Bioreaktor warerkennbar, daß der nichtlineare Charakter der Regelstrecken durch die Vorwärtssteuerung erfaßtwird. Zur Durchführung des Reglerentwurfes ist es notwendig, ein lineares parametervariantesbzw. zeitvariantes Fehlermodell herzuleiten, das den Regelfehler der Systemzustände unter Ver-wendung der linearisierten Regelstrecke beschreibt. Dieses Modell wurde um einen Integratorerweitert, der den Regelfehler der Ausgangsgröße integriert. Parameter des Modells sind die inEchtzeit zur Verfügung stehenden nominalen Zustandsgrößen und die nominale Stellgröße. DieUntersuchungen zeigten, daß ein Regler, der das integral erweiterte Fehlermodell stabilisiert,zu einem beschränkten Regelfehler der Ausgangsgröße und der Zustände bei der nichtlinearenFolgeregelung führt. Des weiteren wurde gezeigt, daß die Verwendung des integral erweitertenFehlermodells zu stationärer Genauigkeit der Folgeregelung führt, wenn eine konstante Aus-gangsgröße gefordert ist. Für die Implementierung der Folgeregelung wurde der Integator als

130

Page 131: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

131

zusätzlicher Regelstreckenzustand eingeführt. Diese Aussagen wurden unter der Annahme ge-troffen, daß sich der Zustand der Regelstrecke nahe der nominalenZustandstrajektorie befindet.

Die Analyse des Regelkreises, bestehend aus dem parametervarianten Fehlermodell und demRegler, führte zu der Erkenntnis, daß eine Beschränkung dererreichbaren Güte der Folgere-gelung aufgrund der Nichtminimalphasigkeit der Regelstrecke besteht. Diese läßt sich in einermaximal zulässigen Bandbreite des Regelkreises bei konstanten Parametern angeben. Es wur-de weiterhin gezeigt, daß zur Stabilisierung einer instabilen Regelstrecke und zur erfolgreichenAusregelung der Regelfehler eine Mindestbandbreite notwendig ist.

Es erfolgte die Entwicklung, Beschreibung und Bewertung von drei grundlegenden Ansätzen zurRegelung des parametervarianten Fehlermodells. Die verwendeten Regler waren ein linearer Zu-standsregler, ein Gain-Scheduling-Regler und ein linearer parameterabhängiger Zustandsregler.Der Entwurf des linearen Zustandsreglers erfolgt an einem zeitinvarianten linearen Fehlermo-dell. Der Gain-Scheduling-Regler stellt ein Kombination von mehreren linearen Reglern dar, diean verschiedenen linearen zeitinvarianten Fehlermodellen entworfen wurden. Diese linearen zei-tinvarianten Fehlermodelle ergeben sich aus dem parametervarianten Fehlermodell durch Wahlkonkreter Parameter. Für den Entwurf der einzelnen Regler kann die ganze Vielfalt der linea-ren Regelungstheorie genutzt werden. So wurde in dieser Arbeit das Verfahren der Polvorgabeangewendet. Der Entwurf linearer Zustandsregler und Gain-Scheduling-Regler ist sehr transpa-rent und ingenieurfreundlich. Nachteilig ist, daß Stabilitäteigenschaften bei der Verwendung desReglers am parametervarianten Fehlermodell schwer nachgewiesen werden können. Der Testder Stabilität erfolgt häufig durch Simulation.Im Gegensatz dazu garantiert ein linearer parametervarianter Regler, wenn er gefunden werdenkann, die Stabilität des Regelkreises. Das verwendete Regelungskonzept ist dem derH∞-Theoriefür lineare zeitinvariante Systeme sehr ähnlich. Die Analyse des Verfahrens ergab, daß dieserRegelungsansatz wenig transparent ist. Die richtige Wahl der notwendigen Wichtungsfaktorenist außerordentlich schwierig. Des weiteren zeigte sich, daß die Testbedingung für die Existenzeines linearen parametervarianten Reglers äußerst konservativ ist.

Der sehr einfache lineare Zustandsregler wurde erfolgreich für die Folgeregelung des Lenk-flugkörpers eingesetzt. Durch Verwendung des integralen Anteils konnte die stationäre Genau-igkeit der Folgeregelung erreicht werden. Für die Folgeregelung des Bioreaktors wurde einGain-Scheduling-Regler implementiert. Dabei zeigte sich, daß eine Verbesserung der Regel-güte gegenüber einem linearen Arbeitspunktregler erreicht werden kann. Die Tauglichkeit dervorgeschlagenden Folgeregelung konnte durch die sehr guten Simulationsergebnisse bewiesenwerden. Die erreichte Regelgüte und Robustheit gegenüber Streckenparameterschwankungen istsehr zufriedenstellend.

Die Übertragung der vorgestellen Lösung auf Mehrgrößensysteme stellt eine zukünftige Auf-gabe dar. Vorteilhaft ist, daß eine Vielzahl der betrachteten Inversionsverfahren bereits jetzt fürMehrgrößensysteme anwendbar ist.

Page 132: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

Literaturverzeichnis

[1] C. W. Anderson and W. T. Miller, III. Challenging ControlProblems. In W. T. Miller, III,R. S. Sutton, and P. J. Werbos, editors,Neural Networks for Control. A Bradford Book,The MIT Press, Cambridge, Massachussetts, 1990.

[2] G. S. Becker. Quadratic Stability and Performance of Linear Parameter Dependent Sy-stems. PhD thesis, University of California at Berkeley, 1993.http://madonna.me.berkeley.edu/∼ftp/pub/papers/index.html.

[3] R. Brockhaus.Flugregelung. Springer-Verlag, Berlin, 1994.

[4] I. N. Bronstein, K. A. Semendjajew, G. Musiol, and H. Mühlig. Taschenbuch der Mathe-matik. Verlag Harri Deutsch, Frankfurt am Main, 1 edition, 1993.

[5] L. H. Carter and J. S. Shamma. Gain-Scheduled Bank-to-Turn Autopilot Design UsingLinear Parameter Varying Transformations.Journal of Guidance, Control, and Dynamics,19(5):1056–1063, September 1995.

[6] D. Chen and B. Paden. Stable inversion of nonlinear non-minimum phase systems.Inter-national Journal of Control, 64(1):81–97, 1996.

[7] S. Devasia, B.Paden, and D. Chen. Nonlinear inversion-based output tracking.IEEE Tran-sactions on Automatic Control, 41(7):930–942, 1996.

[8] III F. J. Doyle, F. Allgöwer, and M. Morari. A Normal Form Approach to ApproximateInput-Output Linearization for Maximum Phase nonlinear SISO Systems.IEEE Transac-tions on Automatic Control, 41(2):305–309, February 1996.

[9] M. Fliess. Generalized controller canonical forms for linear and nonlinear dynamics.IEEETransactions on Automatic Control, 35:994–1000, 1990.

[10] M. I. Freedman and J. C. Willems. Smooth Representationof Systems with DifferentialInputs. IEEE Transactions on Automatic Control, AC-23(1):16–21, February 1978.

[11] J. S. Freudenberg and D. P. Looze.Frequency Domain Properties of Scalar and Multiva-riable Feedback Systems. Springer-Verlag, 1988.

[12] J. Guckenheimer and P. Holmes.Nonlinear Oscillations, Dynamical Systems, and Bifur-cation of Vektor Fields. Springer-Verlag, New York, 1990.

[13] J. Hauser, S. Sastry, and G. Meyer. Nonlinear Control Design for Slightly NonminimumPhase Systems: Application to VSTOL Aircraft.Automatica, 28(4):665–679, 1992.

132

Page 133: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

Literaturverzeichnis 133

[14] K. J. Hunt and T. A. Johansen. Design and Analysis of Gain-Scheduling Control usingLocal Controller Networks.Int. J. Control, 66(5):619–651, 1997.

[15] L. R. Hunt and G. Meyer. Stable Inversion for Nonlinear Systems. Automatica, to appear,1997.

[16] A. Isidori. Nonlinear Control Systems. Springer-Verlag, Berlin, 3 edition, 1995.

[17] A. Isidori, S. S. Sastry, P. V. Kokotovic, and C.I. Byrnes. Singulary Perturbed Zeros Dyna-mics of Nonlinear Systems.IEEE Transactions on Automatic Control, 37(10):1625–1631,Oct. 1992.

[18] T. A. Johansen, K. J. Hunt, P. J. Gawthrop, and H. Fritz. Off-equilibrium Linearisationand Design of Gain Scheduled Control with Application to Vehicle Control. 1997. Underpreparation.

[19] H. K. Khalil. Nonlinear Systems. Prentice Hall, Inc., 2 edition, 1996.

[20] C. Kravaris and P. Daoutidis. Nonminimum-Phase Compensation for Nonlinear Processes.Computers Chem. Eng., 14(4/5):439–449, 1990.

[21] R. Nikoukhah L. El Ghaoui and F. Delebecque. LMITOOL : a Package for LMI optimiza-tion. In IEEE Conference on Decision and Control, December 1995.

[22] C.-F. Lin. Advanced control systems design. Prentice Hall, Englewood Cliffs, NJ, 1994.

[23] J. M. Maciejowski.Multivariable feedback design. Addison-Wesley, 1989.

[24] P. Martin, S. Devasia, and B. Paden. A different look at output tracking: control of a VTOLaircraft. pages 2376–2381, Lake Buena Vista, Fl, Dec. 1994.Proceedings of the 33rdConference on Decision and Control.

[25] The MathWorks, Inc., Natrick, USA.LMI control toolbox user’s guide, May 1995.

[26] M. Morari and E. Zafiriou.Robust Process Control. Prentice-Hall, Englewood Cliffs, NJ,1989.

[27] R. M. Murray, M. Rathinam, and W. Sluis. Differential Flatness of Mechanical ControlSystems: A Catalog of Prototype Systems. San Francisco, CA,Nov. 1995. ASME Int’lMech. Eng. Congress and Expo.

[28] R. A. Nichols, R. T. Reichert, and W. J. Rugh. Gain Scheduling for H-Infinity Controllers:A Flight Control Exemple.IEEE Transactions on Control Systems Technology, 1(2):69–79,June 1993.

[29] P. Plaschko and K. Brod.Nichtlineare Dynamik, Bifurkation und Chaotische Systeme.Friedr. Vieweg & Sohn Verlagsgesellschaft mbH, Braunschweig, Wiesbaden, 1995.

Page 134: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

Literaturverzeichnis 134

[30] G. V. Puskorius and L. A. Feldkamp. Neurocontrol of Nonlinear Dynamical Systemswith Kalman Filter Trained Recurrent Networks.IEEE Transactions on Neural Networks,5(2):279–297, 1994.

[31] R. Reichert. Dynamic Scheduling of Modern-Robust-Control Autopilot Designs for Mis-siles.Control Systems, 12(5):35–42, 1992.

[32] W. J. Rugh. Analytical framework for gain scheduling.IEEE Control Systems Magazine,11:79–84, 1991.

[33] T. Schauer, J. Kalkkuhl, and K. J. Hunt. Bioreactor Benchmark. ESPRIT NACT Project:Deliverable, Glasgow University and Daimler Benz Research, 1997.

[34] H. Schwarz. Kompensation der instabilen Nulldynamik nichtlinearer Systeme.Automati-sierungstechnik, 44(4):180–183, 1996.

[35] J. S. Shamma.Analysis and design of gain scheduled control systems. PhD thesis, MIT,Cambridge, Massachusetts, 1988.

[36] J. S. Shamma and M. Athans. Analysis of Gain Scheduled Control for Nonlinear Plants.IEEE Transactions on Automatic Control, 35(8):898–907, August 1990.

[37] C.J. Tomlin and S. S. Sastry. Bounded Tracking for Nonminimum Phase Nonlinear Sy-stems with fast Zero Dynamics.http://robotics.eecs.berkeley.edu/∼clairet/cdc96_1.html, 1996.

[38] A. J. van der Schaft and J. A. Ball. Nonlinear inner-outer factorization. InProc. 33rd Conf.Decision Control, pages 2549–2551, 1994.

[39] M. J. van Nieustadt.Trajectory Generation for Nonlinear Control Systems. PhD thesis,California Institute of Technology, Pasadena, California, 1996.

[40] S. Wiggins. Introduction to Applied Nonlinear Dynamical Systems and Chaos. Springer-Verlag, New York, 1990.

[41] R. A Wright and C. Kravaris. Nonminimum-Phase Compensation for Nonlinear Processes.AIChE Journal, 38(1):26–40, 1992.

[42] F. Wu. Control of Linear Parameter Varying Systems. PhD thesis, University of Californiaat Berkeley, 1995.http://madonna.me.berkeley.edu/∼ftp/pub/papers/index.html.

Page 135: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

A Lenkflugkörper-Modell

Die Längsdynamik von Lenkflugkörpern ist äußerst nichtlinear und besitzt eine instabile Null-dynamik [28]. Ein solcher Prozeß eignet sich somit zur Demonstration der im zweiten Kapitelvorgestellten Verfahren. Die sehr schnelle Dynamik stellteine zusätzliche Herausforderung anden Reglerentwurf dar. Im folgenden soll die Regelstrecke Lenkflugkörper näher behandelt wer-den. Dabei werden die allgemeinen Bewegungsgleichungen hergeleitet und das [28] entnomme-ne konkrete Modell vorgestellt.Für die Beschreibung der Längsdynamik von Flugobjekten istdie Einführung zweier Koordina-tensysteme (KS) notwendig. Eine ausführliche Einleitung in die Theorie der Flugregelung stellt[3] dar. Abbildung A.1 zeigt einen Lenkflugkörper mit den entsprechenden Koordinatensyste-men. Die Vektorkomponenten werden durch Buchstabenfolgenbezeichnet. Das erste KS ist dasSystem der körperfesten Koordinaten, welches durch den Index f gekennzeichnet wird.

xf

xg

zg

zf

−δ

My

Fzf

Θ

Fxf

α

u f

w f

ug

wg

azf

yg = y f

um

Gzg

Abbildung A.1: Lenkflugkörper

135

Page 136: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

136

FA1

FA2

xf

d

l

Pm

αPF

δ

um

Abbildung A.2: Auftriebskräfte beim Lenkflugkörper

Dieses ist ein rechtshändiges KSx, y, z, dessen z-Achse nach unten zeigt. Die x-Achse liegt inder Symmetrieebene des Lenkflugkörpers und zeigt in Richtung der Lenkflugkörpernase. DerUrsprung des KS ist der momentane Masseschwerpunkt. Für dieAchsen werden weiterhin fol-gende Bezeichnungen verwendet:

• xf -Achse: Roll-Achse (roll-axis)

• y f -Achse: Nick-Achse (pitch-axis)

• zf -Achse: Gier-Achse (yaw-axis)

Drehungen um diese Achsen werden als Rollen, Nicken und Gieren bezeichnet.Das zweite rechtshändige Koordinatensystem ist das der erdlotfesten (geodätischen) Koordina-ten, das durch den Indexg gekennzeichnet wird. Die z-Achse dieses Systems zeigt stets zumErdmittelpunkt.Da zur Beschreibung der Längsdynamik nur diex−zEbene von Bedeutung ist, zeigt AbbildungA.1 nur diese. Die Achseny f undyg fallen in diesem Fall zusammen. Die Lage des körperfestenKS in Bezug zum erdlotfesten KS wird durch die LängsneigungΘ (pitch angle, Nickwinkel)beschrieben. Die Drehachse dieses Winkels ist hiery f . Mit Hilfe der TransformationM fg bzw.Mg f = M−1

fg = MTfg lassen sich die beiden KS ineinander umrechnen.

(

xf

zf

)

= M fg

(

xgzg

)

=

(

cos(Θ) − sin(Θ)sin(Θ) cos(Θ)

) (

xgzg

)

(A.1)

Page 137: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

137

Der Vektor um stellt den Fluggeschwindigkeitsvektor (Translationsgeschwindigkeit des Flug-zeuges gegenüber der Luft) dar. Der Geschwindigkeitsvektor bildet mit derxf Achse den An-stellwinkelα (angle of attack). Die Komponenten des Geschwindigkeitsvektors werden in derRegel mitu, v, w gekennzeichnet. In den beiden x-z Koordinatensystemen stellt sich der Vektorum somit wie folgt dar (Der hochgestellte Index kennzeichnet das KS.):

ufm =

(

uf

w f

)

, ugm =

(

ugwg

)

. (A.2)

Die zu lösende Aufgabe ist das Führen des Lenkflugkörpers aufein gegebenes Ziel. Die dazunotwendigen Vorgaben für die Normalbeschleunigung (Beschleunigung in Richtungzf Achse)berechnet ein externer Trajektorienplaner. In unserem Fall ist nun eine Folgeregelung für dieNormalbeschleunigungazf zu entwerfen. Als Meßgrößen liegen die NickrateΘ und die Nor-malbeschleunigungazf vor. Die Stellgröße ist der Höhenruderausschlagδ (elevator).

Für die Herleitung der Bewegungsgleichungen sollen nun dieam Lenkflugkörper angreifendenKräfte angegeben werden. Das Höhenruder erzeugt die AuftriebskraftFA1, die am Höhenruderangreift. Durch den Lenkflugkörper und seine Flügel wird dieAuftriebskraft FA2 verursacht.Dieser Kraftvektor greift im PunktPf an und bildet mit derxf -Achse einen rechten Winkel.Abbildung A.2 zeigt die entsprechenden Vektoren. Der PunktPf hat die Positiond auf derxf

Achse. Zur Beschreibung der Kinematik ist es sinnvoller, die aus den Auftriebskräften resul-tierenden aerodynamischen KräfteFxf und Fzf sowie das MomentMy zu verwenden (sieheAbbildung A.1). In der Regel werden nur Gleichungen für diese Größen in der Form

Fxf = K f QCx(α, δ,M)

Fzf = K f QCz(α, δ,M)

My = KmQCm(α, δ,M)

angegeben. Dabei istQ der Staudruck undK f und Km durch die Lenkflugkörpergeometrie be-stimmte Konstanten. Die TermeCx,Cz undCm sind nichtlineare Funktionen mit den ArgumentenAnstiegswinkel, Höhenruderwinkel und der Machzahl (M = vm/vs, vs=Schallgeschwindigkeit).Neben den genannten Kräften greift die GewichtskraftGzg = mg am Masseschwerpunkt an. Be-findet sich der Lenkflugkörper in seiner Endphase, so treten keine Schubkräfte auf. Alle weiterenKräfte und Momente sollen vernachlässigt werden.Es ergibt sich somit folgende Kräftebilanz inxf − zf -Koordinaten:

F f = m

(

dumdt

)g

f

= mM fg

dMg f ufm

dt

= mM fg

Mg fdu f

m

dt+

dMg f

dtu

fm

= m(

ufm+ M fgMg f u

fm

)

. (A.3)

Page 138: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

138

Es ist zu beachten, daß die Ableitung eines Vektors in verschiedenen Koordinatensystemen zuverschiedenen Ergebnissen führt. Das KS der körperfesten Koordinaten ist ein nichtinertialesSystem, welches sich gegenüber dem erdlotfesten inertialen Koordinatensystem dreht. Folglichist die TransformationsmatrixMg f zeitabhängig und deren AbleitungMg f erscheint in der Ab-

leitung des Vektorsum. Der Ausdruck(

dumdt

)g

fbedeutet, daß der Vektorum im erdlotfesten Koor-

dinatensystem abgeleitet wird, aber die Komponenten des Vektors in körperfesten Koordinatenausgedrückt werden. Mit

M fgMg f =

(

0 Θ

−Θ 0

)

, F f =

(

Fxf +Gxf

Fzf +Gzf

)

(

Gxf

Gzf

)

=

(

cosΘ − sinΘsinΘ cosΘ

) (

0Gzg

)

(A.4)

ergibt sich für (A.3)

Fxf +Gxf = m(uf + Θw f ) = maxf

Fzf +Gzf = m(w f − Θuf ) = mazf . (A.5)

Die Momentenbilanz lautet

My = IyyΘ, (A.6)

wobei Iyy des Trägheitsmoment der y-Achse darstellt. Für das Führen von Flugobjekten istes sinnvoller, als Systemzustände den Anstellwinkelα und den Betrag der Geschwindigkeitvm = |um| zu verwenden. Die alten Zuständeuf und w f ergeben sich dabei wie folgt aus denneuen Zuständen:

uf = vm cosα

w f = vm sinα. (A.7)

Mit (A.5),(A.6) und (A.7) läßt sich schließlich folgendes Zustandsraummodell für die Längsdy-namik des Lenkflugkörpers angeben:

α =1

mvm

(

− sinα(Fxf +Gxf ) + cosα(Fzf +Gzf ))

+ Θ

vm =1m

(

sinα(Fzf +Gzf ) + cosα(Fxf +Gxf ))

Θ =My

Iyy

y = azf =1m

(Fzf +Gzf ). (A.8)

Die Stellgrößeδ fließt über die KräfteFzf , Fxf und das MomentMy in die Systemgleichungenein. Als konkretes Modell wird das in [28, 31] angegebene verwendet. Dort werden folgendeAnnahmen getroffen:

Page 139: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

139

• Die Geschwindigkeitvm des Lenkflugkörpers ist nahezu konstant, d.h. ˙vm = 0. Folglichgeht die Geschwindigkeit als bekannte externe Eingangsgröße in Form der Machzahl indie Systemgleichungen ein. Ein annähernd realistischer Verlauf für die Machzahl wirddurch die folgende Differentialgleichung beschrieben:

M(t) =1vs

(

−|azf (t)| sin |α(t)| + Fxf M(t)1m

cos(α(t))

)

,M0 = M(t = 0). (A.9)

• Die Gewichtskraft wird vernachlässigt.

• Der Ausdruck sinαFxf wird vernachlässigt,da sinαFxf ≪ cosαFzf gilt.

• Die Stellglieddynamik stellt ein schwingungsfähiges System 2. Ordnung dar.

Das resultierende Zustandsraummodell ist somit

α =180π

1Mvsm

Fzf (α, δ,M) cos(πα/180)+ Θ

Θ =180π

My(α, δ,M)

Iyyδ = δ

δ = −ω2aδ − 2ζωaδ + ω

2aδc

y = azf =1m

Fzf (α, δ,M). (A.10)

Ausgangsgröße ist die gemessene Normalbeschleunigungazf . Neben der eigentlichen Ausgangs-größe ist die NickrateΘmeßbar. Die neue Eingangsgröße ist der vorgegebene Höhenruderwinkelδc.Es sei darauf hingewiesen, daß alle Winkelgrößen in A.10 in der Einheit deg anzugeben sind. Beieiner regelungstechnischen Verwendung des Modells ist es sinnvoll, für die Systemzustände, fürdie Stellgröße und für die Ausgangsgröße die klassischen Bezeichnungenx, u, y zu verwenden.Wird dieses mit

x = [x1, x2, x3, x4]T = [α, Θ, δ, δ]T , u = δc, y = axf meas

getan, so bekommt das Zustandsraummodell (A.10) folgendesAussehen:

x1 =180π

1Mvsm

Fzf (x1, x3,M) cos(πx1/180)+ x2

x2 =180π

My(x1, x3,M)

Iyyx3 = x4

x4 = −ω2ax3 − 2ζωax4 + ω

2au

y =1m

Fzf (x1, x3,M). (A.11)

Page 140: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

140

Die nichtlinearen Funktionen der aerodynamischen Kräfte und Momente lauten

Fzf = Q(M)SCz(x1, x3,M)

Cz(x1, x3,M) = sign(x1)(az|x1|3 + bz|x1|2

+cz(2− M/3)|x1|) + dzx3

My = Q(M)SCm(x1, x3,M)d

Cm(x1, x3,M) = sign(x1)(am|x1|3 + bm|x1|2

+cm(−7+ 8M/3)|x1|) + dmx3

Fxf = Q(M)SCx. (A.12)

Alle Konstanten des Lenkflugkörpers und sonstige in Gleichung (A.12) vorkommende Größensind in der Tabelle A zusammengefaßt.

S = 0.040877m2 Oberflächem = 204.023kg Massed = 0.2286m Position des Angriffspunktes der Kräftevs = 315.89472m/s Schallgeschwindigkeit in 6096m Höheρ0 Luftdichte an der Erdoberflächep0 Luftdruck an der Erdoberflächep = 46601.8561N/m2 Luftdruck in 6096m HöheQ = ρ/2v2m = (ρ0v

2s)/(2p0)pM2 Staudruck

= (ρ0v2s)/(2p0)pM2

mit (ρ0v2s)/(2p0) = 0.7

Iyy = 247.43677kg m2 Trägheitsmoment (Nickachse)ωa = 150rad/s Eigenfrequenz des ungedämpften Stellgliedesζ = 0.7 Dämpfung des StellgliedesCx = −0.3az = 0.000103deg−3 am = 0.000215deg−3

bz = −0.00945deg−2 bm = −0.0195deg−2

cz = −0.1696deg−1 cm = 0.051deg−1

dz = −0.034deg−1 dm = −0.206deg−1

Tabelle A.1: Parameter des Lenkflugkörpers

Für eine spätere Inversion der Strecke wird eine Beschreibung in der Form

x(t) = f (x(t)) + g(x(t))u(t)

y(t) = h(x(t)) (A.13)

benötigt. Die Vektorfunktionenf undg sowie die skalare Funktionh lauten im Fall des Lenk-

Page 141: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

141

flugkörpers

f (x) =

180π

1Mvsm

Fzf (x1, x3,M) cos(πx1/180)+ x2180π

My(x1,x3,M)Iyy

x4

−ω2ax3 − 2ζωax4

, g(x) =

000ω2

a

h(x) =1m

Fzf (x1, x3,M). (A.14)

Weitere nichtlineare Lenkflugkörpermodelle sind in [22] und [5] zu finden.

Page 142: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

A.1 Spezifikation der Regelkreiseigenschaften 142

A.1 Spezifikation der Regelkreiseigenschaften

Die Vorgaben für den geschlossenen Kreis sind nach [28] folgende:

• Gewährleistung robuster Stabilität im Arbeitsbereich−20o ≤ α ≤ 20o und 1.5 ≤ M ≤ 3.Der Regelkreis soll Robustheit gegenüber der Unsicherheitdes Nickmomentes zeigen,welche sich als Unsicherheit des aerodynamischen KoeffizientenCm darstellen läßt. Die inder FunktionCm vorkommenden Koeffizientenam, bm, cm und der Koeffizientdm variierenunabhängig voneinander um±25%.

• Die Anstiegszeit der Sprungantwort des geschlossenen Kreises sollte nicht größer als 0.35s sein. Weiterhin beträgt die maximale Überschwingweite 10% und der maximale statio-näre Fehler 1%.

• Die Verstärkung der offenen Kette des linearisierten Systems hat beiω = 300rad/s weni-ger als−30dB zu betragen. Diese Maßnahme sichert, daß die existierende unmodelliertestrukturelle Dynamik nur einen geringen Einfluß auf das Regelkreisverhalten ausübt.

• Die maximale Winkelgeschwindigkeit des Höhenruders bei einem Führungsgrößensprungum 9.80665m/s2 = 1g sollte 25deg/s nicht überschreiten.

Page 143: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

A.2 Verhalten an stationären Arbeitspunkten 143

A.2 Verhalten an stationären Arbeitspunkten

Um eine bessere Einschätzung der statischen und dynamischen Nichtlinearitäten des Systems zuermöglichen, wurde der Lenkflugkörper an Gleichgewichtspunkten linearisiert. Zur Parametri-sierung der Arbeitspunkte wurde der Anstiegswinkelxe

1 = αe und die MachzahlM verwendet.

Die anderen stationären Größen ergeben sich damit durch

xe3(xe

1,M) = − sign(xe1)(am|xe

1|3 + bm|xe1|2

+cm(−7+ 8M3)|xe1|)/dm

xe2(xe

1,M) = − 1Mvsm

Fzf (xe1, x

e3(xe

1,M),M) cos(πxe1/180)

xe4(xe

1,M) = xe3(xe

1,M)

ye(xe1,M) =

1m

Fzf (xe1, x

e3(xe

1,M),M). (A.15)

In Abbildung A.3 ist die Menge der Gleichgewichtspunkte grafisch dargestellt. Die durch Li-

−20 −10 0 10 20−20

−10

0

10

20

−20 −10 0 10 20−50

0

50

−20 −10 0 10 20−40

−20

0

20

40

−20 −10 0 10 20−50

0

50

xe1 = α

e in deg xe1 = α

e in deg

xe1 = α

e in deg xe1 = α

e in deg

xe 2=Θ

ein

deg

xe 3=δ

ein

deg

ye=

ae z fin

g

u=δ

e cin

deg

M = 1.5

M = 1.5

M = 1.5M = 1.5

M = 3

M = 3

M = 3M = 3

Abbildung A.3: Stationäre Arbeitspunkte des Lenkflugkörpers für M = 1.5, 2, 2.5, 3

Page 144: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

A.2 Verhalten an stationären Arbeitspunkten 144

nearisierung an den Arbeitspunkten erhaltene Übertragungsfunktion

∆y(s) = G(s)∆u(s) = G1(s)GS tellglied(s)∆u(s) (A.16)

zwischen der Stellgröße und der Ausgangsgröße besitzt ein Zählerpolynom 2− tenGrades undein Nennerpolynom 4− tenGrades. Wie in Gleichung (A.16) angedeutet wurde, läßt sichG(s)als Reihenschaltung zweier Teilübertragungsfunktionen darstellen. Die ÜbertragungsfunktionG(s)S tellglied modelliert die Stellglieddynamik, welche arbeitspunktunabhängig ist und

G(s)S tellglied =ω2

a

s2 + 2ωζs+ ω2a

(A.17)

lautet. Der Realteil der Pol- und Nullstellen der arbeitspunktabhängigen Übertragungsfunktion

G1(s) = K(s+ z1)(s+ z2)(s+ p1)(s+ p2)

(A.18)

ist in den Abbildungen A.4 und A.5 in Abhängigkeit vom Gleichgewichtspunkt dargestellt.

−20 −10 0 10 20−6

−4

−2

0

2

4

6

−20 −10 0 10 20−6

−4

−2

0

2

4

6

−20 −10 0 10 20−6

−4

−2

0

2

4

6

−20 −10 0 10 20−6

−4

−2

0

2

4

6

xe1 = α

e in degxe1 = α

e in deg

xe1 = α

e in degxe1 = α

e in deg

ℜ{p

1},ℜ{p

2}

ℜ{p

1},ℜ{p

2}

ℜ{p

1},ℜ{p

2}

ℜ{p

1},ℜ{p

2}

M = 1.5 M = 2.0

M = 2.5 M = 3.0

Abbildung A.4: Realteil der Polstellenp1 (gestrichelte Linie) undp2 (durchgezogene Linie) derTeilübertragungsfunktion (A.18) des linearisierten Lenkflugkörpers in Abhän-gigkeit vom Arbeitspunkt (xe

1,M), M = 1.5, 2, 2.5, 3

Es ist zu erkennen, daß das lineare Modell des Lenkflugkörpers an allen Arbeitspunkten nicht-minimalphasig ist.

Page 145: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

A.2 Verhalten an stationären Arbeitspunkten 145

Für große Machzahlen (z.B.M = 3.0) und kleine Anstiegswinkel existieren jeweils eine Pol-und Nullstelle in der rechten und linken Hälfte der s-Ebene.Der Lenkflugkörper ist in diesemFall instabil. Ansonsten liegt stabiles oszillierendes Systemverhalten vor (konjugiert komplexesPolpaar in der linken Halbebene).

−20 −10 0 10 20−40

−20

0

20

40

−20 −10 0 10 20−40

−20

0

20

40

−20 −10 0 10 20−40

−20

0

20

40

−20 −10 0 10 20−40

−20

0

20

40

xe1 = α

e in degxe1 = α

e in deg

xe1 = α

e in degxe1 = α

e in deg

ℜ{z 1},ℜ{z 2}

ℜ{z 1},ℜ{z 2}

ℜ{z 1},ℜ{z 2}

ℜ{z 1},ℜ{z 2}

M = 1.5 M = 2.0

M = 2.5 M = 3.0

Abbildung A.5: Realteil der Nullstellenz1 (gestrichelte Linie) undz2 (durchgezogene Linie) derTeilübertragungsfunktion (A.18) des linearisierten Lenkflugkörpers in Abhän-gigkeit vom Arbeitspunkt (xe

1,M), M = 1.5, 2, 2.5, 3

Page 146: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

B Bioreaktor-Modell

Der als zweites Anwendungsbeispiel verwendete Bioreaktorwird als Benchmark-Problem fürnichtlineare Regelungen vorgeschlagen [1, 30, 33]. Es handelt sich bei dem Bioreaktor um einenTank, welcher Wasser, biologische Zellen und Nährstoffe enthält. Die Zellen und Nährstoffe wer-den dem Reaktor zugeführt. Im Inneren des Tanks findet eine Durchmischung beider Komponen-ten statt. Die Zustände des Prozesses sind die Konzentration der Zellenc1 und die Konzentrationder Nährstoffec2. Der Füllstand des Reaktors wird konstant gehalten, indem der Zulaufu in denTank gleich dem Ablauf aus dem Behälter ist. Die Stellgröße des Reaktors ist der Durchflußu,für den gilt:

0 ≤ u ≤ 2.

Das Regelungsproblem besteht nun darin, die Konzentrationder Zellenc1 mit Hilfe des Durch-flusses auf einem gewünschten Wert zu halten.

c1 Konzentration biologischer Zellen

c2 Nährstoffkonzentration

u Zufluß

u Abfluß

Abbildung B.1: Bioreaktor

146

Page 147: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

147

Das Systemverhalten wird durch folgende nichtlineare Differentialgleichungen beschrieben:

c1(t) = −c1(t)u(t) + c1(t)(1− c2(t))ec2(t)Γ

c2(t) = −c2(t)u(t) + c1(t)(1− c2(t))ec2(t)Γ

1+ β1+ β − c2(t)

. (B.1)

Die beiden Konzentrationen können dabei Werte im Bereich

0 ≤ c1 ≤ 1; 0≤ c2 ≤ 1

annehmen. Die Parameter des Bioreaktors sind die Wachstumsrateβ der Zellen und die Schrump-fungsrateΓ der Nährstoffe. Die Konstantenβ undΓ bestimmen die Geschwindigkeit mit der Zel-len gebildet und Nährstoffe konsumiert werden. Die Nominalwerte der Parameter sindβ = 0.02undΓ = 0.48. Über bekannte Bereiche, in denen die Reaktorkonstantenvariieren können, exi-stieren in [1, 30] keine genauen Angaben. Es wird jedoch auf eine starke Abhängigkeit derSystemdynamik von der Wahl der Parameter hingewiesen.

Als Bezeichnung der Konzentrationen bzw. Zustände wird im folgenden

x =[

x1

x2

]

=

[

c1

c2

]

verwendet. Das System läßt sich in der Form (B.1)

x = f (x) + g(x)u

y = h(x) (B.2)

mit

f (x) =

(

x1a(x2)x1a(x2)b(x2)

)

, g(x)

(

−x1

−x2

)

h(x) = x1

a(x2) = (1− x2)ex2/Γ, b(x2) = (1+ β)/(1+ β − x2) (B.3)

darstellen. Die Untersuchung des statischen Verhaltens des Reaktors (f (xe)+g(xe)ue = 0) liefertfolgende Menge von Gleichgewichtspunkten:

E ={

(xe1, x

e2, u

e) | 0 ≤ xe2 ≤ 1, ue = (1− xe

2)exe2Γ , xe

1 =xe

2(1+ β − xe2)

1+ β

}

. (B.4)

In Abbildung B.2 sind die dadurch erfaßten Arbeitspunkte grafisch dargestellt.

Page 148: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

148

0 0.5 1 1.50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

ue

−xe 1,−−

xe 2

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.40

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

xe1

xe 2

xe21

xe22

Abbildung B.2:Stationäre Arbeitspunkte des Bioreaktors; Die beiden Abbildungen zeigen, daß es für eine Kon-zentrationxe

1 im Bereich 0.02 ≤ xe1 ≤ 0.255 zwei mögliche Gleichgewichtspunkte gibt. In der

rechten Abbildung ist die Nährstoffkonzentration über der Zellkonzentration dargestellt. Eswirdangestrebt, den Bioreaktor an Arbeitspunkten mit hoher Zellkonzentration und hoher Nährstoff-konzentration zu betreiben. Die Betriebspunkte befinden sich somit auf dem oberen Parabelast(xe

21). Es handelt sich hierbei nicht um Arbeitspunkte mit einem maximalen Durchsatzu, was in

der chemischen Industrie angestrebt werden würde. Die maximal mögliche Zellkonzentration istxe

1 = 0.255.

Für die stationären Werte der Nährstoffkonzentration gilt dabei:

xe21,2=

1+ β2±

(1+ β)2

4− (1+ β)xe

1.

Aus den Arbeitspunktuntersuchungen ist folgendes ersichtlich:

• Der maximal stationär erreichbare Wert der Zellkonzentration ist xe1 = 0.255.

• Die Regelstrecke besitzt eine nicht eindeutige statische Inverse. Dieses äußert sich darin,daß zwei verschiedene Stellgrößenamplituden zu einer gleichen Zellkonzentration führen.

Zur Untersuchung des Verhaltens des Bioreaktors in den Gleichgewichtspunkten wurde das Sy-stem linearisiert. In den Abbildungen B.3 bis B.5 sind die Polstellen, die Nullstelle und dieVerstärkung der sich imi − tenstationären Arbeitspunkt ergebenen Übertragungsfunktion

Gi(s) = Kis+ zi

(s+ p1i )(s+ p2i )=∆y(s)∆u(s)

(B.5)

in Abhängigkeit vom Gleichgewichtspunkt dargestellt. Zurbesseren Kennzeichnung des sta-tionären Arbeitspunktes ist die entsprechende Konzentration xe

1 in die Diagramme eingetragen(rechte y-Skala).

Page 149: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

149

0

0.05

0.1

0.15

0.2

0.25

0.3

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9−8

−7

−6

−5

−4

−3

−2

−1

0

1

xe 1

xe2

ℜ( p

1,p 2

)

xe1

ℜ (p1, p2)

Abbildung B.3: Realteil der Polstellenp1, p2 des linearisierten Bioreaktors:

• Bereich 0≤ xe2 < 0.52, 0 ≤ xe

1 < 0.255: reelle Pole, instabiles Systemverhalten

• Bereich 0.52≤ xe2 ≤ 0.9673, 0.255≥ xe

1 ≥ 0.05: konjugiert komplexes Polpaar, fürxe

1 > 0.1355 instabil, sonst stabil

• Bereich 0.9673< xe2 ≤ 1, 0.05> xe

1 ≥ 0.02: reelle Pole, stabiles Systemverhalten

Aus den Abbildungen B.3 bis B.5 lassen sich mehrere Schlußfolgerungen ziehen. Über denBereich der Arbeitspunkte, der technisch relevant und wie folgt definiert ist,

0.02 ≤ xe1 ≤ 0.255

0.52 ≤ xe2 = xe

21≤ 1,

läßt sich folgendes aussagen:

• Für Konzentrationenxe1 ≤ 0.133 ist das linearisierte System stabil, sonst instabil.

• Für Konzentrationenxe1 ≥ 0.05 ergibt sich oszillierendes Systemverhalten.

• Im gesamten Bereich liegt Nichtminimalphasigkeit vor.

• Für xe1→ 0.02 undxe

1→ 0.255 ändert sich die Systemdynamik sehr stark.

Page 150: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

150

0

0.05

0.1

0.15

0.2

0.25

0.3

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9−2

−1

0

1

2

3

4

5

xe 1

xe2

z

xe1

z

Abbildung B.4: Nullstellezdes linearisierten Bioreaktors:

• Bereich 0≤ xe2 < 0.52, 0 ≤ xe

1 < 0.255: minimalphasiges Systemver-halten

• Bereich 0.52≤ xe2 ≤ 1, 0.255≥ xe

1 ≥ 0.02: nichtminimalphasiges Sy-stemverhalten

Page 151: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

151

0

0.05

0.1

0.15

0.2

0.25

0.3

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9−3

−2

−1

0

1

2

3

4

xe 1

xe2

K

xe1

K

Abbildung B.5: VerstärkungK des linearisierten Bioreaktors

Der wirtschaftlich uninteressante Bereich mit

0 ≤ xe1 < 0.255

0 ≤ xe2 = xe

22< 0.52

zeigt instabiles Verhalten, ist jedoch minimalphasig.

Simulative Untersuchungen des Bioreaktormodells führtenzu weiteren Erkenntnissen über dasSystemverhalten:

• Für konstante Stellgrößenue im Bereich 0≤ ue < 0.8 ist der resultierende Gleichge-wichtspunkt des Reaktors global asymptotisch stabil (außer für x1 = 0).

• Für konstante Stellgrößenue im Bereich 0.8 ≤ ue < 1.26 ist der Reaktor global stabil(außer fürx1 = 0). Es entstehen stabile Grenzzyklen, wie in der Abbildung B.6 zu sehenist.

• Für konstante Stellgrößen im Bereichue ≥ 1.26 ist der Reaktor instabil.

Page 152: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

B.1 Formulierung des Regelungsproblems 152

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x1

x 2

Abbildung B.6: Stabiler Grenzzyklus des Reaktors fürue = 0.9. Das Symbol◦ kennzeichnetdie Anfangsinitialisierungen der Zustände. Die dem Anfangszustandx1(0) = 1zugehörigen Trajektorien bewegen sich entlang der Begrenzung des Zustands-raumes.

B.1 Formulierung des Regelungsproblems

Es ist eine Folgeregelung für die Konzentration der Zellen im Bereich der Gleichgewichtspunkte

0.02≤ xe1 ≤ 0.255

zu entwerfen. Der stationäre Zustandxe2 ist dabei wie folgt festgelegt:

xe2 = xe

21=

1+ β2+

(1+ β)2

4− (1+ β)xe

1.

Für eine Zeitdauer von jeweils 50s wird ein Sollwert für die Zellkonzentration vorgegeben. DerRegler hat die Aufgabe, die Istkonzentration der Zellen möglichst lange in diesem Zeitinter-vall auf dem gewünschten Niveau zu halten. An das Übergangsverhalten werden ansonsten kei-ne weiteren Forderungen gestellt. Des weiteren ist die Robustheit des Regelkreises gegenüberStreckenparameterschwankungen zu gewährleisten. Als Meßgrößen stehen die Zellkonzentrati-on x1 und die Nährstoffkonzentrationx2 zur Verfügung.

Page 153: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

C Invariante Mannigfaltigkeiten linearer undnichtlinearer Systeme

Bei der Analyse dynamischer Systeme spielen invariante Mannigfaltigkeiten [12, 40, 29] einezentrale Rolle. Für nichtlineare autonome Systeme der Form

x = f (x), x ∈ Rn (C.1)

sollen die grundlegenden Inhalte dieser Thematik erläutert werden. Die Darstellung der Sachver-halte erfolgt in Anlehnung an [40]. Die Lösungx(t) der Differentialgleichung (C.1) ist abhängigvom Anfangszustandx0 zum Zeitpunktt0. Soll dieser Fakt deutlich zum Ausdruck gebrachtwerden, so wird die Lösung von (C.1) durchx(t, t0, x0) beschrieben.Es wird zuerst der Begriff der invarianten Menge und der invarianten Mannigfaltigkeit durch diefolgenden Definitionen eingeführt:

Definition C.0.1 (Invariante Menge)Die MengeS ⊂ Rn heißt invariant gegenüber dem Vektorfeldf (C.1), wenn für jedesx0 ∈ S undfür alle t ∈ R die Lösungx(t, t0, x0) der Differentialgleichung (C.1) inS liegt, d.h.x(t, t0, x0) ∈ Sist.

Definition C.0.2 (Invariante Mannigfaltigkeit)Eine invariante MengeS ⊂ Rn, die einCr-Diffeomorphismus ist, nennt man eineCr-differenzierbareinvariante Mannigfaltigkeit.

Unter dem Begriff „Mannigfaltigkeit” ist in diesem Fall einem-dimensionale Hyperfläche zuverstehen, die in denn-dimensionalen Raum eingebettet ist. Hat die Fläche keine singulärenPunkte, so besitzt die Ableitung der die Fläche beschreibenden Funktion den maximalen Rang.Nach dem Theorem impliziter Funktionen kann die Fläche dannlokal als ein Graph dargestelltwerden. Die Hyperfläche ist eineCr-differenzierbare Mannigfaltigkeit, wenn die Graphen, diedie Fläche beschreiben, inCr sind. Man sagt, eine Funktion ist inCr , wenn sier mal differen-zierbar ist und die entsprechenden Ableitungen stetig sind. Für die weiteren Betrachtungen istes völlig ausreichend, wenn man mit dem Begriff Mannigfaltigkeit folgendes verbindet:

1. Im linearen Fall: Ein linearer Untervektorraum vonRn;

2. Im nichtlinearen Fall: Einem-dimensionale Hyperfläche, eingebettet inRn.

Es soll die Lösung der Differentialgleichung (C.1) in der Nähe von Gleichgewichtspunkten be-trachtet werden. Der Punktxe ∈ Rn sei ein Gleichgewichtspunkt des Systems (C.1), so daß

153

Page 154: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

154

f (xe) = 0 gilt. Zu Untersuchung des lokalen Verhaltens in der Nähe desArbeitspunktesxe wirdzunächst die lineare Näherung des Systems (C.1) an der Stelle xe betrachtet:

y = Ay, (C.2)

wobei A = ∂ f (x)∂x

∣∣∣∣∣x=xe

eine konstanten× n Matrix undy = x− xe ist. Die Lösung von (C.2) für

den Anfangswerty0 zum Zeitpunktt = 0 ist gegeben durch

y(t) = eAty0. (C.3)

Der n-dimensionale euklidische Raum läßt sich nun als Summevon drei Untervektorräumendarstellen, die alsEs,Eu undEc bezeichnet werden und wie folgt definiert sind:

Es = span{e1, · · · , es} ,Eu = span{es+1, · · · , es+u} , s+ u+ c = n

Ec = span{es+u+1, · · · , es+u+c} , (C.4)

wobei{e1, · · · , es} die generalisierten Eigenvektoren vonA korrespondierend zu den Eigenwer-ten vonA mit positiven Realteil sind,{es+1, · · · , es+u} die generalisierten Eigenvektoren vonAkorrespondierend zu den Eigenwerten vonA mit negativen Realteil sind und{es+u+1, · · · , es+u+c}die generalisierten Eigenvektoren vonA korrespondierend zu den Eigenwerten vonA mit demRealteil Null sind.Es,Eu undEc werden demzufolge auch stabiler, instabiler und zentralerUn-tervektorraum genannt. Die UntervektorräumeEs,Eu undEc sind Beispiele für invariante Man-nigfaltigkeiten. Lösungen von (C.2) mit Anfangsbedingungen, die inEs,Eu oderEc enthaltensind, verbleiben in der entsprechenden Mannigfaltigkeit für alle Zeiten. Lösungen, die inEs

starten, erreicheny = 0 asymptotisch fürt → +∞ und Lösungen die inEu starten, erreicheny = 0 asymptotisch fürt → −∞. Die gemachten Feststellungen seien an einem Beispiel aus [40]illustriert.

Beispiel C.0.1Es sei angenommen, daß die MatrixA zwei konjugierte komplexe Eigenwerteρ ± jω, ρ < 0,ω , 0 und einen reellen Eigenwertλ > 0 aufweist. Dann gehören zu der Matrix drei Eigenvek-toren. Das Systemy = Ay kann auf Jordansche Normalform gebracht werden. Die Spalten dernotwendigen TransformationsmatrixT sind die generalisierten Eigenvektoren vonA:

T =(

e1 e2 e3

)

. (C.5)

Wendet man die Transformation an, dann ergibt sich als neue Systemmatrix:

Λ =

ρ ω 0−ω ρ 00 0 λ

= T−1AT. (C.6)

Die Lösung von (C.2) füry0 ∈ Rn ist nach (C.3)

y(t) = eAty0 = eTΛT−1ty0. (C.7)

Page 155: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

155

Entwickelt maneAt als Taylorsche Reihe:

eAt = I[n,n] + At +12!

A2t +13!

A3t + · · · , (C.8)

so erkennt man, daß (C.7) als

y(t) = TeΛtT−1y0

= T

eρt cos(ωt) eρt sin(ωt) 0−eρt sin(ωt) eρt cos(ωt) 0

0 0 eλt

T−1y0

=

e1

eρt cos(ωt)

−eρt sin(ωt)

0

e2

eρt sin(ωt)

eρt cos(ωt)

0

e3

00

eλt

T−1y0 (C.9)

geschrieben werden kann. Entsprechend der Definition (C.4)besitzt das System zwei invarianteMannigfaltigkeiten:

Es = span{e1, e2} ,Eu = span{e3} . (C.10)

Die Invarianz der UntervektorräumeEs und Eu kann leicht gezeigt werden. Die Transformati-onsmatrixT−1 transformiert die Koordinaten eines Punktesy0 ∈ R mit Bezug auf die Standard-basis vonR3 (i.a. (1,0,0),(0,1,0),(0,0,1)) in Koordinaten mit Bezug auf die Basis(e1, e2, e3). Füry0 ∈ Es, hatT−1y0 die Form

T−1y0 =

y01

y02

0

(C.11)

und füry0 ∈ Eu, hatT−1y0 die Form

T−1y0 =

00y03

. (C.12)

Substituiert man (C.11) (bzw. (C.12)) in (C.9), so kann man sehen, daßy0 ∈ Eu (bzw.y0 ∈ Eu)zu eAty0 ∈ Es (bzw. eAty0 ∈ Eu) führt. Dies bedeutet, daßEs und Eu invariant sind. Desweiteren zeigt sich, daß für jeden Punkty0 ∈ Es die LösungeAty0 der Differentialgleichung(C.2) asymptotisch gegen Null geht fürt → +∞ und daß für jeden Punkty0 ∈ Eu die LösungeAty0 gegen Null geht fürt → −∞. Die Geometrie der MannigfaltigkeitenEs und Eu ist inAbbildung C.0.1 qualitativ dargestellt.

Page 156: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

156

x3

x1

x2

Eu

Es

Abbildung C.1: Geometrie der stabilen und instabilen Mannigfaltigkeit Es undEu aus BeispielC.0.1

Die Betrachtung des linearen Systems (C.2) erfolgte mit demZiel, Aussagen über die Lösungdes nichtlinearen Systems (C.1) in der Nähe des Gleichgewichtspunktesxe machen zu können.Inwieweit die Analyse des linearisierten Systems Schlüsseauf das Verhalten des nichtlinearenSystems in der Umgebung des Arbeitspunktesxe zuläßt, beantwortet das nachfolgend vorge-stellte Theorem über lokale Mannigfaltigkeiten von Gleichgewichtspunkten. Zuerst wird jedochder stationäre Arbeitspunktxe durch die Transformationy = x− xe in den Ursprung verschoben.In diesem Fall wird (C.1) zu

y = f (xe+ y). (C.13)

Die Taylorentwicklung vonf (xe+ y) um xe liefert

y = Ay + R(y) (C.14)

Page 157: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

157

mit A = ∂ f (x)∂x

∣∣∣∣∣x=xe

,R(y) = O(|y|2) und f (xe) = 0. Mit Hilfe der linearen Algebra läßt sich eine

TransformationT finden, die das lineare System (C.2) in die Blockdiagonalform überführt:

uu

w

=

As 0 00 Au 00 0 Ac

uu

w

, (C.15)

hierbei istT−1y = (u, u,w)T ∈ Rs×Ru×Rc, s+u+c = n. Die Matrix As ist eines× sMatrix mitEigenwerten, deren Realteil negativ ist. Die MatrixAu ist eineu × u Matrix mit Eigenwerten,deren Realteil positiv ist und die MatrixAc ist einec× c Matrix mit Eigenwerten, deren Realteilgleich Null ist. Wendet man die TransformationT auf die nichtlineare gewöhnliche Differenti-algleichung (C.14) an, so bekommt man als Ergebnis:

uu

w

=

As 0 00 Au 00 0 Ac

uu

w

+ T−1R(T(u, u,w))

=

As 0 00 Au 00 0 Ac

uu

w

+

Rs(u, u,w)Ru(u, u,w)Rc(u, u,w)

. (C.16)

Nach den vorherigen Betrachtungen besitzt das lineare Vektorfeld (C.15) eine s-dimensionalestabile Mannigfaltigkeit, eine n-dimensionale instabileMannigfaltigkeit und eine c-dimensionalezentrale Mannigfaltigkeit. Das folgende Theorem aus [40] gibt an, wie sich diese Struktur ändert,wenn das nichtlineare Vektorfeld (C.16) betrachtet wird:

Theorem C.0.1 (Lokale Mannigfaltigkeiten von Gleichgewichtspunkten)Angenommen (C.16) ist inCr , r ≥ 2, dann besitzt der Gleichgewichtspunkt(u, u,w)T = 0von (C.16) eineCr -differenzierbare,s-dimensionale, lokale, stabile MannigfaltigkeitWs

loc(0),eineCr-differenzierbare,u-dimensionale, lokale, instabile MannigfaltigkeitWu

loc(0) und eineCr-differenzierbare,c-dimensionale, lokale, zentrale MannigfaltigkeitWc

loc(0). Alle Mannigfaltig-keiten schneiden sich im Ursprung(u, u,w)T = 0. Die linearen invarianten Mannigfaltigkeitenvon (C.15) stellen die Tangentialebenen der MannigfaltigkeitenWs

loc(0),Wuloc(0) undWc

loc(0) imUrsprung(u, u,w)T = 0 dar. Lokal können die Mannigfaltigkeiten durch Graphen beschriebenwerden:

Wsloc =

{(u, u,w) ∈ Rs× Ru × Rc|u = hs

v(u),w = hsw(u);

dhsv(u)

du

∣∣∣∣∣∣u=0

= 0,dhs

w(u)du

∣∣∣∣∣∣u=0

= 0; |u| genügend klein}

Wuloc =

{(u, u,w) ∈ Rs× Ru × Rc|u = hu

u(u),w = huw(u);

dhuu(u)

du

∣∣∣∣∣∣u=0

= 0,dhu

w(u)

du

∣∣∣∣∣∣u=0

= 0; |u| genügend klein}

Wcloc =

{

(u, u,w) ∈ Rs× Ru × Rc|u = hcv(w), u = hc

u(w);

dhcv(w)

dw

∣∣∣∣∣∣w=0

= 0,dhc

u(w)dw

∣∣∣∣∣∣w=0

= 0; |w| genügend klein},

Page 158: Diplomarbeit - control.tu-berlin.de · ad Lie-Klammer azf Normalbeschleunigung des Lenkflugkörpers BW Bandbreite c1 Zellkonzentration c2 Nährstoffkonzentration Cz aerodynamischer

158

wobei hsv(u), hs

w(u), huu(u), hu

w(u), hcu(w) und hc

v(w) Vektorfunktionen inCr sind.Die MannigfaltigkeitenWs

loc(0) und Wuloc(0) besitzen des weiteren die asymptotischen Eigen-

schaften der invarianten UntervektorräumeEs undEs des linearen Vektorfeldes (C.15). Lösun-gen von (C.16) mit Anfangsbedingungen inWs

loc(0) (bzw. Wuloc(0)) gehen asymptotisch gegen

Null für t → +∞ (bzw. t → −∞).

Die im Theorem C.0.1 vorkommenden Bedingungendhsv(u)

du

∣∣∣∣∣u=0

= 0, dhsw(u)

du

∣∣∣∣∣u=0

= 0 u.s.w.

bedeuten, daß die MannigfaltigkeitenWsloc(0),Wu

loc(0) undWcloc(0) im Ursprung (u, u,w)T = 0

tangential zu den entsprechenden linearen Mannigfaltigkeiten des linearen Vektorfeldes (C.15)verlaufen. Aus dem Theorem C.0.1 lassen sich nun folgende Schlüsse ziehen:

• Existiert für einen Gleichgewichtspunkt keine zentrale Mannigfaltigkeit, d.h. istEc = 6 0,so besitzt das nichtlineare System (C.16) in einer genügendkleinen Umgebung des Gleich-gewichtspunktes die gleiche Lösung wie das lineare System (C.15).

• Im allgemeinen kann vom Charakter einer Lösung inEc nicht auf den Charakter der Lö-sung inWs

loc(0) geschlossen werden.

• Die beiden vorherigen Aussagen bedeuten, daß eine Stabilitätsaussage anhand der Linea-risierung des Systems (C.1) nur möglich ist, wenn die MatrixA keine Eigenwerte mit demRealteil Null besitzt und folglich die MannigfaltigkeitenEc undWs

loc(0) nicht existieren.Ein Gleichgewichtspunkt, der diese Eigenschaft aufweist,wird hyperbolischer Gleichge-wichtspunktgenannt.

• Besitzt das System (C.1) bzw. (C.16) nur eine instabile Mannigfaltigkeit, so ist der Gleich-gewichtspunkt dieses Systems fürt → −∞ asymptotisch stabil.