Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27....

196
Multivariate GRBF-Netzwerke und Systeme lokaler Experten: Neue Konzepte und ihre Anwendung bei komplexen Regelungsaufgaben Dissertation der Fakultät für Physik der Ludwig-Maximilians-Universität München vorgelegt von Sebastian Albrecht aus Hamburg 27. September 1999

Transcript of Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27....

Page 1: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Multiv ariate GRBF-Netzwerke und Systeme lokalerExper ten: Neue Konzepte und ihre Anwendung bei

komple xen Regelungsaufgaben

Disser tation der Fakultät für Physikder Lud wig-Maximilians-Univer sität Münc hen

vorgelegt vonSebastian Albrec ht

aus Hamburg

27. September 1999

Page 2: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

ErsterGutachter: Prof.Dr. P. TavanZweiterGutachter: Prof.Dr. H. LeschTagdermündlichenPrüfung: 24.Februar2000

Page 3: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Zusammenfassung

Solangeder Menschseit Beginn der modernenWissenschaftversucht,seinekognitivenFähigkeiten durch anatomische,physiologischeund psychologischeUntersuchungenzuverstehen,werdendieseForschungenauchvon derEntwicklungmathematischerModellebegleitet.Diesgeschiehtin derHoffnung,zu einemtieferenVerständnisder Gehirnfunk-tionenzu gelangenundin jüngsterZeit mit demZiel, neuartigemathematischeVerfahren,z.B. zur MustererkennungundFunktionenapproximation,zu erhalten.Im RahmendiesesAnsatzeswurdevor etwa 10 Jahrendasradiale Basisfunktionen(RBF)-Netzwerkeinge-führt, welchesbestimmteStrukturenim cerebellarenCortex modelliert.

In früherenArbeitenwurdentiefgehendeBeziehungenzwischendiesemdreischichtigenNetzwerkmodellunddermaximumlikelihood (ML)-SchätzungvonempirischenDatenver-teilungendurchMischungenunivariater Normalverteilungenaufgedeckt.SolcheNetzwer-keeignensichzurdatengetriebenenFunktionenapproximationundzurLösungvonKlassi-fikationsaufgaben.Ausgehendvon diesenBeobachtungenwird in dervorliegendenArbeitdasRBF-Modellstufenweiseverallgemeinert.

Zunächstwird mit dem generalisiertenradialenBasisfunktionen(GRBF)-NetzwerkeinModell vorgestellt,dessenParametersich aus ML-Schätzungenvon DatenverteilungendurchMischungenmultivariater Normalverteilungenableitenlassen.Damitwird erstmalseinVerfahreneingeführt,mit demalleNetzwerkparametersimultanoptimiertwerdenkön-nen.Ein deterministischesAbkühlschemasorgt dabeifür die sichereKonvergenzdeszu-gehörigensequentiellenstochastischenLernprozesses.

Anschließendwird ein neuesModell zur Funktionenapproximation,dersogenannteLLM-Approximator, vorgestellt,dasebenfalls auf DichteschätzungendurchMischungenmul-tivariaterNormalverteilungenberuhtund sich in Spezialfällenauf dasGRBF-Netzwerkreduziert.Im LLM-Verfahrenwird die zu approximierendeFunktiondurcheineInterpo-lation lokaler linearerRegressionsmodelledargestellt.In VerallgemeinerungdieserVer-fahrenwird schließlichein Konstruktionsprinzipfür Systemelokaler Expertenformuliert,dassowohl WettbewerbalsauchKooperationunterschiedlicherExpertenzurLösungeinergemeinsamenAufgabeorganisiert.

Die ArbeitsweisendesLLM-Approximatorsals auchdesSystemslokaler Expertenwer-den am Beispiel von Regelungsproblemenillustriert. Zunächstwird die Regelungeinesvirtuellen Bioreaktorsmit Hilfe desLLM-Approximatorsvorgestellt.AnschließendwirddasSystemlokalerExpertenfür die Regelungeinerrealen,komplexenindustriellenAnla-geverwendet.Dabeihandeltessichum die Anlagezur Rückstandsverbrennungim WerkBurghausenderWacker-ChemieGmbH.

Page 4: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.
Page 5: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Inhaltsverz eichnis

1. Einleitung 1

1.1. MotorischeKontrolle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. IndustrielleRegelung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3. Ein neuronalerAnsatzzur industriellenKontrolle . . . . . . . . . . . . . . 8

1.4. AufbauderArbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2. Gehirn, Datenanal yse und neur onale Netzwerke 13

2.1. Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2. GehirnundKleinhirnrinde . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.1. NervenzellenundSynapsen . . . . . . . . . . . . . . . . . . . . . 15

2.2.2. Kleinhirnrinde . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3. Datenanalyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.3.1. Funktionenapproximation. . . . . . . . . . . . . . . . . . . . . . 22

2.3.2. Mustererkennung. . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.3.3. Dichteschätzung. . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.4. KünstlicheneuronaleNetze. . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.4.1. Perzeptron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

2.4.2. GRBF-Netzwerk . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3. GRBF-Netzwerke , Dichtesc hätzung und Funktionenappr oximation 57

3.1. ErweiterungdesGRBF-Netzwerks. . . . . . . . . . . . . . . . . . . . . . 58

3.2. Lernregelnfür dasmultivariateGRBF-Netzwerk . . . . . . . . . . . . . . 62

3.2.1. DurchführungdesLernverfahrens . . . . . . . . . . . . . . . . . . 67

3.3. Funktionenapproximation. . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3.4. DiskussionundBeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

i

Page 6: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. Systeme lokaler Exper ten 83

4.1. WarumsindlokaleExpertenvorteilhaft? . . . . . . . . . . . . . . . . . . . 84

4.2. VerallgemeinerungdesGRBF-Netzwerksaufein SystemlokalerExperten. 85

4.3. ApproximationeinermultifunktionalenDatenfolge . . . . . . . . . . . . . 90

4.3.1. mGRBF-Systemfür einemultifunktionaleDatenfolge . . . . . . . 91

4.3.2. LLM-Approximator für einemultifunktionaleDatenfolge . . . . . 93

5. Regelungstheorie 97

5.1. Grundbegriffe derRegelungstheorie. . . . . . . . . . . . . . . . . . . . . 97

5.2. ModellbasierteRegelungmit einemPID-Regler . . . . . . . . . . . . . . . 99

5.3. ErfahrungsbasierteRegelungmit einemFuzzy-Regler . . . . . . . . . . . . 103

5.4. DatenbasierteRegelungmit neuronalenNetzen . . . . . . . . . . . . . . . 109

6. Regelung eines Bioreaktor s im Computere xperiment 115

6.1. DynamikdesBioreaktors. . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6.2. RegelungdesBioreaktors. . . . . . . . . . . . . . . . . . . . . . . . . . . 121

6.2.1. SimulationdesBioreaktors. . . . . . . . . . . . . . . . . . . . . . 121

6.2.2. Kriterien zurBeurteilungeinerRegelung . . . . . . . . . . . . . . 122

6.2.3. Drei Regler für denBioreaktor . . . . . . . . . . . . . . . . . . . . 124

6.3. Ergebnissefür verschiedeneSzenarienundRegler . . . . . . . . . . . . . . 128

7. Regelung der Rückstandsverbrenn ung in einer industriellen Anla ge 133

7.1. Die AnlagezurRückstandsverbrennung. . . . . . . . . . . . . . . . . . . 134

7.1.1. ÖfenundBrennstrecken . . . . . . . . . . . . . . . . . . . . . . . 135

7.1.2. RandbedingungenundSicherheitsaspekte. . . . . . . . . . . . . . 138

7.1.3. ProzeßleitsystemderRückstandsverbrennung. . . . . . . . . . . . 139

7.1.4. ProblemebeiderRegelungderRückstandsverbrennung . . . . . . 140

7.2. Entwurf einerneuenRegelung . . . . . . . . . . . . . . . . . . . . . . . . 145

7.2.1. ZielsetzungundKonzeption . . . . . . . . . . . . . . . . . . . . . 145

7.2.2. ProgrammPCSzurRegelungindustriellerProzesse. . . . . . . . . 148

ii

Page 7: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.2.3. ExpertenzurRegelungderFlüssigkeitszufuhr. . . . . . . . . . . . 151

7.2.4. Zwei spezielle,bedarfsorientierteExperten . . . . . . . . . . . . . 152

7.2.5. ExpertenzurRegelungderAbgaszufuhr. . . . . . . . . . . . . . . 158

7.3. BeispieleundDiskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

A. Anhang 165

A.1. DerLLM-Approximator . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

A.1.1. HerleitungdesLLM-Approximators . . . . . . . . . . . . . . . . . 165

A.1.2. Klassifikationmit einemLLM-Approximator . . . . . . . . . . . . 168

A.2. DynamikdesBioreaktors. . . . . . . . . . . . . . . . . . . . . . . . . . . 169

A.2.1. FixpunktedesBioreaktors . . . . . . . . . . . . . . . . . . . . . . 169

A.2.2. StabilitätsanalysederFixpunkte . . . . . . . . . . . . . . . . . . . 171

Literatur verzeichnis 175

Page 8: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.
Page 9: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1. Einleitung

Mit nur wenigenStrichenskizziert Sempéin der obigenAbbildung dasPhänomendesLernens[Sem85]. DasKind mußseineganzeAufmerksamkeit auf die neueBewegungs-form desRadfahrensrichten.Dagegenhat die Mutter, die gutmütigihr Kind beobachtet,keinerleiSchwierigkeitenmit derKontrolledesFahrrads.Auf welcheWeisehatdie Mut-ter ihre Fähigkeit erworben?Wassinddie MechanismendesLernens?Wie werdenin derBiologie sokomplexeAufgabenwie die KoordinationderSkelettmuskulaturwährenddesRadfahrensgelöst?

DiessindFragen,umderenBeantwortungsichvieleForschungsgebietebemühen.Auf dereinenSeitegibt esBiologen,MedizinerundPsychologen,dieLernprozessein biologischenSystemenuntersuchenundbeschreiben,auf deranderenSeiteIngenieureundRegelungs-techniker, die für ihre alltäglicheArbeit Regelungsmethodenzur Lösungverschiedenart-iger technischerProblemebenötigen.ZwischendiesendurchausgegensätzlichenWissen-schaftsgebietenfinden sich Forschungszweigewie die der künstlichenIntelligenz,Neu-roinformatik,Fuzzy-Logik, genetischenAlgorithmen,nichtlinearenOptimierungundderSelbstorganisation.Die vorliegendeArbeit ist im skizziertenZwischenbereichangesiedeltundunternimmtdenVersuch,ausdemAufbaunatürlicherRegelungssystemezulernen,umdie dort erkennbarenOrganisationsprinzipienin die Architektur technischerRegelungssy-stemezuübertragen.

1.1. Motorisc he Kontr olle

WassindnundiePrinzipien,aufGrunddereresderNaturgelingt,Regelungsprobleme,diein derTechnikgroßeSchwierigkeitenbereiten,ohneMühezu lösen?Um die wichtigstenAspekteanschaulichherausarbeitenzu können,soll alsBeispieldie motorischeKontrollebeimMenschen,wie siez.B.währenddesRadfahrensnotwendigist, betrachtetwerden.

In Abbildung 1.1 ist dasmotorischeSystemschematischdargestellt.SeineBestandteilewerdendabeialsKomponenteneinestechnischenRegelkreisesinterpretiert.Denauffällig-stenTeil desmotorischenSystemsbildet der Bewegungsapparat,d.h. Knochen,Sehnen,Bänderund Muskeln [Sch96]. Die Aufgabeder durchdaszentrale Nervensystem(ZNS)zu leistendenRegelungbestehtin der Kontrolle diesesBewegungsapparatesdurch eine

1

Page 10: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1. Einleitung

Muskel 3

Muskel 2

Muskel 1

Aktoren Sensoren

Körpersinn

Augen

Tastsinn

Bewegungsapparat

Reflexbögen

Kleinhirn

Großhirn

Regler

Nervenfasern Nervenfasern

Knochen MuskelnBänder Sehnen

Strecke

Abbildung1.1.:DasmotorischeSystem.Die beteiligtenKomponentenlassensichdenin derTechniküblichenBegriffen (Aktoren,Sensoren,Regler, Strecke) zuordnen.Die Informations-übertragungerfolgtüberdieNervenfasern.Die GesamtstrukturentsprichtderjenigeneinesRe-gelkreises.

Vielzahlvon Muskeln. Die Muskeln sindalsodie Aktoren desSystems.Sie erhaltenvondenMotorneuronendesGehirnsBefehlezur Kontraktion.Informationenüberdie jeweilsaktuellePositionder Gliedmaßenwerdendem ZNS über verschiedeneSinnesmodalitä-ten zugeführt.Die wichtigsteRolle spielt hierbeider Körpersinn,der zum einenauf derLängenmessungder Muskelfaserndurch die Muskelspindelnund zum anderenauf derSpannungsmessungder Muskeln durchdie Sehnenorganeberuht[ST85]. ZusätzlicheIn-formationenerhältdasGehirndurchdie optischeWahrnehmungderGliedmaßenunddentaktilenSinnauf derHautoberfläche.Diesedrei SinnesmodalitätenbildendassensorischeSystemdesBewegungsapparats.Die sensorischenSignalerepräsentierendieEingabedatenfür deneigentlichenRegler innerhalbdesZNS, der sich ausverschiedenenReflexbögen,demKleinhirn undbestimmtenTeilenderGroßhirnrindezusammensetzt.

DasskizzierteSystemzeigteinigeBesonderheiten.Die großeAnzahlverschiedenerMus-keln und der damit verbundenehoheFreiheitsgradan körperlichenBewegungenläßt ah-nen,welcheSchwierigkeitendie Koordinationsovieler Aktorenbereitet.Auch ist bemer-kenswert,daßdie SensorenausgänzlichverschiedenenSinnenbestehen,die zudemeineVielzahl verschiedener, zum Teil redundanterInformationenliefern. DieseRedundanzengebenunsdie Möglichkeit, BewegungenauchuntererschwertenBedingungenauszufüh-ren(blind zugehen,mit dickenHandschuhenetwaszugreifen),selbstwennunsdiesohneÜbung nicht mit der gewohntenPräzisiongelingt. Bei der InformationsübertragungderSensordatenin dasGehirnist diesesPrinzipderRedundanzebenfallssichtbar. VieleSträn-gevonNervenfasernziehenvondenGliedmaßenüberdasRückenmarkin dasGehirn.DieInformationwird dabeinichtübereinbesonderesProtokoll1 übermittelt;vielmehrist in der

1 In derTechnikwürdebei einersolchenprotokollbasiertenInformationsübertragungdie Nachricht“Ther-mometermißt 435

���undManometermißt 0.17bar” übergenaueine Leitunggesendetwerden.

2

Page 11: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1.1. MotorischeKontrolle

Natur jederNervenfaserein bestimmterInformationsgehaltzugeordnet.So wird z.B. einReiz in einersehrkleinenHautregion durcheineErregungweniger– nur diesemHautbe-reichzugeordneter– Nervenzellenin dasGehirnübertragen.Liegt kein solcherReizvor,sofällt esunsschwer, dieseHautregion bewußtwahrzunehmen.DieserUmstandläßtsichnunsobeschreiben,daßjederNervenfasereineBedeutungzugeordnetwird. ErstdurchdieErregungderNervenfaserwird diezugeordneteBedeutungwahrgenommenundsofür dasGehirnrelevant.

Abbildung1.1zeigt,daßauchim motorischenKontrollsystemeineredundanteAufgaben-verteilungexistiert [ST85]. Sehrschnelle,unterUmständenlebensrettendeReaktionsbe-wegungenwerdenüberdie sog.monosynaptischenReflexbögen gesteuert,bei denensen-sorischeSignaleschonim Rückenmarkan motorischeNervenzellenweitergegebenwer-den. Im Gegensatzzu den unwillkürlichen Reflexbewegungenstehendie willkürlichen,geplantenBewegungen,wie z.B. dasGreifennacheinerKaffeetasse.Eine solcheAktionwird zunächstim motorischenFeldder Großhirnrinde(motorischer Cortex ) geplant.DieFeinkoordinationaller beteiligtenMuskeln wird dagegenvor allemvom Kleinhirn ausge-führt [Ste88]. DasKleinhirn ist demGroßhirnabernicht einfachnur nachgeschaltet,son-dernagiertparallelzu diesem.So könnensich Menschenmit einerschwerenVerletzungdesKleinhirns durchausnochbewegen,nur zeichnensich dieseBewegungendurcheine“f alsche”Dosierung(Asynergie), einenTremor oderdurcheinenzu niedrigenMuskelto-nusaus[ST85]. Viele leichtereVerletzungendesKleinhirns könnenabernahezuperfektdurchdasGroßhirnkompensiertwerden.Dagegenführt eineLäsionim Bereichdermoto-rischenCortex zueinerLähmungdesbetroffenenMuskelbereichs,verbundenmit einemzuhohenMuskeltonus(spastischeHemiplegie) [ST85]. Wir werdendenfunktionellenAuf-baudesKleinhirnsim VerlaufdieserArbeit nochgenauerdiskutieren.

Diese– wennauchnur sehrgrobe– SkizzedesmotorischenSystemszeigt wesentlicheMerkmaleeinesjedenbiologischenRegelungssystems.Offensichtlichexistierteinegewis-seAufgabenteilungzwischenverschiedenenspezialisiertenTeilen,wie z.B. denReglernundSensorenausAbbildung1.1, die von nunanalsExpertenbezeichnetwerdensollen.Die GrenzenzwischendeneinzelnenExpertensindabernichtsostarkabgesteckt,daßnichteinExpertedieAufgabeneinesanderenwenigstensteilweiseübernehmenkönnte.An Stel-le einerstarrenAufgabenteilungist die ZusammenarbeitzwischendenExpertenvielmehrvon Kooperation und Konkurrenz geprägt.Die Kooperationwird im obigenBeispiel imWechselspielzwischenGrobkoordinationundFeinkoordinationdeutlich.Eineunwillkür-liche Reflexbewegung,entgegeneinerandersartiggeplantenBewegung,zeigtdagegendieKonkurrenzzwischendeneinzelnenExperten.Auch dieseArchitektureinesSystemsvonkooperierendenund konkurrierendenExpertenwird für die weitereArgumentationvonzentralerBedeutungsein.

In demhier beschriebenenSystemzur motorischenKontrolle lassensich drei Zeitskalenidentifizieren,die für viele biologischeRegelungssystemetypischsind.Die RadfahrendeMutter ausdemEingangsbeispielkorrigiert zügig geringeAbweichungenvon ihrem ge-plantenWeg und wird sich auchnicht von plötzlichenSituationsänderungen(z.B. durch

3

Page 12: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1. Einleitung

einenüberdenWeg springendenHund) irritieren lassen.Ihr motorischesKontrollsystemarbeitetvor allem auf einerkurzen Zeitskala.KurzfristigeAnpassungengelingenihremKind hingegenwesentlichschlechter. Esbefindetsichnochin derLernphase, in derseinKontrollsystemauf einermittelfristigenZeitskalaerstausvielenSituationentypischeBe-wegungsmuster, die zum sicherenRadfahrennotwendigsind, extrahiert.In dieserPhasestelltdieBegegnungmit einemHundnocheingroßesProblemdar. Mutter, Kind undHundverweisenauchaufdieevolutionärenMechanismen,diedasmotorischeKontrollsystemer-zeugthaben.DasRadfahrenist sicherlichkeineFortbewegungsform,die demMenschenangeborenist. Trotzdemkönnenwir unsdie dafür notwendigen– wie auchandere,vielschwierigere– BewegungenaufGrundunsererLernfähigkeit durchÜbunganeignen.Die-seFlexibilität desmotorischenSystemsist die FolgeeinersehrlangfristigenEntwicklungaufeinerZeitskalavonvielenMillionen Jahren.

Die KlärungderFragen,wie sichdieverschiedenenRegelungsmechanismenim LaufevonJahrmillionenevolutionärherausgebildethabenund wasdie treibendenKräfte für dieseEvolution sind, ist Aufgabeder Phylogenie.In Anlehnungan die dort aufgedecktenEnt-wicklungsmechanismender Natur existiert eineeigeneForschungsrichtung,die sich mitder Erforschungsog.evolutionärerAlgorithmen zur Optimierungund Regelungtechni-scherSystemebeschäftigt[KS97, BS93, Bäc96]. Im FolgendenwerdenUmformungenund Entwicklungen,die auf einersehrlangenZeitskalaablaufen,abernicht berücksich-tigt. Vielmehrwird die Existenzsinnvoller biologischerKonstruktionenhier einfach alsgegebenhingenommen.FürdieKonstruktionbiologischinspirierterAlgorithmenbedeutetdies,daßverschiedeneVarianteneinesVerfahrensnicht durchdaslangfristigeÜberlebenin einer“feindlichen” Umgebungausgewählt werden(survivalof thefittest). Im von unsangenommenenSzenariomußvielmehrderEntwicklerdiesenAuswahlprozeßvornehmen,indemerKostendefiniert,diebeiÜber- bzw. UnterschreitenzurVerwerfungbzw. zurWei-terentwickelungeinerIdeeführen.

WaskannmanausderobigenBetrachtunglernen,wennmanRegelungssystemeentwickelnwill, die amVorbild desZNS orientiertundgleichzeitigauchin einertechnischenUmge-bunganwendbarseinsollen?Vier Punktekristallisierensichheraus,die für denweiterenVerlaufdieserArbeit vonzentralerBedeutungsind:

� Die Informationsübertragungerfolgtin einemdoppeltenDatenformat.Die Nervenfa-seralssolchehatzwareineBedeutung,abererstdie AktivierungdieserNervenfaserverleihtdieserBedeutungaktuelleRelevanz.� Die GesamtaufgabeeinesRegelungssystemswird in eine Reihevon Teilaufgabenzerlegt und diesewerdenspezialisiertenUntereinheitenzugewiesen.DieseExper-ten lösendie gestellteGesamtaufgabein einemWechselspielausKooperationundKonkurrenz.� RegelungssystemezeigeneinenmodularenAufbau.DasmotorischeKontrollsystemgliedert sich in Sensoren,Regler und Aktoren. DasGehirnals Regler ist in viele,

4

Page 13: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1.2. IndustrielleRegelung

teils hierarchische,teils parallelarbeitendeund voneinanderabhängigeFunktions-gruppenstrukturiert.DiesesStrukturprinzipist bis zur unterstenEbenehinab,denNervenzellen,sichtbar.� Bei der KonstruktioneinestechnischenRegelungssystemsmußder GesamtaufbauvoneinemEntwicklerunterBerücksichtigungvonKostenvorgegebenwerden,dadielangfristigeselbstorganisierendeAuswahl einerkonkretenSystemarchitekturdurchevolutionäreAlgorithmenzumeinenzu langedauern,zumanderenhohetechnischeRisikenverursachenwürde.In demvonunsverfolgtenSzenariosoll ein solchesSy-stemmittel- undkurzfristigeAnpassungenselbständigvornehmenkönnen.

UnterBerücksichtigungdieservier Vorgabenwird in diesemText einneuronalmotiviertesArchitekturprinzipfür komplexe Regelungssystemeentwickelt, theoretischerforschtundan Handeiner industriellenAnlageauf seinepraktischeRealisierbarkeit untersucht.BeidieserAnlagehandeltessich um jenenTeil desWerksBurghausender Wacker-ChemieGmbH, in welchemdie Rückständeder chemischenProduktionverbranntwerden.DieKontrollproblemedieserTeilanlagewarenes,welchedieseArbeit motiviert haben.Umin die entsprechendenFragestellungeneinzuführen,gibt der folgendeAbschnittzunächsteinenÜberblicküberdenallgemeinenAufbaueinerindustriellenProduktionskontrolle,umanschließenddie Kontrollproblemebei derRückstandsverbrennungim Werk Burghausenzuskizzieren.

1.2. Industrielle Regelung

Abbildung1.2 zeigtein Luftbild desWerksBurghausenderWacker-ChemieGmbH.Aufdiesemetwa 100 ha großenGeländewerdenin etwa 30 Produktionsbetriebenvor allemGrundstoffe für die chemischeIndustriehergestellt[WCG99]. Die kontrollierteFührungeinertechnischenAnlagedieserGrößeerfordertbesondereStrategien.Wie in Abbildung1.3dargestelltist, ist eineausgeprägteHierarchiederOrganisationsstrukturnotwendig,diesich auchin der informationstechnischenAusstattungwiderspiegelt. Die Unternehmens-führungtrif ft vor allem langfristigebetriebswirtschaftlicheEntscheidungen,die sich nurschlechtdurch Informationssystemeautomatisierenlassen.Auf der Ebeneder Produk-tionsführungwerdenmittelfristige Planungenfür die Produktionsabläufevorgenommen,die durchdie FührungenderTeilbetriebeumgesetztwerdensollen.DiesebeidenmittlerenEbenenwerdenin letzterZeit zunehmenddurchInformationssystemeunterstützt.Die aufderunterstenEbeneangesiedelteProzeßführungist lediglich für denkorrektenAblauf desjeweiligen technischenVerfahrensverantwortlich. Schonlangewerdenhier Prozeßleitsy-stemefür dieAutomatisierungundRegelungzuHilfe genommen.

In denletztenJahrenhabenim BereichderindustriellenLeittechnikstarkeVeränderungenstattgefunden.WarenfrühereLeitsystemeproprietäreLösungendesjeweiligenHerstellers,

5

Page 14: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1. Einleitung

Abbildung1.2.:Werk Burghausender Wacker-ChemieGmbH. DasGeländewird vomAlz-Salzach-Kanalunterteilt,dessenBau um 1900 für denStandortdesWerksausschlaggebendwar. DerKreis markiertdie Anlagefür dieRückstandsverbrennung (aus[WCG99]).

so ist derzeitein deutlicherTrend hin zur Standardisierungder verschiedenenKompo-nentenzu beobachten[Bir99]. DieseEntwicklungist abernochim Gangeundwird starkvondenFortschrittenderNetzwerktechnikbeeinflußt2. Die zunehmendeinfachereVerfüg-barkeit von Informationenzu Produktions-und Prozeßabläufenim gesamtenWerk wirdgegenwärtigvor allem zur Analyseund Archivierungvon Betriebsdatenverwendet.ZureigentlichenProzeßführung,also zur Kontrolle destechnischenAblaufes,werdendieseneueninformationstechnischenMöglichkeitendagegennochnicht systematischgenutzt.Dafürverantwortlich ist ein gewisserMangelanMethoden,mit denendievielenverschie-denenInformationenzur Kontrolle einesProzessesverknüpft werdenkönnen.EtabliertsinddagegenVerfahren,die durchMessungeinereinzelnenGröße(z.B.Druck)unddurchVariationeinerzugehörigenStellgröße(z.B.Ventilstellung)einenSollwert einregeln.

Ende1994 kam im RahmeneinesVortragsvon Paul Tavan über Methodender Neuro-informatik ein Kontaktmit dem RegelungsingenieurThomasList zustande.T. List wardamalsim Werk BurghausenderWacker-ChemieGmbHfür die OptimierungbestehenderAnlagenteilezuständigund daherauchimmer auf der Suchenachneuen,erfolgverspre-

2Es ist zu erwarten,daßdasfür dasinternet zentraleÜbertragungsprotokoll TCP/IPunddie plattformun-abhängigeProgrammiersprachejava auchin derLeittechnikimmerwichtigerwerden.

6

Page 15: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1.2. IndustrielleRegelung

SystemFunktion

Unternehmensführung

ProzeßleitsystemProzeßführung

Betriebsführung

Produktionsführung Produktionsleitsystem

Betriebsleitsystem

Abbildung 1.3.: Hierarchieebeneneinesindustriellen Betriebs. Links sind die verschiede-nenOrgansiationsebenendargestelltunddanebendie informationstechnischenSysteme,diezuUnterstützungeingesetztwerden(nach[Bir99]).

chendenKontrollverfahren.

Eine seinerdamaligenAufgabenwar die Behebung bestehenderProblemein der Rück-standsverbrennungsanlagedesWerks.DieserBetriebsteildientderVerbrennungvonRest-stoffen,die innerhalbderverschiedenenProduktionsanlagendesWerksanfallen.Die An-lagezur Rückstandsverbrennungumfaßtdrei verschiedengroßeÖfen,in denenunterEin-haltungdiverserGrenzwertedie Abfälle (Gase,Flüssigkeiten und Feststoffe) bei hoherTemperaturverbranntwerden.WegendergestiegenenProduktiondesWerksunddesdamitverbundenenAnstiegsanAbfallstoffendrohtedieKapazitätderAnlagezurRückstandsver-brennunganihreGrenzenzustoßen.EswardaherdasZiel vonHerrnT. List, MöglicheiteneinerKapazitätserhöhungzu untersuchenundgegebenenfalls entsprechendeMaßnahmenzu ergreifen.Der EinsatzkonventionellerRegelungstechnikzur LösungdieserAufgabewar jedochwegender relativ komplexenStrukturderRückstandsverbrennungsanlagemitgroßenSchwierigkeitenverbunden.

DieseProblemeführtenzu der Idee,in einemstaatlichgefördertenForschungsprojektdieRückstandsverbrennungalsDemonstrationsanlagefür die Anwendbarkeit von Regelungs-methodenderNeuroinformatikzu nutzen[DLT95]. Insbesonderesollte in diesemProjektein ganzheitlicherEntwurf einesSystemszur Produktions-,Betriebs-undProzeßführungversuchtwerden.Sparmaßnahmender staatlichenFörderstellenließenein ProjektdieserGrößenordnungaberleidernichtzu.Trotzdemwurdeim März1995eine–vonderWacker-ChemieGmbH finanzierte– “kleine” Kooperationvereinbart,in derenRahmenTeile dervorliegendenArbeit durchgeführtwurden.Der Ablauf diesesProjektssoll nunkurz skiz-ziertwerden.

NacheinerAnalysederAnlageundvorhandenerarchivierterDatenwurdenverschiedeneProblemfelderundOptimierungsmöglichkeitendeutlich.EinezentraleAufgabederAnlageist die zuverlässigeundständigeVerbrennungderüberlangeRohrleitungenangeliefertenAbgaseausdenProduktionsbetrieben.Da dieseAbgasekaumgepuffert werden,ist eineständigeVerfügbarkeit der Rückstandsverbrennungnotwendig.Ein längererAusfall derAnlagewürdedie Einstellungvon Produktionsprozessenerzwingen.In Hinblick auf das

7

Page 16: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1. Einleitung

Kontrollproblemkommt erschwerendhinzu, daßviele Abgasenicht kontinuierlich,son-dern– abhängigvom jeweiligen Produktionsverfahren– stoßartigherangeführtwerden.Derartigesehrplötzlich auftretendeBelastungsspitzenkönnenzu Über- bzw. Unterschrei-tungenvon Grenzwerten,somitzu einererzwungenenNotabschaltungvon Verbrennungs-öfenundin derFolgeauchzumStillstandin bestimmtenProduktionsbetriebenführen.

Ein weiteresProblemfeldbetrifft die Verbrennungvon flüssigenAbfällen. Derenchemi-scheundphysikalischeEigenschaftensindin allerRegelnichtbekanntundsomitist kaumWissenüberVerbrennungsenthalpienundViskositätenverfügbar. Diesmachtihrekontrol-lierte Dosierungzu einemschwierigenUnterfangen.Da sowohl die VentilcharakteristikenwieauchdieDurchflußmessungenaufGrundderunbekanntenViskositätenmit sehrgroßenFehlernbehaftetsind,mußhäufigallein ausder ReaktiondesVerbrennungsvorgangsaufdieVerbrennungsenthalpienderjeweiligenFlüssigkeitengeschlossenwerden.

Da die Anlagezur Rückstandsverbrennungseitetwa 1950ständigerweitertwurde,findensich in ihr sehrviele historischbedingteEigenartenund Konventionen3, die zu einerge-wissenUnübersichtlichkeit führen.Dasin derAnlageinstallierteProzeßleitsystemstammtausdenachtzigerJahrenundhatsich für eineOptimierungderRegelungalsgroßesHin-derniserwiesen,daseinesehrschwerfälligeProgrammierungdie ImplementierungneuerMethodenfastunmöglichmacht.ErstdieProgrammierungeinerSchnittstellezueinermo-dernenworkstationhatdiefür dieEntwicklungneuartigerRegelungsverfahrennotwendigeFlexibilität erzeugt.

Der wichtigsteRegelkreis,der im Prozeßleitsystemimplementiertist, versuchtdenDruckin denAbgasleitungeninnerhalbgewisserGrenzenauf einenkonstantenWert zu halten.DieseRegelungist abernicht die HauptaufgabedesProzeßleitsystems.Sie bestehtviel-mehrdarin,die VisualisierungzahlreicherMeßwerteunddie Fernsteuerungebensozahl-reicherVentilezuermöglichen.Mit derBeobachtungundBedienungdesLeitsystemssinddie Anlagenfahrerder jeweiligen Schichtfür die kontrollierteVerbrennungder GaseundFlüssigkeitenverantwortlich. Ihre wesentlicheStrategie bestehtdarin,die Öfen in einemsehr“sicheren” Bereichzu belassen,d.h. den Betriebszustandder Öfen möglichstweitentferntvon Grenzwerten,derenÜberschreitungzur automatischenNotabschaltungfüh-renwürde,zu halten.DieseStrategie führt zwar zu einerwünschenswertenReduktionderAusfälle;anderseitswird aberdadurchauchdiemittlereVerbrennungskapazitätderAnlageverringert.

1.3. Ein neur onaler Ansatz zur industriellenKontr olle

Die Zusammenarbeitmit derWacker-ChemieGmbHvon März 1995bis Dezember1997bot die selteneGelegenheit“echte” industrielleDatenzu analysierenundauchregelndin

3Sowerdendie12 Abgaszuleitungenvon 1 bis13 durchnumeriert.Leitungsiebenexistiert nicht.

8

Page 17: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1.3. Ein neuronalerAnsatzzur industriellenKontrolle

einenrealen,komplexen Prozeßeinzugreifen.In vielen Produktionsanlagenwerdenver-fahrenstechnischeAbläufezumSchutzvor Industriespionagevertraulichbehandelt.Daherist in solchenAnlagenein detaillierterEinblick werksfremderPersonensehrunüblich.

Diesmagauchein Grunddafürsein,weshalbzwar viele Konzeptezur intelligentenKon-trolle mit MethodenderNeuroinformatikpubliziertwerden[MSW92, DeS95], aberbislangnur wenigedieserKonzepteantatsächlichexisitierendenAnlagenerprobtwurden.Dasinder Literatur häufigskizzierteVorgehenbestehtvielmehrdarin,neueMethodenan HandderSimulationvonModellsystemenzuevaluieren.DabeiwerdenaberAspektewie Verfüg-barkeit,Zuverlässigkeit,Pflegbarkeit undpraktischeRealisierbarkeit häufigvernachlässigt.Die wenigenzugänglichenBeispielefür industrielleAnwendungenvon Regelungsmetho-denderNeuroinformatikkönnenin zweiGruppeneingeteiltwerden.

Zum einenfindensich in derLiteratur seitetwa 1987ArbeitenzumEinsatz(z.B. [SR87,LBD � 90]) von sogenanntenmulti layer perceptrons (MLP), die mit dem backpropaga-tion -Algorithmustrainiert wurden[RHW86, And97]. DasTraining diesesNetzwerktypserfolgte dabeihäufig mit einemder inzwischenallgemeinverfügbarenProgrammpake-ten[Uni99, Mat99]. Die mathematischkomplizierteundbiologischwenigplausibleMLP-Strukturerlaubtesabernicht,ausdiesenhäufigsehrspeziellenArbeitenRückschlüsseaufdengenerellenNutzendieserNetzwerkarchitekturzu ziehen[Cri89]. Anderseitswerdenseitetwa 15 JahrenzunehmendneuronaleNetzwerkmodelleverwendet[Mal81, RMS92],die aufKonzeptenderbiologischenSelbstorganisationberuhen.InsbesonderewurdenhiersogenannteneuronaleKarten [Koh82, RT89, Koh90, MBS93], Netzwerke mit radialenBasisfunktionen(RBF)[MD89, PG90a, ABK � 99] odermit lokalenExperten[JJ93a, JJ92]intensiv untersucht.SolcheselbstorganisierendenModellewurdenauchzur Lösunginge-nieurstechnischerFrageneingesetzt,wie z.B. zur Kontrolle einerWalzstraße[MGPS96],zurKontrollevonRobotern[WMS91] undvonautonomenFahrzeugen[MSW92]. Die vor-liegendeArbeit ordnetsichin diesenDiskussionszusammenhangein.

Angesichtsderrelativ geringenAnzahltatsächlicherAnwendungenvonKontrollmethodenderNeuroinformatikin der industriellenPraxisunddesMangelseigenerErfahrungenaufdiesemGebietstelltedie obenskizzierteKooperationmit derWacker-ChemieGmbHeinWagnisdar. AnderseitsrepräsentiertendiedamitverbundenenAufgabestellungenaucheineHerausforderung,dasieeineneueForm desinterdisziplinärenArbeitenserforderten.Aufder einenSeitewarendie Einarbeitungin Verfahrens-und Leitsystemtechniksowie derAustauschmit Anlagenfahrernund Technikern vor Ort notwendig.Auf der anderenSei-temußtenkonzeptionelleEntwicklungengeleistet,TestsanModellbeispielendurchgeführtundschließlichneueRegelungsmethodenin einzuverlässigessoftware-Systemimplemen-tiert werden.

In Anlehnungandie weiterobenskizziertenPrinzipiendermotorischenKontrollebei Le-bewesen,die Architektur von RBF-Netzwerken sowie an Konzeptevon M. JordanundR. Jacobs[JJ92, JJ93a] wurde für die Regelungder Anlagezur Rückstandsverbrennungein hierarchischesSystemlokalerExpertenentwickelt. JederExperteist dabeifür einebe-stimmteTeilaufgabezuständig.Sogibt esz.B. einenExperten,der für die Einhaltungdes

9

Page 18: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1. Einleitung

vorgegebenenDrucksin denAbgaszuleitungenverantwortlich ist,undandereExperten,dienur bei GefahreinerNotabschaltungdurchUnter- bzw. Überschreitungvon Grenzwertenin denProzeßeingreifen.Im Gesamtsystemarbeitenetwa 20 Expertenbei der KontrollederRückstandsverbrennungzusammen,derenZusammenarbeitalsWechselspielvonkom-petitivenundkooperativenProzessenorganisiertist.

Es ist ein Ziel diesesTextes,diesesan biologischenVorbildern angelehnteExpertensy-stemzu begründen.Entsprechendist sie in einentheoretischenTeil und einenAbschnitt,der nochgenauerauf dasgeschilderteIndustrieprojekteingehenwird, gegliedert.Weite-re GliederungsaspekteergebensichausderNotwendigkeit, in Hinblick auf die skizzierteKontrollaufgabesowohl MethodenderNeuroinformatikwie auchderRegelungstechnikzuuntersuchen.

1.4. Aufbau der Arbeit

DievorliegendeArbeit ist in dreiBlöckeaufgeteilt.SieumfaßteinführendeKapitel,theore-tischeEntwicklungenunddieDemonstrationderneuenMethodenanHandvonBeispielen:

� In Kapitel2 wird zunächsteinÜberblicküberdenAufbaudesGehirnsunddieStruk-tur biologischerNeuronennetzwerke gegeben.DarauswerdeneineReihevon For-derungenandie mathematischenEigenschaftenentsprechenderModelleabgeleitet,d.h. eswerdendie Eigenschaftenkünstlicher neuronaler Netzwerke (KNN) spezi-fiziert. Dabei werdendie KNN-Modelle als VariantenklassischermathematischerVerfahrenzurMustererkennung,FunktionenapproximationundDichteschätzungin-terpretiert.NachderBeschreibungeiniger, für dieEntwicklungderNeuroinformatikwichtiger, Modelle neuronalerNetzwerke wird der Schwerpunktder weiterenBe-trachtungauf dasradiale BasisfunktionenNetzwerk(RBF) und dasgeneralisierteradialeBasisfunktionenNetzwerk(GRBF)gelenkt,die spezielleVariantender feedforward Netzwerke sind.

Abbildung 1.4 zeigt den Aufbau einessolchendreischichtigenneuronalenNetz-werks.DemNetzwerkwerdenüberdie Eingabeschicht Datenzugeführt,die durchdieZwischen- undAusgabeschicht verschiedenenTransformationenoderUmkodie-rungenunterworfen werden.Die drei Schichtensind jeweils auskünstlichenNeu-ronenaufgebaut,derenReizantwortcharakteristikder FunktionsweisebiologischerNervenzellennachgebildetist. Die NeuroneneinerSchichtgebenüberVerbindun-genInformationenandieNeuronendernachfolgendenSchichtweiter. Die GewichtedieserVerbindungenstellenfreie ParameterdesNetzwerksdar. Weiterefreie Para-metergehenin die Reizantwortcharakteristiken der Neuronenein. Die AnpassungdieserParameterdurcheinengeeignetenAlgorithmuswird alsLernenoderTrainingbezeichnet.Dazuwird ein Trainingsdatensatzbenötigt,in demzu jedemSatzvonEingabedatendie zu realisierendenAusgabenvorgegebensind.

10

Page 19: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1.4. AufbauderArbeit

�� �� �� �� ��� � � � � � � � � � � �

� �� � � ��� �� �� � � � � � � � � � � � �

� ��� �� �� ��

Abbildung 1.4.: DreischichtigesneuronalesNetzwerk. Die drei SchichtenwerdenjeweilsdurchkünstlicheNeuronengebildet(graueKreise).DiesekönnenüberparametrisierbareVer-bindungen(dünnePfeile)InformationenandieNeuronendernachfolgendenSchichtweiterge-ben.

� In Kapitel3 wird erläutert,warumfür dasoptimaleTraining einesGRBF-NetzwerkseinesogenannteparametrischeDichteschätzungderVerteilungderEingabedatener-forderlich ist. Für den Fall der Dichteschätzungmit einerMischungmultivariaterNormalverteilungen werdenLernregeln für die freien Parameterhergeleitet,wel-chedie likelihood derDichteschätzungbeischnellerundsichererKonvergenzmaxi-mieren[ABK � 99]. Anschließendwird diesesKonzeptzumZweckderFunktionen-approximationdurchein GRBF-Netzwerkverallgemeinert,indemdie gemeinsameDichte der Ein- und Ausgabedatenverteilungeneiner Schätzungunterzogenwird.Man erhältsoeineneuartigeFunktionenapproximationdurchlokale lineare Model-le (LLM). Die ArbeitsweisediesesLLM-Approximatorswird aneinigeneinfachenBeispielendemonstriert.

Allen Typenvon GRBF-Netzwerken ist eigen,daßdie KodierungderEingabedatenauf der ZwischenschichtdesNetzesstark lokalisiert ist. EntsprechendkönnendieNeuronenderZwischenschichtals lokaleExpertenfür einenTeil derEingabedatenaufgefaßtwerden.DieseEigenschaftwird in Kapitel4 dazugenutzt,einallgemeinesKonzeptfür ein Systemzu entwerfen,welchesauslokalenExpertenaufgebautist,dieüberklar definierte,abermöglicherweisewechselseitigüberlappendeZuständig-keitenverfügen.Die ExpertenberechnennebenihrerAusgabenocheineKompetenz,mit dersiedie Relevanzihrer Ausgabequantifizieren.DiesezusätzlicheAngabeih-rer eigenenKompetenzermöglicht,wie gezeigtwerdenwird, die EinführungvonkompetitivenundkooperativenWechselwirkungenzwischendenExperten.� Als eineanspruchsvolle AnwendungvonneuronalenNetzen,welchedieLösungvonAufgabenwie die der Klassifikation,der Funktionenapproximationund des Ler-nenseinschließt,gilt die Regelungvon technischenSystemen.Kapitel 5 führt diein diesemZusammenhangwichtigstenBegriffe ein unddemonstriertanHanddreierprinzipiell verschiedenerMöglichkeiten,wie einesolcheRegelungrealisiertwerdenkann.

Mit dem analytischenModell dessogenanntenBioreaktorsist von verschiedenen

11

Page 20: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

1. Einleitung

Autoreneinbenchmark-Systemfür denVergleichvonRegelungssytemeneingeführtworden.In Kapitel6 werdenzunächstdieDifferentialgleichungendiskutiert,welchediesenbiochemischenProzeßbeschreiben,und eswerdendamit die Schwierigkei-ten der RegelungdiesesSystemsaufgezeigt.Anschließendwerdenein klassischerPID-Regler, eineFuzzy-RegelungundeinRegler, deraufeinemLLM-Approximatorberuht,amBeispieldiesesBioreaktorsgetestetundverglichen.

Kapitel 7 beschreibtschließlichamBeispielderschonangesprochenenRückstands-verbrennungjeneErfordernisseund Probleme,die bei der UmsetzungneuerRege-lungskonzeptein diePraxisdesindustriellenAlltagsauftreten.Vielederin Kapitel3und4 beschriebenenVerfahrenwurdenverwendet,umdieRegelungderRückstands-verbrennungerfolgreichzuverbessern.NachdemAufgabeundAufbaudieserAnlagedargestelltunddiesoftware-technischenProblemederAnwendunggeschildertsind,wird aufverschiedeneAspektedesrealisiertenGesamtsystemseingegangen.

12

Page 21: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn, Datenanal yse undneur onale Netzwerke

1987wurdenvon M. Powell [Pow87] Netzwerke ausradialenBasisfunktionen(RBF) alsWerkzeugezur InterpolationhochdimensionalerDatensätzeausführlichuntersuchtundsoderwissenschaftlichenÖffentlichkeit bekanntgemacht.In derFolgehatsichausdieserzu-nächstrein mathematischbegründetenMethodedasRBF-Netzwerkalsein weithin beach-teterNetzwerktypderNeuroinformatikentwickelt undetabliert.EinegroßeZahl von Ver-öffentlichungenhatsichmit verschiedenenVarianten,LernalgorithmenundAnwendungenvon RBF-Netzwerkenbeschäftigt(siehez.B. [CCG91, MAC� 95, BFG95, BF95, KL98]),sodaßdieseNetzwerke heuteAlternativenzumursprünglichsehrweit verbreiteten,aberbiologischnur schwerinterpretierbarenmulti layer-Perzeptron[RHW86, And97] darstel-len.WegenderzentralenStellung,diedasRBF-Netzwerkmodellin dervorliegendenArbeithat, sollenvorabdie Fragendiskutiertwerden,(i) warumRBF-Netzwerke in der Neuro-informatik einederartwichtigeRolle spielen,(ii) in wie weit sieneurobiologischeBeob-achtungenwiderspiegeln und, (iii) in welchemZusammenhangihre mathematischenEi-genschaftenmit denFähigkeitendesGehirnsstehen.Für ein tiefergehendesVerständnisist esdabeinotwendig,etwasweiter auszuholenundvorabeinigeFakten,MethodenundKonzepteausdenForschungsgebietenderNeuroanatomie,statistischenDatenanalyseundNeuroinformatikzu referieren.Darauf aufbauendkann anschließendder PrototypeinesRBF-Netzwerks[MD88, MD89] vorgestellt,begründetunduntersuchtwerden.

2.1. Überb lic k

Ziel der Neuroinformatikist es,die FunktionsweisedesGehirnsdurchdie KonstruktionvereinfachtermathematischerModelle zu verstehen.Dabei wird daszentraleNervensy-stem(ZNS) als informationsverarbeitendesSystemaufgefaßt.Ausgehendvom heutigenKenntnisstandwird angenommen,daßseineinformationsverarbeitendenFähigkeiten– wiein derEinleitungamBeispieldermotorischenKontrolleskizziert– aufderArbeit derNer-venzellenundderInformationsübertragungdurchdieNervenfasernberuhen.

Um empirischeGrundlagenfür die Bildung von Modellenin derNeuroinformatik,insbe-sonderederRBF-Netzwerke, zu erarbeiten,werdenin Abschnitt2.2zunächsteinigejener

13

Page 22: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

anatomischenundphysiologischenAspektedesZNSdargestellt,die für dieweiterenAus-führungenvon Bedeutungsind.Dabeiwird genauerauf dasKleinhirn eingegangen,wel-chesfür die Feinkoordinationim motorischenSystemverantwortlich ist. DieserTeil desZNS zeigteinerelativ einfacheanatomischeStruktur, derenVerschaltungvon J.C.Ecclesund Mitarbeitern[EIS67, Ecc73] entschlüsseltwurde.1969wurdevon D. Marr [Mar69]ein erstesFunktionsmodellfür die Kleinhirnrindeentwickelt undanschließendvon J. Al-bus [Alb71] verfeinert.Die AnatomieundFunktionsweiseder Kleinhirnrindesoll haupt-sächlichdeshalbrelativ detailliert besprochenwerden,da sie dasbiologischeVorbild fürRBF-Netzwerke ist [PG89].

Da im Laufe dieserArbeit verschiedenemathematischeAspektedesvon unsentwickel-tengeneralisiertenRBF-Netzwerks(GRBF)untersuchtwerdensollen(vgl. [Ado92, KT97,ABK � 99]), wird mit Abschnitt2.3einmathematischerTeil eingeschoben,in demBegriffeeingeführtwerden,die für dasweitereVerständniswichtig sind.GRBF-Netzwerke dienen– wie viele andereneuronaleNetzwerkmodelleauch– der Approximationeinesgegebe-nen Datensatzesdurch eine Modellfunktion. Entsprechendsoll dieseAufgabezunächstallgemeinmathematischskizziertwerden.Fernersoll gezeigtwerden,daßsolcheFunk-tionenapproximatorenin praktischenAnwendungendazugenutztwerdenkönnenKlas-sifikationsproblemezu lösen,wie sie z.B. bei der Spracherkennungauftreten.Zur Vor-bereitungder Analysein Kapitel 3, die tiefgreifendeZusammenhänge[Klo96] zwischenunseremGRBF-Netzwerk[ABK � 99] undetabliertenstatistischenVerfahrenderparame-trischenDichteschätzung[DH73] ausnutzenwird, sollendieobengenanntenKonzepteein-geführtwerden.Die Auswahlderin Abschnitt2.3dargestelltenmathematischenVerfahrenist alsovor allemdadurchmotiviert, daßviele dieserAlgorithmenbei derDiskussionvonRBF-Netzwerkenvon grundlegenderBedeutungsind.

NachderEinführunganatomischerundmathematischerBegriffe stehteinTeil jenerMittelbereit,diezurneurobiologischenBegründungderFormulierungunseresGRBF-Netzwerksbenötigtwerden.EsfehlenabernocheinigeVorstellungen,die im BereichderNeuroinfor-matikmittlerweilewohletabliertsind.

Die GrundlagendiesesWissenschaftsgebietswurdenEndedesletztenJahrhundertsgelegt.Damalswarendie Mikroskopie- und Präparationstechniken ausreichendweit entwickelt,um die anatomischeStruktur desGehirnsuntersuchen[yC52, Gol23] und so auchsei-nenfunktionellenAufbau erforschenzu können.Seitdemist die Vorstellungvom GehirnalseinemNetzwerkvon Nervenzellen,welcheüberNervenfasernelektrischeSignaleaus-tauschen,allgemeinakzeptiert.Einesder zentralenParadigmender Neuroinformatikistdaherdie Überzeugung,daßsich die kognitiven Fähigkeiten desGehirnsauf ein dyna-misches,sich selbstorganisierendesNetzwerkvon neuronalen“Prozessoren”zurückfüh-ren läßt.Auf derBasisdieserauchalsKonnektionismusbezeichnetenHypothesestellten1943W. McCullochundW. Pitts [MP43] erstmalsein Netzwerkformaler Neuronenvor,auf das,wie sie zeigenkonnten,jede beliebigeOperationder binärenLogik abgebildetwerdenkann.In den letztenJahrzehntenhat sich darausdasForschungsgebietder Neu-roinformatik entwickelt, welchesinzwischenin viele verschiedeneTeilgebietegegliedert

14

Page 23: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.2. GehirnundKleinhirnrinde

ist unddementsprechendviele KonzepteundTheorienhervorgebrachthat.Im drittenundletztenAbschnitt2.4diesesKapitelswerdendaherdiejenigenModellederNeuroinforma-tik beschrieben,die für dasVerständnisunseresGRBF-Netzwerksnotwendigsind. DenAbschlußbildet die DarstellungjenesmodifiziertenRBF-Netzwerks,welches1988 vonJ.Moody undC. Darken[MD88, MD89] vorgeschlagenwurde,undwelchesvon unszumGRBF-Netzwerkverallgemeinertwurde[ABK � 99].

2.2. Gehirn und Kleinhirnrinde

DasGehirndesMenschenundandererhöhererLebewesenist ein ungemeinkompliziertesGebilde,dassichin einegroßeAnzahlanatomischerStrukturengliedernläßt[Sch96]. Ab-bildung2.1zeigteinenBlick aufdasmenschlicheGehirnzusammenmit denBezeichnun-genderauffälligstenStrukturen.AusnaturwissenschaftlicherSichtfungiertdiesesGebildeals informationsverarbeitendesSystem,dasseineEingabeinformationenausderAktivitätderverschiedenenSinnebezieht.Die Sinnesreizerufenim GehirnhöchstkomplexeundimEinzelnengrößtenteilsnochunbekannteAbläufehervor, die letztendlichzu AktionenderMuskeln führen.

In diesemJahrhundertund speziell im vergangenenJahrzehntwurden außerordentlichgroßeAnstrengungenunternommen,um dieseszunächstgeheimnisvoll erscheinendeOr-ganunddie PrinzipienseinerArbeitsweisesystematischzu erforschen.Als Ergebnisdie-serUntersuchungenzuranatomischen,physiologischenundfunktionellenStrukturdesGe-hirnshatsichinzwischeneinsehrbreitesundzumTeil auchtiefgehendesWissenangesam-melt,welchesinsbesondereauchin dieModellbildungenderNeuroinformatikeingegangenist. DabeiwerdendiezueinemNervennetzwerkverbundenenNervenzellenalsdiewesent-lichen Elementarbausteineder Hirnfunktion aufgefaßt.Entsprechendsollen im nächstenAbschnittzunächstdie für die Bildung von FunktionsmodellenwichtigstenEigenschaftendieserBausteineskizziertwerden.

2.2.1. Nervenzellen und Synapsen

Um die JahrhundertwendekonntenRamóny CajalundC. Golgi auf GrundspeziellerPrä-parationstechniken erstmalseinzelneNervenzelleninnerhalbsehrdünnerGehirnschnitteunterdemMikroskop nachweisen[yC52, Gol23]. Für dieseLeistungwurdensie1906ge-meinsammit demNobelpreisausgezeichnet.Schnellwurdedeutlich,daßdasGehirnauseinerUnzahlvon Nervenzellenaufgebautist, die, verbundendurchdie Nervenfasern,einsehrkompliziertesGeflechtbilden.Heutewird geschätzt,daßsichunserGehirnausetwa "!$#&%(') *!$#+#

Nervenzellenzusammensetzt.Dabei ist jede dieserZellen durch Nervenfa-sernmit etwa

*!,!-!anderenZellenverbunden[ST85]. Diesegrundlegenden1 Bausteinedes

1Die NervenzellenwerdenmeistzusätzlichvonBegleitzellenumhüllt.DieseGliazellen,diezahlreicheralsdie Neuronensind,nehmenmehrals die Hälfte desRaumsim Gehirnein und scheinenvor allem eine

15

Page 24: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Abbildung 2.1.: Das menschlicheGehirn. Die stark gefalteteGroßhirnrindeüberdecktdiestammesgeschichtlichälterenStrukturendesKleinhirnes,desHirnstammesunddeshier nichtsichtbarenMittelhirns (aus[Hub90]).

Gehirnstreten,abhängigvon ihrem anatomischenUmfeld, in vielen Variationenauf. ImfolgendensollenaberzunächsteinigegemeinsameanatomischeMerkmalevonNervenzel-lenbesprochenwerden[ST85].

Wie in Abbildung2.2schematischdargestelltist, bestehteineNervenzelleausdrei Funk-tionsgruppen:dem Zellsoma,den Dendritenund dem Axon. Die Zellmembran,die alsguterelektrischerIsolatorwirkt, umschließtdieseFunktionsgruppenundgrenztsodieZellegegenihre Umgebung ab. Die Dendritensind häufigmehrfachverzweigtund erstreckensichin die nähereUmgebungdesZellsomas.DasAxon, welchesoft auchalsNervenfaserbezeichnetwird, entspringtam AxonhügelausdemSomaund ist typischerweiserelativlang,sehrdünnundamEndeverzweigt.Axonewerdenvon präsynaptischenEndigungenabgeschlossen.

Bei einemKontakteinesAxonsmit derZellmembraneineranderenNervenzellekannsicheine Synapseausbilden,welchedie Übertragungvon elektrischenSignalenermöglicht.DieseKontaktstellenbestehenausderpräsynaptischenEndigungdesAxons,demsynapti-schenSpaltundderpostsynaptischenMembran,welchezumeistandenDendritenoderamZellkörper, machmalaberaucham Axon der nachgeschaltetenZelle lokalisiert ist. Mankanndaherzwischenaxo-dendritischen,axo-somatischenund axo-axonischenSynapsenunterscheiden.

Versorgungs-undSchutzfunktionfür dieNervenzellenzuhaben[ST85].

16

Page 25: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.2. GehirnundKleinhirnrinde

Abbildung2.2.:Vereinfachter Aufbau von Nervenzellen (aus[Hub90]). Im Gehirnhat jedeZelle durchschnittlichmit etwa 1000anderenZellensynaptischeVerbindungen.Die typischeGrößeeinerNervenzelleliegt bei 5-100 . m. DasAxon kannbis zueinemMeterlangwerden.

Vom Standpunktder Informationsverarbeitungbetrachtet,fungierendie NervenzellenimOrganismuszugleichalsProzessorenwie auchalsLeiterbahnen.Entsprechendlassensichihre speziellenAufgabeneinteilenin die Aufnahmevon Information,ihre Verarbeitung,die FortleitungderverarbeitetenInformationenübergrößereDistanzen,sowie derenWei-tergabeaneineodermehrerenachgeschalteteZellen.BetrachtetmandenOrganismusalsGanzes,so erfolgt die Aufnahmevon Informationdurchdie Sinneszellen,die als Senso-renauf die DetektionverschiedenerphysikalischerUmgebungseinflüssespezialisiertsind.DieseZellen kodierendie Ergebnisseihrer jeweiligen Messungenzunächstdurchgradu-elle Veränderungenihres Membranpotentials[Ste88]. DieseVeränderungenkönnenvonnachgeschaltetenNervenzellenabgegriffen werdenund dort in einerArt Analog-Digital-UmwandlungSequenzenpulsförmigerDepolarisationendesMembranpotentialsauslösen.Diesespikes werdenschließlichüberdieAxonedieserZellenweitergeleitet.

Die biophysikalischenMechanismendesaxonalenspike-Transportssind im Prinzip seitdenPionierarbeitenvon A. HodginundA. Huxley (Nobelpreiszusammenmit J.C.Eccles1963, [HH52]) bekannt.Ihre biochemischenund molekularenGrundlagenwurdenseit-demim Detail aufgeklärt.Die Ausbreitungsgeschwindigkeit der etwa 1 ms andauerndenspikes liegt zwischen1 und 100m/s. Insgesamtscheintbei der Umwandlungder an denSinneszellenzumeistnochin analogerForm repräsentiertenMeßwertein PulsfolgendernachgeschaltetenZellendie sog.Frequenzkodierungwirksamzu sein:Starke Sinnesreize

17

Page 26: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

RezeptorenMotoneuron

Muskelzellen

Abbildung 2.3.: Stark vereinfachte Struktur eines Netzwerks aus Nervenzellen (nach[Hub90]). An vielen motorischenRegelkreisenim Gehirnsind nur 4-10 Schichtenvon Ner-venzellenbeteiligt.Die Zahl derVerbindungenzwischendenNervenzellenist in einemrealenNetzwerkaberum Größenordnungenhöher.

führenzuhochfrequentenspike-Folgen[ST85].

Wie obenerwähntwurde,erfolgtdieSignalübertragungzwischenverschiedenenZellenandenSynapsen.Bei EinlaufeneineselektrischenSignalsin die präsynaptischeEndigungeinesAxonswerdendort chemischeTransmitterstoffe ausgeschüttet,die durchdensynap-tischenSpaltdiffundierenund an der postsynaptischenMembranein elektrischesSignalverursachen[ST85]. DasSignaleinerZelle,welchesdurchdasAxon aneineSynapseher-angeführtwird, kannauf die postsynaptischeNervenzelleeineerregende(exzitatorische)oderhemmende(inhibitorische)Wirkung haben.Die Stärke der Kopplungzwischenver-schiedenenZellenhängtvonderZahl undEffektivität dersynaptischenVerbindungenab.

Im Zellsomaeiner Zelle werdendie zumeistüber die Dendritenvon vielen Seitenein-gehendenSignalenäherungsweiseeinfach aufsummiert,wenn man von ebenfalls mög-lichen, nichtlinearenInteraktionender Signaleabsieht.An der Somamembranführt dasÜberschreiteneinerbestimmtenGesamtdepolarisation,die zu einemgegebenenZeitpunktauf Grundder Erregungder vielen synaptischenKontaktevorliegt, zur AusbildungeinesDepolarisationspulsesundsomitzueinemAusgabesignalderZelle,welchesüberdasAxonweitergeleitetwird [ST85]. Die Erregbarkeit einerNervenzelleist dabeivon vielenFakto-ren,wie derNeuronengröße,demNeuronentypundderEntfernungderjeweiligenSynapsevomZellsoma,abhängig.

Abbildung 2.3 faßt die wichtigstenFunktionsbausteinedesNervensystemsschematischzusammen.Manerkennt,wie sensorischeDatenüberdieRezeptoreneinemNetzwerkvonNervenzellenzugeführtwerden.JedesolcheZelle empfängtüberdie Synapsen– hier dar-gestelltalsPfeilspitzen– Informationenvon anderenNervenzellen.DieseSignalekönnendieNervenzellezumAussendeneigenerSignaleaktivieren,dieüberdasAxon – diePfeile– an andereNeuronenweitergegebenwerden.Dabeientscheidendie Übertragungseigen-

18

Page 27: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.2. GehirnundKleinhirnrinde

schaftenderSynapsen,ob undin welchemMaßedie nachgeschaltetenNeuronenaktiviertodergehemmtwerden.Dashier skizzierteVerschaltungsschemaist einederzentralenAn-nahmenderNeuroinformatik,nachdersichdieFunktionsweisedesGehirnsdurchdiesinn-volle VerschaltungvonsehrvieleninformationsverarbeitendenElementen– denNeuronen– erklärenläßt[And97].

Im Gegensatzzu derschematischenDarstellungin Abbildung2.3 sinddie VerbindungeninnerhalbdesGehirnsnichtausschließlich“vorwärts”,d.h.vondensensorischenEingäng-en zu den motorischenAusgängen,gerichtet.Vielmehr gibt es dort zusätzlichelateraleVerbindungeninnerhalbder Zellschichtenund reziproke VerbindungenzwischendiesenSchichten.Dies trif ft auchfür die relativ übersichtlicheundgut untersuchteKleinhirnrin-de zu, der sichder nächsteAbschnittausdenfolgendenGründenwidmet:EinerseitssolldurchdieDarstellungderAnatomieundFunktionderKleinhirnrindeeineVorstellungvonderKomplexität derVerschaltungderNervenzellenim ZNSvermitteltwerden.Anderseitsdienten,wie obenerwähnt,AufbauundFunktionderKleinhirnrindealsbiologischesVor-bild bei derKonstruktionderunsinteressierendenRBF-Netzwerke [PG89].

2.2.2. Kleinhirnrinde

DasKleinhirn (Cerebellum) dient hauptsächlichder Kontrolle und FeinabstimmungderKörpermotorik.Es ist stammesgeschichtlichälter alsdasGroßhirn(Cerebrum) undglie-dert sich im wesentlichenin zwei Teile. Die innenliegendeweißeMassebestehtvor al-lem ausNervenfasern.Dort werdendie über dasMittelhirn und GroßhirneingehendenInformationenzu geplantenmotorischenAktionen auf die außenliegendeKleinhirnrinde(cerebellarer Cortex ) verteilt [Sch96]. DiesegraueMasse, welchein Abbildung 2.4 imQuerschnittdargestelltist, hat einestarkfaltigeStrukturundstellt im ausgebreitetenZu-standeineSchichtvon etwa 1500cm/ dar. Die Kleinhirnrindeist überweiteGebietesehreinheitlichaufgebautund weist einegewisseSchichtstrukturauf, die durchverschiedeneZelltypenentsteht[Sch96].

Abbildung 2.5 zeigt das Verschaltungsschemader wichtigstenZelltypen innerhalbderKleinhirnrindenachJ.C.EcclesundMitarbeitern[EIS67, Ecc73]. Für die FunktiondieserVerschaltungwurdevon D. Marr [Mar69] und J. Albus [Alb71] eineersteInterpretationgeliefert.

NachdiesemModell wird einein derGroßhirnrindegenerierteBewegungsskizzeüberver-schiedeneStufenandie Kleinhirnrindegesendetundschließlichüberdie sog.Moosfasernan die Körnerzellenherangeführt.Dabei hat eine MoosfaserVerbindungenmit ca. 0 !,!Körnerzellen;eine Körnerzellehat abernur etwa vier Verbindungenmit verschiedenenMoosfasern.Die Körnerzellen(beimMenschenetwa10

#&%) verarbeitendie überdie Moos-

faserneinlaufendenEingabenundgebendasErgebnisüberihre Axone,die Parallelfasern,in RichtungderMolekularschicht(vgl. Abbildung2.4) weiter, in derdieAusgabeinforma-tion übereineUmgebung von ca.1–2 mm Durchmesserverteilt wird. Die Parallelfasern

19

Page 28: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Sternzelle

Körnerzelle

Golgi-Zelle

Körnerschicht

Purkinje-Zelle

Molekularschicht

Sternzelle

Abbildung2.4.:Schnitt durch die Kleinhir nrinde. Die Dicke desdargestelltenSchnittsbe-trägt ca.1 mm. Die im Kleinhirn innenliegendeweißeMassebefindetsich in derAbbildunglinks unten(aus[Tho90]).

durchquerenhierbeidieDendritenbäumealleranderenNeuronenundbildenSynapsenmitdenGolgi-, Stern-,Korb-undPurkinjezellen[ST85]. Dabeilassensichzwei Informations-strömeunterscheiden:

Zum einenwird überdie GolgizelleneineRückkopplungzu denKörnerzellenaufgebaut.Die Golgizellensammelndie über die ParallelfasernvermitteltenAktivitätender Körn-erzellenein, verarbeitendieseund bilden mit ihren Axonen an den Kontaktstellenzwi-schenMoosfasernundKörnerzelleninhibitorischeaxon-axonischeSynapsen.Diesenega-tiveRückkopplungführt zueinerRegulierungderKörnerzellaktivität unddamitderParal-lelfaseraktivität.

Zumanderenwird dieAktivität derKörnerzellenandiegroßenPurkinjezellenweitergege-ben.DerenZahl ist viel kleiner als jeneder Körnerzellen(

2143,!,!,!-!); ihre Axonebilden

den einzigen“Ausgang”der Kleinhirnrinde. DieseAusgabesignaleerreichennachVer-schaltungenim Thalamuswiederdie motorischeGroßhirnrindeundüberdasRückenmarkdieverschiedenenMuskeln.

Zu denPurkinjezellenscheintsicheineweitere,hieraberanscheinendpositiveRückkopp-lung aufzubauen.Man findet in der weißenMassekleine Gebietemit AnhäufungenvonZellkörpern,die inferior olivia . Aus dieserRegion gibt es über die KletterfasernVer-

20

Page 29: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.2. GehirnundKleinhirnrinde

inferiorolivia

Golgizellen

Purkinjezellen

+

Körnerzellen

SternzellenKorbzellen

Parallelfasern

Eingabesignale

AusgabesignaleAbgleich

Kletterfasern

Körnerschicht

Molekularschicht

Moosfasern

-

+ -

+

+

Abbildung 2.5.: Schematischeneuronale Verschaltung im Cerebellum. Die verschiedenenNervenzellensind zusammenmit ihren Dendritenbäumenals Ellipsendargestellt.Die Pfeilesymbolisierendie Axone,die von demjeweiligen Neuronausgehen,und die PfeilspitzendiesynaptischenVerbindungen.Eineexzitatorischebzw. inhibitorischeVerbindungwird durchein5

bzw. 6 in derPfeilspitzecharakterisiert(nach[ST85]).

bindungenzu denDendritender Purkinjezellen.Dabei“klettern” die VerzweigungenderKletterfasernan denÄstender Dendritenbäumeder Purkinjezellenhochund bilden dortzahlreicheexzitatorischeSynapsenaus.JedePurkinjezellewird von nur einerKletterfasererreicht,aberjedeKletterfaserversorgt 10–15Purkinjezellen.Ein einzelnerImpulsin einerKletterfaserführt daherzueinermehrfachenEntladungderaktiviertenPurkinjezellen.

Siehtmanvon dendurchdie ParallelfasernaktiviertenPurkinjezellenab,sosinddie Wir-kungender übrigen,von diesenFasernaktivierten Zellen inhibitorisch. Beispielsweisehemmendie Golgizellendie Körnerzellen(feedback -Hemmung),währenddie Sternzel-len unddie Korbzellenhemmendaufdie Purkinjezellenwirken(feedforward -Hemmung).Bis aufdieKörner- undPurkinjezellen,sowie dieZellenderinferior olivia,wirkenalsodiemeistenNeuronenderKleinhirnrindeinhibitorisch.An keineranderenStelledesZentral-nervensystemsist ein derartigesÜberwiegenderHemmungbekannt[ST85].

Nach der Interpretationvon D. Marr [Mar69] und J. Albus [Alb71] kann man sich diegroßeÜberzahlanKörnerzellengegenüberdenMoosfasernalseinAbbildungderüberdieMoosfaserngeliefertenEingabein einenhöherdimensionalenRaumvorstellen.Die hoch-dimensionaleAusgabederKörnerzellenstellt somiteinesehrredundanteTransformationder Eingabedatendar, welchezusätzlichdurchdie inhibitorischeRückkopplungüberdieGolgizellenmoduliertwird. Die SignalederPurkinjezellenspannenschließlichwegenih-rer geringerenAnzahl einenRaumvon deutlichniedrigererDimensionauf, auf dendieSignalederKörnerzellenabgebildetwerden.Die Rückkopplungüberdie inferior olivia hatdabeidie Eigenschaft,daßdie exzitatorischenVerbindungenzwischenParallelfasernund

21

Page 30: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Purkinjezellenverstärktwerden,wenngleichzeitigein Signalüberdie KletterfasernunddenParallelfasernanliegt [Mas84]. EinederartigeVerstärkungsynaptischerVerbindungenauf GrundgleichzeitigerAktivitätenvon prä-undpostsynaptischenNeuronenwurdeerst-malsim Jahre1949vonD. HebbalsLernregel für dieModifikationsynaptischerKontaktepostuliert[Heb49]. InzwischengibtesHinweiseaufdieWirksamkeitdieserHebbschenRe-gel im zentralnervösenGewebe[KGB86]. Im gegebenenFall desCerebellums“belohnt”die inferior olivia alsorichtige Aktionen,die durchdie Purkinjezellenausgelöstwerden,durchWachstumderzugehörigenSynapsenstärken.

1989diskutiertenT. PoggioundF. Girosi [PG89] erstmalsdenZusammenhangzwischeneinemRBF-Netzwerkund demModell desCerebellumsvon D. Marr undJ. Albus.Die-serZusammenhangundmithin diebiologischeMotivierungvon RBF-Netzwerkenwird inAbschnitt2.4 nochgenauererläutertwerden.Um die mathematischenEigenschaftenvonRBF-Netzwerkengründlichdiskutierenzu können,ist esjedochzunächstnotwendigsichmit einerReihevonmathematischenKonzeptenzubefassen.DieseKonzeptestammenausdenGebietender statistischenDatenanalyse,der Mustererkennung,der Wahrscheinlich-keitstheorieundderOptimierung.Wie anHanddesRBF-Modellsgezeigtwerdensoll, hatdie Natur mit der KonstruktiondesCerebellumsanscheinendein mathematischesInstru-mentgeschaffen, dessenselbstorganisierendeVerschaltungs-undFunktionsdynamikeineVielzahlwohlbekannter, schwierigerProblemeausdiesenklassischenWissenschaftszwei-genzu lösenvermag.

2.3. Datenanal yse

Viele der intelligentenFähigkeitenhöhererLebewesenberuhenauf einerAnalysedervondenSinnesorganeneingehendenInformationen:VögelngelingteinepunktgenaueLandungauf einemschwankendenAst, LebewesenkönnenausvielenBeobachtungeneinenErfah-rungsschatzaufbauenundMenschenhabendie bemerkenswerteFähigkeit GesichterauchnachlangerZeit wiederzu erkennen.Die Grundlagenfür alle dieseFähigkeitensindzwarangeboren.Viele dieserFähigkeitenentfaltensichabererstdurchintensivesTraining.Essollennun einige jenerBegriffe eingeführtwerden,mit derenHilfe sich die FähigkeitenzurAnalyseundSpeicherungsensorischerInformationen,sowie diezugehörigenLernpro-zesse,mathematischformulierenlassen.Dabeiwerdenwir insbesondereAnsätzeausderklassischenstatistischenDatenanalysegenauerdarstellenundmit demProblemderFunk-tionenapproximationbeginnen.

2.3.1. Funktionenappr oximation

Der Begriff der Funktionenapproximation bezeichnetmathematischeVerfahren,die dar-auf abzielen,den lediglich an Handvon MessungenzugänglichenZusammenhangzwi-schenEingaben798 IR: und Ausgaben;<8 IR= einesbeliebigenSystemsdurcheine

22

Page 31: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

Abbildung 2.6.: Funktionenapproximation. Die Punktezeigenalle ElementeeinesDaten-satzes> , welchereinenfunktionalenZusammenhangzwischenden jeweils eindimensiona-len Eingabedaten? und Ausgabedaten@ aufweist.DieserDatensatzwurdeerzeugt,indem

zu derFunktion ACBEDGFIHJDLK 5NMPORQTSVUPWYX 6[ZK \^]*_$`ba cedgf`ba ` Zih j , die als gestrichelteLinie eingetragenist,ein Rauschtermk addiertwurde.Der Datensatz? ist im Intervall

X 6 MPORl-monpORl j nicht gleichver-teilt, sondernentsprechendeinerNormalverteilunggewürfelt. DieseNormalverteilunghatbeiDqH MPORl ihr Maximumundfällt bis DqHr6 MPORl bzw. DqH npORl starkab.

analytischeFunktionzu approximieren.Abbildung2.6 zeigtein einfaches,niedrigdimen-sionalesBeispielfür dieseAufgabenstellung.Die MengenderbeobachtetenEingabedatensutwv 7Yx$y{z t}|�~*~*~����2�

IR: undAusgabedaten� twv ;Yx$y{z t}|�~*~*~����2�IR= werden

als gegebenvorausgesetztund zum Gesamtdatensatz� t�v�s�� � � zusammengefaßt.Eswird angenommen,daßderDatensatz� einerAbbildung

;Yx t��P� 7Yx������ � z t�|�~*~"~V�(2.1)

gehorcht.Dabeiist�P� 7�� derdemDatensatz� zuGrundeliegendefunktionaleZusammen-

hangund � einnichtnäherbekannterRauschterm,deretwaMeßfehlerbeiderBeobachtungeinesDatenpunktes

� 7Yx � ;Yxp� berücksichtigt.Gesuchtist nuneineFunktion ��P� 7��V��� , diedenim Datensatz� verborgenenfunktionalenZusammenhang

�,� 7�� möglichstgut widerspie-gelt.Mit einemzudefinierendenÄhnlichkeitsmaßsolltealso

���� 7��V����� �,� 7�� (2.2)

23

Page 32: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

gelten.Hier ist � die Mengealler Parameter, die in die Funktion ���� IR:�� IR= eingehen.Die BestimmungeinesParametersatzes� , für den(2.2) gilt, ist damitein Optimierungs-problem,anwelchesdie folgendenAnforderungengestelltwerden:Die Funktion ���� 7��o���soll einerseitsübereinehoheApproximierungsqualitätverfügen,um denZusammenhangzwischen

sund � im Datensatz� gutwiedergebenzukönnen.Essolltealsogelten

��,� 7Yx-�o������;Yx � z t |�~"~*~V�2~(2.3)

Anderseitssoll ��,� 7��o��� im Sinnevon (2.2) auchgeneralisierungsfähigsein.Der Rausch-term � aus(2.1) solltedahermöglichstweitgehendeliminiertwerden.

Bei derBerechnungdesParametersatzes� kannzwischenparametrischenundnicht-para-metrischenVerfahrenunterschiedenwerden[Bis95]. Bei einemnicht-parametrischenVer-fahrenwerdenalle Parameter� einfachaus � abgelesenundnicht durcheinenspeziellenAlgorithmusberechnet.

Betrachtenwir alsBeispielfür einnicht-parametrischesVerfahrendie lineareInterpolationeineseindimensionalenDatensatzes( ¡ t¢|

, £ t¢|). Hier wird die Funktion ¤ �&¥ � appro-

ximiert, indemderFunktionswert �¤ �¦¥ �o��� aneinerim Datensatznicht auffindbarenStelle¥, diezwischendirektbenachbartenDatenpunkten

¥ xo§ und¥ x f liegt, gemäß

�¤ �&¥ �o��� t�¨ x©§�� ¨ x f«ª ¨ x §¥ x f ª ¥ xo§ �&¥ ª ¥ xo§V� (2.4)

ausdenzugehörigen -Werten x©§ und¨ x f berechnetwird.

DieApproximierungsqualitätdiesesnicht-parametrischenVerfahrensistwegen �¤ �&¥ x,�V���­¬¨ x , z t®|�~*~*~V�, optimal.Allerdingsist seineGeneralisierungsfähigkeit gering,dakeinerlei

Anstrengungunternommenwurde,dasRauschen� zu unterdrücken.Der Vorteil, daßdieParameter� nichtaus� berechnetwerdenmüssen,sonderndurch � unmittelbargegebensind,wird durchdenNachteilerkauft,daßdieParameterzahly¯�°y genausogroßist wie derDatensatz� .

EineAlternative sind parametrischeMethoden,die versuchenmit sehrviel kleinerenPa-rametersätzenauszukommenund einehöhereGeneralisierungsfähigkeit erreichen.Dabeistellt sichzunächstdie nicht-trivialeAufgabederWahleinergeeignetenanalytischenDar-stellungderFunktionenschar���� 7��V��� . Wenndaszu untersuchendeSystemeinerbestimm-tenProblemklasseangehört,sokannhäufigmittelseinerAnalysedesSystemseinegeeig-neteFunktionenschar��P� 7��o��� ausgewählt werden2. Soll der parametrischeFunktionenap-proximatorjedochauf einegroßeKlassevon Systemenanwendbarsein,so ist die Wahl

2Als BeispielseidiewiederholteMessungdesStrömungswiderstandes± einesKörpersin einerturbulentenStrömungbeiverschiedenenGeschwindigkeiten ² genannt.Dafür denturbulentenStrömungswiderstandderZusammenhang±´³¶µe·L¸º¹»¼² » bekanntist [LG88], ist esauchsinnvoll eineFunktionenapproximationmit ±I½g²�¾À¿Á³ÃÂbµ ·­ÄoÅ auszuführen.¸ ist hierbeidergrößtederStrömungentgegenstehendeKörperquer-schnitt und Æ die Dichte desströmendenMediums.Der Widerstandsbeiwertµ · ist ein Parameterundkannmit einemRegressionsverfahrenausdemDatensatzÇ bestimmtwerden.

24

Page 33: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

derFunktionenschar���� 7��o��� schwieriger. EsmüssendannRegularisierungsannahmen,wieetwaGlattheitsannahmen,gemachtwerden,welchein allgemeinerFormversuchen,dieEi-genschaftenderjeweiligenSystemklassenzubeschreiben.Ist eineFunktionenschar��P� 7��V���festgelegt, müssenschließlichdieParameter� andenDatensatz� angepaßtwerden.Hierstellt sichdie Frage,nachwelchemOptimierungskriteriumdieserfolgenundmit welchemAlgorithmusdie Parameter� berechnetwerdensollen.

EineverbreiteteForm zur Parameterbestimmungist die Regression[MKB94]. DasOpti-mierungskriteriumisthierdieForderungnachderMinimierungdermittlerenquadratischenAbweichung

È°� �É�b�Ê� t |� ËÌxoÍ Z

ÎÎ ��P� 7Yx,�o��� ª ;Cx ÎÎ K (2.5)

derApproximationdesFunktionswerts��P� 7Cx,�o��� amEingabedatenpunkt7Cx vomzugehöri-genAusgabedatenpunkt;Yx für dengesamtenDatensatz� . Mit der Definition desMitte-lungssymbolsÏÑÐgÒ durch

Ï¦Ó � 7���ÒeÔÕ¬ |� ËÌxVÍ Z Ó

� 7Yx�� � s<tÖv 7YxLy¯z t®|�~*~*~����(2.6)

kanndiesaucheinfacherals È°� �É�b�Ê� t Ïoy ��,� 7Yx��o��� ª ;Yx�y K ÒÑ× (2.7)

geschriebenwerden.Die StationaritätsbedingungenØØÚÙ ÈÛ� �[�V�Ê� tÝÜ Þ Ù 8Á� (2.8)

repräsentierendanndie notwendigenVoraussetzungenfür dasVorliegeneinesMinimumsdesFehlerfunktionals

ÈÛ� �[�V�Ê� .Regression mit Polynomen

Eine häufigeWahl für die Funktionenschar��P� 7Yx,�o��� sind bei eindimensionalenEin- undAusgabedatensätzendie Polynome

�¤ �&¥ �o��� t ßÌ à Í `âáà ¥ à

(2.9)

der Ordnung ã . DieserAnsatzführt mit (2.8) zur polynomialenRegression, bei der dieParameter� t v á ` ~"~*~ á ß � durchdaslineareGleichungssystem

ßÌ à Í ` áàÏ ¥àbäGåÒ t Ï ¨$¥

åÒ � æYtçÜI~*~*~ ã (2.10)

25

Page 34: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Abbildung2.7.:Polynomiale Regression.Links ist dasErgebniseinerpolynomialenRegres-sion der DatenausAbbildung 2.6 mit einemPolynomder Ordnung èçH n

(durchgezogeneLinie), è H l

(gestrichelt)und è�H noM(gepunktet)gezeigt.Rechtsist der Fehler(2.7) in

Abhängigkeit von derPolynomordnungè dargestellt.Dabeiwird zwischené�B¦êìë+>íF ( î ) undé�B¦êíë+>«ïñð¦òóïÑF (5

) unterschieden.

bestimmtsind. Für den trivialen Fall der Approximationdurch einekonstanteFunktion�¤ �¦¥ �o� t á ` � t á ` , also ã tôÜ, erhältman aus(2.10) á ` t Ï ¨ Ò . Der gesuchteZu-

sammenhangzwischenEin- undAusgabedatensatzwird alsogeradedurchdenMittelwertdesAusgabedatensatzes� genähert.Die lineare Regressionmit einerAusgleichsgeraden( ã t�|

) liefert die Funktionenapproximation

�¤ �&¥ �V��� t á ` � á Z ¥ (2.11)

mit

á Z t Ï ¥õ¨ Ò ª Ï ¥ Ò*Ï ¨ ÒÏ ¥ K Ò ª Ï ¥ Ò K öø÷Gù á ` t Ï ¨ Ò ª á Z Ï ¥ Ò � (2.12)

in die, nebendenMittelwerten Ï ¥ Ò , Ï ¨ Ò , die Korrelation Ï ¥õ¨ Ò ª Ï ¥ Ò"Ï ¨ Ò derEin- undAus-gabedatensowie dieVarianz Ï ¥ K Ò ª Ï ¥ Ò K derEingabedateneingehen.Die beidenBeispielefür ã túÜ

und ã tû|verdeutlichen,wie sich der Parametersatz� ausder Berechnung

statistischerMomenteergibt.

Abbildung2.7 zeigt für denDatensatzausAbbildung2.6 dasErgebnisderpolynomialenRegressionmit Polynomender Ordnungenã t |-�oü

und|*Ü

. Ebenfalls dargestelltsinddie Fehler(2.7) dieserRegressionenin Abhängigkeit von der Ordnung ã der Polynome.Dabeiwird zwischendemFehlerfür denDatensatz� , anHanddessendieParameternach(2.10) bestimmtwurden,und dem Fehlerfür einenweiterenDatensatz� ïóð&ògï , der durch

26

Page 35: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

denselbenstochastischenProzeßgeneriertwurde,unterschieden.Bei � sprichtmanauchvomTrainingsdatensatzundbei � ïóð&ògï vomTestdatensatz.

Für denTrainingsdatensatzist in Abbildung2.7zu erkennen,wie die steigendePolynom-ordnungã allmählichzueinerAbnahmedesFehlers

È°� �[�V�Ê� führt undsomitdieQualitätder Approximationzunimmt.Anderseitswird der Fehler

È°� �[�V� ïóð&ògï � für denTestdaten-satzbei ã�ý |pü

wiedergrößer. WennderDatensatzdurchein Polynomzu hoherOrdnungapproximiertwird, nimmt alsodie Generalisierungsfähigkeit ab. Abbildung2.7zeigtaberauch,daßdieQualitätderFunktionenapproximationfür großeã nichtunbedingtmit ã zu-nimmt.Der Grunddafür ist in derNotwendigkeit zu sehen,daßfür zunehmendeã immerhöherestatistischeMomenteberechnenwerdenmüssen.FüreinenDatensatz� mit endlichvielenElementensinddieseabermit einemimmergrößerenstatistischenFehlerbehaftet.EineErhöhungderPolynomordnungführt alsonicht zwingendzu einerVerbesserungderApproximierungsqualitätundGeneralisierungsfähigkeit [Bis95].

Für denallgemeineren3 Fall einerhochdimensionalenEingabe( ¡ þtu|) und einereindi-

mensionalenAusgabe( £ t<|) kanndie polynomialeRegressionnatürlichauchauf mul-

tivariablePolynomeangewendetwerden.Die Bestimmungder Parameter� beruhtdannwieder auf der BerechnungverschiedenerstatistischerMomentevon

sund � . Für ein

PolynomdritterOrdnungmüßtez.B.

�¤ � 7��V��� t á ` � :Ìÿ §iÍ Z á ÿ §¥ ÿ § � :Ìÿ §&Í Z

:Ìÿ f Í Z á ÿ § ÿ f¥ ÿ § ¥ ÿ f � :Ìÿ §iÍ Z

:Ìÿ f Í Z:Ìÿ�� Í Z á ÿ § ÿ f ÿ � ¥ ÿ § ¥ ÿ f ¥ ÿ �

geschriebenwerden.Bei einersolchenAbbildung gilt für die Parameterzahly¯�Ûy�� ¡ ß .Bei einemgegebenenhochdimensionalenDatensatz� hatdieserasanteZunahmederPa-rameterzahlzurFolge,daßmit zunehmenderOrdnungã für dieBerechnungdereinzelnenParameterimmer wenigerDatenpunktezur Verfügungstehen.Dahernimmt der statisti-scheFehlerder Parameterbestimmungmit steigendemã raschzu. Für hochdimensionaleAbbildungenmüssendahersehrgroßeTrainingsdatensätzezur Verfügungstehen,umeineguteQualitätderApproximationzu erhalten.Auch wird die Fehlerfunktion(2.7) für vieleParameterimmerkomplexerundihre Optimierungimmerschwieriger[Bis95].

2.3.2. Mustererkenn ung

EineherausragendeLeistungvieler Lebewesenist die Mustererkennungbzw. Klassifikati-on. Beim Menschenwird dieseFähigkeit beispielsweisebei der Gesichts-oderderSpra-cherkennungdeutlich.Hierbei wird einemsehrhochdimensionalen4 Eingabesignal,wel-chessichausoptischenoderakustischenSinneswahrnehmungenzusammensetzt,einePer-sonodereinebestimmtesprachlicheÄußerungzugeordnet.Bemerkenswertist, daßdiese

3Tatsächlichist dies der allgemeineFall, da jede Abbildung���

IR��

IR

in � Einzelabbildungen�� �IR� �

IR zerlegt werdenkann.4Die NetzhautdesmenschlichenAugesenthältungefähr ����� lichtempfindlicheRezeptoren.Nach einer

Vorverarbeitunginnerhalbder Netzhautwird die visuelleWahrnehmungüberdenSehnerv, welcheret-

27

Page 36: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

λλ (x)=2(x)=1

Abbildung2.8.:Mustererkennung. Links sind �}H�� MpMpM Merkmalsvektoren�Úx eineszwei-dimensionalenDatensatzes? dargestellt.Zusätzlichist die Wahrscheinlichkeitsdichte �TB��TF ,nachderdie gezeigtenPunktegewürfelt wurden,in einerHöhenliniendarstellung eingetragen.Die Datengliedernsichin fünf Häufungen.Im ganzlinkenHaufenbefindensich1000Punkteundin denrestlichenvier jeweils500Punkte.Im rechtenTeilbild ist jederMerkmalsvektordesDatensatzes? einervon zwei Klassen����� npm��! zugeordnet;die Klassenzugehörigkeiten ��xwerdendurchdie Farbkodierungenrot undgrünunterschieden.Die gestrichelteingezeichneteLinie markierteinemöglicheGrenzezwischendenbeidenKlassen.DurcheinesolcheGrenzewerdenzwei GebietedesMerkmalsraumsabgegrenzt,auf denendie zugehörigeKlassifikati-onsfunktion �TB��TF jeweils die Werte �­B��TF�H n (grün)und �­B��TF«H � (rot) annimmt.Verwendetman dieseFunktion zur Klassifikationder Daten,so werdennur wenigenObjektenausderKlasse“rot” irrtümlich derFunktionswert�TB��TF4H n zugeordnet.

ErkennungauchaufderBasisunvollständigerEingabedatenrelativ gut ausgeführtwerdenkann:Ein Gesichtist vonderSeitezuerkennen,auchüberschlechteTelephonleitungenisteinGesprächmöglich.

TypischeMustererkennungsproblemesind die Spracherkennung[Alb95, Der95] oderdieGesichtserkennung[Küh94, LVB

ä93]. Abbildung2.8 illustriert anHandeinessehreinfa-

chenBeispielsdie Aufgabenstellung,die bei derMustererkennungzubewältigenist. DemBeispielliegt ein fiktivesSzenariozugrunde,welchessooderähnlichin jedemLehrbuchzurMustererkennunganzutreffenist (z.B. [DH73]). Dabeiwird angenommen,daßObjektez auseinerMenge " durchzwei Sensorenmeßtechnischerfaßtwerden.Für jedesObjektz werdenbeideSensorsignale

¥ Z x und¥ K x zueinemMerkmalsvektor7Cx zusammengefaßt,

deralsOrtsvektorin einemzugehörigenMerkmalsraum interpretiertwird. Ein Objektwird

wa ����# Nervenfasernumfaßt,in denvisuellenCortex übertragen[Hub90]. Auch wenndie SignaledervielenNervenfasernstarkkorrelieren,sohatderdurchdieseSignaleaufgespannteRaumeinegewaltigeDimension.

28

Page 37: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

sodurchdieMessungausgewählterMerkmalecharakterisiert.Jedessensorischbeobachte-teObjektkanndaheralsPunktim Merkmalsraumdargestelltwerden,wobeidieDimensiondiesesRaumsdurchdie Zahl der Sensorengegebenist. Entsprechendwird die Menge "durcheinenDatensatz

s t v 7Cx$y¯z t |�~*~*~b���undmithin durcheinePunktverteilungim

Merkmalsraumrepräsentiert.Daslinke Teilbild von Abbildung 2.8 zeigt ein BeispielfüreinesolcheVerteilung.Zusätzlichist bei diesemnumerischgeneriertenBeispielnochdiebeiderErzeugungverwendeteModelldichte$ � 7â� angegeben.Bei tatsächlichenKlassifika-tionsproblemenist dieseDichteselbstverständlichnichtbekannt.

Im BeispielausAbbildung2.8wird fernerangenommen,daßdieObjekteauszweiKlassen% t |���&stammen.Die AufgabeeinesmustererkennendenSystemsoderKlassifikators ist

esnun,die ObjekteausschließlichanHanddersensorischenBeobachtung7 ihrer jeweili-genKlasse

% � 7�� zuzuordnen.In Abbildung 2.8 ist einemöglicheKlassifikationsfunktion% � 7â� durchdieAngabeeinerGrenzliniedefiniert,beider% � 7�� vomWert

% � 7�� t�|aufden

Wert% � 7�� t'&

springt.Als Wissensbasisfür die KonstruktioneinessolchenKlassifikatorsdient ein Trainingsdatensatz� túv�s�� � � , der nebendenMeßergebnissen7Yx auchnochdie Klassenzugehörigkeiten

% x enthält.In Abbildung 2.8, rechtswurdeder Datensatzs

ausdemlinkenTeilbild zu einemsolchenTrainingsdatensatz� erweitert,wobei zur An-gabederKlassenzugehörigkeiten

% x dieFarbkodierunggrünfür% x t®|

undrot für% x t(&

verwendetwurde.

Aus demangeführtenBeispielkannnunzunächstgeschlossenwerden,daßdie Musterer-kennungalsSpezialfall derFunktionenapproximationaufgefaßtwerdenkann.Gilt esdochhier, ausBeispieldaten

v 7Cx � % xLy¯z t�|�~*~*~����eineKlassifikationsfunktion

% � 7�� zu extra-hieren.Anderseitsscheintder Fall besonderseinfachzu sein,da die Klassifikationsfunk-tion nur endlichviele WerteannehmenkannundüberweiteBereichedesMerkmalraumskonstantseinsollte.Eine solcheKlassifikationsfunktionführt so zu einerAufteilung desMerkmalsraumsin Raumgebiete,die mit denverschiedenenObjektklassenassoziiertsind.Man sprichtbei diesemVorgangauchvon der Partitionierung desMerkmalsraums.DieTrennflächenzwischendenverschiedenenPartitionenwerdendurchdie Klassengrenzengebildet.In Abbildung2.8, rechts,ist einemöglicheKlassengrenzeeingezeichnet,die zueinersehrgutenKlassifikationführenwürde.

In dennächstenbeidenAbschnittenwerdenzwei Methodenzur Mustererkennungdisku-tiert, diesichunteranderemin derArt derPartitionierungunterscheiden.Bei demnächstenNachbar Erkenner wird einescharfe PartitionierungdesMerkmalsraumsvorgenommen.Diesbedeutet,daßjederRaumpunktgenaueinerPartition zugeordnetwird. Der anschlie-ßenddargestellteBayessche Erkenner beruhtdagegenauf einer unscharfen Partitionie-rung,beiderein RaumpunktmehrerenPartitionenzugeordnetwerdenkann.

Nächster Nachbar Erkenner

Ein naheliegendesKonzeptzur KonstruktioneinesErkennersbestehtin der geeignetenBestimmungeinergeringenAnzahl ) * �

von prototypischen Punkten+ t�v-,!. y / t29

Page 38: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

|�~*~*~ ) �°�IR: , derenKlassenzugehörigkeit

% .bekanntist [Rip96]. Wird ein zu klassi-

fizierenderMerkmalsvektor 7 dem Erkennerpräsentiert,so wird zunächstentsprechendeinerMetrik y Ðøy undderVorschrift/-0 t(132�46587 ÷. Í Z a¯a¯a 9 y ,!. ª 7 y (2.13)

derzu 7 nächsteprototypischePunkt,!.;:

bestimmtundanschließenddieKlassenzugehörig-keit

% .;:diesesnächstenNachbarnalserkannteKlasse

% � 7�� angenommen.Die Schwierig-keit diesesVerfahrensliegt in derAuswahl derPunktmenge+ , welchedie prototypischenPunkte

,!.umfaßt.

Die Bestimmungeiner solchenPunktmenge+ wird auchals Vektorquantisierung(VQ)oderclustering [DH73, Der95] bezeichnet.DieseMethodenzielenauf eineoptimaleBe-schreibung einesgroßenDatensatzes

sdurch eine kleinereMenge + von repräsentati-

ven, typischen Datenpunktenab. + bezeichnetmanüblicherweisealsKodebuch und ihreElemente

,!.als Kodebuchvektoren oderPrototypen. Viele technischeAnwendungenim

BereichderDatenverarbeitungerforderneinesolchereduzierteDarstellungin Form einesKodebuchs,um eineeffizienteSpeicherung,ÜbermittlungundVerarbeitungvon Datenzuerreichen.

In derLiteraturgibt eseineVielzahlvon Vorschlägenfür clustering-Verfahren,die unter-schiedlichbegründetwerdenund jeweils ihre Vorzügeund Nachteilehaben.So wurdenausingenieurstechnischerSicht algorithmischeinfachzu handhabendeMethodenwie et-wa derLBG-Algorithmus[LBG80] oderdask-meansclustering [Mac67] entwickelt, dieauf die OptimierungunterschiedlicherFehlermaßezur Repräsentationvon Datenzielen.DieseVerfahrenweisenjedochalle sehrschwerwiegendeKonvergenzproblemeauf (siehez.B.[Küh94] für einenÜberblick).AusÜberlegungenzuselbstorganisierendenneuronalenNetzenstammendagegenclustering-Methodenwie die selbstorganisierendenMerkmals-kartenvon T. Kohonen[Koh82, RMS92, DT94a] oderder neural-gas AlgorithmusvonMartinetzet al. [MS91], die zwar sicherkonvergieren,derenOptimierungszielaberhäu-fig nicht klar definiert ist. Im folgendenwird daherein Verfahrenvorstellt, dassowohlüberguteKonvergenzeigenschaftenals auchübereineklare mathematischeBegründungverfügt.

RGF-Algorithm us

K. Rose,E. Gurewitz undG. Fox haben1990einclustering-Verfahrenvorgeschlagen,dasauf KonzeptenausderstatistischenMechanikberuht[RGF90]. Als Fehlermaß,dasdurcheinoptimales+ minimiert werdensoll, wähltensie

<[� + �>= � t ËÌxoÍ Z

9Ì . Í Z ? x .*� 7Yx ª ,!. � K ~ (2.14)

30

Page 39: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

Dabeibeschreibtdie Menge=<t v ? x . 8 v�Üø�p|�� y{z t |�~*~*~b� � / t |�~"~*~ ) �

die Zuord-nungender Datenpunkte7Cx zu jeweils genaueinemKodebuchvektor

,!., d.h. esgilt die

Nebenbedingung@ . ? x .°tô|. Für ein gegebenes

=sind die optimalen

,!.die Zentroide,!.ìt @ x ? x . 7 .>A @ x ? x . , sodaß

<nur von

=abhängt,d.h.

< ¬ <q�B= � . Allerdings ist dieBerechnungdesjenigenSatzes

=von Zuordnungsvariablen? x . , der

<q�C= � minimiert, einhöchstkompliziertes,NP-vollständigesOptimierungsproblem[GJ79].

Um diesesProblemzu lösen,kann mannachK. Roseet al. dasFehlerfunktional<q�B= �

als die Energie einesphysikalischenSystemsmit dendynamischenVariablen ? x . inter-pretieren,ein kanonischesEnsemblesolcherSystemebetrachtenundversuchen,zunächstdas Minimum der zugehörigenfreien Energie bei endlicherTemperaturzu bestimmen(vgl. auch[Küh94]). Ein AbkühlendesEnsemblesführt dannzum Grundzustand

= ` desSystemsmit minimalerEnergie

<[�C= ` � . DadiefreieEnergiedieseskanonischenEnsemblesnichteinfachberechnetwerdenkann,schlugenK. Roseetal. vor, dasProblemim Rahmender mean-fieldNäherungzu behandeln.In dieserNäherungist die freie Energie bei derTemperaturD�¬ &3E K eineFunktiondesKodebuchs+ undist gegebendurchFÛ� + �GE � t ª &-E K ËÌ xoÍ Z H ÷

I 9Ì . Í ZKJ�LNM O ª � 7Yx ª ,!. � K A!&3E KQP�R ~ (2.15)

Sienimmt ihr Minimum bei denErwartungswertenS � /Úy 7 �UT+ �GE ��¬ T? x . derZuordnungsva-riablen ? x . an,die durch

S � /Úy 7 �UT+ ��E � t J�LNM O ª � 7 ª T,!. � K AV&3E K P@ 9.;: Í Z J�LNM O ª � 7 ª T,!.;: � K A!&3E K P (2.16)

gegebensind und Zuordnungswahrscheinlichkeitenrepräsentieren.Die ErwartungswerteT,!. deroptimalenKodebuchvektorenergebensichauchhier durchdie Zentroidbedingung,die sichnunals T,!. túÏCS � /Úy 7 �UT+ �GE � 7�ÒeÔÏCS � /Úy 7 �KT+ �GE �bÒeÔ (2.17)

schreibenläßt.DurchDifferenzierenvon(2.15) kannmanleichtverifizieren,daßdienicht-linear gekoppeltenGleichungssysteme(2.16) und (2.17) die SattelpunktgleichungenfürFÊ� + �GE � unddamitnotwendigeBedingungenfür ein Minimum von

FÛ� + �GE � darstellen.

Es sei angemerkt,daßdie Nebenbedingung@ . ? x .¶t |auchnoch für die Erwartungs-

werte S � /Úy 7 � T+ �GE �ɬ T? x . gilt [vgl. (2.16)] und sich nun als NormierungsbedingungderZuordnungswahrscheinlichkeiten 9Ì . Í Z S � /­y 7 �UT+ �GE � t®|

(2.18)

erweist.Faßtmandie ) ZuordnungswahrscheinlichkeitenS � /Úy 7 �WT+ �GE � alsFunktionenvon7 auf, so definierensie eineunscharfe Partition desMerkmalsraums[Gra95], durchdie

31

Page 40: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

jederPunkt 7 mit derWahrscheinlichkeit S � /Úy 7 �UT+ �GE � demKodebuchvektor,!.

zugeordnetwird.

Zur BestimmungdesoptimalenKodebuchsschlagenK. Roseet al. nun vor, durcheineFixpunktiterationvon (2.16) und (2.17) dasMinimum von

FÛ� + �GE � zunächstbei hoherTemperatur

&3E K zuberechnen,weilFÛ� + �GE � dorteinfachkonvex ist unddasMinimum dort

entsprechendsichergefundenwird. AnschließendsolltedurchVerringerungdesTempera-turparameters

EeinAbkühlvorgangmodelliertundsoeinKodebuchbestimmtwerden,wel-

chesdasobenaufgeführteFehlermaß(2.14) näherungsweiseminimiert.Die EigenschaftendiesesAbkühlprozesses,derzueinerhierarchischgeordnetenSerievonKodebüchernführt,welchedie StrukturendesDatensatzesmit zunehmenderAuflösungwiderspiegeln, sindvonverschiedenenAutorendetailliertuntersuchtworden[DT94b, DT94a, Der95, RGF90].

Im BesonderenkanndiesesRGF-clusteringauchalssequentieller, stochastischerAlgorith-musformuliertwerden[Der95]. Dabeiwird ausdemDatensatz

szufällig ein Datenpunkt7Yx gezogenundentsprechendderLernregel,VX ðCY. tZ,V[]\ ï. �_^a`Qb ,!.p� 7Yx � � / t�|�~*~*~ ) (2.19)

mit b ,!.p� 7Yx � t S � /­y 7Yx � + ��E � � 7Yx ª , []\ ï. ���_c (2.20)

eineAnpassungdesKodebuchs + vorgenommen.Hierbei ist c ein normalverteilterZu-fallsvektormit einersehrkleinenVarianzundeinemverschwindenenMittelwert [Der95].NachjedemLernschritt(2.20) wird derTemperaturparameter

Egeringfügigverkleinertbis

– ausgehendvoneinemStartwertE ÿ – einEndwert

Eederreichtist. Im Verlaufdieseriterati-

venKodebuchberechnungwird auchderLernparameter ^Q` voneinemgroßenWert( fhgjilk )aufeinenkleinenWert ( fhmonqp ) verringert.

Esseiangemerkt,daßdieLernregeln(2.19) und(2.20) tiefgreifendeformaleÄhnlichkeitenzuclustering-Algorithmenwie demKohonen-Algorithmus[Koh82] aufweisen,dieausderNeuroinformatikstammen.Diesein derDissertationvonD. Dersch[Der95] genauererklär-tenZusammenhängelassenesauchzu,dasRGF-clusteringalsModell für selbstorganisier-tesLernenin biologischenneuronalenNetzwerkenzu interpretieren(vgl. [ABK r 99]).

D. DerschundP. Tavanhabengezeigt[DT94b, DT94a], daßein optimalesKodebuch imGrenzfall sehrvielerKodebuchvektoren( m s t ) dieEigenschaftderloadbalance, d.h.uwvyxwz|{ }�~Q��~������a��� �m ~ z�� � iqi�i>m (2.21)

undderSchwerpunkterhaltung,d.h. �m �� �����K� � ��u�}��a�(2.22)

32

Page 41: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

Abbildung2.9.:RGF-clustering und nächsterNachbar Erk enner. Für die Konstruktionei-nesnächstenNachbarErkennerswurdendieDatenpunktederKlassen����������� und �����������getrennteinemRGF-clustering mit jeweils ��� ��� � � und �¡� �£¢ �6¤ Kodebuchvektorenunterzogen.Links wird für jede der beidenKlassender Verlauf desRekonstruktionsfehlers¥ �§¦U¨�©ª� währenddesAbkühlprozessesalsFunktiondesTemperaturparameters« dargestellt.Der Temperaturparameter«N¬ bei minimalem

¥ �§¦U¨�©ª� ist jeweils alsPfeil eingetragen.Rechtswerdendie beidenbei minimalem

¥ �§¦U¨�©­� erhaltenenKodebücher¦ � und ¦ ¢ ( ® und ¯ ) imDatensatz© gezeigt.Die aus(2.13) resultierendeKlassengrenzeist alsschwarzeLinie einge-tragen.

hat.Die Eigenschaftder loadbalancebesagtdabei,daßjederKodebuchvektor� �

dieglei-cheAnzahlvon Datenpunktenrepräsentiert.D. DerschentwickelteaufGrundlagederbei-denEigenschaften(2.21) und (2.22) einenAlgorithmus,der dieseEigenschaftenals Ne-benbedingungeinführtundsozubesserenKodebüchernführt [Der95].

DasErgebnisdesRGF-clusterings ist unabhängigvom gewähltenStartkodebuch, wenn�±°�²³�e�gewähltwird, wobei

�e�dieStandardabweichungdesDatensatzes´ ist [RGF90].

FürdieWahldesEndwerts� ¬ gibt esaberkeineähnlichverbindlicheVorschrift.D. Dersch

führte als AbbruchkriteriumdasMinimum desRekonstruktionsfehlers µ x¶��~ ´ �·�¸u>{ }º¹» ��]��� v¼xCze{ }½~Q��~G��� � � {l�a�ein.AllerdingskonntediesesKriterium nur heuristischbegründet

werden[Der95]. In Abschnitt2.3.3wird dagegenein theoretischfundiertesAbbruchkrite-rium eingeführtwerden,dasauf dernochzu erklärendenÄquivalenzdesRGF-clusteringsmit VerfahrenderDichteschätzungdurchMischungenunivariaterNormalverteilungenbe-ruht.

Zur Illustration der ErgebnissedesRGF-clusteringszeigt Abbildung 2.9 einennächstenNachbarErkenner, der mittels desRGF-clusteringsberechnetwurde.Auch wennder soresultierendeKlassifikatorzu gutenErgebnissenführt (sieheauch[Alb95, Gro95]), so ist

33

Page 42: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

einsolchernächsterNachbarErkennerauswahrscheinlichkeitstheoretischerSichtdennochwenigbefriedigend.

Bayessc her Erkenner

Bei derBehandlungderKlassifikationim RahmenderWahrscheinlichkeitstheorie[Gar97]wird dasZiel verfolgt,einenunbekanntenMerkmalsvektor

}sozu klassifizieren,daßdas

Risiko einerFehlklassifikationminimiert wird [Bis95]. Für einenMerkmalsvektor}

be-zeichne

v¼x¿¾½{ }À�die Wahrscheinlichkeit, daßdie Klasse

¾vorliegt. Ist diesea posteriori-

Wahrscheinlichkeitv¼x¿¾½{ }À�

bekannt,dannkanndurchdie Klassifikationsvorschrift¾�xw}À�À�(Á!Â�Ã6ÄÅÁ-Æ�>Ç ���]ÈÉÈÉÈ Ê v¼x¿¾±ËB{ }À� (2.23)

eineMinimierungderFehlklassifikationenerreichtwerden[Rip96].

FürdieKonstruktioneinessolchenrisikominimierendenErkennersmüssendiea posterio-ri -Wahrscheinlichkeiten

vyxB¾�{ }À�ausdenMerkmalsvektoren ´ und denKlassenzugehö-

rigkeiten Ì einesTrainingsdatensatzesÍ bestimmtwerden.Mit Hilfe desausder Wahr-scheinlichkeitstheoriebekanntenBayesschenSatzes[Rip96]v¼x¿¾½{ }À��� v �GÎ x�}Ï{оÑ�Î xw}À� � v �GÎ xw}Ò{оÑ�» Ê

�>Ç v �>ÇÐÎ x�}Ï{о Ë � (2.24)

läßtsichv¼x¿¾½{ }À�

auf Größenzurückführen,die durchdie Analysevon ´ und Ì geschätztwerdenkönnen.Dabeisind

v � die a priori -Wahrscheinlichkeitender Ó Klassen,die ein-fach ausden Mächtigkeiten der verschiedenenKlassenin Í bestimmtwerdenkönnen.Die Dichte Î x�}À� beschreibtdie Verteilungaller Merkmalsvektorenin ´ und kanndurchdie Summeüberalle a priori -Wahrscheinlichkeiten,multipliziert mit denklassenlokalenDichtenÎ x�}Ï{оÑ� , berechnetwerden.

Letztendlichist also für eine Klassifikationnach(2.23) und (2.24) die näherungsweiseBestimmungvon

v � und Î x�}Ï{оÑ� notwendig.Ein solcherKlassifikatorwird dannauchalsBayesscherErkennerbezeichnet.Abbildung 2.10 illustriert dasVorgehenan HandeineseindimensionalenDatensatzes.In diesemBeispielwird auchdeutlich,daßdie a posterio-ri -Wahrscheinlichkeiten

vyxB¾�{ }À�eineunscharfe PartitionierungdesMerkmalsraumsdar-

stellen,dafür jedes}

die NormierungsbedingungÊ� � ��� vyxB¾�{ }À��� � (2.25)

gilt.

Im BayesschenSatz(2.24) beschreibtÎ x�}Ï{оÑ� die Verteilungder MerkmalsvektorenderKlasse

¾. Da dieseDichtefunktionenüblicherweiseunbekanntsind, müssensie für die

34

Page 43: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

Abbildung 2.10.: BayesscherSatz. Links sind schematischklassenlokaleDichten Ô��¶ÕWÖ×��� ,Ô��¶ÕWÖ �Ø� und ÔÑ�¶ÕUÖ ¤Ø� eineseindimensionalenDatensatzeszu erkennen,derausdrei Klassenbe-steht.Die a priori -WahrscheinlichkeitenderKlassensind Ù � �(Ù ¢ �Ú� und Ù|ÛÜ�Z¤ . Rechtssinddie a posteriori-Wahrscheinlichkeiten Ù��;�!Ö Õ±� , Ù����NÖ Õj� und Ù���¤NÖ Õj� nachAnwendungdesBayesschenSatzes(2.24) dargestellt.Die Pfeilekennzeichnendie Klassifikationsgrenzen,diesich ausderGleichheit(z.B. Ù����NÖ Õj�Ý�ÞÙ���¤NÖ Õj� ) der a posteriori-Wahrscheinlichkeiten erge-ben.

KonstruktioneinesBayesschenMustererkennerszunächstausdemDatensatzÍ geschätztwerden.Diesesals DichteschätzungbekannteProblemwird im 3. Kapitel eineherausra-gendeRollespielen.Im nächstenAbschnittwerdendaherzweiverschiedeneVerfahrenzurDichteschätzungdiskutiert,um die SchwierigkeitenundmöglicheHerangehensweisenandieseAufgabenstellungzu illustrieren.

2.3.3. Dichtesc hätzung

In derklassischenStatistikist dieDichteschätzungeinesgegebenenDatensatzes´ �ßà}Uáâ{ã � � i�iqi�p�ä ein bekanntesProblem[DH73]. Die Aufgabebestehtdarin,die Wahrschein-lichkeitsdichteÎ x�}À� , mit derDatendurcheinenbestimmtenProzeßerzeugtwurden,durcheineFunktion åÎ x�}Ï{Ðæç� zu schätzen.Alle dazunotwendigenParameterwerdendabeimit

æbezeichnet.Die DichteschätzungeinesDatensatzesist in derStatistikhäufigvon großemNutzen.Soist, wie obenverdeutlichtwurde,eineguteDichteschätzungderklassenlokalenDatenverteilungenunabdingbarfür dieKonstruktioneinesgutenBayesschenMustererken-ners.

Die einfachsteMethodeeinerDichteschätzungist die Histogrammnäherung[DH73], wel-che in Abbildung 2.11 veranschaulichtwird. Dabei wird zunächstfür jede Achse è �� i�iqiGé desEingaberaumsIRê ein Intervall ë °Ò�íì î±ï° ~Gî£ð°]ñ

festgelegt unddiesesanschlies-sendin p¡ò° Teilintervalle ë ò;ó° , ô °�� � i�iqiGp¡ò° , è � � i�i�iGé , aufgeteilt,sodaß p¡ò �öõ ê° p÷ò°Zellenentstehen.FürdieHistogrammnäherungwird nunabgezählt,wie vieleDatenpunkteaus innerhalbdersodefiniertenVolumina ë¼òQø

ÈÉÈÉÈò¿ù�úhë òaø�Zû ë ò]ü¢'û iqi�i û ë ò;ùê liegen.Diese

KardinalzahlenmZòaøÈÉÈÉÈò;ù sindein Maßfür die Wahrscheinlichkeit einenDatenpunktinner-

35

Page 44: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Abbildung2.11.:Datenverteilung und Histogrammnäherung. Links ist nochmalsdie zwei-dimensionaleDatenverteilung© dargestellt.Rechtsist dasErgebniseinerDichteschätzungmitderHistogrammnäherungzusehen.DerzweidimensionaleEingaberaumwurdedafürin ¤�ýÑþ½¤�ýZellenzerlegt. Die Grautönungist einMaßfür dieAnzahlvon Datenpunktenin einerZelle.

halbvon ëyò øÈÉÈÉÈò¿ù zu finden.Die Dichteschätzungerfolgt schließlichüberdie Normierung

der mZòQøÈÉÈÉÈò¿ù mit derGesamtanzahlp derDatenpunkte:

åÎ xw}Ï{Éæª�À� m òQøÈÉÈÉÈò¿ùp Ä8ÿ�� }�� ë òaø ÈÉÈÉÈ ò ù i (2.26)

DieParameteræ

einersolchenHistogrammnäherungumfassendieKardinalzahlenmZòaøÈÉÈÉÈò;ù

unddie Definition derZellen ë òaøÈÉÈÉÈò;ù . EinesolcheDichteschätzungist in Abbildung2.11

durchdenGrautonder �Vg û �!g Zellendargestellt.

DiesesVerfahrenzurDichteschätzungist zwareinfachin deralgorithmischenAusführung,abernur für niedrigdimensionaleDatensätze geeignet.Da die Zellenzahlp¡ò exponen-tiell mit derDimensioné anwächst,ist sehrschnelldie GrenzedesMachbarenerreicht5.Eine großeZellenzahl p ò erforderteinensehrumfangreichenDatensatz , um eineei-nigermaßenaussagekräftigeDichteschätzungzu erhalten.Ist der Datensatz kleiner alsdieZellenzahlp÷ò , sowird in vieleZellen ë ò ø

ÈÉÈÉÈò;ù keinDatenpunkteingezählt.Damitwer-

dendie Schätzungensehrunzuverlässigund die statistischenFehlerentsprechendgroß.Die hier angesprochenenProblemewerdenin derenglisch-sprachigenLiteraturhäufigalscurseof dimensionalitybezeichnet[Bis95].

Von größererBedeutungfür die DichteschätzunghochdimensionalerDatensätzesind an-dereparametrischeVerfahren.EineMöglichkeit ist dieVerwendungvonMischungenmul-

5Wird ein20-dimensionalerEingaberaumin jeweils3 ZellenproRaumachseaufgeteilt,sosindschon������ ����������� Zellennotwendig.

36

Page 45: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

tivariaterNormalverteilungen.DichteschätzungenvermittelssolcherMischungenwerdenentscheidendin dasvonmir weiterentwickelteRBF-NetzwerkzurFunktionenapproximati-oneingehen(sieheKapitel3). Die beidenfolgendenAbschnittestellendaherzweietablier-te Verfahrenzur Dichteschätzungmit Hilfe einer einzigenundmit Hilfe einerMischungvon multivariatenNormalverteilungendar.

Dichtesc hätzung mit einer multiv ariaten Normalver teilung

Zunächstwird die Dichteschätzungmit einermultivariatenNormalverteilung

åÎ xw}Ï{Éæ������W�À��� Æ! Àì ¹ªxw}�¹ � �#"%$'& � x�}¡¹ � � ñx#(*)�� ê + ¢ x-, � �.$Å� � + ¢ (2.27)

betrachtet[DH73]. Die positiveFunktion(2.27) hatamPunkt� �

IRê ihr Maximum.DieAusdehnungvon åÎ x�}Ï{Ðæ ����� � in die verschiedenenRaumrichtungenwird über die sym-metrischeMatrix

$ �IRê0/!ê skaliert.Auf Grund der Normierungist åÎ x�}Ï{Ðæ ����� � eine

Wahrscheinlichkeitsdichte.

Wie könnennun die Parameteræ ����� � ß1$¼~ � ä so ausdenTrainingsdaten bestimmt

werden,daß åÎ xw}Ï{Éæ ����� � möglichstgut die Verteilungvon ´ abschätzt?Eine möglicheAntwort auf dieseFrageliefert der maximumlikelihood-(ML)-Ansatz.NachdiesemAn-satzgibt der Wert åÎ xw}Uáâ{Ðæ ����� � geradedie likelihood an,daß

}Uádurchdie ModelldichteåÎ xw}Ï{Éæ ����� � erzeugtwurde.Entsprechendist dasProdukt

Î x ´ {Éæ������U�À� 23á ��� åÎ xw}Uáâ{Ðæ������K� (2.28)

die likelihood, daßder gesamteDatensatz von der Modelldichte Î x ´ {Ðæ ����� � erzeugtwurde.JenerParametersatz4æ ����� , für denÎ x ´ {Éæ ����� � maximalist, kennzeichnetalsodieoptimalezu ´ passendeModelldichte.Aus analytischenGründenwird häufigauchdielog-likelihood 5 x ´ {Éæ������U�À�7698 Î x ´ {Éæ������Ñ��� 2� á ��� 698 åÎ x�}UáN{Éæ:�����K� (2.29)

verwendet.Da der Logarithmuseine monotonsteigendeFunktion ist, maximiert 4æ �����auch

5 x ´ {Ðæ ����� � . Am Maximumder log-likelihood müssendieSattelpunktbedingungen;;�< 5 x ´ {Ðæ ����� �À� g = < � æ �����(2.30)

erfüllt sein.WerdendieseBedingungenaufdie multivariateSchätzung(2.27) angewendet,erhältmanmit (2.6) für die Parameter

æ �����die Bestimmungsgleichungen� � u�}À���

(2.31)$ � uQx�}�¹ � ��xw}¡¹ � � " �a� i (2.32)

37

Page 46: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Abbildung2.12.:principal component analysis . In derAbbildungist dasErgebniseinerPCAdesexemplarischenDatensatzesausAbbildung2.11zusehen.Die beidenHauptachsen> ° sindalsKoordinatenkreuzeingezeichnet,welchesauf demMittelwert ? derVerteilungzentriertist.Die Standardabweichungen« ° sind durchdie Längender Achsenangegeben.Die Form derzweidimensionalenNormalverteilung @Ô����½Ö A ����� � wird durchdie Höhenlinienangedeutet.

Der optimalePunkt�

ist geradederMittelwert von ´ unddie optimalemetrischeMatrix$ist die KovarianzmatrixderDaten ´ [DH73]. Die ML-SchätzungderDaten ´ mit der

Dichte (2.27) führt alsozu denParameterneinerStatistik2. OrdnungdesDatensatzes[Gar97].

Die Kovarianzmatrix$

kann in ihre Eigenvektoren B ° und in die Eigenwerte� ¢°

, è �� i�i�iQé , zerlegt werden.Mit derorthogonalenMatrix C ��x B � i�i�iDB ê � undderdiagona-lenMatrix å$ ( å$ ° °Ñ�(� ¢°

) wird dieSpektralzerlegung$Ú� C å$ C "(2.33)

ermöglicht[MKB94]. EbensokanndieInverse$'& �

durchdie inverseDiagonalmatrix å$ &�

dargestelltwerden, $ & � � C å$ & � C " ~(2.34)

und es gilt, � �%$ � , � � å$ . Die Parameterder Schätzung(2.27) könnenalso auchalsæ ����� �öß å$¼~ C ~ � ä geschriebenwerden.DieseBeschreibungeinesDatensatzes durch

einemultivariateNormalverteilungwird üblicherweisealsHauptachsenanalyseoderprin-cipal componentanalysis(PCA)bezeichnet[MKB94].

In Abbildung2.12ist die PCA derBeispielverteilungausAbbildung2.11dargestellt.Er-wartungsgemäßist die ML-Dichteschätzungauf GrunddeseingeschränktenModellansat-zesvon schlechterQualität. Abbildung 2.13 zeigt einenBayesschenErkenner, der auf

38

Page 47: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

Abbildung2.13.:KlassenlokaleML-Dichteschätzungund BayesscherErk enner. Links sinddie klassenlokalenML-Dichteschätzungen@Ô����½Ö � �ö��� und @Ô|���½Ö � �Þ�Ø� gezeigt,die sich mitje einerbivariatenNormalverteilungfür diebeidenKlassendesDatensatzesausAbbildung2.8ergeben.Aus diesenkannzusammenmit dena priori -Wahrscheinlichkeiten Ù|� ��� �³�FE�¤ undÙ�� �£¢ � �FE�¤ nachdemBayesschenSatz(2.24) die a posteriori-Wahrscheinlichkeit @Ù��;�!Ö ���bzw. @Ù����NÖ ��� bestimmtwerden.Die durch @Ù��;�!Ö ���Ü� @Ù ���NÖ ��� resultierendeKlassengrenzeistim rechtenTeilbild eingetragen.

klassenlokalenML-DichteschätzungenåÎ x�}Ï{о�� � � und åÎ xw}Ï{ɾ�� ( �vermittels jeweils

einer bivariatenNormalverteilungdurch eine PCA beruht.Trotz der sehrgeringenPa-rameterzahl,erhältmandurchdieseneinfachenErkennerschoneinerechtguteAbgren-zungzwischendenbeidenKlassen.EinedeutlicheVerbesserungist zu erwarten,wennfürdie ML-Dichteschätzungmit einerMischungmultivariaterNormalverteilungengearbeitetwird. Dieswird im nächstenAbschnittdiskutiert.

Dichtesc hätzung mit einer Misc hung multiv ariater Normalver teilung en

Eine Verallgemeinerungder Modelldichte(2.27) bestehtdarin, eine unbekannteDichteÎ xw}À� mit einerMischung

åÎ xw}Ï{Éæ � �À� �� ����� v � åÎ xw}Ï{ zØ~�æ������� �(2.35)

von m multivariatenNormalverteilungenmit

åÎ xw}Ï{ z-~>æ ������ �½� � Æ! Àì ¹ªxw}�¹ � � �G"%$H& �� xw}¡¹ � � � n ( ñx#(F)À� ê + ¢ x-, � �.$ � � � + ¢ (2.36)

39

Page 48: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

zuschätzen[DH73]. Diev �

sindpositiveZahlenundstellendiestatistischenGewichtederKomponentenåÎ xw}Ï{Éæ ������ �

dar, d.h.» � v � � � . Die

v �und

æ ������ �ß å$ � ~ C � ~ � � ä werdenzueinemGesamtparametersatz

æ � �ß-v � ~�æ ������ { z�� � i�iqiGmÚä zusammengefaßt.

Bildet mandie log-likelihood für dieSchätzung(2.35) undführt dieAbleitungennachdenverschiedenenParameternaus,soerhältmanfür denParametersatz

æ �dieSattelpunktbe-

dingungen[Klo96] � � � u�}À� � I JLK (2.37)v � � u åÎ xCze{ }�~�æ � ���a� (2.38)$ � � M � I J K (2.39)

mit M � I JLK ú uQx�}�¹ � � ��x�}¡¹ � � � " � � I JLK i (2.40)

Bei derBildung derErwartungswerteuON � � I JLK in (2.37) und(2.40) habennicht alle Daten-

punkte}Uá:� ´ dasselbestatistischeGewicht. Vielmehrwird die MittelungsvorschriftuPÑxw}À�Q� � I JLK ú uCv¼xCze{ }½~�æ � �#PKx�}À�����uCv¼xCze{ }�~�æ � ���a� (2.41)

verwendet.DiessindlokaleErwartungswerte,die bezüglichdera posteriori-Wahrschein-lichkeiten v¼xCze{ }�~>æ � �À� v � åÎ xw}Ï{ zØ~�æ ������ �» � Ç v � ÇqåÎ x�}Ï{ z Ë ~�æ ������ Ç � (2.42)

der Zuordnungenvon Punkten}

zu lokalen Verteilungenz

gebildetwerden.Die a po-steriori -Wahrscheinlichkeiten

vyxwz|{ }�~�æ � �definiereneine unscharfePartitionierungdes

Merkmalsraums,dafür jedes} �� ����� vyxwz|{ }�~�æ � �½� � (2.43)

gilt. JedePartitionierungsfunktionvyxwz|{ }�~�æ � �

gibt die Wahrscheinlichkeit an,mit dereinDatenpunkt

}der

z-ten Komponenteder Mischungsdichte(2.38) zuzuordnenist. In diez

-lokalenMittelwerteuQN � � I J K gehendahernur jeneDatenpunktemit hohemstatistischen

Gewicht ein,diemit großerWahrscheinlichkeit derz-tenKomponentezugeordnetwerden.

Für m � � , alsodie Schätzungmit einer multivariatenNormalverteilung,reduzierensich(2.37) – (2.39) auf die Gleichungen(2.31) und(2.32) derStatistik2. Ordnung.In diesemFall werdendieMittelungenüberdengesamtenDatensatz ausgeführtunddieParameterlassensichmit Hilfe einerPCA direkt berechnen.Im Unterschieddazuhandeltessichfürm ² � bei (2.37), (2.38) und (2.39) um implizite, nichtlineargekoppelteBestimmungs-gleichungenfür denParametersatz

æ �. Zusammenfassendkannmanalsofeststellen:Im

40

Page 49: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.3. Datenanalyse

RahmendesML-Ansatzesist dasProblemderDichteschätzungmit einerMischungmul-tivariaterNormalverteilungen,jeneLösungvon (2.37) – (2.39) zu finden,für die die log-likelihood 5 x ´ {Ðæ � ��� 2� á ��� 698 åÎ x�}UáN{Éæ � � (2.44)

maximalist.

Die einfachsteMöglichkeit wäredie AnwendungeinesiterativenGradientenaufstiegszurMaximierungvon

5 x ´ {Ðæ � � . Allerdingsist5 x ´ {Ðæ � � im allgemeinenkeinekonvexeFunk-

tion, sodaßeinsolcherGradientenaufstieg sehrleichtzueinemlokalenMaximumkonver-giert unddamitnicht zuroptimalenLösungvon (2.37) – (2.39) führt [DH73].

EineweitereMöglichkeit zurBestimmungderParameteræ �

bietetderexpectation-maxi-mization-(EM)-Algorithmus[DLR77]. Dabeiist zunächsteineinitiale SchätzungderPara-meternotwendig.Mit dieserwerdennunzunächstdiePartitionierungsfunktionen(2.42) (E-Schritt) unddamitanschließendein neuerParametersatznach(2.37) – (2.39) (M-Schritt)bestimmt.DieserVorgangwird iterativ solangefortgesetzt,bis sicheineselbstkonsistenteLösungeinstellt.

Allerdings sind die ErgebnissedesEM-Algorithmusim starken Maßevon der Anfangs-schätzungderParameter

æ �abhängig.EbensostellensichhäufigsinguläreLösungenein,

indemdieAusdehnung, � �.$ � für einigeNormalverteilungensehrklein undfür anderesehr

großwird. Der Grundfür dieseInstabilitätensind zufälligeFluktuationendermetrischenMatrix

$ �währenddesiterativenAblaufs desEM-Algorithmus[YSU94, KT97, YC98].

DieseSchwankungenkönnenim nächstenM-Schritt zu einerVerringerungdesGewichtsv �führenund damit letztendlichzum VerschwindeneinerKomponente

v � åÎ xw}Ï{ zØ~�æ ������ �.

Geradebei großenDimensionendesMerkmalsraumsist der EM-Algorithmusbesondersanfällig für dieseInstabilitäten,da danneinekleine Fluktuationvon

$ �einegroßeÄn-

derungdesVolumens, � �.$ � und damit nach(2.38) auchdesstatistischenGewichts

v �verursacht.DieseEigenschaftenzeigendie komplexeStrukturder log-likelihood im Para-meterraumundverweisenaufdieSchwierigkeiteneinesnaivenGradientenaufstiegsmittelsdesEM-Algorithmus.

EntscheidendeImpulsezur LösungdieserSchwierigkeiten kamenvon M. KloppenburgundP. Tavan[Klo96, KT97], denendie ÄquivalenzdesRGF-clusteringsmit einemSpe-zialfall der ML-DichteschätzungdurchMischungenvon Normalverteilungenaufgefallenwar. Für denFall univariaterNormalverteilungenmit identischenstatistischenGewichten,d.h.

$ & �� �SR � & ¢und

v � � � n�m , stimmtnämlichdie ML-Stationaritätsbedingung(2.37)für die

� �exaktmit derRGF-Sattelpunktbedingung(2.17) überein.EbensostimmtderAus-

druck(2.42) für diea posteriori-Wahrscheinlichkeitvyxwz|{ }�~�æ � �

mit derGleichung(2.16)für dieZuordnungswahrscheinlichkeit

vyxwz|{ }�~Q�½~G���beimRGF-clusteringüberein.Daauch

die log-likelihood (2.44) bis auf denFaktor¹T(3� ¢

mit der freien Energie (2.15) überein-stimmt,entsprichtdie Maximierungvon

5 x ´ {Ðæ � � einerMinimierungvon U x��½~G��� . Daher

41

Page 50: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

ist dasRGF-clustering tatsächlichein Spezialfall derML-Dichteschätzung.Im Gegensatzzur freien Energie U x���~���� besitztdie log-likelihood

5 x ´ {Ðæç� jedochbei einemnichtver-schwindendenWert desParameters

�ein Extremumund erlaubtso die Bestimmungei-

nerminimalenTemperatur(3� ¢¬ währenddesAbkühlprozessesbeimRGF-clustering. Die-

serentsprechendmodifizierteRGF-AlgorithmuszurML-Dichteschätzungmit MischungenunivariaterNormalverteilungenwird künftig auchalsunivar-Verfahrenbezeichnet.

Nun scheintdie ML-Dichteschätzungmit einerMischungunivariaterNormalverteilungenmit identischenVarianzenundstatistischenGewichtenzunächstkeinenVorteil zu haben.Aber geradedie BeschränkungdesParametersatzesauf die

� �und die Verwendungvon�

alsAbkühlparameterermöglichenbeimunivar-AlgorithmuseinehoheStabilitätbei derParameterbestimmung.DiesealgorithmischeStabilitätdesunivar-VerfahrenshatM. Klop-penburg undP. Tavandazumotiviert, einenverwandtenAlgorithmusauchfür denmulti-variatenFall zu entwickeln [KT97]. Dabeiwerdendie Sattelpunktbedingungen(2.38) und(2.39) für die Parameter

v �und

$ �soerweitert,daßein Abkühlverfahrenmöglichwird.

Zunächstwerdendazudie$ �

durch ihre Eigenvektoren B ° � und Eigenwerte� ¢° �

, è �� i�i�iQé , ersetzt.Die inverseMatrix$ & ��

kanndahernacheinerSpektralzerlegung$ & �� �C � å$ & �� C " �

in die orthogonaleMatrix C � �¸x B �w� i�iqiVB ê � � der Eigenvektorenund diediagonaleMatrix å$ � derEigenwerteaufgeteiltwerden.Mit dieserRepräsentationvon

$H& ��gliedertsichdieSattelpunktbedingung(2.39) in zweiGruppenvonGleichungen.Die ersteGruppe � ¢° � � B "° � M � I JLK B ° � (2.45)

beschreibtdie Varianzen� ¢° �

in Richtungder B ° � unddie zweiteGruppe� ¢° � B ° � �WM � I J K B ° � (2.46)

dieEigenvektorenB ° � derKovarianzmatrizenM � I JLK . M. Kloppenburg undP. Tavanerwei-

ternnundieSattelpunktbedingungen(2.45) zu� ¢° � � B "° � M � I JLK B ° �YX[Z � ¢ ¹ � ¢° �uCv¼xCze{ }�~�æ � ���a� i (2.47)

Nun sinddie Varianzen� ¢° �

übereinenKopplungsparameter

ZandenTemperaturparame-

ter�

gekoppelt.Im Fall einerstarken Kopplung(

Z s t ) erhältmandaherdenunivar-Algorithmus.Bei derAnwendungdesEM-Algorithmuswerdennunim M-SchrittdieGlei-chungen(2.46) und (2.47) an Stellevon (2.39) ausgewertet.Zusätzlichist esnachjedemM-Schritt notwendig,die Vektoren B ° � einer hierarchischenOrthonormierung,z.B. mitdemSchmidtschenVerfahren[Fis86], zu unterziehen.Als Folgewird B �w� zumEigenvek-tor von

M � I JLK mit demgrößtenEigenwert� ¢�w�

, B ¢¿� zumEigenvektormit demzweitgrößten� ¢¢¿�usw. , konvergieren[RT89].

Schließlichkannauchdie EM-Gleichung(2.38) durchv � �öuCv¼xCze{ }�~�æ � ���a� X ¾�xÜ�m ¹�v � �(2.48)

42

Page 51: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.4. KünstlicheneuronaleNetze

ersetztwerden.DurchdenZusatztermwerdenfür einengroßenKopplungsparameter¾

diestatistischenGewichteannäherndauf denselbenWert � n�m gebrachtundfolglich auchdieEigenschaftder loadbalanceerzwungen[vgl. (2.21)].

Für denAbkühlprozeßwährendder EM-Schrittemit (2.37) und (2.46) – (2.48) wird derTemperaturparameter

�langsamvoneinemgroßenzueinemkleinenWertverringert.Wäh-

renddessenoderanschließendwerdenauchdie Kopplungsparameter

Zund

¾verkleinert

[Klo96]. Der VerlaufderOptimierungkanndurchdie log-likelihood5 x ´ {Ðæ � ~G��~ Z ~�¾Ñ� be-

urteilt undbeiErreicheneinesMaximumsvon5 x ´ {Ðæ � ~G�Ñ~ Z ~�¾K� beendetwerden.

M. Kloppenburg und P. Tavan habensomit einenEM-Algorithmusentwickelt, der unterVerwendungeinesAbkühlverfahrenssicherkonvergiert, ein klar definiertesAbbruchkri-terium hat und zuverlässigzu einergutenDichteschätzungführt. DieserAlgorithmusistinzwischenerfolgreichfür dieKlassifikationvonSprachdatenverwendetworden[Met98].

2.4. Künstlic he neur onale Netze

Die im vorangehendenAbschnitt diskutiertenVerfahrenzur Funktionenapproximation,Mustererkennungund Dichteschätzungbasiertenhauptsächlichauf mathematischenVor-stellungen.Beim Entwurf einigerdieserMethoden,wie etwa bei denzumRGF-clusteringverwendetenAbkühlungsmethoden[RGF93, DT94a], standenallerdingsauchKonzepteausder statistischenPhysik Pate. Fernerwurdenauchschonneurobiologischmotivier-te Methodenerwähnt.Der letztereZugangkennzeichnetdasForschungsgebietder Neu-roinformatik, dassystematischversucht,ausder FunktionsweisebiologischerInformati-onsverarbeitungalgorithmischeVorgehensweisenzur LösungschwierigermathematischerProblemezu entwickeln. In diesemAbschnittsolleneinigeKonzepteder Neuroinforma-tik vorgestelltwerden,die für dasVerständnisvon RBF-Netzwerkennotwendigsind.AmEndediesesKapitelswerdendannschließlichalle Begriffe zur Verfügungstehen,die zurDiskussionsolcherRBF-Netzwerke nötig sind.

In Abschnitt2.2 wurdeneineReihewichtiger StrukturendesGehirnsundder Kleinhirn-rinde skizziert.Es wurde dort deutlich,daßdie Nervenzelleeine zentraleRolle bei derInformationsverarbeitungim Gehirneinnimmt.Bei derKonstruktionkünstlicherneurona-ler Netzwerke(kNN) spiegeltsichdiesesKonzeptin derEinführungdesformalenNeuronswieder. Abbildung 2.14 zeigt ein einzelnesformalesNeuroninnerhalbeinesNetzwerksvon m formalenNeuronen.DasformaleNeuronist diekleinsteinformationsverarbeitendeEinheiteineskNN. Eserhältüberdie Verbindungenmit anderenNeuronen6 Eingaben,dieinnerhalbdesNeuronsverarbeitet,vom ihm ausgegebenundanandereNeuronenweiter-geleitetwerden.

6Zur genauerenUnterscheidungwerdenkünftig biologischeNeuronenalsNervenzellenundformaleNeu-ronenalsNeuronenbezeichnet.

43

Page 52: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Dendritenbaum

iAktivität aVerbindungenpräsynaptische

Neuron iE

inga

be

Aus

gabe

y

x

i

Axonbaum

Abbildung2.14.:Künstliches neuronalesNetzwerk. ElementarerBausteineineskünstlichenneuronalenNetzwerksist dasformaleNeuron.Dieseserhältüberdie präsynaptischenVerbin-dungenInformationenvon anderenformalenNeuronen.DieseEingabenwerdenverrechnetundalsAktivität weitergegeben.

Die meistenModellederNeuroinformatikbeschreibendabeidieelektrischeAktivität einerNervenzelleè durcheinereellwertigeAktivitätsvariable \ ° , è � � i�i�i�m . Die AktivitätenallerNeuroneneineskNN könnenzueinemVektor ] �öx \ � i�iqi�\ � � zusammengefaßtwer-den,der damit denAktivitätszustanddiesesNetzeserfaßt.Analog zu einemnatürlichenNetzwerkvon Nervenzellenwird jedeAktivität \ ° überdenAxonbaumzu nachgeschal-tetenNeuronenweitergeleitet(vgl. die in Abbildung2.14rot eingezeichnetenVerbindun-gen).In biologischemNervengewebebildet eineNervenzelleüberihren Axonbaumsehrviele synaptischeKontake mit anderenZellenaus.In einemkNN wird die Übertragungs-qualitäteinessolchenKontaktsvon einemNeuron è zu einemNeuron ^ durcheinereell-wertigeVariable _a` ° modelliert.Diesesog.Verbindungsstärken _a` ° gebenan, wie starkeineneuronaleAktivität \ ° die Aktivität einesNeurons beeinflußt.Alle zu einemNeu-ron è konvergierendenVerbindungsstärkenkönnenin einemVektor B ° � x _ � ° i�i�iV_ � °C�G"gebündeltwerden.Diesersog.Dendritenbaumist in Abbildung2.14grüneingezeichnet.Ebensokönnendie Stärkendervon einemNeuron è auslaufendenVerbindungenzu einemVektor bc` � x _a` � iqi�i�_a` � � zusammengefaßtwerden,der die ÜbertragungseigenschaftendesAxonbaumsmodelliert.Verbindungsstärken _a` ° mit einemWert von Null kennzeich-nendabeieinenicht vorhandeneVerbindungvon Neuron è zueinemNeuron .

Die ZellaktivitäteninnerhalbbiologischenNervengewebessinddurchdynamischeMuster-bildungsprozessegeprägt[Hin94, ST85]. Die ModellierungdieserdynamischenArbeits-weisein einemNetzwerkformalerNeuronenkannbeispielsweisedurcheinezeitlicheDis-kretisierungder folgendenArt vorgenommenwerden:Ein Neuronerhältzum Zeitpunkt7d

die überdenDendritenbaumB ° modulierteAktivität ] ì d ¹ � ñ alsEingabe.Die Aktivität\ °Qì d ñ desNeuronsè wird dabeidurcheine,im allgemeinennichtlineare,Übertragungsfunk-

7DiskretisierteZeitangabenwerdenim folgendendurcheckigeKlammern egf h gekennzeichnet.

44

Page 53: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.4. KünstlicheneuronaleNetze

tionP-°Hi

IR� s IR bestimmt.Die Dynamik eineskNN ist im RahmendiesesModells

vollständigdurch \ °Qì d ñ �jP3°]x ] ì d ¹ � ñ#k æ °w�>~ è � � i�iqiGm ~(2.49)

beschrieben.Die Parametermengeæ °

umfaßtdenDendritenbaumB ° undsonstigefür dieBeschreibungderÜbertragungsfunktionnotwendigenParameter.

Für die Klasseder rekurrentenkNN sind die dynamischenEigenschaften,die aus(2.49)folgen, von entscheidenderBedeutung[Hop82, TGK90]. Netzwerke diesesTyps sind sostrukturiert,daßauchRekursioneninnerhalbdesNetzwerksauftretenkönnen.Dasin Ab-bildung2.14skizzierteNetzwerkweisteinigesolcheVerbindungenauf.Im folgendenwer-denaberhauptächlichvorwärtsgerichteteNetzwerke betrachten,bei denenkeinerücklau-fendenVerbindungenauftreten.Wird einemsolchenfeedforward Netzwerküberausge-zeichneteNeuroneneineEingabeaktivität

}[�IRê zugeführt,sowird sichandenspeziel-

len AusgabeneuronennacheinerendlichenZeit eineAusgabeaktivität l �IR

Êeinstellen.

Ein solchesNetzwerkführt dahereineAbbildungl � åb x�} k æç� (2.50)

aus.æÚ�öß3æÜ°Q{ è � � i�i�i�mÚä beinhaltetalle zur ParametrisierungdesNetzwerksnotwendi-

genGrößen.

Ein Vergleich von (2.50) mit (2.3) zeigt unmittelbar, daßein solchesfeedforward Netz-werk einenFunktionenapproximatorrepräsentiert.Ein kNN der Form (2.50) kanndaherzurFunktionenapproximationunddamitauchzurMustererkennungverwendetwerden.Esdrängtsichhier sofortdie Frageauf, wie derParametersatz

æsobestimmtwerdenkann,

daßdaskNN einenin Form einesTrainingsdatensatzesÍ � ßNxw}Ká3~ l á-��{ ã � � i�i�i�pºä vor-gegebenenfunktionalenZusammenhangmöglichstgut approximiert.Analog zur Lernfä-higkeit von biologischenNetzwerken,die durchwiederholtePräsentationvon BeispielenneueZusammenhängelernenkönnen,werdenhierfürLernalgorithmenbenötigt.

Ein Ziel der Neuroinformatikist damit – unterBerücksichtigungdesLernverhaltensbio-logischerNetzwerke – die Entwicklungvon Lernregeln, mit derenHilfe die Parameter

æsequentiellan präsentierteBeispieleangepaßtwerdenkönnen.Gesuchtsind Lernregeln,die für ein zufällig aus Í gezogenesDatentupel

xw}Uá-~ l áØ� eineAnpassungæ�mOn o° �(æ:pVqGr° Xtsvu æÜ°�xw}Uá3~ l áà� è � � i�i�iGm (2.51)

vornehmen[And97]. Der Lernparameter

sist einepositive Zahl kleinerEins,die im Zu-

ge desLernverfahrenslangsamverringertwird. Der Lernschritt

u æÜ°]xw}Uá3~ l áà� mußderartgestaltetsein,daßseinBetragbei wiederholterAnwendungder Lernregel (2.51) immerkleinerwird, undsoschließlichdieKonvergenzvon (2.51) eintritt.

Die Neuroinformatikhat im Laufe der letztenJahrzehnteeinegroßeZahl verschiedenerTypenvonkNN entwickelt,diesichwesentlichin derWahlihrerVerbindungstopologieundderFormulierungderLernregelnunterscheiden(siehez.B. [And97, Roj93, RMS92]). DernächsteAbschnittdiskutiertdasfür dieseEntwicklungwichtigezweischichtigePerzeptron,bevor im Abschnitt2.4.2dasRBF-Netzwerkeingeführtwird.

45

Page 54: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Abbildung2.15.:SchemaeineszweischichtigenPerzeptrons.

2.4.1. Perzeptr on

Den erstenDurchbruchbei der Entwicklung lernfähigerneuronalerNetzwerke erzielteF. Rosenblatt1958 mit dem Perzeptron [Ros58], dasseitdemfür viele Weiterentwick-lungenPategestandenist. Abbildung 2.15zeigt die VerbindungstopologieeinessolchenPerzeptronsundweistesalsein zweischichtigesNetzwerkaus.Die AufgabediesesNetz-werks ist die Klassifikation von Daten.An die Eingabeschichtwird ein Eingabevektorwyx IRz angelegt, dessenKomponenten{}| die Aktivitätender ~ Eingabeneuronenange-ben.DieseAktivitätenwerdenvermittelsderDendritenbäume��| zu den � NeuronenderAusgabeschichttransportiertunderzeugendort eineEingabe,die durchdasSkalarprodukt�'��� w gegebenist. JedesdieserNeuronengehörtzu einerder � Klassen,die im Daten-satz � enthaltensind.Die Abbildung,die dasPerzeptronausführt,soll vonderFormsein,daßbei derKlassifikationeinesDatenpunktsw auseinerKlasse��� wY� die Aktivität ��� desAusgabeneurons� Einswird unddieAktivitätenderverbleibendenAusgabeneuronenNullwerden.

Die ÜbertragungsfunktioneinesAusgabeneurons� wird bei einemPerzeptrondurcheineStufenfunktion �� �D� wa�v��������� ��� z|������ ��|�{}|T�j�� �¡ V¢¤£L D¥ � � �§¦�¦�¦ � (2.52)

beschrieben.Um eineeinfachereFormulierungvon(2.52) zuerhalten,kanneinPerzeptronmit demSchwellenwert� in einäquivalentesPerzeptronmit einemSchwellenwert

�trans-

formiert werden.Dafür ist es lediglich notwendig,dennegativen SchwellenwertT� alsVerbindungsstärke �ª© � ¨T� einerfiktivenzusätzlichenEingabeleitungzuverwenden,dieandiekonstanteEingabe{ © � � angeschlossenwird. Mankanndannauch�� �D� wa�v����� � � � �'��� w � �� �¡ V¢1£� D¥ � � �§¦�¦«¦ � (2.53)

schreiben,wobei �'� denentsprechenderweitertenDendritenbaumdesAusgabeneurons�repräsentiert.Da �'��� w¬� �

im MerkmalsraumderEingabedaten� eineHyperebenemit

46

Page 55: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.4. KünstlicheneuronaleNetze

demNormalenvektor �'� beschreibt,wird derMerkmalsraumdurchjedesAusgabeneuronin zwei Teilräumeaufgeteilt.Die Klassifikationdurchein Perzeptronerfolgt dannentlangdieserTeilraumzerlegungen.

Wie könnendie Verbindungsstärken �W�®­ �'��¯ � � �§¦�¦«¦ ��° �®­*± |²¯ ³ � �§¦�¦�¦ ~´° nunsobe-rechnetwerden,daßeindurcheinenBeispieldatensatzµ �¶­ � w%·�¸�¹%· � ¯gº � �§¦�¦«¦�» � � ¹%·F� � �¼ �½�¿¾�° vorgegebenesKlassifikationsproblemmöglichstgut gelöstwird? Da die ursprüngli-cheLernregelvonF. RosenblattinzwischennurgeringeBedeutunghat,wird im folgendenein Vorschlagvon B. Widrow undM. Hoff ausdemJahre1960diskutiert.Für die Herlei-tungdieserLernregel wird mit dermittlerenquadratischenAbweichungÀ � �Á¸ µ �Â�Äà ¯ �± � w%·1�Å�Æ� ¨ ¹%· ¯ Ç�ÈQÉ ¦ (2.54)

ein Fehlermaßfestgelegt, mit welchemdie KlassifikationsleistungeinesPerzeptronsbe-urteilt werdenkann[WH60, WS85]. Im Raumaller Verbindungsstärken definiert diesesMaßein Fehlergebirge, in demdie LagedesglobalenMinimums

ÀËÊÍÌ�Îdie Parameterdes

optimalenPerzeptronsfestlegt. Die einfachsteMöglichkeit ein Minimum vonÀ � �Á¸ µ � zu

berechnenist ein Gradientenabstieg aufÀ � �Á¸ µ � [And97]. Dies führt zu einersequenti-

ellenLernregel der Form (2.51) für die Axonbäume± | derEingabeneuronen³ mit einemLernschritt Ï ± |¤� w%·¤¸V¹%·F�Â� �-{}| �O· � ¹%· ¨ �± � w%·1�v���V�v¸ ³ � � ¦�¦�¦ ~ ¸ (2.55)

wobei die ³ -te KomponentedesEingabevektors w%· mit �Ð{}| �O· bezeichnetwird. Der Term�-{}| �Ñ· � ¹%· dieserDelta-Regel führt zueinerVerstärkungderKomponentendesAxonbaums± | , wennkorrelierteundpositiveEin- undAusgabeaktivitätenvorliegen.Er modelliertda-mit dievonD. HebbformulierteHypotheseüberdenLernmechanismusvonNervenzellen.Der zweiteTerm ¨Æ�Ð{}| �O· �± � w%·��v��� ist notwendig,um ein unbegrenztesWachstumderVer-bindungsstärken zu verhindern,und entsprichtdamit einemZerfallsterm.Dahersprichtman bei (2.55) auchvon einer kompetitiven HebbschenLernregel. Die spezielleRegel(2.55) besagt,daßbei einer richtigen AusgabedesNeuronsdie entsprechendenVerbin-dungsstärkenunverändertbleiben.Liegt eineAbweichungvomSollwert ¹%· vor, sowerdendieVerbindungsstärkensoadaptiert,daßderBetrag ¯ ¹%· ¨ �± � w%·1�v��� ¯ beimnächstenAuftre-tendesMerkmalsvektorsw.· verringertwird.

Allerdings handeltessich bei der Delta-Regel (2.55) um einebiologischnicht plausibleLernvorschrift,da in die Anpassungeiner Verbindungsstärke im Axonbaumdie gesamteNetzwerkausgabe

�± � w%·¤�v��� eingeht.In einembiologischenNetzwerkwärediesnur mög-lich, wenndieAusgabe

�± � w.·¤�v��� für alleNervenzellenderEingabeschichtverfügbarwäre,wasbei FehlenrückwärtigerVerbindungennichtderFall seinkann.Man sprichtdaherbei(2.55) auchvoneinernichtlokalenLernregel.

EineebenfallsHebbscheLernregel für denAxonbaum± | ist die outstar-RegelÏ ± |¤� w%·�¸V¹%·*��� �-{}| �Ñ· � ¹%· ¨ ± | �v¸ ³ � � ¦�¦�¦ ~ ¸ (2.56)

47

Page 56: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Abbildung2.16.:Klassifikation mit einemzweischichtigenPerzeptron. Die DatenverteilungÒausAbbildung 2.8 soll mit einemeinfachenzweischichtigenPerzeptronklassifiziertwer-

den.DasPerzeptron(2.53) ist auszwei Eingabeneuronen( ÓSÔyÕ ) undeinemAusgabeneuron( Ö�Ôj× ) aufgebautundwurdemit (2.55) trainiert.In derAbbildungist derTrainingsdatensatzzusammenmit derGeradenØ ©�Ù Ø �DÚ�� Ù Ø Ç Ú Ç Ô¬Û eingezeichnet,die durchdie ParameterÜdefiniertwird.

die erstmalsvon S. Grossberg vorgeschlagenwurde [Gro74]. In (2.56) wurdedie Netz-werkausgabe

�± � w%·1�Å�Æ� aus(2.55) durchdenAxonbaum± | ersetzt.FürdieAnpassungeinerVerbindungsstärke sind nun nur nochlokal am Eingabeneuron³ verfügbareGrößeerfor-derlich.Die outstar-Regel ist alsoeinelokaleunddaherbiologischplausibleLernregel.

Abbildung 2.16 zeigt dasLernergebnisfür ein einfachesPerzeptronmit einemeinzigenAusgabeneuron,welchesmit der outstar-Regel für denbekanntenDatensatzausAbbil-dung2.8trainiertwurde.Manerkennt,wie dasPerzeptronversucht,mit einerGeradendieKlassifikationder beidenKlassenzu bewerkstelligen.Allerdingskanndiesfür dengege-benenDatensatzzu keinemoptimalenErgebnisführen,dadie beidenKlassennicht linearseparierbarsind,d.h.nichtdurcheineGeradezu trennensind.

1969wiesenM. Minsky und S. Papert[MP69] einewesentlicheEigenschafteineszwei-schichtigenPerzeptronsmit beliebigvielen Ausgabeneuronennach,dassog.Perzeptron-Konvergenzkriterium.Diesessagtaus,daßdie Lernregel (2.55) immer konvergiert, fallseineLösungvorhandenist.FallsdieDatenlinearseparierbarsind,alsodurchHyperebenenzu trennensind,wird die Lernregel geradezu dieseroptimalenLösungkonvergierenundsozueinerfehlerfreienKlassifikationführen.Ist dieVerteilungderverschiedenenKlassen– wie in Abbildung2.16– hingegenkomplexer (Klassensindineinanderverzahntoderei-neKlasseist in eineandereeingebettet),dannmachtdaszweischichtigePerzeptrongroßeFehler.

48

Page 57: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.4. KünstlicheneuronaleNetze

Die BeschränkungderProblemklasseauflinearseparierbareMerkmalsräume,wie siebeimzweischichtigenPerzeptrongegebenist, wurdedurchdie Entwicklungdesmehrschichti-genPerzeptrons(multi layer perceptron (MLP)) aufgehoben[And97]. Beim MLP werdenvieleSchichtenvoneinfachenPerzeptronenhintereinandergeschaltet,wobeijedeseinzelneNeuronnochimmer seineAusgabeaktivität nach(2.53) berechnet.Da jedeSchichteinessolchenPerzeptronszu einerUmkodierungder Merkmalsvektorenführt, ist die Flexibi-lität einessolchenNetzwerksdeutlichgrößeralsdiejenigeeineszweischichtigenPerzep-trons. 1989 wurde sogargezeigt[Cyb89, HSW89, Hor91, Fun89], daßschonein drei-schichtigesPerzeptronmit sigmoidenAntwortcharakteristiken der Zwischenschichtneu-ronen jede Funktion beliebig genauapproximierenkann, wenn die Zahl der Neuronendort ausreichendgroß ist. Allerdings war langenicht klar, mit welchenLernregeln dieVerbindungsstärkeneinessolchendreischichtigenMLP bestimmtwerdensollen.ErstEn-de der achtzigerJahresetztesich immer mehrder back propagation-Algorithmusdurch[Wer74, RHW86]. DasZiel diesesVerfahrensist die MinimierungderquadratischenDif-ferenzzwischendemSollwert ¹%· undderNetzwerkausgabe

�± � w.·1�v��� durcheinenGradien-tenabstieg aufderFehlerfunktion

À � �Á¸ µ � [siehe(2.54)]. Diesführt zueinerLernregel,beiderdervom NetzwerkgemachteFehler“rückwärts” durchdasNetzwerkpropagiertwer-denmuß,um die Verbindungsstärkenanpassenzu können.DieserAlgorithmushat in denletztenJahreneinebreiteAnwendungbei praktischenProblemengefunden.Da durchdenGradientenabstieg im gesamtenParameterraumgleichzeitignacheineroptimalenLösungfür die Gewichtegesuchtwird, konvergiert dasVerfahrenabernur sehrlangsamund fin-dethäufignursuboptimaleLösungen[And97]. Zudemkonntein biologischenNetzwerkenbishernochnicht beobachtetwerden,daßeineRückwärtspropagationvon Fehlerinforma-tionenstattfindet[Cri89].

2.4.2. GRBF-Netzwerk

SeitAnfangderneunzigerJahreist ein dreischichtigerNetzwerktypimmerpopulärerge-worden,der sich von einemdreischichtigenMLP dadurchunterscheidet,daßdie Über-tragungsfunktionderNeuronenauf derZwischenschichtnicht durcheinesigmoideFunk-tion oder Stufenfunktion,sonderndurch eine nicht normierte,univariateGaußfunktionÝ �v¯�Þ¤ß�¨ w ¯ ¸ÅàY� mit derVarianzà Ç beschriebenwird (siehez.B. [CCG91, MACá 95, BFG95,BF95, KL98]). Die Aktivitätender â Zwischenschichtneuronensind bei diesemNetz-werk,dessenStrukturzusammenmit denBezeichnungenin Abbildung2.17dargestelltist,durch ã ßF� wa�v� ß ���7Ý �v¯�ޤߧ¨ w ¯ ¸ÅàY� úåä¿æèç��Q¨ ¯ Þ¤ßa¨ w ¯ Çé à Ç � (2.57)

gegeben.Þ¤ß x IRz umfaßtdie VerbindungsstärkendesDendritenbaumseinesZwischen-schichtneuronsê und wëx IRz die Aktivität der Eingabeneuronen.In neurobiologischerInterpretationspezifiziertÞ¤ß dasZentrumeinesisotropen,gaußförmigenrezeptivenFeldsderBreite à im Merkmalsraum,derdurchdieEingangsreizeaufgespanntwird [PG89]. Der

49

Page 58: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Abbildung2.17.:Schemavon RBF- und GRBF-Netzwerken.SolcheNetzwerkestellennachT. PoggioundF. Girosi [PG89] ModelledesCerebellumsdar(vgl. Abschnitt2.2.2). Dabeiwer-dendie Eingabeneuronenmit denMoosfasern,die Neuronenin derZwischenschichtmit denKörnerzellenund die Ausgabeneuronenmit denPurkinjezellenidentifiziert (vgl. Abbildung2.4und2.5). Die lateralenVerbindungenin derZwischenschichtrepräsentierendie feedback -Wechselwirkung derKörnerzellen.

Parametersatz� ß , der zur Spezifikationder Übertragungsfunktion(2.57) benötigtwird,enthältalso lediglich Þ¤ß und à . Die Netzwerkausgabe

�± � wa�v��� ergibt sich durcheineLi-nearkombinationder Aktivitäten

ã ß*� w§�v� ß � , die mit denVerbindungsstärken ± ß x IRì imAxonbaumderZwischenschichtneuronengewichtetsind,gemäß�± � wa�v����� íî ßO��� ± ß

ã ßF� w§�v� ß � ¦ (2.58)

DadieÜbertragungsfunktionen

ã ßF� w§�v� ß � derZwischenschichtneuronennach(2.57) um Þ¤ßzentrierte,radialsymmetrischeGaußfunktionenmit der Varianz à Ç sind und die Ausgabe(2.58) eineLinearkombinationdieserFunktionenist, wird ein Netzwerk,welchesdurch(2.57) und(2.58) beschriebenwird, auchalsradialesBasisfunktionen-NetzwerkoderkurzRBF-Netzwerkbezeichnet.

DasRBF-NetzwerkhatseinenUrsprungin denobenschonerwähntenUntersuchungenvonM. Powell zur Funktioneninterpolationmit radialenBasisfunktionen[Pow87]. T. PoggioundF. GirosistelltenerstmalsdieVerbindungzurNeurobiologieher[PG89, PG90b]. 1988schlugenJ.MoodyundC. DarkeneineModifikationdesRBF-Netzwerksvor [MD88], dieim folgendenalsgeneralisiertesRBF-NetzwerkoderGRBF-Netzwerkbezeichnetwird.

Beim GRBF-Netzwerkwerdendie radialsymmetrischenÜbertragungsfunktionen(2.57)durchdie normiertenZwischenschichtaktivitätenã ßF� wa�v�Tï��Â� Ý �v¯�ޤߧ¨ w ¯ ¸Åà��ð � w§�v� ï � (2.59)

50

Page 59: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.4. KünstlicheneuronaleNetze

Abbildung2.18.:Unnormierte und normierte Basisfunktionen.Dargestelltist dieFormvonvier Basisfunktionen( ñ Ôóò ) für eineneindimensionalenMerkmalsraum( Ó�Ôô× ). Obensinddie univariatenGaußfunktionenõèöV÷ ø ßaùûú ÷ýüOþ ÿ unduntendie normiertenBasisfunktionen� ß ö ú�� Ü ï ÿ dargestellt.Bei den � ß ö ú�� Ü ï ÿ handeltes sich nicht mehr um radialsymmetrischeFunktionen.Trotzdemsinddie � ß ö ú�� Ü ï ÿ in derRegelumdenPunkt ø ß starklokalisierteFunk-tionen.Wegen � ß � ß ö ú�� Ü ï ÿ�Ô�× wird der Merkmalsraumdurchdie � ß ö ú�� Ü ï ÿ partitioniert.Dieswird durchdie vier grauenBalkenangedeutet.

ersetzt,wobeidie normierendeFunktion

ð � wa�v�Tï��Â� íî ßQ��� Ý �v¯�ޤߧ¨ w ¯ ¸ÅàY� (2.60)

die Summealler univariatenGaußfunktionenist, die auchals Gesamtaktivitätder Zwi-schenschichtbezeichnetwird. Faßtman,wie in der Erläuterungzu Abbildung 2.17skiz-ziert, GRBF-Netzwerke alsModellefür dasCerebellumauf, dannmodelliertdie Normie-rungin (2.59) die lateralefeedback -WechselwirkungderKörnerzellen.Nach(2.59) enthältder zur Spezifikationder GRBF-ÜbertragungsfunktionnötigeParametersatz� ï alsodieDendritenbäumeÞ¤ß aller â Zwischenschichtneuronen,d.h. � ï � ­Fà�¸ ޤߤ¯ ê � �§¦�¦«¦ â ° .Abbildung2.18 illustriert an einemeindimensionalenBeispieldie GemeinsamkeitenundUnterschiedederÜbertragungsfunktionen(2.57) und(2.59). Manerkenntdort,daßsichdiedurchdieAktivitätsfunktionendefiniertenrezeptivenFelderderZwischenschichtneuronenbei dergegebenenWahl derGaußbreiteà in beidenFällenüberlappen.Die Neuronenko-operieren daherbeiderKodierungvonEingangsreizenw ausdenÜberlappungsbereichen.NebendieserGemeinsamkeit sind jedochvor allem die folgendenbeidenUnterschiedevon Bedeutung:(i) die Übertragungsfunktion(2.59) desGRBF-Netzwerksist keineum Þ¤ßradialsymmetrischeFunktionund (ii) die entsprechenden

ã ß � wa�v� ï � habenauf Grundder

51

Page 60: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Normierungmit (2.60) dieEigenschaftíî ßQ���ã ß � wa�v� ï �Â� � ¸ (2.61)

die besagt,daßjederEingangsreizw dieselbeeffektive Gesamtaktivität auf derZwischen-schichtinduziert.NachC. v. Malsburg [Mal73] undD. Dersch[Der95] kanneinederarti-geEigenschaftauchalsKonkurrenz derZwischenschichtneuronenum die KodierungderEingangsreizew aufgefaßtwerden.Ein solchesElementderKonkurrenzfehlt im einfachenFall desRBF-Modells.Hier ist die reizinduzierteAktivität einesNeuronslediglich durchdie Form desrezeptivenFelds,nicht jedoch,wie beimGRBF-Netzwerk,durchdenAkti-vitätszustandderübrigenNeuronengegeben.MathematischsindÜbertragungsfunktionen(2.59) wegen(2.61) alsoPartitionierungsfunktionen,diedenMerkmalsraumin â unscharfabgegrenzteGebieteaufteilen.

Die AusgabeeinesGRBF-Netzwerkswird analogzumRBF-NetzwerkwiederumdurchdieÜberlagerung �± � w§�v����������� íî ßQ��� ± ß

ã ß � wa�v� ï � (2.62)

der mit denVerbindungsstärken ± ß in denAxonbäumengewichtetenZwischenschichtak-tivitäten gebildet.Der Parametersatz� ����� , welcher ein GRBF-Netzwerkvollständigbeschreibt,setztsich alsoausdenParametern� ï � ­Fà͸ Þ¤ß�¯ ê � �§¦�¦«¦ â ° der Zwischen-schicht,d.h.denDendritenbäumenÞ¤ß unddergemeinsamenGaußbreiteà , unddenAxon-bäumen�� �� ­*± ߤ¯ ê � �§¦�¦�¦ â ° zusammen.

RBF- vs. GRBF-Netzwerk

Worin unterscheidetsichdie ArbeitsweiseeinesGRBF-Netzwerksvon einemRBF-Netz-werk?An Handvon Abbildung2.19lassensichdie beidenAnsätze(2.58) und(2.62) zurFunktionenapproximationgut vergleichen.In beidenFällenwurdenidentischeDendriten-bäume�¿ß undAxonbäume

� ß gewählt,die nicht durcheinenLernalgorithmussondernausderKenntnisderzu approximierendenFunktion

� �Ð{ � bestimmtwurden.In derAbbildungist dieFunktionenapproximationfür eineGaußbreiteà vonjeweils

� ¦ �²é (blau)und� ¦9� (rot)

dargestellt.

Aus demBeispielwird deutlich,daßbeideModelle bei hinreichendstarker Kooperativi-tät derZwischenschichtneuronen(großeGaußbreiteà ) glatteFunktionenapproximationen(roteLinien) liefern können.Eszeigtferner, daßdie ApproximationeinerFunktiondurcheinGRBF-NetzwerkbeiabnehmenderKooperationundzunehmenderKonkurrenz(abneh-mendesà ) auf GrundderzunehmendschärferenPartitionierungdesEingaberaumsimmermehr zu einer Stufenfunktionübergeht. Bei verschwindendemà entsprichtdasGRBF-NetzwerkdahereinerDiskretisierungderFunktiondurcheineTabelle.Die Qualitäteiner

52

Page 61: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.4. KünstlicheneuronaleNetze

Abbildung2.19.:Funktionenapproximation durch ein RBF- und GRBF-Netzwerk.FürdenVergleichderbeidenNetzwerke wurdendie ParameterausderanalytischenKenntisderzuap-proximierendenFunktion �.ö Ú ÿ (gestrichelteLinie) bestimmt.Die Gaußzentren� ß der ñ Ô ×vÛZwischenschichtneuronen sind äquidistantim Intervall � ù Û����¤üv×������ verteilt. Die Verbindungs-stärken � ß ergebensich durchdenWert � ß Ô��.ö�� ß ÿ der zu approximierendenFunktion �.ö Ú ÿamOrt Ú Ô�� ß . Die rotenKurvenzeigendieAproximationenfür eineGaußbreitevon þHÔ¬Û��½× ,unddie blauenKurven für þ Ô7Û���ÛFÕ . Zusätzlichsindnochdie Aktivitäten(2.57) bzw. (2.59)derZwischenschichtneuronen eingetragen.

solchenApproximationkannbei einerausreichendgroßenZahl â von Zwischenschicht-neuronenbeliebiggesteigertwerden.Bei à � �

werdendie Stufenzunehmendgeglättet.Andersverhält sich dasRBF-Netzwerkbei verschwindendemà . In diesemrein koope-rativen Netzwerkwerdendie Übertragungsfunktionen(2.57) bei verschiedenerKoopera-tivität zu stark um Þ¤ß lokalisiertenFunktionen,so daßdasRBF-Netzwerknur noch fürw�� Þ¤ß einekorrekteAusgabeliefert. Im GegensatzzumreinkooperativenRBF-Netzwerkbleibt alsodaskooperativ-kompetitive GRBF-Netzwerkauchim Grenzfall (kleine à ) ge-neralisierungsfähig.Der hier angesprocheneVorteil von Modellen,die KooperationundKompetitionin sichvereinen,gegenüberreinkooperativenModellen,wird beidervonmirvorgestelltenEntwicklungeinerallgemeinenArchitektur von Systemenlokaler Expertenin Kapitel 4 nochvon entscheidenderBedeutungsein.

Die Zwisc hensc hic htneur onen als lokale Merkmalsdetektoren

Ein großerVorteil desGRBF-Netzwerksist – im Gegensatzzudenmulti layer-Perzeptron-en– dieguteInterpretierbarkeit derParametersätze� ������ , diediespeziellenEigenschaf-tendieserNetzwerke festlegen.DieseEigenschaftensindzumeinendurchdieAusgabeak-

53

Page 62: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

tivitätender Zwischenschichtneuronen,die von denVerbindungsstärken Þ¤ß und der Aus-dehnungà bestimmtwerden,und zum anderendurch die Verbindungsstärken ± ß in denAxonbäumenzur Ausgabeschichtcharakterisiert.Die Verbindungsstärken Þ¤ß legenproto-typischePunkteim MerkmalsraumIRz fest, an welchendie Verbindungsstärken ± ß “an-geheftet”sind.Durchdie – abhängigvon à – mehroderminderglattenPartitionierungs-funktionen(2.59) wird für jedesZwischenschichtneuronim Merkmalsraumein Bereichdefiniert,auf dendasNeuronbesondersempfindlichreagiert,d.h.eineEingabew ausei-nemsolchenBereichführt zu einerAusgabeaktivität

ã ß � wa�v� ï � desNeuronsê naheEinsund daherfür kleines à zu einerNetzwerkausgabe

�± � wa�v� ����� � � ± ß . Für größereWer-te desKooperationsparametersà findet dagegeneineInterpolationder Funktionswerte± ßgemäß(2.62) statt.Man sprichtdaherbei denZwischenschichtneuronenauchvon loka-len Merkmalsdetektoren, dadiesenur auf Merkmalskombinationenw ansprechen,die auseinerunscharfbegrenztenUmgebungdesprototypischenPunktsÞ¤ß stammen.

DieseEigenschaftmodelliertdie Beobachtung,daßviele Nervenzellender sensorischenCorticesnur für bestimmteMerkmalskombinationenempfindlichsind.Zum BeispielsinddieNervenzellenim somato-sensorischenCortex aufbestimmteBereichederKörperober-flächespezialisiertundreagierennuraufdortörtlich lokalisierteReize[EKS94]. Eineähn-liche Beobachtungmachtmanim visuellenCortex. Hier findensichNervenzellen,die se-lektiv auf Signalevon der Retinareagieren,die von einerObjektorientierungmit einembestimmtenWinkel herrühren[Hub90]. In beidenFällenwird die Selektivität derReizant-wortcharakteristikder NervenzellenergänztdurcheineKooperationvieler Zellen bei derKodierungeinesgegebenenEingangsreizes,die ausderÜberlagerungderzugehörigenre-zeptivenFelderherrühren(für eineeingehendeDiskussionderresultierendenPopulations-kodierungsiehe[HKRT94]). DiesebeidenBeispieleverdeutlichenferner, daßmaneinerNervenzellehäufigsowohl einephysikalischePosition,alsodiegeometrischeLageim Ge-hirn, wie aucheinevirtuelle Positionim Eingaberaumzuordnenkann[TGK90].

In derobigenDiskussionwurdedie FragederParameterbestimmungnicht berücksichtigt.T. Poggiound F. Girosi untersuchtenfür dasRBF-Netzwerkein Regressionsverfahren,welchesdurcheinenGradientenabstieg aufderFehlerfuntion(2.5) alleNetzwerkparametergleichzeitigoptimiert [PG89]. Auf Grundder langsamenKonvergenzunddersuboptima-len ResultatediesesVerfahrens(siehe[Ado92] für eineeingehendeDiskussion)schlugenJ. Moody und C. Darken für die ParameterschätzungdesGRBF-Netzwerksein heuristi-schesdreistufigesVorgehenvor [MD89], für welcheskeinglobalesOptimierungskriteriumangegebenwerdenkann.Die (i) Zentren Þ¤ß werdendurchAnwendungdesk-meansclu-sterings [Llo82] und (ii) die Gaußbreiteà durcheineHeurisitk bestimmt.Anschließendwerden(iii) die Axonbäume± ß mit Hilfe der Delta-Lernregel (2.55) berechnet.Wie imfolgendenAbschnitt gezeigtwird, können(i) und (ii) durchein anderes,besserbegrün-detesVerfahrenersetztund in einemgemeinsamenOptimierungsschrittzusammengefaßtwerden.

54

Page 63: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2.4. KünstlicheneuronaleNetze

Das GRBF-Netzwerk und ML-Dic htesc hätzung

VergleichtmannämlichdieZwichenschichtaktivität (2.59) desGRBF-Netzwerksmit deraposteriori-Wahrscheinlichkeit (2.42) beiderDichteschätzungmit einerMischungmultiva-riaterNormalverteilungen,sofällt auf,daßdiesebeidenAusdrücke im Fall gleichgewich-teterunivariaterNormalverteilungenidentischerVarianz( !�ß � �#" â und $&% �ß �('�à %!Ç )übereinstimmen,d.h. ! �Ðê�¯ w¸¿� ï �)� ã ßF� w§�v� ï � ¦ (2.63)

Bis auf denNormierungsfaktor entsprichtauchdie unnormierteAktivität Ý �v¯�Þ¤ß ¨ w ¯ ¸ÅàY�in Gleichung(2.59) derKomponente(2.36) derMischungsdichtefür denunivariatenFall.Ebensogleicht– bisaufeinenFaktor– dieGesamtaktivität

ð � wa�v� ï � derMischungsdichte(2.35). Die ZwischenschichteinesGRBF-Netzwerkskann dahereiner ML-Dichteschät-zungderEingabedaten� mit einerMischungunivariaterNormalverteilungenzugeordnetwerden.In Abschnitt2.3.3wurdefestgestellt,daßalle Parameter� ï einersolchenSchät-zung mit dem univar-Algorithmus (modifiziertesRGF-clustering, vgl. Abschnitt 2.3.2)zuverlässigbestimmtwerdenkönnen.Es bietetsichdaheran die DendritenbäumeÞ¤ß derZwischenschichtneuronenmit Hilfe desin (2.19) und(2.20) definiertensequentiellenAlgo-rithmusunddie Gaußbreitenà durchdie Maximierungder log-likelihood zu berechnen.Dannwerdendie Aktivitäten

ã ß � wa�v� ï � zu a posteriori-Wahrscheinlichkeiten ! �-ê ¯ w§¸¿� ï �einerML-Dichteschätzungmit einerMischungunivariaterNormalverteilungen.

Training der Verbindungsstärken ± ßIn Abschnitt2.4.1habenwird festgestellt,daßdie Delta-Regel (2.55) zwar zu einerMini-mierungdesFehlermaßes(2.54) führt, aberwegenihrer nichtlokalenStrukturbiologischnicht plausibelist. U. Adolphsschlugdahererstmalsvor, die Verbindungsstärken ± ß desAxonbaumsin einemGRBF-Netzwerkmit einerentsprechendmodifiziertenoutstar-Regel(2.56) zutrainieren[Ado92]. DieseLernregel,diebeiKlassifikationsaufgabenausdemBe-reichderSpracherkennungzugutenErgebnissengeführthat[Alb95, Gro95], wird auchindieserArbeit für dasTrainingder ± ß verwendet.SiehatnundieFormÏ ± ß � ã ßF� w.·1�v� ï � � ¹%· ¨ ± ß �v¸ ê � �§¦�¦�¦ â ¦ (2.64)

Abbildung2.20zeigtdie ApproximationderDatenausAbbildung2.6durchdasobenbe-schriebeneGRBF-Netzwerk.Dabeiwurdenfür die Bestimmungvon � ï die Eingabedaten� zunächsteinemclustering mit demunivar-Algorithmusunterzogen.DieserwurdeamMaximumderlog-likelihoodbeendet.AnschließendwurdendieVerbindungsstärken ± ß mitdersequentiellenoutstar-Regel (2.56) berechnet.Esist zu erkennen,wie die Approxima-tion für einehoheDichte an Datenpunktenrelativ gut ist, aberfür Bereichemit wenigenMerkmalsdetektoren( {+* � ¦-, ) versagt.Anderseitswird der konstanteFunktionsbereich( {/. �

) sehrgut angenähert.

55

Page 64: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

2. Gehirn,DatenanalyseundneuronaleNetzwerke

Abbildung2.20.:Funktionenapproximation mit einemGRBF-Netzwerk. Ein GRBF-Netz-werk mit ñ Ô ×vÛ Zwischenschichtneuronen wurdemit demDatensatz0 ausAbbildung2.6trainiert. Die durchgezogeneLinie ist die Approximation 1�.ö Ú2� Ü ������ ÿ durch das GRBF-Netzwerkund die gestrichelteLinie die dem Datensatzzu GrundeliegendeFunktion. DieKreuzegebendieLagederMerkmalsdetektoren� ß (horizontalePosition)undderVerbindungs-stärken � ß (vertikalePosition)wieder. Die AchsenlängederKreuzeentsprichtþ . Untensindzusätzlichdie Zwischenschichtaktivitäten � ß ö Ú2� Ü ï ÿ eingezeichnet.

Fazit

Zusammenfassendsei festgehalten,daßdie in unsererArbeitsgruppeentwickelte Kom-bination [Ado92, Der95, KT97, ABK á 99] desunivar-Verfahrensmit der outstar-Regel(2.64) ein Verfahrenzur Parameterschätzungvon GRBF-Netzwerken darstellt,dassicherkonvergiert und qualitativ akzeptableFunktionenapproximationenliefert, für dasjedochein FehlerfunktionalalsglobalesOptimierungskriteriumfehlt. Entsprechendgabesbis zumeinerArbeit keinstabilesLernverfahrenzurgleichzeitigenBestimmungallerParameter.

56

Page 65: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke ,Dichtesc hätzung undFunktionenappr oximation

Im letztenKapitel wurdenverschiedeneVerfahrenzur Funktionenapproximationvorge-stellt. Wie wir gesehenhaben,beruhenklassischeVerfahren,wie die Regression,auf derMinimierungeinesvorgegebenenFehlermaßes.DagegenwerdendieParametervonkünst-lichenneuronalenNetzen,dieebenfallsderFunktionenapproximationdienen,gelegentlich,wie im Falle desdiskutiertenGRBF-Netzwerks,vermittelssequentiellerLernregeln be-stimmt,derenOptimierungszielnicht immervollständigbekanntist. NebendiesenbeidenMöglichkeitenist aberaucheineFunktionenapproximation�± � wa�v���)�43

IR5 ¹�6 � ¹ ¯ w§¸¿���87²¹ (3.1)

auf GrundlageeinerSchätzungder bedingtenWahrscheinlichkeitsdichte

�6 � ¹ ¯ w§¸¿��� denk-bar. Bei diesemVorgehenwird für ein vorgegebenesw der Erwartungswertvon ¹ be-rechnet.Mit dem BayesschenSatz

�6 � ¹ ¯ w§¸¿��� � �6 � w§¸�¹ ¯ ��� " �6 � w ¯ ��� und mit

�6 � w ¯ �Æ� �9 �6 � w¸�¹ ¯ ���87²¹ kannfür (3.1) auch�± � wa�v���Â� 9IR5 ¹ �6 � w§¸�¹ ¯ ���87²¹9IR5 �6 � w§¸�¹ ¯ ���87²¹ (3.2)

geschriebenwerden.Für eineFunktionenapproximationnach(3.2) ist alsoeineSchätzung�6 � w§¸�¹ ¯ �Æ� derzumTrainingsdatensatzµ �ó­ � ¸;: ° � ­ � w%·�¸�¹%· � ¯gº � �§¦�¦�¦V» ° gehörigenVerbundwahrscheinlichkeitsdichte6 � w§¸V¹a� notwendig.

Nach Abschnitt 2.3.3 bietendazuMischungenmultivariater NormalverteilungeneinenmöglichenModellansatz,für denzudemmit demvonM. Kloppenburg undP. Tavanvorge-schlagenenEM-Abkühlverfahrenein sicherkonvergierenderWeg zur Parameteroptimier-ungim SinnederMaximierungder likelihoodvorliegt.

57

Page 66: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

Esist dasZiel diesesAbschnitts,< diesenAnsatznäherzuerkundenund< seineBeziehungzuGRBF-Netzwerkenaufzuklären.

Die zweite Fragestellungliegt nachden Ergebnissenvon Abschnitt 2.4.2 nahe,da dortgezeigtwurde,daßdie Parameter� ï derZwischenschichteinesGRBF-Netzwerksvermit-telseinerML-SchätzungderDichte 6 � w�� derEingabedatenbestimmtwerdenkönnenunddaßdie Funktion (2.60) zur Berechnungder Gesamtaktivität bis auf konstanteFaktorenalsML-Mischungsdichte

�6 � wa�Å� ï � univariaterNormalverteilungenaufgefaßtwerdenkann.AllerdingsfordertderAnsatz(3.2) statteinerSchätzungvon 6 � w�� eineSchätzungderVer-bunddichte6 � w§¸�¹§� . Esstellt sichdamitdie Frage,ob undgegebenenfalls wie dasGRBF-NetzwerkausAbbildung 2.17 erweitertwerdenkann, damit allen freien Parametern�einerzugehörigenML-MischungsdichteausmultivariatenNormalverteilungen

�6 � w§¸�¹ ¯ ���einNetzwerkkorrelatzugeordnetwerdenkann.

Eine solcheZuordnungist dabeivor allem deshalbvon Interesse,weil eine Abbildungzunächstrein mathematischmotivierterKonzepteauf neurobiologischeModellvorstellun-generfahrungsgemäßwichtige Anregungenzur LösungschwierigeralgorithmischerFra-gestellungenliefernkann(siehez.B. [Der95, ABK á 99]). Darüberhinauskanneinederarti-geneurobiologischeInterpretationmöglicherweiseauchzumVerständnisderHirnfunktionbeitragen.

Im vorliegendenFall erhebtsichbeispielsweisedieweitereFrage,obundwie daserwähnteEM-Abkühlverfahrenzur ML-DichteschätzungalssequentiellerstochastischerLernalgo-rithmus,d.h. als neurobiologischplausibles“Lernen ausBeispielen” formuliert werdenkann.SolcheAlgorithmenhabendenVorteil sich auchfür adaptiveson-line Lernenzueignen.Esseidabeidaranerinnert,daßdasEM-Abkühlverfahrennach(2.37), (2.47) und(2.48) zunächstvermittelsstatistischerErwartungswerteformuliertwordenist.

Bevor im folgendenderin Gleichung(3.2) formulierteAnsatzzurFunktionenapproximati-onnäheruntersuchtwird, soll zunächstdieFrageuntersuchtwerden,in welcherBeziehung(3.2) zueinemGRBF-Netzwerksteht.

3.1. Erweiterung des GRBF-Netzwerks

In Abschnitt 2.4.2wurde festgestellt,daßein Teil der Parameterdesin Abbildung 2.17schematischdargestelltenGRBF-Netzwerkszur Funktionenapproximationvermittelsdeszumunivar-VerfahrenerweitertenRGF-clusteringsfestgelegt werdenkann.Eswarendiesdie Zentren Þ¤ß und die Breiten à der rezeptivenFelderder Zwischenschichtneuronenê ,währendfür dieAxonbäume± ß dieserNeuronen,welchedieübrigenParameteraus� ����2�umfassen,eineseparateLernregel (2.64) verwendetwurde.Vergleichtmannundie lokale

58

Page 67: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.1. ErweiterungdesGRBF-Netzwerks

Abbildung3.1.:SchemaeinesGRBF-Netzwerksmit Rückwärtsverbindungen =?>ß .Lernregel (2.64) für die ± ß mit derRGF-clusteringLernregel (2.20) für die Þ¤ß , so fällt dieformaleÄhnlichkeit dieserbeidenkompetitiven HebbschenRegeln sofort auf. In beidenFällenist derHebbscheWachstumstermdasKorrelationsproduktderZwischenschichtak-tivität

ã ß mit denAktivitäten w bzw. ¹ der prä- bzw. postsynaptischenNeuronen.Auchdie wachstumsbegrenzendenTerme ¨ ã ß¿Þ¤ß und ¨ ã ß ± ß habendie gleicheForm undumfas-senlediglich lokale,amNeuronê verfügbareGrößen.DerwesentlicheUnterschiedbestehtdarin,daßbeimTrainingdesfeedforward NetzesausAbbildung2.17in dieAktivierung

ã ßdesZwischenschichtneuronsê lediglich der Eingangsreizw%· nicht jedochdie zugehörigeSollausgabe¹%· ausdemBeispielsdatenpaar@ ·A� � w%·�¸�¹%·*�0x µ (3.3)

eingeht,sodaßdie Sollausgabenach(2.64) beim AxonwachstumkeinenEinfluß auf denpräsynaptischenTeil

ã ß desHebbschenKorrelationsproduktshat.

Im Gegensatzzu dieserModellarchitekturkönnenim Falle desCerebellumsdie Übertra-gungseigenschaftenderAxonederKörnerzellenzudenPrukinjezellenvermittelsderKlet-terfasernpräsynaptisch(bzgl.derdieAusgabekodierendenPurkinjezellen)durchVorgabeeiner Sollausgabemoduliert werden(vgl. Abschnitt 2.2). Zur ErfassungdiesesBefundsmußdaherdie feedforward ArchitekturdesGRBF-Modellserweitertwerden.Dieskann,wie in Abbildung3.1 dargestelltist, durchEinführungrückwärtigerVerbindungen± >ß vondenAusgabeneuronenzur Zwischenschicht,d.h. durchErweiterungder DendritenbäumeÞ¤ß x IRz zuDendritenbäumenB ß � �ÐÞ¤ß ¸v± >ß �0x IRzDC IRì (3.4)

geschehen.WährendderTrainingsphasefungierendieAusgabeneuronendamitalszusätz-liche Eingabeneuronenund die Zwischenschichtaktivitäten

ã ß werdenzu FunktionendesEingangsreizesw%· und derSollausgabe¹%· , d.h.ã ß � ã ßF� @ ·¤�v����� ã ß*� w%·�¸V¹%·1�v���Ÿ (3.5)

59

Page 68: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

wobei � die Mengeder Netzwerkparameterist. Verwendetmannun für denerweitertenDendritenbaumdie bisherigeclusteringLernregel,sohatsiedie FormÏ Þ¤ß � ã ß*� w%·*¸�¹%·1�Å�Æ� � w%· ¨[Þ¤ß �FEHG (3.6)

und Ï ± >ß � ã ß � w%·�¸�¹%·��v��� � ¹%· ¨ ± >ß �FEIG > (3.7)

undkannunterVerwendungderDefinitionen(3.3) und(3.4) sowie mit JG4� � G ¸?G > � auchzu Ï B ß � ã ßF� @ ·��v��� � @ · ¨ B ß �FE JG (3.8)

zusammengefaßtwerden.Die Lernregel (2.64) für dieAxonbäumehatnundie FormÏ ± ß � ã ßF� w.·¤¸�¹%·��v��� � ¹.· ¨ ± ß � (3.9)

und ist mit der Lernregel (3.7) für die Rückwärtsverbindungenbis auf denRauschtermidentisch.Fallsfür diesenTerm ÃKG > È � �

gilt, dannkonvergierendiesynaptischenGewichte� |Qß zudenselbenWertenwie die� >ß-| , d.h.esgilt amEndedesLernprozesses� |Qß � � >ß| LM�N ¦ ± ß �å± >ß ¦ (3.10)

Die durch(3.10) ausgedrückteSymmetriederreziprokenVerschaltungzwischenAusgabe-undZwischenschichtist dabeiunabängigvon derspeziellenWahl derÜbertragungsfunk-tion

ã ß*� @ �v���O� ã ß � w§¸V¹��Å�Æ� derZwischenschichtneuronenê .Wählt man jedochfür dieseFunktionenanalogzu (2.59) und (2.60) die Partitionsfunk-tionen ã ßF� @ � J�TïÅ��� Ý �¿¯ @ ¨ B ߤ¯ ¸ÅàY�ð � @ � J� ï � (3.11)

mit dernormierendenGesamtaktivitätð � @ � J�Tï��Â� íî ßQ��� Ý �¿¯@ ¨ B ß1¯ ¸ÅàY�v¸ (3.12)

so resultiertdie stochastischeIterationder Lernregel (3.8) in einemRGF-clustering desTrainingsdatensatzesµ � ­ @ ·P� � w%·�¸�¹%·F� ¯gº � �§¦�¦«¦Å» ° durch das Kodebuch JQR �­ B ߤ¯ ê � �§¦�¦�¦ ⶰ . Wie in Abschnitt 2.4.2 erklärt wurde,maximiert dieserLernprozeßfür jedesà die likelihood, daßderDatensatzµ von derModelldichte�6 � @ ¯ J� ï �Â� �âÄ�TS éVU àY� z á ì ð �

@ � J� ï � (3.13)

60

Page 69: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.1. ErweiterungdesGRBF-Netzwerks

erzeugtwurde,wobeiderParametersatzJ� ï dasstationäreKodebuch JWXR unddieGaußbreiteà umfaßt.Wie dort ebenfalls erläutertwurde,erlaubtdasAbkühlendesTemperaturpara-meters à im univar-Verfahrendie BestimmungjenesParametersatzesY� ï � ­ JWXR[Z ¸Åà ° ,welcherdie likelihood maximiert,daßµ voneinersolchenMischungsdichteausunivaria-tenNormalverteilungenmit identischenstatistischenGewichten !�ß � �#" â undVarianzenà ß �åà erzeugtwurde.

BeachtetmannunnochdieSymmetriebeziehung(3.10) sokönnendie folgendenResultatefestgehaltenwerden:< Auf GrundderEinführungreziproker Verbindungenkönnenalle Netzwerkparame-

ter � ����� � ­ Y� ï ¸v± ߤ¯ ê � �§¦�¦�¦ â ° in einemgemeinsamenLernprozeßaus µ ex-trahiertwerden.SeparateTrainingsprozessefür die Þ¤ß und ± ß sowie heuristischePro-zedurenzurBestimmungderGaußbreiten,wie sieim ursprünglichenGRBF-ModellvonJ.Moody undC. Darkenvorgesehenwaren[MD88, MD89], entfallendamit.< Die Funktion

ð � @ � Y� ï � , die zur ErfassungdernormierendenGesamtaktivität auf derZwischenschichtdesGRBF-NetzwerkswährenddesLernprozesseseingeführtwur-de,hatnuneineneuestatistischeBedeutung.Nach(3.13) stellt siebis auf konstanteFaktoreneine ML-Schätzungder Verbundwahrscheinlichkeitsdichte

�6 � w§¸�¹ ¯\Y� ï � ��6 � @ ¯\Y� ï � derTrainingsdatenµ dar. Wie schonmehrfachdargelegt wurde,hattenwirdagegen im ursprünglichenModell ausAbbildung 2.17 eineAktivierungsfunktionð � w§�v� ï � verwendet,welche bis auf einen konstantenFaktor lediglich eine ML-SchätzungderVerteilungderEingabedaten� darstellte.< Damitist nunaucheineinheitlichesOptimierungskriteriumfür alleGRBF-Parameterformuliert.

Mit diesenResultatenist eine ersteAntwort auf die zweite Eingangsfragestellungnachder BeziehungzwischenGRBF-Netzwerken und Funktionenapproximationen(3.2) ausSchätzungen

�6 � w§¸�¹ ¯\Y� ï � der Verbunddichte6 � w§¸�¹§� gegeben.Denn es hat sich gezeigt,daßalle ParametereinersolchenFunktionenaproximationauseinemLernprozeßfür einGRBF-Netzwerk,dasum rückwärtigeVerbindungenerweitertwurde,abgeleitetwerdenkönnen.Allerdings handeltessich dabeibislangum ein Modell, bei dem 6 � w¸�¹§� durcheineMischungunivariater Normalverteilungenmit identischenGewichtenundVarianzenapproximiertwird. Wegen der größerenFlexibilität von Mischungsdichtenausmultiva-riaten KomponentenwärenjedochderartigeModellevorzuziehen,insbesonderewennsieauchnochdurchadaptiveson-line Lernenerzeugtwerdenkönnen.

Wendenwir unsdaherderAnschlußfragezu, die auf eineFormulierungdesEM-Abkühl-verfahrensfür eineMischungmultivariaterNormalverteilungenalssequentiellemAlgorith-muszielt. Für dieseDiskussionkannunterVerwendungder Definitionen(3.3) und (3.4)die Notationvereinfachtund stattder ML-SchätzungeinergemeinsamenDichte 6 � w§¸�¹§�mit � w§¸V¹a�0x IRz C IRì dieSchätzungeinerDichte 6 � @ � mit

@ x IRz á ì diskutiertwerden.

61

Page 70: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

Damit reduziertsich dasProblemformal auf die in Abschnitt 2.3.3 im Detail erläuterteFragederML-SchätzungeinerunbekanntenDichte 6 � w�� mit einerdurch(2.35) und(2.36)gegebenenMischungaus â multivariatenNormalverteilungen.

Esseiangemerkt,daßeinsolchermultivariaterAnsatzauchfür dieWahlderÜbertragungs-funktionderZwischenschichtneuronenim ursprünglichenNetzwerkmodellausAbbildung2.17gewählt werdenkann.DasresultierendemultivariateGRBF-Netzwerkist danneineVerallgemeinerungdesunivariatenGRBF-Netzwerks(2.62), diesichvondiesemlediglichin derWahl derÜbertragungsfunktionderZwischenschichtneuronenunterscheidet.DieseFunktion

ã ßF� wa�v� í � desmultivariatenGRBF-Netzwerksist analogzum Ausdruck(2.59)für dieÜbertragungsfunktionim univariatenFall aufgebautundist durchã ßF� wa�v� í ��� !�ß �6 � w ¯ ê ¸¿�^]�_�`ß �� ßba !�ßba �6 � w ¯ ê > ¸v� ]�_�`ß a � (3.14)

gegeben.DerUnterschiedbestehtin derWahlvonmultivariatenVerteilungen

�6 � w ¯ ê ¸v� ]�_�`ß �nach(2.36), derenKovarianzmatrizen$�ß und statistischenGewichte !�ß für jedesZwi-schenschichtneuronverschiedengewählt werdenkönnen.Ein Vergleich mit (2.42) zeigt,daßdieAktivierungsfunktionendesmultivariatenGRBF-Netzwerksgeradediea posterio-ri -Wahrscheinlichkeiten ! �Ðê�¯ w§¸¿� í � sind,d.h.esgiltã ßF� w§�v� í ��� ! �Ðê�¯ w§¸¿� í � ¦ (3.15)

Fernerist in dieserFormulierungdie normierendeGesamtaktivitätð � w§�v� í � mit derML-

Modelldichte(2.35) identisch,d.h.ð � wa�Å� í �Â� �6 � w ¯ � í � ¦ (3.16)

Zur FormulierungeinessequentiellenAlgorithmusfür dasEM-Abkühlverfahrenwerdenwir unszunächstandiesemKozepteinesmultivariatenGRBF-Netzwerksorientierenundes dazuverwenden,den Parametern� í der ML-Dichteschätzung

�6 � w ¯ � í � Netzwerk-korrelatezuzuordnen.DieseZuordnungwird ausder Hoffnunggespeist,daßeinesolcheneuronaleInterpretationHinweiseaufdiezuwählendenLernalgorithmenliefernkann.

3.2. Lernreg eln für das multiv ariate GRBF-Netzwerk

Am EndedesAbschnitts2.3.3wurdedargestellt,wie M. Kloppenburg undP. Tavanmit ei-nemmaximumlikelihood-Ansatzzur BestimmungderParameter� í ��­ Þ¤ß ¸Åà � ß ¸ �'� ß ¸ !�ߤ¯� � �§¦�¦�¦ ~ ¸ ê � �§¦�¦�¦ ⶰ zu einemEM-Algorithmuskommen,derdurchdie AnwendungeinesdeterministischenAbkühlverfahrensauchsicherkonvergiert [KT97]. DasZiel die-sesAbschnittsist die Entwicklungbiologischplausibler, sequentiellerLernregeln für einmultivariatesGRBF-Netzwerkmit denAktivitäten(3.14).

62

Page 71: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.2. Lernregelnfür dasmultivariateGRBF-Netzwerk

Lernreg eln für die Þ¤ßFür die DendritenbäumeÞ¤ß ist die Antwort auf dieseFrageoffensichtlich.Ersetztmaninder Lernregel (2.20) für dasRGF-clustering die Zuordnungsfunktion! �-ê ¯ w§¸ Q ¸ÅàY� durchdie Aktivierungsfunktionaus(3.14), so ist einegeeigneteLernregel definiert.Dennmankannsichleichtdavonüberzeugen,daßdiestationärenPunktediesersequentiellenLernre-gelundderFixpunktiteration(2.37) identischsind.DaherfehlenlediglichnochLernregelnderForm � Îdcfe� ß � �hgji k� ß EHl\m Ï �'� ßF� w%·*� (3.17)à Çdn Îdcfe� ß � à Çdn gji k� ß EHl R Ï à Ç� ß � w%·*� (3.18)! Îdcfeß � ! gji kß EIl ] Ï !�ß � w%·F� (3.19)

für die Eigenvektoren�'� ß , die Eigenwerteà Ç� ß und die statistischenGewichte !�ß , welchedie Gleichungen(2.44)-(2.46)derEM-Fixpunktiterationersetzenkönnen.

Zur AbleitungsolcherRegelnwollen wir zunächstversuchen,die Parameterdesmultiva-riatenGRBF-Netzwerksneurobiologischzu interpretieren.Analog zur InterpretationderunivariatenGaußfunktionin (2.59) alsFormfunktioneinesrezeptivenFeldeseinesNeuronsauf der Zwischenschicht,kannauchder Ausdruck(2.36) für die multivariateNormalver-teilung

�6 � w ¯ ê ¸¿� ]�_�`ß � alsderartigeFormfunktiongedeutetwerden.Die AusrichtungeinessolchenrezeptivenFeldesist durchdenSatzorthonormalerVektoren�'� ß , � � �§¦�¦«¦ ~ , de-finiert, derdie lokaleKovarianzmatrix$ ß diagonalisiert.Werdendie Parameter­ Þ¤ß ¸ �'� ß�°zu o«� ß zusammengefaßt,sokanndiemultivariateNormalverteilung(2.36) auchalsProduktdereindimensionalenNormalverteilungen�6 �qp«� ß � wa� o«� ß ���Â� ä�æ!çsr ¨Ap Ç� ß �V� wa� o«� ß � " éut� éuU à Ç� ß � �fv Ç (3.20)

geschriebenwerden,wobeidie Argumentep�� ßF� w§� o«� ß � durchp«� ß � wa� o«� ß �)�7à % �� ß �xw� ß � w ¨ Þ¤ß � (3.21)

gegebensind.Dies ist die ProjektionderDif ferenzzwischendemDatenpunktw unddemZentrum Þ¤ß einesrezeptivenFeldesauf denVektor à % �� ß �H� ß x IRz . DerartigeProjektionenvon Eingabevektorenauf festeRichtungen�'� ß werdenin der Neuroinformatiküblicher-weisealsMerkmalsextraktionenbezeichnet.EntsprechendbeschreibtjederdieserVektor-eneinenMerkmalsdetektor, dessenRichtungim Merkmalsraumdurch �'� ß unddessenGe-wichtungdurch à % �� ß gegebensind.

Lernreg el für die Orientierung en �'� ßIn denletztenJahrenwar die Erforschungvon Lernregeln für die SelbstorganisationvonMerkmalsdetektorenein wichtigesThemain derNeuroinformatik[HSW89]. 1988wurde

63

Page 72: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

beispielsweisevonJ.RubnerundP. Tavandazuein zweischichtigesNetzwerkvorgeschla-gen [RT89]. Die Gewichte �H� , � � �§¦�¦�¦ ~ , zwischenEin- und AusgabeschichtdiesesNetzwerkswerdenmit einerHebbschenLernregel trainiert,wohingegenzusätzlichelate-raleVerbindungenzwischendenNeuronenderAusgabeschichtmit eineranti-HebbschenLernregelgelerntwerden.DiesesNetzwerkführt einePCAderVerteilungderEingangsda-ten � aus.Die AktivitätenderAusgabeneuronenwerdendabeistatistischdekorreliert,dieGewichte �'� x IRz konvergierenzudenEigenvektorenderKovarianzmatrixderEingangs-datenunddieGewichtederlateralenVerbindungenverschwinden.DerEigenvektor � � , derzumgrößtenEigenwertà Ç� gehört,wird alserstesberechnet,gefolgtvon derorthogonalenMengeder restlichenEigenvektorenin der Reihenfolgeder entsprechendenEigenwerte.Mit diesemModell ist esmöglich,psycho-physiologischeBefundederFarbwahrnehmungwie auchStrukturenderrezeptivenFeldervonMerkmalsdetektorenim visuellenKortex zuerklären[Rub89, RS90].

Eserscheintdahersinnvoll, die Lernregeln diesesModells auf die SelbstorganisationderOrientierungen�'� ß derMerkmalsdetektoren(3.20) zu übertragen.AllerdingssindAnpas-sungennotwendig,da es sich nun nicht um eine globalePCA handelt,sondernum dieAnalyseder Richtungenw ¨ Þ¤ß durcheinenlokalenDetektor. Zusätzlichwerdendie la-teralenVerbindungen,welchezu einerOrthogonalisierungder �'� ß führen,vernachlässigtunddurchdasSchmidtscheOrtonormierungsverfahrenersetzt[Fis86], dasichdadurchdietechnischeUmsetzungdeutlicheinfachergestaltet.Eine geeignetesequentiellestochasti-scheLernregel ist dannÏ �'� ß � w%·F�Â� ã ß*� w.·¤�v� í � p«� ßF� w%·¤� o«� ß � � w%· ¨[Þ¤ß � " à � ß ¸ (3.22)

wobei jedemLernschritteine Orthonormierungder �'� ß folgt. (3.22) ist eine HebbscheLernregel, wenndasProdukt

ã ßF� w%·��v� í � p«� ß � w%·¤� o«� ß � " à � ß mit derpostsynaptischenAktivi-tät einesNeurons �Ðê ¸ � � assoziiertwird unddie Komponentenvon w%· ¨jÞ¤ß alsdie Aktivi-tätenvon ~ präsynaptischenNeuronenverstandenwerden.Durch die Renormierungder�'� ß nachjedemLernschrittwird die obige Lernregel zu einer kompetitivenHebbschenLernregel [RT89].

Esbleibtzubemerken,daß(3.22) in nichtlinearerWeisevonallenParametern� í abhängt.Im Besonderensinddie Gewichte à % �� ß der lokalenMerkmalsdetektorenenthalten,für dienochLernregelnangegebenwerdenmüssen.Um einesolcheLernregelableitenzukönnen,wird zunächstdie Stationaritätsbedingungfür die �H� ß betrachtet,die derständigenRenor-mierungdieserVektorenwährenddesstochastischenLernprozesses(3.22) Rechnungträgt.Sielautet Ã Ï �'� ß�È\y � �L� ß��'� ß (3.23)

mit skalarenParametern��� ß . Setztmannundie Definition (3.21) in (3.22) unddasobigeResultatin die obige Stationaritätsbedingungein, so erhält man unter VerwendungderDefinition (2.40) der ê -lokalenKovarianzmatrizenz ß n {}| sowie der Identität(3.15) nach

64

Page 73: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.2. Lernregelnfür dasmultivariateGRBF-Netzwerk

einerkurzenRechnungdie äquivalenteBedingungz ß n {}| �'� ß � � >� ß �'� ß (3.24)

mit denneuenParametern� >� ß � ��� ß à Ç� ß " à ã ß�� wa�Å� í � È\y . Damit wird die Lernregel (3.22)genaudannstationär, sobalddie Orientierungen�'� ß zu Eigenvektorender lokalen Ko-varianzmatrizen(2.40) werden.Die sequentiellestochastischeLernregel (3.17) hat damitdenselbenstationärenPunktwie dieFixpunktiterationsgleichung(2.46). Hier wird auchderwesentlicheUnterschiedzumursprünglichenModell von J.RubnerundP. Tavandeutlich,welchesnur die globaleKovarianzmatrixdesgesamtenDatensatzesdiagonalisiert.Da diebeidenAlgorithmenansonstenidentischsind,gilt die schnelleKovergenzdesursprüngli-chenVerfahrens[HK92, RT89] auchfür denmodifiziertenAlgorithmus.Daherkannmanannehmen,daßnacheinemkurzenRelaxationsprozeß– unterder VoraussetzungkleinerLernparameterundlangsamerAbkühlung– die �'� ß währenddesgesamtenLernprozessestatsächlichdie EigenvektorenderlokalenKovarianzmatrizensind.

Als FolgederlokalenKovarianzanalysedurchdieMerkmalsdetektorenwerdendieProjek-tionen(3.21) lokal dekorreliert.Dieskanndurchà p«� ß � wa� o«� ß � p¿|Qß � wa� ov|Qß � È ß n {}| � � >� ßà � ß à |Dß ¼ �g| (3.25)

ausdrücktwerdenund folgt ausdenDefinitionen(3.21), (2.41) sowie dersoebenbegrün-detenAnnahme,daßdie �H� ß dasEigenwertproblem(3.24) lösen.

Lernreg el für die Gewic hte à % �� ßEs wird nun verlangt,daßdie Projektionen(3.21) auf die lokalenMerkmalsvektorendieEigenschaft à p Ç� ß � w§� o«� ß � È ß n {}| � � (3.26)

habensollen,welcheauchals functionalbalancebezeichnenwerdensoll. Mit (3.26) wirdfür jedenMerkmalsdetektoreinelokaleMahanalobi-Metrikeingeführt.DiesentsprichtderForderung,daßdie verschiedenenMerkmalsdetektoreneine ausgewogeneRolle bei derRepräsentationder Datenspielensollen.Aus (3.25) folgt nun, daß(3.26) gilt, wennderParameterà Ç� ß mit demEigenwert � >� ß übereinstimmt.Um dieseGleichheitund damit diefunctionalbalancezugarantieren,wird die sequentiellestochastischeLernregelÏ à Ç� ß � w.·*��� ã ßF� w%·1�Å� í �Oà Ç� ß r~p Ç� ß � w%·�� o«� ß � ¨ � t (3.27)

eingeführt,derenstationärerPunktdurch à Ç� ß � � >� ß gegebenist. Am stationärenPunktistder Erwartungswertder Lernregel (3.27) geradegleich der Sattelpunktsgleichung(2.45).

65

Page 74: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

Letzerewurde im ML-Algorithmus von M. Kloppenburg und P. Tavan durch (2.47) er-setzt,umeinAbkühlungsverfahrenzuermöglichen.Die ErweiterungderobigenLernregelgemäß Ï à Ç� ß � w.·*�Â� ã ß*� w%·¤�Å� í ����à Ç� ß r~p Ç� ß � w%·¤� o«� ß � ¨ � t EI� à Ç ¨ à Ç� ßà ã ß�È � ¸ (3.28)

wobei à ã ß�È einengleitendenMittelwertderAktivität

ã ß � wa�v� í � darstellt,hatdenselbenEf-fekt.Wie im genanntenEM-Abkühlungsverfahrensindauchhierdie à Ç� ß beigroßenWertenvon � starkandenTemperaturparameterà gekoppelt.Bei Verringerungvon � nähernsichdie à Ç� ß immermehrdenEigenwertenderlokalenKovarianzmatrizenz ß n { | an.

Lernreg el für die !�ßNachdemnunLernregeln für die Þ¤ß , �H� ß und à � ß entwickelt wurden,fehlennochentspre-chendeLernregeln für die statistischenGewichte !�ß in (3.14). Aus der Sicht der Dichte-schätzungdrücktdieEigenschaftder loadbalancebeimunivar-AlgorithmusdieTatsacheaus,daßdie Gewichte !�ß nicht als freie Parameteroptimiertwerden,sondernauf ��" â fi-xiert sind.Diesführt dazu,daßdieverbleibendenParameterdazugezwungenwerden,sichwährenddesAbkühlvorgangssoanzupassen,daßdie loadbalancesogutwie möglicher-haltenwird. FührtmanstattdieserKompetitionzwischendeneinzelnenKomponentenderMischungsdichteeineLernregel für die !�ß ein, so bestehtdie Gefahr, singuläreLösung-en ( !�ß � �

) zu erhalten.Eine stochastischeLernregel, die die EM-Sattelpunktgleichung(2.38) ersetzt,ist Ï !�ß � ã ß � w%·¤�v� í � ¨�!�ß ¦ (3.29)

DieseRegelbeschreibteinestochastischausgeführteMittelung,diefür !�ß �Äà ã ßF� w§�v� í � È\ystationärwird [vgl. (2.38)]. WennwährenddesLernvorgangsein Neuron ê zwischenzeit-lich nur schwachaktiviert ist, so wird daszugehörigestatistischeGewicht !�ß auf Grundvon (3.29) abnehmenundwegenderSummennormierungderAktivität (3.14) in derFolgenochweiterverkleinert.Um einenstabilenVerlaufdesLernprozesseszuermöglichen,wirdin dieserArbeit daherdieseLernregel nicht verwendetund !�ß bei ��" â fixiert.

Fazit

Wir habenmit (2.20), (3.22) und(3.28) sowie mit derFestsetzung!�ß � ��" â einenSatzsequentiellerstochastischerLernregeln für die Parameter� ]�_�`ß � ­ Þ¤ß ¸�� ß ¸ �$ ß«° formu-liert, welchedie Gleichungen(2.37), (2.48), (2.47) desEM-Abkühlverfahrensersetzen.Im VerlaufdessodefiniertenstochastischenAbkühlverfahrensspiegelndie ParameterderKomponenten

�6 � w ¯ ê ¸¿� ]�_�`ß � derMischungsdichtein zunehmenderWeisedie lokaleStati-stik desDatensatzes� in dendurch

ã ßF� w§�v� í � definiertenUmgebungender Zentren Þ¤ß66

Page 75: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.2. Lernregelnfür dasmultivariateGRBF-Netzwerk

wider. Auf GrunddesAnsatzesbezeichnenwir diesesVerfahren,daseinelokalePCA desDatensatzes� ausführt,auchalsmultivar-Algorithmus.

Der nächsteAbschnittgehtnäherauf algorithmischeDetailsund auf die Wahl der Lern-undAbkühlparameterein.Abschließendwird nochderVerlaufdesmultivar-VerfahrensanHandderausAbbildung2.8bekanntenDatendemonstriert.

3.2.1. Durchführung des Lernverfahrens

Bei der Anwendungdesmultivar-Algorithmus zur KonstruktioneinesSpracherkenners[Met98, Wil98] hatsichherausgestellt,daßesgünstigist, die BestimmungderParameter���

in einenunivar- undeinenmultivar-Schrittzugliedern.DiesebeidenSchrittewerdenim folgendenzusammengefaßt und in Abbildung 3.2 und 3.3 an einemBeispiel veran-schaulicht.

� Der univar-Schrittbasiertauf demunivar-Algorithmus(sieheAbschnitt2.3.2) mitdenAktivitäten(2.16). Für sehrgroße � sind alle Aktivitätenunabhängigvon denDatenundgleich �#�#� . In diesemFall gilt ���������s�T� . Die InitialisierungderMerk-malsdetektoren��� erfolgtalsosinnvollerweiseaufdenSchwerpunktdesDatensatzes�

. In [Der95] wird gezeigt,daßdie ��� im Schwerpunktverbleiben,bis � untereinenkritischenWert abgekühltwird, derderStreuung��� desDatensatzes

�entspricht.

Daherwird derAnfangswert��� auf knappüber ��� gesetzt.Mit dieserInitialsierungwird diestochastischeLernregel (2.19) mit demLernschritt(2.20) wiederholtausge-führt. WährenddesAbkühlensvon � aufeinenkleinenWertwird derLernparameter�d� üblicherweiselinearvon 0.9auf etwa ����� verringert.DasAbkühlenerfolgt so-lange,bisdie log-likelihood �d� ��� � �;  maximalwird. DiesesMaximumbestimmtdenEndwert ��¡ unddamiteinenParametersatz

� � �£¢V��¡¥¤¦���¨§ ©&�ª� ¦�¦�¦ �P« , welcherimRahmendesgewähltenModellsdie optimaleSchätzungdesDatensatzes

�ist.� Der anschließendemultivar-Schrittwird mit

� �und ��¡ initialisiert, d.h.die ��� wer-

den übernommen,die lokalen Kovarianzmatrizenauf ¬­ �®� ��¡V¯ und die statisti-schenGewichte °�� auf �#�#� gesetzt1. Anschließendwerdendie stochastischen,se-quentiellenLernregeln(2.19), (3.17) und(3.18) mit denLernschritten(2.20), (3.22),(3.28) und denmultivariatenAktivitäten ±��V�²�´³ � � �   ausgeführt.Um einenlangsa-men Übergangvom univar-Schritt zu erreichen,wird der Kopplungsparameterµzunächstmit einemsehrgroßenWertbelegt. Im Laufedesmultivar-Verfahrenswirdµ auf denWertNull verringert,sodaßdie Ausdehnungen���¶� dereinzelnenmultiva-riatenSchätzungennicht mehran ��¡ gekoppeltsind.Die Lernparameter�d� , �d· und

1 Die Parameterentsprechennun genaudemunivar-Fall. Man könntealsodenunivar-Schritt auchmitdenLernschritten(2.20), (3.22), (3.28) undeinergroßerKopplung ¸ berechnen.DagegensprechenaberdieaufwendigeAuswertungdermultivariatenNormalverteilung(2.36) unddiebeidenwegenderstarkenKopplungan ¹ überflüssigenLernschritte(3.22) und(3.28).

67

Page 76: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

Abbildung 3.2.: Dichteschätzungmit dem multivar -Algorithmus. Die DatenverteilungausAbbildung2.8wird hier für 10Neuronenmit demmultivar-Algorithmusgeschätzt.Die Dicht-en º»2¼¾½À¿ Á �; bzw. º»Ã¼¾½À¿ Á �  werdendurchHöhenliniendargestellt.DasKoordinatenkreuzzeigtdie Ausrichtungder Eigenvektoren Ä �¶� und die Längeder Achsenentsprichtder Standard-abweichungÅ �¶� . Links obenist derInitialisierungszustandfür denunivar-Schrittgezeigt.AllelokalenMerkmalsvektorenÆ � sindaufdenMittelwertderDatenzentriert.Å � ist aufeinenWertknappüber Å � gesetzt.Rechtsobenist dasErgebnisdesunivar-Schrittsgezeigtund rechtsuntendasErgebniseinesdaraufaufbauendenmultivar-Schritts.Links untenist ein beliebigherausgegriffenerZustandwährenddesmultivar-Schrittsdargestellt.

68

Page 77: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.2. Lernregelnfür dasmultivariateGRBF-Netzwerk

Abbildung 3.3.: Die log-likelihood als Abbruchkriterium. Links ist die log-likelihood fürdenDatensatzausAbbildung3.2im VerlaufderAbkühlungvon Å gezeigt.DasMaximumderlog-likelihood (Pfeil) definiertdenEndwert Å�¡ undeinenParametersatzÁ � , derin Abbildung3.2, rechtsobendargestelltist. Dasmultivar-Verfahrenführt zu einerweiterenVergrößerungder log-likelihood. Der Pfeil kennzeichnetdenjenigenMomentdesLernvorgangs,andemderParametersatzesÁ � optimalist. Á � ist auchin Abbildung3.2, rechtsunten,dargestellt.�dÇ werdendabeiwiederumvon 0.9 auf etwa ����� verringert.Im multivar-Schritt

könnensichdaherdie Positionen��� weiterverändernundesfindetgleichzeitigeineAnpassungder einzelnenKomponenten© an die lokale Form der Verteilungstatt.DerAlgorithmuswird beendet,sobalddie log-likelihood (2.44) beieinemmöglichstgroßenWert stationärgewordenist.

Abbildung3.2 zeigtdenAblauf einerDichteschätzungderbekanntenzweidimensionalenDatenausAbbildung2.8mit demmultivar-Algorithmus.Die obereZeilezeigtdieSituati-on bei derInitialisierungunddasErgebnisdesunivar-Schritts.In derunterenZeile ist einZwischenzustandunddasResultatdesmultivar-Schrittsdargestellt.Derunivar-Schrittlie-fert schonein rechtgutesErgebnisfür ¬È �²�ɧ � �¦  . Die StrukturdesDatensatzeswird erkannt,allerdingskanndieAusrichtungderlokalenVerteilungennichtwiedergegebenwerde.Diesist erstnachdemmultivar-Schrittmöglich,welcherzueinerSchätzung¬È ���ɧ ���   führt, dierelativ gutmit derursprünglichenVerteilungübereinstimmt.DerVerlaufderlog-likelihoodwährendderunivar- bzw. multivar-Schrittewird in Abbildung3.3dargestellt,welchedieZunahmederQualitätderDichteschätzungim VerlaufdesLernprozessesdokumentiert.

69

Page 78: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

3.3. Funktionenappr oximation

Nachdemnungeklärtist, daßmit deniterativenLernregelnundAbkühlverfahrendesmul-tivar -AlgorithmuseinzuverlässigesInstrumentzurML-DichteschätzungeinesDatensatz-esdurcheineMischung(2.35) zur Verfügungsteht,bleibt nochzu untersuchen,welcheAuswirkungenmultivariaterweiterteÜbertragungsfunktionen(3.14) aufdieEigenschafteneinesGRBF-Netzwerkeshaben.Fernerist nochunklar, obundwie dievonmir vorgeschla-geneAlternative (3.2) zur Funktionenapproximation,in die alswesentlichesElementeineSchätzungder VerbundwahrscheinlichkeitsdichteÈ �²�O¤dÊ   desDatensatzesË eingeht,mitder Approximation(2.62) von Funktionendurch multivariateGRBF-Netzwerke zusam-menhängt.Zwarhabenwir schongesehen,daßdasTrainingeinesumrückwärtigeVerbin-dungenerweitertenunivariatenGRBF-Netzwerksvermittelsdesunivar-Algorithmusdazuführt, daß(i) alle ParametereinessolchenNetzesgleichzeitigoptimiert werdenkönnenund(ii) die resultierendeGesamtaktivität derZwischenschichtÌÍ�²�À¤;Ê ��Î� �;  nach(3.13) ei-ne ML-SchätzungdesDatensatzesË durcheineunivariateMischungsdichte¬È �²�À¤;Êϧ Î� �  darstellt.Aber damit sind die Konsequenzender Verallgemeinerungauf denmultivaria-ten Fall nochnicht gezogenund ein Zusammenhangzur Alternative (3.2) ist nochnichtsichtbar. Esscheintlediglich plausibel,daßein solcherZusammenhangexistierenkönnte.

Um diesenMißstandzubeseitigen,soll nunderAnsatz(3.2) nähererkundetwerden.Dazuwird angenommen,daßfür denDatensatzË mittelsdesmultivar-AlgorithmuseineML-Dichteschätzungdurchgeführtwordensei.Die resultierendeModelldichte

¬È ���O¤;Êϧ � �   � �� �Ð �jÑÃÒ ¬È ���O¤;Êϧ ©V¤ �^Ó�Ô�Õ�  (3.30)

ist dannmit (3.3) analogzu (2.35) eineMischungausmultivariatenNormalverteilungen

¬È �KÖ �×���O¤;Ê   § ©u¤ ��Ó�Ô�Õ�   �£Ø[Ù�ÚsÛ¶Ü �KÖ Ü�Ý �  qÞ ­&ß Ò� �²Ö Ü�Ý �   �áàuâ�qàVã  ¦äæå�ç�è)éëêjì �Kí Ø ¥ ­ �   Ò êjì (3.31)

mit identischenGewichten und kann analogzu (3.13) als normierendeGesamtaktivitätÌÍ���O¤;Ê � � �   einesmultivariaten,um rückwärtigeVerbindungenî�ï� erweiterten,GRBF-Netzwerks(vgl. Abbildung 3.1) aufgefaßtwerden.Entsprechendkanndie multivar-Op-timierungderDichteschätzungalsLernprozeßfür dieParameter

� �einessolchenGRBF-

Netzwerksinterpretiertwerden.WährenddesLernenssinddanndie Aktivierungsfunktio-nenderZwischenschichtneuronen© analogzu (3.14) durch±��V���O¤;Ê � � �   � �d���#�   ¬È ���O¤;Êϧ � Ó�Ô�Õ�  

¬È �²�O¤dÊ�§ � �   (3.32)

gegeben.SiesindunscharfePartitionsfunktionenim IRå�ç�è

, derenWerteZuordnungswahr-scheinlichkeitenvonPunkten���O¤;Ê   zuZwischenschichtneuronen© angeben.DerParame-tersatz

��� � ¢ ¬­ ��¤�ðñ�#¤¦���#¤?î ï� § ©I� � ¦�¦«¦ �P« beschreibtrezeptive Felderder Zwischen-schichtneuronenim erweitertenMerkmalsraumIR

å�ç�è, die um die Punkte �f���#¤¦î�ï�   loka-

lisiert sind und derenFormendurchdie in denDiagonalmatrizen¬­ �óò IRå�ç�èPô

IRå�ç�è

70

Page 79: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.3. Funktionenapproximation

zusammengefaßtenVarianzenunddiein denorthogonalenMatrizen ð(��ò IRå�ç�è ô

IRå�ç�è

zusammegfaßtenOrientierungenbeschriebenwerden.Verwendetmanfür dasTrainingderAxonbäumeîf� die Regel (3.9), so erhält man nachden ArgumentenausAbschnitt 3.1die Symmetriebeziehung(3.10). Daherkannauf ein gesondertesTrainingder îf� verzichtetwerdenundwir setzenvon nunan îf�öõ+î ï� ¦ (3.33)

Als Resultatdermultivar-SchätzungdergemeinsamenVerteilungderEin-undAusgabeda-tenerhaltenwir, wie wir beigenaueremHinsehensogleichfeststellenwerden,einegrößereParameterzahlalsdiesfür ein multivariatesGRBF-Netzwerkzur Funktionenapproximati-oneigentlichnötigwäre.DennbeiseinemEinsatzalsFunktionenapproximatornach(2.62)wird lediglich der Eingabevektor �÷ò IR

åvorgegeben,währenddie SollausgabeÊ fehlt,

so daßeswenig sinnvoll ist, zu diesemZeitpunktdie im IRå�ç�è

definierteAktivierungs-funktion (3.32) zu verwenden.Stattdessenmußeineauf denIR

åeingeschränkteAktivie-

rungsfunktion(3.14) verwendetwerden,in die entsprechendauf denIRå

eingeschränktemultivariateNormalverteilungeneingehen.DerenKovarianzmatrizenhabenabereinesehrviel kleinereDimensionals jeneKovarianzmatrizen

­ � , die ausder multivar-Schätzungvon È �²�À¤;Ê   bestimmtwordensind.

Um die damitgeforderteReduktionderParameterzahlzu bewerkstelligen,betrachtenwirnundenAnsatz(3.2) zurFunktionenapproximation,derdurch

¬î���� � � �   �ùø IRú Ê ¬È ���O¤;Êϧ � �  8û Êø IRú ¬È ���O¤;Êϧ � �  8û Ê (3.34)

gegebenist, genauer.

Zur Auswertungder Integrale(3.34) werdendie Matrizen ¬­ � und ð(� in Blockmatrizenzerlegt, diedie UnterräumeIR

åundIR

èbetreffen.Wir definierendaherüDý � þ��ÿ ��� � � õ ð(� (3.35)

und � ¬­ ß Ò��� Ò �� ¬­ ß Ò��� ì�� õ ¬­ ß Ò� (3.36)

mitý � ò IR

å ôIRå

, þ ��ò IRè ô

IRè

,ÿ ��ò IR

è ôIRå

und � ��ò IRå ô

IRè

. Mit(3.35) und (3.36) kanndie inverseKovarianzmatrix

­&ß Ò� in der Exponentialfunktionder© -tenNormalverteilung(3.31) auchdurchü ß Ò� ß Ò�� ß Ò�  qÞ � ß Ò� � õ ­&ß Ò� �Pð(� ¬­ ß Ò� ð Þ � (3.37)

71

Page 80: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

mit ß Ò� �×� ß Ò�   Þ õ ý � ¬­ ß Ò��� Ò ý Þ � � þ � ¬­ ß Ò��� ì þ Þ � (3.38)� ß Ò� �×� � ß Ò�   Þ õ ÿ � ¬­ ß Ò��� Ò ÿ Þ � � � � ¬­ ß Ò��� ì � Þ � (3.39) ß Ò� õ ý � ¬­ ß Ò��� Ò ÿ Þ ��� þ�� ¬­ ß Ò��� ì � Þ � (3.40)

ausgedrücktwerden.

Die beidenIntegraleaus(3.34) werdenin AnhangA.1.1 berechnet.Als ErgebniserhältmaneineLinearkombination

¬î¥�²� � ����� �   � �Ð �TÑÃÒ��îf�V��� � ����� ��   �±����²� � ����� �   (3.41)

deraffinenFunktionen

�îK�V�²� � ����� ��   õ+îK� � �� �V��� Ü ���   (3.42)

mit den“Aktivierungsfunktionen”

�±¥���²� � � ��� �   õ �È ���ɧ ©V¤ � ��� ��  � ���� ÑÃÒ �È ���ɧ © ï ¤ � ��� ����   ¤ (3.43)

diedurchdie multivariatenNormalverteilungen

�È ���ɧ ©V¤ ����� ��   õ Ø[Ù�Ú���Ü ��� Ü ���  qÞ � ß Ò� ��� Ü ���   �áà���qàuã   å�êjì �²í Ø ¥ � �   Ò êjì (3.44)

gegebensind.DabeisinddieProjektionsmatrizen�� � in (3.42) durch

�� �Ïõ Ü � �V� ß Ò�   Þ (3.45)

unddie metrischenMatrizen � ß Ò� in (3.44) durch

� ß Ò� õ ß Ò� Ü ß Ò� � ��� ß Ò�   Þ (3.46)

definiert.

Die Funktionenapproximation¬î¥��� � � ��� �   ist durcheinenParametersatz� ��� �

bestimmt,dersichausden � Parametersätzen

� ��� �� � ¢ � ¤ � ��¤V� ß Ò�  fÞ ¤?����¤?î�ï� ¤¦° ��« zusammensetzt.Die� � sinddurchInversionderregulärenMatrizen

� ß Ò� zuberechnen.Alle übrigenPara-meterkönnendirektausdenParametern

���dermultivariatenML-Dichteschätzung(3.30)

desDatensatzenË abgelesenwerden.

Die Funktionenapproximation(3.41) zeigt eine Reihevon Gemeinsamkeiten mit einemGRBF-Netzwerk:

72

Page 81: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.4. DiskussionundBeispiele

� Wie beim GRBF-Netzwerkist die zur FunktionenapproximationverwendeteMo-dellfunktion (3.41) eineLinearkombination,in welchedie Aktivierungsfunktionen�±¥���²� � � ��� �   eingehen.� Auch hier bildendieAktivierungsfunktionen(3.43) aufGrundderEigenschaft�Ð �TÑÃÒ �±��V��� � � ��� �   � � (3.47)

eineunscharfePartitionierungdesEingaberaumsIRå

.� Wie beimmultivariatenGRBF-NetzwerksinddieFunktionen�±��V�²� � � ��� �   ausmul-tivariatenNormalverteilungen�È �²�ɧ ©u¤ � ��� ��  

aufgebaut.DerenLokalisierungumdieZentren��� sorgt dafür, daßessichauchbei den �±��V�²� � � ��� �   um lokalisierteFunk-tionenhandelt.� Der konstanteTerm îf� in der affinen Funktion(3.42) entsprichtdemAxonbaumineinemGRBF-Netzwerk.

DereinzigeUnterschiedzueinemGRBF-Netzwerkzeigtsichim linearenTerm �� �V��� Ü ���  derFunktion(3.42). DieserfindetkeineEntsprechungin einemGRBF-Netzwerkundläßtsich auchnicht zwanglosdurch eine neurobiologischeBeobachtunginterpretieren.FürdenFall, daßdie Kopplungsmatrizen ß Ò� zu Null werdenund somit dieselinearenTer-meverschwinden[vgl. (3.45)], ist aberdieFunktionenapproximation(3.41) tatsächlicheinmultivariatesGRBF-Netzwerk.Die Funktionenapproximation(3.41) ist alsodemGRBF-Netzwerkzwar formal ähnlich,kanndiesemNetzwerktypim allgemeinenabernicht zu-geordnetwerden.Da ¬î¥�²� � � ��� �   eineFunktionenapproximationdurcheineLinearkombi-nationder lokalenlinearenModelle �îf�u��� � � ��� ��  

vornimmt,wird im folgenden(3.41) alsLLM-Approximatorbezeichnet.

Im nächstenAbschnittwerdendieEigenschaftendesLLM-Approximatorsfür verschiede-neSpezialfällediskutiertundanHandderbereitsbekanntenBeispieldatenausAbbildung2.6und2.8illustriert.

3.4. Diskussion und Beispiele

In diesemAbschnittsollenvor allemdie durch(3.45) und (3.46) definiertenProjektions-matrizen �� � und metrischenMatrizen � ß Ò� näherbeleuchtetwerden.Zu diesemZweckwird der LLM-Approximator (3.41) für die drei Spezialfälleuntersucht,daß(i) die ML-SchätzungderVerbunddichte ¬È ���O¤;Êϧ � �   durcheineMischungunivariaterNormalvertei-lungenmit gleichenVarianzen� ì erfolgt, daß(ii) der LLM-Approximator einenzweidi-mensionalenDatensatzË modelliert,unddaß(iii) demLLM-Approximator die AufgabederKlassifikationeinesDatensatzes

�nachverschiedenenKlassenzugewiesenwird.

73

Page 82: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

Abbildung3.4.:Der LLM-A pproximator alsunivariatesGRBF-Netzwerk.Links ist dasEr-gebniseinerML-DichteschätzungderDaten��� � ¼"! ³$#&%�³  ¿ ' ��(*)+)+)-,/. durcheineMischungunivariaterNormalverteilungenmit gleichenVarianzenÅ ì dargestellt.Die gestrichelteLinie istdie ursprünglicheFunktion 0 ¼"!  , die approximiertwerdensoll. Rechtsist die Approximationº0 ¼"!21\Á ��� �  mit demausderML-DichteschätzungresultierendenLLM-Approximatorgezeigt(dicke durchgezogeneLinie). Untenist zusätzlichder Verlauf der Partitionierungsfunktionen34 � ¼"!51\Á ��� �  für die lokalenlinearenModelle

30 ¼"!51\Á ��� ��  �60 � eingetragen.

LLM-Appr oximator aus einer ML-Misc hungsdic hte univ ariaterNormalver teilung en

Für denFall, daßderLLM-Approximator auseinerML-Mischungsdichte¬È �²�O¤;Êϧ � �   ausunivariatenNormalverteilungenmit gleichenVarianzen� ì abgeleitetist, werdendie inver-senlokalenKovarianzmatrizen

­ ß Ò� in (3.37) diagonal.DanundieKopplungsmatrizen ß Ò�verschwinden,werdendiemetrischenMatrizen � ß Ò� derNormalverteilung(3.44) ebenfallsdiagonalunddie Projektionsmatrizen�� � zuNull [vgl. (3.45) und(3.46)], d.h.

� ß Ò� � �� ì¡87 9 £ í �� ß Ò� �;: ¦ (3.48)

Die AusdehnungenderNormalverteilungen�È ���ɧ ©V¤ � ��� ��  skalierenjetzt nur nochmit ��¡

und die lokalen linearenModelle (3.42) werdenzu konstantenModellen îf� . Man erhältdaherfür denLLM-ApproximatordenAusdruck

¬î¥�²� � ����� �   � �Ð �TÑÃÒ îf� �±����²� � ����� �   (3.49)

74

Page 83: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.4. DiskussionundBeispiele

mit denAktivierungsfunktionen

�±��V�²� � � ��� �   � Ø Ù�Ú �?§ � Ü ����§ ì �áà¨� ì  � ����-ÑÃÒ Ø Ù�Ú �?§ � Ü �����T§ ì �áà¨� ì[  ¦ (3.50)

Diesist genaudasunivariateGRBF-Netzwerk,dasdurch(2.59) und(2.62) definiertist. Esist aberzubeachten,daßdieParameter

� ��� �desunivariatenGRBF-Netzwerks(3.49) aus

einerML-SchätzungdesgesamtenDatensatzesË bestimmtwerden,im Gegensatzzu denParametern

�=<?>A@CBdesunivariatenGRBF-Netzwerks(2.62), diedurcheineML-Schätzung

derEingabedaten�

unddie Anwendungderoutstar-Regel (2.64) bestimmtwerden.

Abbildung3.4 zeigtdie ArbeitsweiseeinessolchenLLM-Aproximators bzw. univariatenGRBF-Netzwerksan demschonbekanntenBeispielausAbbildung 2.6. Die QualitätderApproximierungähneltderjenigendesunivariatenGRBF-NetzwerksausAbbildung2.20.Allerdings sind nun die Lagender Zentren ��� sowie die Werte îf� der AusgabegewichtedurcheineML-SchätzungderVerbunddichteÈ ���O¤;Ê   festgelegt. Dieszeigt,daßderLLM-Approximator(3.49) demin Abbildung3.1skizzierten,um rückwärtigeVerbindungener-weitertenGRBF-Netzwerkentspricht,dessenLernprozeßschonin Abschnitt3.1diskutiertwurde.

LLM-Appr oximator für einen zweidimensionalen Datensatz ËFür denFall einesDatensatzesË , der sichauseindimensionalenEin- undAusgabedatenzusammensetzt,führt derLLM-Approximator die Abbildung ¬D �FE � � ��� �  =G IR H IR aus.Nach denDefinitionen(3.35) und (3.36) gilt dannfür die Matrizen ð(� ò IR

ôIR der

Eigenvektorenundfür die inversendiagonalisiertenKovarianzmatrizen¬­ ß Ò� ò IRô

IR

ð(�X� ü Ì�� I �J �LK � � 9 £ í ¬­ ß Ò� � ü � ß ì��� Ò� � ß ì��� ì � ¦ (3.51)

DieseMatrizenerhältmandirekt ausderML-SchätzungderDaten Ë mit einerMischung(3.30) bivariaterNormalverteilungen.Mit (3.51) kann nacheiner kurzenRechnungundunterAusnutzungderOrthonormalitätderEigenvektorendie Metrik �M ß Ò� als

�M ß Ò� � �Ì ì� � ì��� Ò � J ì� � ì��� ì (3.52)

geschriebenwerden.Mit analogenArgumentenwerdendie Projektionen �N � , welchedieSteigung

û �D �V�OE � � ��� ��   � û E derlokalenlinearenModellebeschreiben,zu

�N �É� � ì��� Ò Ì�� J � � � ì��� ì I �+K �� ì��� Ò Ì ì�P� � ì��� ì I ì� ¦ (3.53)

75

Page 84: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

Ein einziges lokales lineares Modell

Wie wollennunzunächstdenFall untersuchen,daßderLLM-ApproximatornuraufgenaueinemlokalenlinearenModell beruht,d.h. � � � . Für die folgendenAusführungenwirddaherder Index © weggelassen.Die Aktivierungsfunktion�±Ã�OE � � ��� �   ist nun auf GrundderNormierungseigenschaft(3.47) immergleichEins.DerLLM-Approximatorwird daherzudereinfachenGeradengleichung

�D �OE � ����� �   � D � � ìÒ Ì J � � ìì I K� ìÒ Ì ì � � ìì I ì �FE Ü6Q   ¦ (3.54)

DieseGleichungkannweiteranalysiertwerden,wennmanberücksichtigt,daßdieKovari-anzmatrixeinerzweidimensionalenVerteilung[DH73] einerseitsdurch­ � ü �RE ì � Ü �OEF� ì �RE8S�� Ü �OEF���OS���OE8S�� Ü �REF�#�OS}� �RS ì � Ü �OS�� ì � (3.55)

undanderseits,aufGrundvon (3.51), auchdurch­ � ð ¬­ ð Þ � ü � ìÒ Ì ì � � ìì I ì � ìÒ Ì J � � ìì ITK� ìÒ Ì J � � ìì I K � ìÒ J ì � � ìì K ì � (3.56)

gegebenist. DurchKoeffizientenvergleich in (3.54)–(3.56) undwegen Q �ñ�OEF� , D �(�OS}� ,kannfür (3.54) auch D �OE � � ��� �   � �OS}� � �OE8S}� Ü �OEF�#�RS���OE ì � Ü �OEF� ì �FE Ü �OEF�   (3.57)

geschriebenwerden.Dies ist genaudie FunktionenapproximationdurchRegressionmiteiner Ausgleichsgeraden[vgl. (2.11)]. Abbildung 3.5 illustiert den LLM-ApproximatoranhanddesbekanntenDatensatzesausAbbildung 2.6. Da für � U � die der Kovari-anzmatrix(3.55) entsprechendenlokalenKovarianzmatrizen

­ � durchlokale Mittelwert-bildungen[vgl. (2.39)–(2.41)] bestimmtwerden,gilt die Aussage(3.57) in dendurchdieunscharfenPartitionierungsfunktionen±��V��� � � ��� �   definiertenGebietenausIR

åauchfür

denallgemeinenFall einesLLM-Approximators.Darauskann geschlossenwerden,daßdie lokalenlinearenModelleeinesLLM-Approximatorsdie AusgleichshyperebeneneinerlokalenRegressionsind,zwischendenendiePartitionierungsfunktionen±��V��� � � ��� �   eineglatteInterpolationinduzieren.� lokale lineare Modelle

Wir wollen nun zum allgemeinenFall einesLLM-Approximatorszurückkehren,der mitmehrerenlokalen linearenModellen ( � U � ) arbeitet,und diesengenauerdiskutieren.Im folgendenwird von einemeindimensionalenEingaberaumIR ausgegangen,der durchdie Aktivierungsfunktionen�±��V�OE � � ��� �   unscharfpartitioniertwird. Entscheidendfür dieLage dieserPartitionensind die Zentren Q � und die Metriken �M ß Ò� , die im vorliegendenSpezialfall durch(3.52) gegebensind.AbhängigvonderSteigung

J � ��Ì�� desEigenvektors�KÌ��#¤ J �   , derzumgrößtenEigenwert� ì��� Ò gehört[vgl. auch(3.51)], könnenzweiGrenzfälleunterschiedenwerden:

76

Page 85: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.4. DiskussionundBeispiele

Abbildung 3.5.: LLM-A pproximator für VW�YX . Links sind die Eigenvektorenund Eigen-wertederglobalenKovarianzmatrixZ[�[\ ºZ=\ Þ der Daten �]�^� ¼"! ³�#&%�³  ¿ ' �](*)+)+)_,`.dargestellt.Die gestrichelteLinie ist dieursprünglicheFunktion 0 ¼"!  , dieapproximiertwerdensoll.DasrechteBild zeigtdieFunktionenapproximation (dickeLinie) durch(3.54) bzw. (3.57).Dieseist geradedieAusgleichsgerade(vgl. Abbildung2.7).� Bei einersehrkleinenSteigung(

J � ��Ì��ba � ) wird �M ß Ò� a � ß ì��� Ò . Die Varianz �M ß Ò� derNormalverteilung �È �FEÀ§ ©V¤ � ��� ��  

, welchein diePartitionierungsfunktion�±��V�OE � � ��� �  eingeht,ist in diesemFall also gleich dem maximalenEigenwert � ì��� Ò der lokalenSchätzung.� Bei einersehrgroßenSteigung(

J �?��Ì �cH dfe ) drehensichdieVerhältnisseum.Danun �M ß Ò� a4� ß ì��� ì gilt, wird dieAusdehnungderPartitionierungsfunktion�±��V�FE � � ��� �  in diesemFall vondemkleinerenEigenwert� ì��� ì bestimmt.

Die durch �M ß Ò� definierteSkalader Partitionierungsfunktionpaßtsich alsoan die lokaleStrukturder Datenverteilung Ë an. In Regionenmit starken Steigungender Zielfunktionwird damit die Diskretisierungder E -Achsedichter. KonstanteBereichewerdendagegenvon lokalenModellenmit großenAusdehnungenapproximiert.Abbildung3.6zeigteinenLLM-Approximator aus � ��� � lokalenlinearenModellen,andemdiesesVerhaltengutzuerkennenist.

In analogerWeisekönnendie lokalenlinearenModelle �D ���FE � � ��� �   untersuchtwerden.Für derenSteigungen�N � , welchedurch(3.53) gegebensind,könnenwiederzwei Grenz-fälle unterschiedenwerden:� StimmendiebeidenlokalenEigenwerteeineslinearenModellsüberein( ����� ÒO�+����� ì ),

so wird �N � zu Null, da wegen der Orthogonalitätder Eigenvektoren �gI��#¤+K �   �77

Page 86: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

Abbildung 3.6.: LLM-A pproximator mit V �YX�h . Links ist die multivariate ML-DichteschätzungderbekanntenDatenzusammenmit 0 ¼"!  gezeigt.Rechtsist die Funktionen-approximation º0 ¼"!51\Á ��� �  durcheinenLLM-Approximatordargestellt(dickedurchgezogeneLinie). Untensind zusätzlichdie Partitionierungsfunktionen

34 � ¼"!21\Á ��� �  für alle lokalenli-nearenModelle eingezeichnet.0 ¼"!  und º0 ¼"!21\Á ��� �  stimmenin weiten Bereichennahezuüberein.

� Ü J �#¤¦Ì �   gilt. Dasentsprechendelokale Modell �D ���FE � � ��� ��  reduziertsich dann

auf dieKonstanteD � .

� Ist dagegen ����� Òji ����� ì , wasdergenerischeFall für eineglatteundwenigverrauschteZielfunktion ist, dannberechnetsich die SteigungdeslokalenlinearenModells zu�N �ka J �?��Ì � , d.h. sie ist durch die Richtungdeszu ����� Ò gehörigenEigenvektorsgegeben.

DiesesVerhaltenist auchbei demLLM-Approximator ausAbbildung3.6 sichtbar:wannimmer dort starkunterschiedliche����� � berechnetwerden,paßtsich die SteigungdesEi-genvektors lx��� Ò an die Steigungder Zielfunktion an.DiesesBeispielund die obigenBe-trachtungenmachendeutlich,wie sichdiePartitionierungsfunktionen�±��u�²� � � ��� �   unddielinearenModelle �îK�V�²� � � ��� ��  

bei derFunktionenapproximationmit einemLLM-Approx-imator an die lokalen Eigenheitender Verteilung Ë anpassen.Obwohl sich die lokalenEigenvektorsystemeð(� nicht immer optimal an die zu approximierendeFunktion

D �FE  anschmiegen,wird dieursprünglicheFunktiondurchdieInterpolationderlokalenModelleD ���FE � � ��� ��  

, welchedurchdieGewichtungmit denunscharfenPartitionierungsfunktionen�±��V��� � � ��� �   erzeugtwird, sehrgutapproximiert.

78

Page 87: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.4. DiskussionundBeispiele

Abbildung 3.7.: SchemaeinesGRBF-Netzwerks für die Klassifikation einesDatensatzesm.

Klassifikation mit einem LLM-Appr oximator

ZumAbschlußsoll nochuntersuchtwerden,wiesichderLLM-Approximatorfür diein Ab-schnitt2.3.2nähererläuterteAufgabenstellungderKlassifikationverwendenläßt.Bei derKlassifikationwird einemVektor � auseinemEingaberaumIR

åeineKlassen ò ¢8� ¦�¦�¦_o «

zugeordnet.Dabeiwird davon ausgegangen,daßdie DateneineinnereStrukturbesitzen,die eineAufteilung in o verschiedeneKlassenerlaubt.Für dasTrainingeinesKlassifika-tors ist zum einenein Eingabedatensatz

� � ¢�� ³8§qp �(� ¦�¦�¦ � «sr IRå

erforderlich,dersich in disjunkteTeilmengen

�ctmit

� �[u èt ÑÃÒ �ct zerlegenläßt.Zum anderenist ein Da-tensatzv ï �P¢�n}³8§wp �P� ¦�¦�¦ ��« r IR notwendig,derjedemDatenpunkt� ³ ò � eineKlassen}³ zuweist.DerBeschreibungderKlassemit einemIndex n ist einEinheitsvektor x t ò IR

èäquivalent,dessenn -te KomponentegleichEins ist, also �Ox t  Oy �[z y t , { � � ¦�¦«¦|o . DaherkannauchderDatensatzv÷� ¢�x t~} §qpx��� ¦�¦�¦ � «Tr IR

èfür dasTrainingdesKlassifikators

verwendetwerden.

Für diesespezielleFunktionenapproximationwird nundasVerhalteneinesLLM-Approx-imatorsuntersucht.Da die VerbundwahrscheinlichkeitsdichteÈ �²�O¤;Ê   in Ê -Richtungaus

einemSatzvon o z -Distributionen z��²Ê Ü x t   besteht,divergierendie Matrizen ¬­ ß Ò��� ì in(3.36). Folglich müssenwir zumursprünglichenAnsatz(3.2) zurückkehrenunddiesenfürdie gegebeneAufgabenstellungauswerten.Dies erfolgt in AnhangA.1.2. Unter Berück-sichtigungder speziellenForm der VerbunddichteÈ �²�O¤;Ê   bei der Aufgabeder Klassifi-kation und auf Grundder Eigenschaftder load balance desmultivar-Algorithmuszeigtsich, daßdie ML-Dichteschätzung¬È ���O¤;Êϧ ���   mit der Mischung(3.30) in o Teilsum-menzerfällt,die jeweilsnurdieML-DichteschätzungeinesklassenlokalenDatensatzes

�ctbetreffen.Man erhältdaherfür (3.2)

¬î���� � � ��� �   � � èt ÑÃÒ x t � ���� � ÑÃÒ ¬È ���ɧ © t ¤ � Ó�Ô�Õ� �  � èt ÑÃÒ � � �� � ÑÃÒ ¬È �²�ɧ © t ¤ � Ó�Ô�Õ� �   ¤ (3.58)

79

Page 88: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

wobei sich die Anzahl � t der verwendetenmultivariatenNormalverteilungenausdenapriori -Wahrscheinlichkeiten ° t derKlassenergibt. Esgilt� t� a+° t 9 £ í èÐ t ÑÃÒ � t �4� ¦ (3.59)

Aus (3.58) wird deutlich,wie derLLM-Approximator für die AufgabenstellungderKlas-sifikation zu einemGRBF-Netzwerkmit einerspeziellenVerbindungstopologiewird. InAbbildung 3.7 ist diesesGRBF-Netzwerkdargestellt.Die � Zwischenschichtneuronenzerfallenentsprechend(3.59) in o Gruppenmit jeweils � t Neuronen.Damit

¬È �²�ɧwn�¤ � �t   � �� t ���Ð� � ÑÃÒ ¬È �²�ɧ © t ¤ � Ó�Ô�Õ� �  (3.60)

dieklassenlokaleML-DichteschätzungdurcheineMischunggleichgewichtetermultivaria-terNormalverteilungeinerKlassen charakterisiertist, wird dieGesamtaktivität ÌÍ��� � � �t  einerNeuronengruppen aufderZwischenschichtäquivalentzurklassenlokalenML-Schät-zung (3.60). Die Parameter

� �t � ¢ � Ó�Ô�Õ� � § © t � � ¦�¦«¦ � t « setzensich dabeiausallenParameternder multivariatenNormverteilungen(2.36) zusammen,die zu einerKlasse ngehören.Mit (3.60) kann(3.58) auchzu

¬î��²� � ����� �   � � èt ÑÃÒ x t � t ¬È ���ɧqn ¤ � �t  � èt ÑÃÒ � t ¬È �²�X§qn ¤ � �t   (3.61)

umgeschriebenwerden.Beachtetmannun nochdie ML-Schätzung ¬° t � � t �#� der apriori -WahrscheinlichkeitunddenBayesschenSatz(2.24), derdannfür dieML-Schätzung¬°x��nÀ§ �O¤ � �t   dera posteriori-Wahrscheinlichkeit, eineKlassen bei einemgegebenenDa-tenpunkt� zuerhalten,

¬° ��nÀ§ �O¤ � �   � ¬° t ¬È �²�ɧwn�¤ � �t  � èt ÑÃÒ ¬° t ¬È �²�X§qn ¤ � �t   (3.62)

liefert, dannhat dasGRBF-Netzwerkfür die Aufgabenstellungder KlassifikationeinesDatensatzes

�dieAusgabe

¬î��²� � �=��� �   � èÐ t ÑÃÒ x t ¬°x��nÀ§ �À¤ � �   ¦ (3.63)

Da die Verbindungsstärken zwischenallen NeuroneneinerKlasse n und demAusgabe-neuronn EinsundsonstNull sind,liegt anjedemAusgabeneuronn einessolchenGRBF-Netzwerksfolglich geradediegeschätztea posteriori-Wahrscheinlichkeit ¬° ��nÀ§ �O¤ � �   an.

Die geschätztea posteriori-Wahrscheinlichkeit ¬°x��nÀ§ �À¤ � �   ist nach(3.62) ausdenklas-senlokalenML-Schätzungen¬È �²�ɧwn�¤ � �t   aufbaut,sodaßnunnicht mehrdergesamteDa-tensatz¢ � ¤�v « einerML-Dichteschätzungunterzogenwerdenmuß.Vielmehrist esausrei-chend,die DichtenderklassenlokalenDatensätze

�ctgetrenntzu schätzen.Dadurchwird

80

Page 89: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3.4. DiskussionundBeispiele

Abbildung3.8.:Klassifikation mit einemLLM-A pproximator. Die beidenKlassen� ¼¾½  ��((grüne Punkte)und � ¼¾½  � � (rote Punkte)wurden getrennteiner ML-Dichteschätzungdurchdenmultivar-Algorithmusunterzogen.Links sind die darausresultierendenSchätzun-gen º»2¼¾½À¿ (�# Á � Ò Â und º»Ã¼¾½À¿ �$# Á �ì  dargestellt. Die Gleichheit der geschätztena posteriori-Wahrscheinlichkeiten º� ¼ ( ¿ ½ # Á � Ò Â und º� ¼ � ¿ ½ # Á �ì  führt zu der im rechtenTeilbild einge-tragenenEntscheidungsgrenze.

derAufwandzurParameterbestimmungerheblichreduziert.FürdieAuswertungvon(3.63)ist esdannlediglich notwendigdenKlassenindex n der maximalen,geschätztena poste-riori -Wahrscheinlichkeit ¬° �gnO§ �O¤ � �   zu bestimmen.Bei diesemKlassifikatorhandeltessichumeinenoptimalenBayesschenKlassifikator[DH73], dessenQualitätausschließlichvon derGütederklassenlokalenML-Dichteschätzungenabhängt.

In Abbildung3.8wird dieserKlassifikatorfür dasschonbekannteBeispielausAbbildung2.8 illustriert. Die a priori -Wahrscheinlichkeitender beidenKlassensind °OÒ � à���� und° ì � ����� . Daherwurdenzwei ML-Dichteschätzungen¬È ���ɧ ��¤ � � Ò   und ¬È ���ɧ~à8¤ � �ì   miteinerMischungaus ��ÒÍ��� und � ì ��� multivariatenNormalverteilungenausgeführt.Die in derAbbildungeingetrageneKlassengrenzeist durchdieGleichheitdera posteriori-Wahrscheinlichkeiten ¬°x�\��§ �O¤ � � Ò   und ¬°x�qà�§ �O¤ � �ì   definiert.

In seinerDiplomarbeithatJ. BuscheinenanalogenKlassifikatorauf derGrundlageeinesunivariatenGRBF-Netzwerkshergeleitet,indem er die Verbindungsstärken îf� probabili-stischinterpretierthat [Bus97]. DieserKlassifikatorist inzwischenfür Aufgabender au-tomatischenSpracherkennungerfolgreichangewendetworden[Wil98, Met98]. Die obigeAbleitung auseinerML-Schätzungder VerbunddichteÈ ���O¤;Ê   wird in [ABK

ç99] veröf-

fentlicht.

81

Page 90: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

3. GRBF-Netzwerke,DichteschätzungundFunktionenapproximation

Zusammenfassung

In diesemKapitelwurdezunächsteinGRBF-Netzwerkuntersucht,dassichdurchrückwär-tige Verbindungenvon der Ausgabeschichtzur Zwischenschichtauszeichnet.Auf Grunddieserreziproken Verbindungenkönnenalle ParameterdiesesGRBF-Netzwerksin ei-nem gemeinsamenLernprozeßaus den Ein- und Ausgabedatenbestimmtwerden.ZurErlangungeinergrößerenFlexibilität werdenin dieserNetzwerkstrukturzusätzlichÜber-tragungsfunktioneneingeführt,die ausmultivariatenNormalverteilungenaufgebautsind.FürdieParametereinessolchenNetzwerksgebenwir sequentiellestochastischeLernregelnan,diedazuführen,daßdieGesamtaktivität aufderZwischenschichteinerML-SchätzungderTrainingsdatendurcheineMischungmultivariaterNormalverteilungenentspricht.Die-se Lernregeln werdenvon uns auchals sequentiellermultivar-Algorithmus bezeichnet[ABK

ç99].

Der AusgangspunktderobigenErgebnisseist die Funktionenapproximation(3.1), die aufder Schätzungder gemeinsamenDichte È �²�O¤;Ê   der Ein- und Ausgabedatenberuht.FüreineML-Dichteschätzungmit einerMischungmultivariaterNormalverteilungenführt dergewählteAnsatzzu einerFunktionenapproximation,der auseinerLinearkombinationlo-kaler linearerModelle besteht.Diesersog.LLM-Approximator hat eineReihevon Ähn-lichkeitenmit einemGRBF-Netzwerk.Insbesonderezeigtsich,daßfür denFall einerML-Schätzungmit einerMischungunivariaterNormalverteilungenderLLM-ApproximatorzueinemunivariatenGRBF-Netzwerkwird. Wennder LLM-Approximator für Klassifikati-onsaufgabenherangezogenwird, reduziertsich dieserauf ein GRBF-Netzwerk,welchesurprünglichvon J. Buschvorgeschlagen[Bus97] und inzwischenfür Problemeder auto-matischenSpracherkennungeingesetztwurde[Wil98, Met98]. Im allgemeinenFall ist derLLM-Approximator jedochnichtmehralsGRBF-Netzwerkinterpretierbar, sondernlieferteineglatteInterpolationeinervorgegebenZahl lokalerRegressionendurchaffineFunktio-nen.

82

Page 91: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. Systeme lokaler Exper ten

Wir verlassennun die neurobiologischmotivierteHerangehensweisean dasProblemderFunktionenapproximationund wendenunseiner formalenAbstraktiondesGRBF-Netz-werksunddesLLM-Approximatorszu.Dabeisoll zunächstdieFrageim Vordergrundste-hen,wie dasGRBF-NetzwerkundderschonnichtmehrvollständigneuronalbegründbareLLM-Approximator zu einemSystemlokaler Expertenverallgemeinertwerdenkönnen,welchesverschiedeneApproximierungsstrategien in ein Gesamtsystemintegriert. DiesesSystemwird die konzeptionelleundsoftwaretechnischeGrundlagefür die in Kapitel 7 zubeschreibendeneueRegelungderRückstandsverbrennungim WerkBurghausenbilden.

Im vorangehendenKapitelwurdeauseinerML-SchätzungderVerbunddichteÈ ���O¤;Ê   durcheineMischungmultivariaterNormalverteilungender LLM-Approximator entwickelt, dereineFunktionenapproximationdurcheineinterpolierendeMischunglokaler linearerMo-delle realisiertund der eineMischunglokaler linearerRegressionsanalysenrepräsentiert.Wie wir gesehenhaben,reduziertsichderLLM-Approximator in einerReihevonSpezial-fällen auf dasGRBF-Netzwerk.Sowohl dasGRBF-NetzwerkalsauchderLLM-Approxi-matorberuhendarauf,daßsiezunächstdenEingaberaumdurchPartitionierungsfunktionenin unscharfdefinierteTeilgebieteaufteilen.DiesenTeilgebietenwird jeweils eine lokaleModellfunktion zugewiesen,die beim GRBF-Netzwerkeine konstanteund beim LLM-Approximatoreineaffine Funktion ist. Die Ausgabeerfolgt bei beidenApproximatorendurch eine Gewichtung der lokalen Modellfunktionenmit den Partitionierungsfunktio-nen und durch Summationder gewichtetenlokalen Modelle, was zur Interpolationdie-ser Modelle führt. Im folgendenwird dieseArchitektur desGRBF-Netzwerksund desLLM-ApproximatorsaufgegriffenundzumEntwurfeinesverallgemeinertenKonzeptsderFunktionenapproximationgenutzt,daseineÜberlagerungbeliebiger lokalerFunktionenineinemSystemlokalerExpertenrealisiert.

Die Idee,eineProblemstellungauf verschiedeneExpertenaufzuteilenund die Entschei-dungüberdasentgültigeErgebniseinemübergeordnetenExpertenzuüberlassen1, ist nichtneu.DerersteAnstoß,diesesVorgehenaufdieArchitektureinesneuronalenNetzwerkszuübertragen,kamvon R. Jacobset al. [JJNH91]. DieseAutorenhabenseitdemverschiede-neFragestellungenuntersucht,die bei denMischungenvon Expertenauftreten.All diesenUntersuchungenist dabeigemeinsam,daßjederExpertedurchein neuronalesNetzwerk

1In Anlehnungan denGrundsatzrömischerMachtpolitik divide et impera wird diesesVorgehenin derenglischsprachigenLiteraturmit divideandconquerumschrieben.

83

Page 92: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. SystemelokalerExperten

repräsentiertwird, welcheseinenbestimmten,in denTrainingsdatenvorhandenenZusam-menhang,modelliert.Die AusgabedesGesamtsystemswird durchein gatingnetwork be-stimmt,welches,abhängigvom eingehendenMerkmalsvektor � , eineMischungder ver-schiedenenExpertenvornimmt. DasTraining einer solchenmixture of experts zielt aufdie Maximierungder log-likelihood desgesamtenSystemsabunderfolgt im einfachstenFall durcheinenGradientenabstieg [JJ93a, AJ96] oderdurchdenexpectationmaximization(EM)-Algorithmus[JX93, JJ93b, JJ94].

Ein ähnlicherAnsatzwird von R. Murray-Smithverfolgt [MS94]. DieserAutor fixiertaberwederdenkonkretenAufbau der lokalenModelle,nochwird dasVorgehenbei derMischungder verschiedenenModelle festgelegt. Der Schwerpunktliegt in [MS94] viel-mehrdarin,wie derZuständigkeitsbereicheinesModellsgeeignetbestimmtwerdenkannund wie sich eineHierarchiesolcherlokaler Modelle aufgebauenläßt. In [MSE97] zei-genR. Murray-SmithundT. Johansen,in welchemengenZusammenhangdasKonzeptderlokalenModellemit KonzeptenausderFuzzy-Logik, derRegelungstheorie,derNeuroin-formatikundderStatistiksteht.

Im Gegensatzzum top-downAnsatzvon M. Jordanet al. handeltessichbei demim fol-gendenvorgestelltenKonzeptumeinbottom-upVorgehen,beidemvondenEigenschaftendesLLM-Approximatorsausgegangenwird, für welchenin denAbschnitten3.2 und 3.3Lernregeln entwickelt wurden.DieseEigenschaftenwerdenstufenweiseauf ein Systemlokaler Expertenverallgemeinert.Hierbei wird sich herausstellen,daßfür diesesSystemkein gatingnetwork notwendigist. Zunächstsollenaberdie Vorteile lokalerExpertenge-genüberglobalenMethodendiskutiertwerden.

4.1. Warum sind lokale Exper ten vor teilhaft?

WelcheKonstruktionsmerkmalezeichnenein SystemlokalerExpertenaus?Zunächstein-malmüssen“Elemente”vorhandensein,die im Merkmalsraumjeweilseinenklar definier-ten Aufgabenbereichhaben.DieseBereichekönnenentwederin einemSelbstorganisati-onsprozeßermittelt odervom Systementwicklervorgegebenwerden.Häufig sprichtmandann– in AnalogiezusozialenOrganisationstrukturen– bei diesen“Elementen”auchvonExperten2. Desweiterenist ein Verfahrennotwendig,mit demdieAusgabenderExpertensinnvoll verknüpftwerdenkönnen.

Wie erwähnt,wird dasKonzeptlokaler Expertenseit einigenJahrenverstärktuntersuchtwird. Dabeihatsichherausgestellt,daßin solchenSystemendaslokaleLerneneineReihe

2Allerdingsdarf diesesKonzeptnicht mit denExpertensystemendersymbolischenkünstlichenIntelligenzverwechseltwerden.DieseExpertensystemeberuhendarauf,daßdieErfahrungeinesodervielermensch-licher Expertenin symbolischenRegeln formuliert wird, die automatischausgewertetwerden[Sch86].Der im folgendenwichtigeAspektdeslokalenLernensspieltbeidiesenSystemenkeineRolle.

84

Page 93: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4.2. VerallgemeinerungdesGRBF-Netzwerksaufein SystemlokalerExperten

von VorteilengegenüberLösungsansätzenbietet,welchedurchein globalesModell, des-senParametermit einemglobalenVerfahrenbestimmtwerden,zumZiel kommenwollen[MS94]:� DasTrainingeineseinzelnenExpertenist numerischeffizienteralsdasTrainingeines

großen,allesbeschreibendenNetzwerks[MS94].� DasglobaleTraining führt zu Parametern,die aucheineglobaleBedeutunghaben.DadurchwerdensolcheNetzwerkeschwerinterpretierbar. Im Gegensatzdazuhabendie ParameterlokalerExpertennur einebegrenzteWirkung undsinddamitwesent-lich besserzu interpretieren[JJ93a].� WennneueEigenschaftenintegriert werdensollen,dannist diesmit einemSystemlokalerExperteneinfachzurealisieren,indemeinneuerExpertemit derentsprechen-denEigenschafthinzugefügtwird. Bei einemglobalenModell ist in einemsolchenFall einneuesTrainingnotwendig[MS94].� Auch wennein Systemlokaler Expertennicht immer eineoptimaleApproximier-ungsqualitätaufweist,ist estrotzdemwegenseinerhöherenRobustheitundInterpre-tierbarkeit einerglobalenModellierungvorzuziehen[MS94].� In ein SystemlokalerExpertenkönnenzwanglosverschiedeneVerfahrenundAlgo-rithmenintegriertwerden.SolcheheterogenenSystemesindmit globalenMethodennicht realisierbar[JJ93a].

Im nächstenAbschnittwird anHanddesGRBF-NetzwerksunddesLLM-ApproximatorseinSystemlokalerExpertenentwickelt.Dasdarausresultierende,allgemeineKonzeptwirdzunächstvergleichenddiskutiert.ZumAbschlußdiesesKapitelswird einkomplexeresBei-spieldargestellt,auf welchesfür die Regelungsaufgabenin Kapitel 6. und7 nochzurück-gegriffenwerdenwird.

4.2. Verallg emeinerung des GRBF-Netzwerks aufein System lokaler Exper ten

Dasin Abschnitt3.2 vorgestelltemultivariateGRBF-Netzwerkist ebensowie der LLM-ApproximatorausAbschnitt3.3 zunächstein sehrspeziellesModell. Erst die ReduktiondieserModelleauf ihrewesentlichstenEigenschaftenführt zueinemSystemlokalerExper-ten.DieseVerallgemeinerungsoll in drei Schrittenerfolgen,derenResultatin Abbildung4.1 illustriert ist:

1. Schritt . Die Zwischenschichtaktivitäten �����O���+�=��� des GRBF-NetzwerksunddesLLM-ApproximatorswerdenausNormalverteilungen�� �O��� ���+���C�?�� � [vgl. (2.36)]

85

Page 94: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. SystemelokalerExperten

undstatistischenGewichten � � berechnet.Von nunansollendie �� �R�c� ���+���C�?�� � einebeliebigefunktionaleForm annehmenkönnen.Die neuenFunktionen ¡����R�¢�+��£8¤&¥� �werdenim folgendenauchals lokale Kompetenzenbezeichnetund definierendieZuständigkeitsbereicheder lokalen Experten � im Merkmalsraum,wobei auf eineglobaleNormierung(2.59) wie im GRBF-Netzwerkundim LLM-Approximatorzu-nächstverzichtetwird. Somit weist sich jeder Expertezu einer Eingabe � durch¡����O�¢�+� £8¤&¥� � selbständigeinelokaleKompetenzzu, welcheseineersteAusgabebil-det.Von dieserAusgabewird nur gefordert,daßsie Wertegrößerodergleich Nullannimmt.

2. Schritt . Zusätzlichzu diesererstenAusgabeliefert jederlokaleExpertezur Ein-gabe � einenFunktionswert¦F���O���+��§�§ �� � , dener auseinerbeliebigenFunktion ¦g�berechnet.Damit kannein lokalerExpertedurchein frei wählbaresVerfahreneineModellbildungvornehmen,dienichtaufdiekonstantenModelle ¦g� desmultivariatenGRBF-Netzwerksoderdie linearenModelle ¦g���O�¢���=§�§ �� � desLLM-Approximators(3.41) eingeschränktist.

3. Schritt . Die statistischenGewichte � � der ¨ lokalenExpertenwerdennicht auf©«ª ¨ fixiert, sondernzur heuristischenGewichtungihrer Aussagenverwendet.Die-seParameterbekommendamitdieBedeutungeinerübergeordnetenKompetenzundwerdenfortanmit ¬�� bezeichnet.SiesinddenlokalenExpertennicht bekannt,son-dernwerdendiesendurcheinenhierarchischübergeordneten,nachfolgendenExper-ten,densog.Entscheider, zugeordnet.

Ein lokaler Experte � hat alsoals EingabeeinenMerkmalsvektor � ò IR­ und gibt ei-neSchätzungseinerlokalenKompetenz¡����O�¢�+� £8¤&¥� � undeinenFunktionswert�¦g���R�¢�+� £8¤&¥� �aus,wobei die Funktion �¦g� ein lokalesModell desfunktionalenZusammenhangsim Zu-ständigkeitsbereichdesExpertendarstellt.Abbildung4.1zeigteinenAusschnittauseinemSystemsolcherlokalerExperten.In dererstenSchichterhaltendiesog.SpezialistenEinga-ben � (z.B.voneinemSensorsystem)undberechnenKompetenzen¡����R�¢�+��£8¤&¥� � undFunk-tionswerte�¦g���O�¢�+��£8¤&¥� � . Alle dieseInformationenwerdenzueinemneuenMerkmalsvektor�¯®R�O�P�±°³²�¡����O���+��£C¤&¥� �+´ �¦F���O���+��£C¤&¥� �«� �µ° © ¦�¦«¦ ¨·¶�ò IR­¯¸ zusammengefaßtund an einennachgeschaltetenExperten��® , denEntscheider, weitergegeben.DieserberechneteineneueKompetenz¡�� ¸ �O� ® �+� £C¤&¥� ¸ � undeinenneuenFunktionswert�¦g� ¸ �O� ® �+� £C¤&¥� ¸ � .Im Gegensatzzu den frei wählbarenlokalen Modellen �¦F���O���+� £C¤&¥� � der vorgeschaltetenExperten,ist die funktionale Form von �¦g� ¸ �R� ® �+� £8¤&¥� ¸ � durch die Aufgabedes Entschei-ders,die Aussagender vorgeschaltetenExpertenzusammenzuführen,eingeschränkt.InAnalogiezur Bildung desGesamtresultatsbeim GRBF-Netzwerk(2.62) undbeim LLM-Approximator(3.41) wird hier für �¦F� ¸ �R�¯®R��� £8¤&¥� ¸ � einekompetitiveInterpolationderForm�¦g� ¸ �O� ® �O�P�+�+� £8¤&¥� ¸ �P°º¹ ��¼»2½ �¦g���O�¢�+� £8¤&¥� �&¬���¡$���O�¢��� £8¤&¥� �¹ �¾ »2½ ¬ ¾ ¡ ¾ �R�¢�+� £8¤&¥¾ � (4.1)

86

Page 95: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4.2. VerallgemeinerungdesGRBF-Netzwerksaufein SystemlokalerExperten

x

Experte r-1

x

Experte r Experte r+1

x

r-1 Θ Exp; r-1x

Experte r’

x’

r x Θ rExp;k ( )

f r x Θ rExp;( )

k ( )r’ x’ Θ r’Exp;

Θ

( )

r’Exp;fr’ x’( )

Spezialisten

Entscheider

k ( ) r+1 Θ Exp; r+1xk ( )

f r-1 x( ); Θ r-1Exp f r+1 x ; Θ r+1

Exp

Abbildung4.1.:Systemlokaler Experten.Ein Spezialist¿ hatZugriff aufdieEingabedatenÀ .Die AusgabeeinessolchenlokalenExpertensetztsichausderlokalenKompetenzÁ �«Â À�Ã-Ä £C¤&¥� ÅunddemModell ÆÇ �  À�Ã-Ä £8¤&¥� Å zusammen.DieseInformationenbildenzusammendie EingabeÀ ® für denEntscheider¿ ® , derwiederumeinelokaleKompetenzÁ�� ¸  À ® Ã-Ä £8¤&¥� ¸ Å undein ModellÆÇ � ¸  À ® Ã-Ä £8¤&¥� ¸ Å berechnet.

gewählt. Für ein gegebenes�¯® bildet �¦g� ¸ �O�È®O�+� £8¤&¥� ¸ � denzweitenTeil derAusgabedesEnt-scheiders.Den erstenTeil bildet die Selbsteinschätzung¡�� ¸ �O� ® �+� £8¤&¥� ¸ � seinerKompetenz,die ergemäß

¡$� ¸ �R� ® �R�P�~�+� £8¤&¥� ¸ �É° �Ê �¼»2½ ¬��~¡����R�¢�+� £8¤&¥� � (4.2)

durchLinearkombinationausdenKompetenzen¡����R�¢�+� £8¤&¥� � dervorgeschaltetenExperten,sowie auseinemSatzvon Gewichten ¬�� , überdie er verfügt,berechnet.Der Kompetenz-bereichdesEntscheidersumfaßtalsodieKompetenzbereichedervorgeschaltetenSpeziali-stenundseineModellbildungrepräsentierteineInterpolationdervorgeschaltetenModelle.Damit läßtsichderEntscheiderwiederalseinfacherExperteauffassenundbeispielsweisemit anderenlokalenExpertenparallel schalten,wennein weiterernachgeschalteterEnt-scheiderdie ZusammenfassungderAussagenübernimmt.

In demobenformuliertenKonzeptfehlt zunächstjeglicheAussageüberdaskonkreteVor-gehenbei derModellbildungundderKompetenzbestimmung.Diesist auchnicht dasZieleinesSystemslokalerExperten.Vielmehrsoll einsolchesSystemlediglicheinenallgemei-nen konzeptionellenRahmenbilden, in dem verschiedeneMethodenzusammenarbeitenkönnen.

87

Page 96: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. SystemelokalerExperten

0.0

0.5

1.0

Abweichung x der Führungsgröße von der Regelungsgröße

0.0

0.5

1.0

Fuzzy-Regler PID-ReglerNeuro-ReglerPID-Regler

0.0

Abbildung4.2.:Verhalten der lokalen Kompetenz.DasBeispielzeigtim oberenTeilbild dielokalenKompetenzeneinesNeuro-,Fuzzy- undPID-Reglersin einemSystemlokalerExper-ten. Unten ist dargestellt,wie der Entscheiderüber die Zuständigkeiten Ë �  À�Ã-Ä £8¤&¥ Å darauseineunscharfePartitionierungdesMerkmalsraumsberechnet.In der Abbildung wurdendieübergeordnetenKompetenzenÌ � aller ExpertenaufEinsgesetzt.

Als Beispielfür einSystemlokalerExpertenzeigtAbbildung4.2, wie einNeuro-,einFuz-zy- undeinPID-Regler in einRegelungssystemintegriertwerdenkönnen3. Im oberenTeilder Abbildung sind die heuristischgewähltenlokalenKompetenzen¡����R�¢�+� £8¤&¥� � der dreiExpertendargestellt,wobeiderMerkmalsvektor Í im gegebenenFall die Abweichungderzu regelndenGrößevon derenaktuellerMessungbezeichnet.Der KompetenzbereichdesNeuro-Reglers ist durch die Gaußfunktion¡�½Î�R�¢�+� £8¤&¥½ � festgelegt, der BereichdesFuz-zy-Reglersdurchdie trapezförmigeFunktion ¡�Ï��R�¢�+� £8¤&¥Ï � , währenddie lokaleKompetenzdesPID-ReglersüberdemgesamtenMerkmalsraumeinekleineKonstanteist. Im gewähl-tenBeispielstellt der PID-Regler somit eineArt Notfallsystemdar, welchesimmer dannregelndeingreifensoll, wennderNeuro-undderFuzzy-Regler sichselbstzukleineKom-petenzenzuweisen.Im unterenTeilbild ist gezeigt,wie der Entscheider� ® deneinzelnenExpertenzunächstZuständigkeiten

Ð ���O�¢��� £8¤&¥� ¸ ��Ñ ¬��~¡��«�O�¢��� £8¤&¥� �¹ �¾ »2½ ¬ ¾ ¡ ¾ �O���+� £C¤&¥¾ � (4.3)

3Die verschiedenenRegelungskonzepte,diedieseRegler jeweilscharakterisieren,werdenin Kapitel5 nochnähererläutert.

88

Page 97: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4.2. VerallgemeinerungdesGRBF-Netzwerksaufein SystemlokalerExperten

zuordnet,welchenach(4.1) gemäß�¦F� ¸ �R� ® �R�P�~��� £8¤&¥� ¸ ��° �Ê �¼»2½ �¦g���R�¢�+� £8¤&¥� � Ð ���O�¢�+� £8¤&¥� ¸ � (4.4)

zur Berechnungder Interpolationbenötigtwerden.Die Zuständigkeitenrepräsentieren–ganzanalogzu denZwischenschichtaktivitäteneinesGRBF-Netzwerks– eineunscharfePartitiondesMerkmalsraums,welchejeneBereicheidentifiziert,in denenvornehmlicheinbestimmterExpertedie Gesamtausgabe�¦$�O�¢�+��£8¤&¥�� bestimmt.

Ein VergleichdesobendargestelltenSystemsvon lokalenExpertenmit dermixture of ex-perts vonR. Jacobsetal. [JJ93a, JX93, JJ93b, JJ94, AJ96] machtzweiwesentlicheUnter-schiededeutlich.Bei dermixtureof experts ist einspeziellesgatingnetworkvorgeschaltet,dasanHandderEingabe� die Entscheidungtrif ft, welcherExperteaktiv wird. In [JJ93b]wird alsBeispieldie RegelungeinesRoboterarmsuntersucht,welcherdurchverschiedeneNutzlastenbelastetwird. Die einzelnenExpertenbekommenalsEingabedatenlediglichdieRaumkoordinaten,diederRoboterarmanfahrensoll.Nur dasgatingnetworkerhältzusätz-lich dieInformationüberdieMassederNutzlastundkannsodieAuswahleinesgeeignetenExpertentreffen.In einemSystemlokalerExpertenwird dieseEntscheidungdagegenzumTeil “dezentral”von denExpertengetroffen werden,indemdiesesich selbständigKom-petenzenzuweisen.InsofernderEntscheiderdie Selbsteinschätzungder lokalenExpertendurchZuweisungübergeordneterKompetenzgewichtemodifizierenkann,hater allerdingeineähnlicheFunktionwie ein gatingnetwork.

Der zweiteUnterschiedbetrifft dasTraining der Experten.R. Jacobset al. schlageneinTraining mit dem backpropagation- oder dem EM-Algorithmus vor. Dabei werdenalleParameterdermixtureof expertsgemeinsamtrainiert.Diesmachtbesondersdie nachträg-liche Erweiterungder mixture of experts um weitereAufgabenund die IntegrationvonkonventionellenVerfahrenschwierig.BeimSystemlokalerExpertenist diesaufGrunddervollständigenLokalität derExperteneinfacher. In Kapitel 7 wird geradedieseEigenschaftvongroßerBedeutungsein,umverschiedeneRegelungsverfahrenin einGesamtsystemzurRegelungderRückstandsverbrennungzu integrieren.Esmußaberangemerktwerden,daßdie Entwicklungvon globalenOptimierungs-und Lernszenarienfür solcheSystemeeinkünftig nochnäherzuuntersuchendesProblemdarstellt.

DassehroffeneKonzeptder lokalenExpertenstellt alsozunächstnur eine“Konstrukti-onsanleitung”für die Entwicklungkomplexer, hierarchischerSystemedar, die z.B. für dieFunktionenapproximationoderdie RegelungtechnischerAnlagenverwendetwerdenkön-nen.Im folgendenAbschnittwird am Beispielder Funktionenapproximationeinermul-tifunktionalenDatenfolgeillustriert, wie zwei konkreteRealisierungenstrukturiert seinkönnen.Auch diesebeidenRealisierungenvon SystemenlokalerExpertenwerdenfür dieRegelungsaufgabenin Kapitel 6 und7 nochvonBedeutungsein.

89

Page 98: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. SystemelokalerExperten

Abbildung 4.3.: Multifunktionale Datenfolge. Die links dargestelltenDatenpunkteergebensich auseinemSystem,welchesauf GrundeinerstochastischenDynamik zwei verschiedeneZuständeÒ�Ó Ô�Õ8Ö/×�Ø�Ù¼Ú�Û annehmenkann.AbhängigvomZustandÒ�Ó Ô�Õ wird eineAbbildung ÜCÓ Ô�ÝØ�Õ?Þàß ¾-á âäã Â"å Ó Ô�Õ Å ausgeführt,die zusätzlichnochleicht verrauschtwird (roteundgrünePunkte).Die beidenFunktionenß ½æÂ"å Å und ß Ï«Â"å Å sind links als gestrichelteund durchgezogeneLinieeingezeichnet.Die Datenfolge × å Ó Ô�Õ$çOÔ/Þ�Ø*è+è+è|é/Û folgt der stochastischenDynamik einesrandomwalk: Die nachjedemZeitschritterfolgendeVerschiebung ê å Þ å Ó ÔgÕìë å Ó Ô¯ësØ�Õ wirdauseinemIntervall ÓqëíØæîðï�ñ�Ù+Øæîðï�ñ«Õ nacheinerGleichverteilunggewürfelt. Zusätzlichwird å Ó Ô�ÕnachjedemZustandswechselausdemIntervall Óqë�ñ�èóò�Ù+Ø�èóòÎÕ neuinitialisiert.

4.3. Appr oximation einer multifunktionalenDatenf olg e

Bei einermultifunktionalenDatenfolgeô ° �gõö´|÷T� werdendie Ausgabedaten÷ nichtnur durcheine Funktion ¦��R�P� ø IR­·ù IRú sonderndurcheinenSatzvon û Funktionen¦ ¾ �O�P� , üT° © ¦«¦�¦ û , generiert.Die Auswahl der jeweils aktuellenFunktion ¦ ¾_á âäã �R�P� kannda-beibeispielsweisedurcheinendiskreten,stochastischenProzeßerfolgen,dereinediskretestochastischeZustandsfolgeýà°·²�ü�þ ÿ���� IN � ©�� ü�þ ÿ�� � ûP´_ÿj° © ¦�¦�¦�� ¶ erzeugt.Eswerdenun angenommen,daßdie Zeitreihe,welchedurchdie zeitlicheAbfolge der Zuständeýgebildetwird, einemhomogenenMarkov-Prozeß[Hak82] gehorche,dereinelangsamver-änderlicheDynamik modelliert[Son97]. Diesbedeutet,(i) daßdie bedingteWahrschein-lichkeit � ��ü�þ ÿ���´|ÿ �_ü�þ ÿ� © �g´|ÿ� © ´~ü�þ ÿ����g´|ÿ���´ ¦�¦�¦ � , dasSystemzumZeitpunkt ÿ im Zustandü�þ ÿ�� zu finden,ausschließlichvom Zustandü�þ ÿ � © � zumZeitpunkt ÿ � © abhängtund (ii)daßdie mittlereLebensdauereinesZustandsdeutlichgrößerEinsist.

Die AufgabeeinesSystemslokalerExpertensoll nunsein,die gegebenemultifunktionaleDatenfolgeôL° ²���þ ÿ��g´�� þ ÿ�� © �A�&ÿ±° © ¦�¦«¦�� � © ¶ durcheinegeeigneteModellfunktion

90

Page 99: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4.3. ApproximationeinermultifunktionalenDatenfolge�¦ �R�¢�+�f� zu approximieren.Dabei ist ��þ ÿ�� die zum Zeitpunkt ÿ beobachteteEingabeeinesdynamischenSystemsund � þ ÿ�� © � faßtdie Systemantwort zumZeitpunkt ÿ�� © auf dieseEingabezusammen.DasProblemder ApproximationmultifunktionalerDatenfolgentrittimmer dannauf, wennein Systemvorliegt, welchesauf Grundvon Unstetigkeitensehrstarke Schwankungenaufweist.Ein solchesVerhaltenwerdenwir in Kapitel 6 bei derRegelungeinesBioreaktorsund in Kapitel 7 bei der Modellierungvon Ventilkennlinienwiederantreffen.

Abbildung 4.3 zeigt links eine einfachemultifunktionaleDatenfolge ô , die durch û ° Zuständebestimmtwird. Im rechtenTeilbild ist ein Ausschnittausder ZeitreihederZuständedargestellt,durchwelchezwischendenbeidenFunktionen��½Î�OÍÈ� und � Ï��FÍÈ� hin-undhergeschaltetwird. DieseZeitreiheerfüllt die beidenobenbeschriebenenAnnahmen.Zusätzlicherfüllt die Eingabedatenfolgeõ ° ²�ÍPþ ÿ��?�&ÿí° © ¦�¦«¦�� � © ¶ die Dynamikeinesrandomwalk Prozesses[Hak82]. Um trotzdemeinegewisseGleichverteilungvon õ zuerreichen,wird beijedemZustandswechselÍPþ ÿ�� neuausdemIntervall þ���� ¦�� ´ © ¦�� � gewürfelt.

4.3.1. mGRBF-System für eine multifunktionale Datenf olg e

M. Sonnerhat in seinerDiplomarbeitein Verfahrenentwickelt, welchesdie obengeschil-derte Aufgabenstellungbearbeitet[Son97]. Er führt hierzu multiple GRBF-Netzwerke,kurzdasmGRBF-System, ein.Diesesist einSystemlokalerExperten,diejeweilsdurcheinunivariatesGRBF-NetzwerkderForm (2.59) gebildetwerden.Die AusgabedesmGRBF-Systemswird nach(4.3) und(4.4) durch�¦��R��þ ÿ����+������� �"!P�É° §Ê # »2½ �¦ # �O��þ ÿ����+�$��� �"!# �&%Ð # þ ÿ�� (4.5)

berechnet.%Ð # þ ÿ�� sinddie ZuständigkeiteneinesGRBF-Netzwerks' undwerdendurcheinegleitendeMittelwertbildung

%Ð # þ ÿ��2°[� © � ©( �&%Ð # þ ÿ)� © �*� ©( Ð # �R��þ ÿ+� © �g´�� þ ÿ����+������� �"! � (4.6)

mit einemGedächnis ( ausdenaktuellenZuständigkeiten Ð # �O��þ ÿ)� © �g´�� þ ÿ����+� ����� �"! � ge-bildet. Die aktuellenZuständigkeiten werdenanalogzu den Zwischenschichtaktivitäten(2.59) einesGRBF-NetzwerksdurchÐ # �O��þ ÿ)� © ��´�� þ ÿ������ ����� �"! �¢Ñ ,.-0/ 1 � � �¦ # �O��þ ÿ)� © ���+� ���0�2!# ���3� þ ÿ��O� Ï ª 54 Ï687¹ §# ¸ »2½ ,9- / 1 � � �¦ # ¸ �R��þ ÿ)� © ���+� ��� �"!# ¸ ���:� þ ÿ��F� Ï ª 54 Ï6 7 (4.7)

bestimmt.

Im mGRBF-Systemwerdenalsodie Zuständigkeiten(4.6) des' -tenGRBF-Netzwerksda-durchfestgelegt, wie gut dessenFunktionenapproximationen�¦ # �R��þ ÿ)� © ���+� ���0�2!# � mit den

91

Page 100: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. SystemelokalerExperten

tatsächlichenSystemantworten � þ ÿ�� bei Eingaben��þ ÿ;� © � in der Vergangenheitüberein-gestimmthaben.EineguteFunktionenapproximationdurchdas' -teGRBF-NetzwerkübereineZeitspanne( führt somit zu einergroßenZuständigkeit %Ð # þ ÿ�� . Tritt in der multifunk-tionalenDatenfolge ô ein Zustandswechselauf, so wird die Zuständigkeit desnun ambestenpassendenGRBF-NetzwerkszunehmenundentsprechendeinebessereFunktionen-approximation(4.5) ausgegeben.Im günstigstenFall wird im mGRBF-Systemdurchjedesder < GRBF-Netzwerke eineder û Funktionen¦ ¾ �O�P� , ü ° © ¦«¦�¦ û , der multifunktionalenDatenfolgeapproximiert.

DieserIdealfall kannnatürlichnur durchein problemangepaßtesTraining der Parameter� �)���0�"! °³²�� ��� �"!# �=' ° © ¦�¦�¦ <c¶ eintreten.M. Sonneruntersuchtin seinerArbeit dasmGRBF-Systemnur für denFall ��P�FÍ���� ����� �"! � ø IR ù IR, d.h. nur für eineeindimen-sionaleEin- undAusgabedatenfolge[Son97]. AußerdemsetztM. Sonnervoraus,daßdieEingabedatenfolgeõ in einemendlichenIntervall gleichverteilt ist. Für dieseSituationschlägtM. Sonnervor, auf ein Training der Zentren >+�?� IR einesGRBF-Netzwerkszuverzichtenunddieseäquidistantim gegebebenIntervall zu verteilen.Für dasTrainingderVerbindungsstärkender < GRBF-Netzwerke modifiziertM. Sonnerdie outstar-Lernregel(2.64), indemerdieseumdieZuständigkeiten(4.6) erweitert.Fürden � -tenAxonbaum¦F�A@ #des' -tenGRBF-Netzwerkserhälter somitdie LernregelB ¦g�A@ # �R��þ ÿ+� © �g´�� þ ÿ��O�P°;���A@ # �O��þ ÿ+� © ����� ���0�"!# �&%Ð # þ ÿ��&�C� þ ÿ��"�k¦g�A@ # � ¦ (4.8)

DieseLernregel führt dazu,daßjeweils dasjenigeGRBF-Netzwerkam stärkstendurcheinenLernreiz �O��þ ÿ�� © �g´�� þ ÿ��O� angepaßtwird, dessenvergangenenFunktionenapproxima-tionen �¦ # �R��þ ÿD� © ��ÿ&®����+� ��� �"!# � , ÿ&® ° © ¦�¦«¦ ( , am bestenmit denZielausgaben� þ ÿD��ÿ&®�� ,( ° © ¦�¦�¦ ( , übereingestimmthaben.

M. Sonneruntersuchtin seinerArbeit die Stationaritäts-und StabilitätsbedingungenderLernregel (4.8) in Abhängigkeit vonderGaußbreite4 6 unddemGedächnisparameter( . ErschlägteinLernverfahrenvor, beidemzunächst4 6 und ( relativ großgewähltwerden.DerLernvorganggliedertsichdannin zwei Phasen.Zunächstwird die KompetitionzwischendenlokalenExpertenverschärft,indem 4 6 langsamverringertwird. Dadurcherfolgt eineSpezialisierungder lokalenExpertenauf die jeweiligen funktionalenZusammenhängeinderDatenfolgeô . Da nacheinererstenSpezialisierungdie QualitätderFunktionenappro-ximationdurchdasMitlernenandererZielfunktionenverringertwird, mußin derzweitenPhasederGedächnisparameter( schrittweisereduziertwerden,bisschließlichjederlokaleExpertegenaueineZielfunktion appoximiert.Ein sotrainiertesmGRBF-Systemist in derLage,jededer in der multifunktionalenDatenfolgeô enthaltenenZielfunktionenin derQualitäteinesGRBF-Netzwerkszuapproximieren.

Abbildung4.4 zeigtdie Approximationder multifunktionalenDatenfolgeausAbbildung4.3 mit einemmGRBF-Systemauszwei GRBF-Netzwerken mit jeweils 20 Zwischen-schichtneuronen.Bei demin Kapitel7 dargestelltenneuenRegelungssystemfür dieRück-standsverbrennungim Werk Burghausenwird dasmGRBF-Systemdazuverwendetdie

92

Page 101: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4.3. ApproximationeinermultifunktionalenDatenfolge

Abbildung 4.4.: mGRBF-System für eine multifunktionale Datenfolge. Das verwendetemGRBF-Systemist auszweiGRBF-Netzwerkenmit jeweils20Zwischenschichtneuronenauf-gebaut.Links sinddie beidenFunktionenapproximationen Æß ½ Â"å Ã-Ä ��� �"!½ Å und Æß Ï Â"å Ã-Ä ���0�2!Ï Å(rote und grüneLinie) der multifunktionalenTrainingsdatenE (rote und grünePunkte)dar-gestellt.Die Lagen F � der 20 Zentrensind durchdie schwarzenKreuzemarkiert.DasrechteTeilbild zeigt die Zugehörigkeit Ë ½ Ó Ô�Õ für eineTestdatenfolgeG�HJILKJH (rote Line). Diesestimmtnahezuperfektmit dertatsächlichenZustandsfolgeÒ�Ó ÔgÕ überein(schwarzePunkte).

Kennlinienvon stark nichtlinearen,diskontinuierlichenFlüssigkeitsventilen zu approxi-mieren.Damals(Oktober1997)standderLLM-Approximator nochnicht zur Verfügung,derebenfallszurFunktionenapproximationeinermultifunktionalenDatenfolgeô geeignetist.

4.3.2. LLM-Appr oximator für eine multifunktionale Datenf olg e

Die FunktionenapproximationeinermultifunktionalenDatenfolgeô^° ²���þ ÿ���´M� þ ÿN� © �?�&ÿÉ°© ¦�¦«¦�� � © ¶PO IR­�Q ú kannauchzwanglosmit einemLLM-Approximatorgelöstwerden,bei demessichselbstverständlichebenfalls umeinSystemlokalerExpertenhandelt.

Auf Grundder dynamischenStrukturder Datenfolgeô ist esnun allerdingsnotwendig,für die Optimierungder Parameter� §�§ � einesLLM-Approximatorsmit einer anderenDatenfolge Rô zuarbeiten.Die einfachsteWahl ist Rô[°·²���þ ÿ���´�� þ ÿ���´M� þ ÿ�� © �?�&ÿ�° © ¦�¦�¦�� �© ¶ . Rô setztsich ausder EingabedatenfolgeRõ °�²���þ ÿ��g´�� þ ÿ��A�&ÿf° © ¦«¦�¦�� � © ¶SO IR­�Q úund der AusgabedatenfolgeR÷ ° ²&� þ ÿ;� © �?�&ÿ�° © ¦�¦�¦M� � © ¶TO IRú zusammen.DieEingabedatenfolgeRõ umfaßtnebenderaktuellenEingabe��þ ÿ�� auchdieSystemantwort � þ ÿ��auf die Eingabe��þ ÿ � © � . Da sich ��þ ÿ�� auf Grunddergefordertenrandomwalk Dynamik

93

Page 102: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. SystemelokalerExperten

Abbildung4.5.:LLM-A pproximator für einemultifunktionale Datenfolge.Zur Funktionen-approximationdesin Abbildung4.3 gezeigtenmultifunktionalenZusammenhangswurdezu-nächstdieDatenfolge UE HJVXW�Y[Z Þà× å Ó ÔgÕOÙ&Ü5Ó Ô�ÕOÙ&ÜCÓ Ô+ÝTØ�Õ$çOÔPÞYØ*è+è+è-ésë Ø«Û einerML-Dichteschätzungmit einerMischungaus20 multivariatenNormalverteilungenunterzogen.Im linken Teilbildsinddie darausresultierendendreidimensionalenlokalenKoordinatensystemein einerProjek-tion auf die Ebenedargestellt,die durchdie Achsenå Ó ÔgÕ und Ü5Ó ÔgÕ aufgespanntwird. NachderKonstruktioneinesLLM-Approximators Æß Â UÀÉÓ ÔgÕOÃ-Ä §�§ � Å ergibt sich schließlichfür eineTest-datenfolge UG$H\ILK]H Þà× å Ó ÔgÕOÙ&Ü5Ó ÔgÕ$çOÔ Þ�Ø*è+è+è_é ë Ø«Û die rechtsgezeigteFunktionenapproximation.

nur langsamverändert,enthälteinDatenpunktR��þ ÿ��¯Ñ �R��þ ÿ���´�� þ ÿ��F� � Rõ wegen� þ ÿ��_^;¦ ¾-á âäã �O��þ ÿ��O� (4.9)

nunauchdie implizite Informationdarüber, in welchemZustandü�þ ÿ�� sichdasSystemgera-debefindet.Allerdingskannein größererSprungin derDatenfolgeõ einenApproximie-rungsfehlerverursachen,dadann(4.9) nichtmehrerfüllt seinmuß.

Mit einersolchenDatenfolge Rô kannentsprechenddemVorgehenausAbschnitt3.3 einLLM-Approximatorgeneriertwerden,welcherdieFunktionenapproximation

R� þ ÿ�� © �5° ��P� R�cþ ÿ����+� §�§ � � (4.10)

ausführt.

Die beidenAbbildungen4.5 und 4.6 veranschaulichendasVorgehenbei der Konstrukti-on der Funktionenapproximation(4.10) für die DatenfolgeausAbbildung 4.3. In diesemFall ist Rô O IR , Rõ O IRÏ und R÷ O IR. In Abbildung 4.5, links, ist in einer zweidi-mensionalenProjektiongezeigt,wie sichdie lokalenModelledesLLM-ApproximatorsinderdreidimensionalenDatenfolge Rô verteilen.Abbildung4.6zeigtdieselbenlokalenMo-delle zusammenmit der Funktionenapproximation(4.10) durchdenLLM-Approximator

94

Page 103: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4.3. ApproximationeinermultifunktionalenDatenfolge

Abbildung4.6.:LLM-A pproximator für einemultifunktionale Datenfolge.DieFunktionen-approximation Æß Â UÀ�Ó Ô�ÕOÃ-Ä §�§ � Å ausAbbildung4.5 ist hier in einerdreidimensionalenDarstel-lung gezeigt.Zusätzlichsind für die 20 Normalverteilungendie lokalenKoordinatensystemeundin rot die beidenFunktionenß ½æÂ"å Å und ß Ï«Â"å Å eingetragen.Die Abbildungmachtdeutlich,wie sich beim LLM-Approximator die lokalen Expertennur auf Bereicheim Eingaberaumspezialisieren,in denenauchtatsächlichDatenvorliegen.

in einerdreidimensionalenDarstellung.DasrechteTeilbild der Abbildung 4.5 illustriertdie FunktionenapproximationdesLLM-Approximators für eine Testdatenfolge Rõ H\ILK]H °²�ÍPþ ÿ��g´�a�þ ÿ��?�&ÿí° © ¦�¦�¦M� � © ¶ . Da derKomponentea*þ ÿ�� ein kleinerRauschanteilaufaddiertwurde(sieheauchAbbildung4.3) erhältmankeineglatteFuntionenapproximation.DasindiesenAbbildungenskizzierteVorgehenkannnatürlichauchaufkomplexere,höherdimen-sionalereDatensätzeübertragenwerden.Entscheidendist,daßderLLM-ApproximatormiteinerEingabedatenfolgeRõ trainiertwird, in derderZustandü�þ ÿ�� implizit kodiertist.

Der LLM-Approximator unterscheidetsich in einer Reihevon Punktenvom mGRBF-SystemvonM. Sonner:

95

Page 104: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

4. SystemelokalerExperten� DasmGRBF-SystemerlaubteineZustandsdetektionvon üAþ ÿ�� . Dies ist möglich,dajedesder < GRBF-Netzwerke überdie Zuständigkeiten %Ð # þ ÿ�� auf einenZustandüAþ ÿ��zeigenkann.Eine solcheZustandsdetektionist beim LLM-Approximator nicht indieserexpliziten Weisemöglich.� DasmGRBF-SystembenötigtnichtzwingendeineEingabedatenfolge,dieeinerran-domwalk Dynamik gehorcht.DieselangsameDynamik der Eingabedaten,die derLLM-Approximator für die Erfüllung von (4.9) verlangt,ist aberin vielen realenProblemstellungendiegenerischeSituation.� M. SonnerhatdasmGRBF-Netzwerknur für gleichverteilteeindimensionaleEinga-bedatenuntersucht.In hohenDimensionenführt die äquidistantePositionierungderZentrenb�� zusehrgroßenmGRBF-Systemen.Esist auchnichtaufAnhiebklar, wieeinTrainingallerParameterdesmGRBF-Systemsfür eineFunktionenapproximation�¦ ø IR­ ù IRú auszusehenhat.� Im Gegensatzdazuist der LLM-Approximator vollständigdichteorientiert.Nur inRaumgebieten,in denenDatenpunktevorliegen,wird aucheineFunktionenappro-ximationdurchgeführt.Dahersind für einemit demmGRBF-SystemvergleichbareApproximierungsqualitätdeutlichwenigerParametererforderlich.

Zusammenfassung

Im erstenTeil diesesKapitelswurdeausder formalenStrukturdesLLM-Approximators,der auchals eineVerallgemeinerungdesGRBF-Netzwerksaufgefaßtwerdenkann,eineKonstruktionsvorschriftfür denAufbauvon SystemenlokalerExpertenentwickelt. In denAbschnitten4.3.1 und 4.3.2 wurdenzwei Beispielefür Systemelokaler Expertenvor-gestellt,die sich beidezur FunktionenapproximationmultifunktionalerDatenfolgeneig-nen.DieseAufgabenstellunghat nochmalsdie guteApproximierungsqualitätdesLLM-Approximatorsgezeigt.Auf GrunddiesergünstigenEigenschaftenwird in Kapitel 6 derLLM-Approximator für dieRegelungeinesBioreaktorseinsetzt,dersichdurcheinenicht-lineareDynamikundstochastischeZustandsänderungenauszeichnet.Auf dasKonzeptdesSystemslokalerExpertenwerdenwir in Kapitel 7 zurückkommen,daessichdort alsnot-wendigerweisenwird, verschiedeneStrategien für die Regelungder Rückstandsverbren-nungin einemGesamtsystemzu integrieren.

96

Page 105: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

Wie schonin derEinleitungerklärtwurde,hatdie vorliegendeArbeit dasZiel, aufbauendauf denWeiterentwicklungendesGRBF-NetzwerkmodellsneueKonzeptezur RegelungindustriellerAnlagenzu entwerfen.Komplementärzu denhierzu erforderlichenGrund-lagenausder Neuroinformatik,welcheim 2. Kapitel referiert wurden,ist esdahernunnotwendig,zunächstauchentsprechendesBasiswissenausderRegelungstheorieeinzufüh-ren.DieseKenntnissesollenesermöglichen,die in denKapiteln6 und7 darzustellendenAufgabenin derSprachederRegelungstheoriezu beschreiben.Insbesonderewird im fol-gendenauf zwei etablierteRegelungsverfahren,denPID- unddenFuzzy-Regler, genauereingegangen,dadieseMethodenzurvergleichendenEvaluationdervonmir vorgeschlage-nenVerfahrenverwendetwerden.

5.1. Grundbegriff e der Regelungstheorie

Im Jahre1963begründeteN. Wienermit seinemBuch “K ybernetik” [Wie63] einenda-malsneuenForschungszweig.Dieserbeschäftigtesichmit dermathematischenBeschrei-bung und modellartigenErklärungvon dynamischenSystemen,welchedurchdie Rück-führungvon Informationenin einemRückkopplungssystemgeprägtsind.Der inzwischenetwasüberholteBegriff der Kybernetikumfaßtedamit Disziplinenwie die System-,dieNachrichten-unddie Informationstheorie.Im besonderenMaßeist aberauchdie heutigeRegelungstheoriedurchdieKybernetikbeeinflußtworden.

Mit Regelung wird in Biologie undTechnikderVorgangbezeichnet,daszeitlicheVerhal-teneinesSystemssozu beeinflussen,daßein bestimmtes,erwünschtesZiel erreichtwird[Föl92]. Wir hattenin der Einleitungmit der Beschreibung der Bewegungskoordinationbei Lebewesenein sehrkomplexesBeispielkennengelernt.Nun sindzwar technischeSy-stemevon viel geringererKomplexität, aberdennochist die Regelungstheorieim LebendesmodernenMenschenvon großerBedeutung.Allerdingsist dieseTatsachehäufignichtoffensichtlich,dadie Regelungstheoriein derunauffälligen Arbeitsweisevieler effizientertechnischerGeräteverborgenist.

In derRegelungstheoriewird daszu regelnde,dynamischeSystemalsStrecke bezeichnet.Dabeiwerdenauchdie verschiedenenMeßeinrichtungen– die Sensoren – unddie Stell-glieder– die Aktoren – zur Strecke gezählt.Überdie Stellgrößen�j�Oÿ��c� IR­ werdendie

97

Page 106: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

Regler Führungsgröße

Strecke Regelgröße y

Regler(t)

Strecke

Führungsgröße

Regelgröße yStellgröße x Stellgröße x(t) (t)(t) (t)

(t)ww

Abbildung5.1.:Geschlossenerund offener Regelkreis.

Veränderungender an den d Aktoren einzustellendenWertevorgegeben.Die Regelgrö-ße egfLh�i�j IRk liefert Informationenüberdie Signaleder l Sensorenund machtsomitAussagenüberdengegenwärtigenZustandderStrecke. Die AufgabedesReglersbestehtnundarin,die Strecke sozubeeinflussen,daßdie RegelgrößeegfCh�i möglichstgutmit einervorgegebenenFührungsgrößemnfLh�ioj IRk übereinstimmt.Häufig wird dazueine Füh-rungsgrößenabweichung pqfLh�i�rsmnfLh�i�tuegfCh�i eingeführt.DabeibeschreibtmSfCh�i die Ziel-trajektorie,die dasSystemauf Grundder Regelungdurchlaufensoll. DasGesamtsystemausStrecke undRegler wird auchalsRegelkreis bezeichnet.

Abbildung5.1zeigtzweigrundsätzlichverschiedeneMethoden,einetechnischeRegelungzurealisieren.Links ist dasSchemaeinesrückgekoppeltenRegelkreisesdargestellt.Bei ei-nemsolchenSystemgeneriertderRegleranHandvonFührungs-und Regelgrößeneinege-eigneteStellgröße.Als einfachesBeispielläßtsichhierdie RegelungderRaumtemperaturdurcheinenMenschennennen.Abhängigvon seinemjeweiligenBefindenist ihm einebe-stimmteRaumtemperatur(Führungsgröße)erwünscht.Er vergleichtdieseWunschtempe-raturmit deraktuellenTemperatur(Regelgröße)undverstelltdementsprechenddasHeiz-körperventil (Stellgröße).Bei demGesamtsystemMensch-Heizunghandeltessichalsoumeinengeschlossenen,rückgekoppeltenRegelkreis.WennderRegler jedochkeineInforma-tionen zur Regelgrößehat, spricht man von einemoffenen,bzw. nicht rückgekoppeltenRegelkreis.Dieserauchals SteuerungbezeichneteVorgangwird häufigbei der Ablauf-kontrollevon Gerätenangewendet.

Die StellgrößevwfLh�i j IRx , dieRegelgrößeegfLh�iwj IRk unddieFührungsgrößemSfCh�iwj IRkkönnenskalareodervektorielleGrößensein.Gilt d yzl y { sprichtmanvon einemsingle input-singleoutput (SISO) Regelkreis.Bei d |y { und l |y { wird ein multi-ple input-multipleoutput (MIMO) Regler notwendig.EntsprechendsindauchMISO- undSIMO-Regler zuverstehen.

NachwelchenPrinzipienkannnun ein Regler konzipiertwerden?Für die KonstruktioneinesfunktionstüchtigenReglersist esunabdingbar, daßdiezu regelndeStreckemöglichstgut bekanntist. NachderArt derRepräsentationdiesesWissenskönnendrei grundlegendverschiedeneReglerklassenunterschiedenwerden:} Bei der modellbasierten Regelungwird die Strecke durch ein analytischesMo-

dell beschrieben.DerweitverbreiteteProportional-Integral-Differential-Regler(PID-

98

Page 107: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5.2. ModellbasierteRegelungmit einemPID-Regler

Regler) ist ein VertreterdiesesPrinzipsundwird in Abschnitt5.2 ausführlicherer-läutert.DerPID-Regler beruhtaufeinerModellbeschreibungdurcheinelineareDif-ferentialgleichung.NeuereReglertypen,wie z.B. derKalman-Filter[Kal60, Sor70]oder der self-tuningregulator [AW73, MSW92] versuchendie Qualität der Mo-dellbeschreibung– unddamitauchdesReglers– durchdie Verwendungvon nicht-linearenDifferentialgleichungenzuverbessern.} Die erfahrungsbasierteRegelungist dannnotwendig,wenndie Strecke analytischsehrschwerodergar nicht beschreibbarist, aberdurchdie manuelleRegelungderStrecke ein großerErfahrungsschatzverfügbarist. Diesevon MenschengewonneneErfahrungkanndannz.B.mit Hilfe vonwissensbasiertenExpertensystemen[Sch86]oderderFuzzy-Logik [Zim93, DeS95] soformalisiertwerden,daßdasursprünglicheVorgehenbei dermanuellenRegelungdurcheineentsprechendeAutomatikkopiertwird. In Abschnitt5.3wird dieArbeitsweiseeinesFuzzy-Reglersbeschrieben.} DatenbasierteRegelungist prädestiniertfür Fälle,beidenenwedereinanalytischesModell der Strecke existiert, nocheineformalisierbaremenschlicheErfahrungzurRegelungdieserStreckevorliegt. FürdieParametrisierungsolcherReglersindMeß-datennotwendig,die dasVerhaltender Strecke in verschiedenenSituationenundübereinenlängerenZeitraumerfassen.Fernerwird ein Verfahrenbenötigt,welchesesgestattet,dieParameterausdenDatenzuextrahieren.DaherbietensichneuronaleNetze,die datenbasierteFunktionenapproximationenermöglichen,als Regelungs-werkzeugean.

Die meistenMethodender klassischenRegelungstheoriesind den modellbasiertenVer-fahrenzuzuordnen[Föl92]. Auf Grund methodischerFortschritteund der kostengünsti-genVerfügbarkeit hoherRechenleistung1 sinddie numerischaufwendigerenerfahrungs-bzw. datenbasiertenRegelungsverfahrenin denletztenJahrzehntenaberzunehmendaktu-eller geworden.Anzumerkenist, daßbei praktischenLösungendie obigeEinteilungnichteindeutiggreift, dadort häufigverschiedeneMethodenzu hybridenVerfahrenkombiniertwerden.

5.2. Modellbasier te Regelung mit einem PID-Regler

Viele technischeStrecken lassensich nachEinführungeinesZustandsvektors ~�j IR�durchein linearesDifferentialgleichungssystem1. Ordnungmit konstantenKoeffizientenmodellieren.Der Zustandsvektor ~ umfaßt alle für eine Beschreibung der Strecke rele-vantenGrößen,für die abernicht unbedingteine Messungvorliegt. Für den Fall eines

1Universelleinsetzbareund programmierbaremicro-controller werdenin sehrhohenStückzahlenprodu-ziertundsindseitetwa10Jahrensopreisgünstig,daßsichderEinsatzauchin alltäglichenGerätenlohnt.

99

Page 108: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

e(t) w (t)

(t)

PID

x (t) (t)yStreckez

Abbildung5.2.:SchemaeinesPID-Reglers.

SISO-Regelkreises(d.h. d�y�l�ys{ ) kanneinesolcheStreckedanndurch�� h ~2fLh�i)y����&~2fLh�i��u����fLh�i (5.1)

mit denzeitunabhängigenParametern� j IR�_�N� und ��j�� x beschriebenwerden.InvielenFällenkanndie Regelgröße��fLh�i alslinearabhängigvomZustandsvektor ~2fLh�i ange-nommenwerden.DiesesVerhaltenwird durchdiealgebraischeGleichung

��fLh�i�yT�5���&~2fCh�i (5.2)

mit ��j IR� modelliert[Lud89].

Die meistenin der IndustrieeingesetztenStandardregler für eineStrecke, die annäherndeinerBeschreibungdurch(5.1) und(5.2) gehorcht,sindlineareRegler [Czi89]. Der wich-tigsteVertreterdieserReglerklasseist derPID-Regler [Föl92]

��fCh�i)y�l��$�]�fCh�i�� {�q������ �fL�qi � � � ��¡ �� h �fCh�iA¢5£ (5.3)

wobeihier derFall einerSISO-Strecke angenommenwird. Abbildung5.2zeigteinenRe-gelkreismit einemsolchenPID-Regler. DerPID-ReglerberechneteineStellgröße��fLh�i aufGrundlagevondrei Termen:

} DerP-Anteil l¤�_�fLh�i ist proportionalzurAbweichung�fLh�i . Allein mit demP-Anteilgelingtesabernicht, eineStrecke auf eineFührungsgröße¥¦fCh�i einzuregeln,da im-mereineAbweichung�fCh�i�|y�§ verbleibenwird [Föl92].} Erst der I-Anteil l��_¨ ���ª© �� �fL�2i � � vermagin Verbindungmit dem P-Anteil dieAbweichung�fLh�i zumVerschwindenzu bringen,indemdie Stellgröße��fLh�i propor-tional zur Summederbis zumaktuellenZeitpunkterfolgtenAbweichungenberech-net wird. Bei einerkonstantenAbweichung �fLh�i«y { entsprichtder I-Anteil zumZeitpunktderNachhaltezeit

���geradedemBeitragdesP-Anteils.Die nur langsam

einsetzendeWirkungdesI-Anteil führt zueinemÜberschwingenderStellgröße��fLh�iunddamitauchderFührungsgröße��fLh�i [Föl92].

100

Page 109: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5.2. ModellbasierteRegelungmit einemPID-Regler

t [T ]S

x(t)

1 2 3

3 t

x[t]

1 2

Abbildung 5.3.: Zeitdiskretisierung. Dasobengezeigtezeitkontinuierliche Signal ¬�­\®�¯ wirdmit einerAbtastperiode°�± abgetastet.DasuntereBild zeigtdasso resultierendezeitdiskreteSignal ¬�² ®´³ mit ®)µ IN. DiepunktiertenLiniendeutenan,daßderWertvon ¬¶² ®·³ biszumnächstenAbtastzeitpunktalskonstantangenommenwird.

} Beim D-Anteil l�� ��¡ � �fLh�i¸¨ � h ist die Neigungzum ÜberschwingengeringeralsbeimI-Anteil. Esstellt sichauchhier einebleibendeAbweichung�fLh�i ein,die abergeringerist alsbeimP-Anteil.DaderD-Anteil bei jedemFührungsgrößensprungzueinerstoßartigenStellgröße��fCh�i führt, kannderD-Anteil in derPraxisnur mit einerTiefpaßfilterungvor der Dif ferenzierungverwendetwerden[Lud89]. Zur Vorhalte-zeit

��¡ist derGleichstandzwischenD-Anteil undP-Anteil erreicht,wenn �fLh�igy¹h

gilt.

Bei geeigneterKombinationder P-, I-, und D-Anteile erhältmaneinenPID-Regler, derein geringesÜberschwingenaufweistund zu einerverschwindendenFührungsgrößenab-weichung�fCh�i führt [Lud89]. DaszentraleEntwurfproblembeieinemPID-Regler ist daherdie Wahl derParameterl¤� ,

�q�und

�_¡. Ist die Strecke annähernddurch(5.1) beschreib-

bar, dannist die Parameterbestimmungrelativ einfach[Föl92, TCA71]. Ist allerdingsdieStreckenichtanalytischgenaubekannt,wird dieFestlegungderPID-Parameterim wesen-lichenzueinemtrial anderror Problem.KommennochNichtlinearitäten,zeitlichvariableSystemparameterund– für denFall einesMIMO-Regelkreises– starkeWechselwirkungenzwischendenverschiedenenStellgrößenhinzu,wird dieAufgabezunehmendschwieriger.Für dieseSituationensind Verfahrennotwendig,die die PID-Parameterkontinuierlichandie Erfordernisseneuanpassen.EinedervielenMöglichkeitenist hier z.B. derself-tuningregulator [AW73, MSW92].

Für die praktischeRealisierungdurch einenAlgorithmus kann der PID-Regler nicht inderobigenzeitkontinuierlichenForm (5.3) verwendetwerden.Vielmehrmüssenzunächst

101

Page 110: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

diezeitkontinuierlichenGrößendiskretisiertwerden.Abbildung5.3veranschaulichtdiesenVorgang.Bei einersolchenAbtastungwird mit einerAbtastperiode

� ± die zeitkontinuier-liche Größe��fLh�i zu denZeitpunktenº � ± , º?j IN, ausgelesenundderzeitdiskretenGröße��»[º*¼qyT��f´º � ± i zugewiesen.Eshandeltsichhierbeiumeineeindeutige,abernichtumkehr-bareAbbildung.Der Vorgangder Abtastungwird im Folgendendurchdie Schreibweise��»[º*¼ bzw. ��» h�¼ mit ºq£�h�j IN angedeutet.EineAbtastungist für alle Regler notwendig,dieaufeinerInformationsverarbeitungdurchdigitaleRechnerberuhen.

Nach[DL89] ergibt sich nacheinersolchenAbtastungfür denPID-Regler der folgendediskreteRegelungsalgorithmus:

0. Initialisierung

�½ y�l¤� � ± ¨N¾���z£ ¿ x y � x t � ± ¨À¾� x � � ± ¨N¾ £ � x y�l¤� ��¡� x � � ± ¨N¾1. Einlesen von ¥¤» h�¼ und ��» h�¼2. Regelungsschritt

�0» h�¼Áy ¥¤» h�¼ÂtÃ��» h�¼�Â�g» h�¼Äy l��¶�0» h�¼� ½ » h�¼Äy � ½ » h�tÅ{8¼*� �*½ fÆ�0» h�¼0�u�0» h+tÇ{8¼Li� x » h�¼Äy ¿ x � x » h�tÅ{8¼*� � x f´�0» h�¼"t��0» h+tÇ{8¼Li��» h�¼Áy �Â� » h�¼0��� ½ » h�¼0��� x » h�¼3. Ausgeben von ��» h�¼4. Abwarten der Abtastperiode

� ± : h Èzh_��{Neuen Regelungsschritt mit 1. beginnen.

In diesemdiskretenPID-Algorithmusgibt es zusätzlichzur Nachhaltezeit�q�

und Vor-haltezeit

��¡noch eine Dämpfungszeit

� x . DieserParametercharakterisiertdie für denD-Anteil notwendigeTiefpaßfilterungderFührungsgrößenabweichung�0» h�¼ . BesondersfürFührungsgrößen�¶» h�¼ , diestarkmit einemRauschenbehaftetsind,ist einesolcheDämpfungwichtig, dasonstdasRauschenzu einerDestabilisierungdesRegelkreisesführt [Gee94].Die Abtastperiode

� ± einessolchendiskretenPID-Reglerssollteetwa 10 mal kleinerseinalsdie kleinsteZeitkonstante,die für dieStrecke vonBedeutungist [Lud89].

102

Page 111: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5.3. ErfahrungsbasierteRegelungmit einemFuzzy-Regler

Strecke

[t]FuzzifizierungDefuzzifizierung

Regelbasis

Fuzzy-Regler

Inferenz

x [t] [t]y

w

Abbildung5.4.:Prinizp einesFuzzy -Reglers.

5.3. Erfahrungsbasier te Regelung mit einemFuzzy -Regler

KonventionelleRegelungstechniken,wie der PID-Regler, habenviele Vorteile.Wenndiezu GrundeliegendenAnnahmenerfüllt und die Parameterkorrekt eingestelltsind, danngarantierendieseVerfahreneine optimaleRegelung;häufig weisensie sogareine hoheRobustheitgegenüberkleinerenStörungenundModellunsicherheitenauf [DeS95, Lud89].Es sind aberaucheinigeNachteilevorhanden.Die Methodensind relativ unflexibel underlaubenkeine Grobeinstellungder Parameterauf Basisvon unvollständigenoder unsi-cherenInformationen.AuchkönnensolchemodellbasiertenVerfahrennichtaufqualitativemenschlicheErfahrungenzurückgreifen,die durch eine manuelleRegelungder Streckegesammeltwurden.ErfahrungsbasierteTechniken,wie z.B. derFuzzy-Regler, bietenhiereineAlternativezumodellbasiertenRegelungen.

Abbildung5.4zeigtdenprinzipiellenAufbaueinesFuzzy-Reglers.Die IdeeeinesFuzzy-Reglers,wie auchder Fuzzy-Logik, bestehtdarin,zunächsteineRegelbasis aufzustellenund an HanddieserRegeln Entscheidungenzu treffen. Es handeltsich dabeiabernichtum scharfdefinierteHandlungsvorschriften,sondernum unscharfe,sog.fuzzyRegeln.Ei-nesolcheRegel könntez.B. lauten:Wenndie Temperatursehrhochist, dannschließedasVentil schnell. Um auf der GrundlagesolcherRegelnEntscheidungentreffen zu können,ist zunächsteineFuzzifizierungderEingabedateneD» h�¼ und mÉ» h�¼ notwendig.Dazuwird ei-ne scharfdefinierteGröße(z.B. der MeßwerteinerTemperatur)einerunscharfenMenge(z.B.sehrhoheTemperatur) zugeordnet.Damit trägtdasVerfahrenmöglichenMeßfehlernundUnsicherheitenbeiderBestimmungderEingabedatenRechnung.Die eigentlicheEnt-scheidungsfindungerfolgtdurchdiekompositorischeInferenzregel [Zad73]. AbschließendmußnocheineDefuzzifizierungvorgenommenwerden,umzuscharfdefiniertenAusgabenzukommen,diealsStellgrößenvg» h�¼ verwendetwerdenkönnen.

In denfolgendendrei Teilabschnittenwird ein Fuzzy-SystemnachE. Mamdanibeschrie-ben[MG87]. SeineArbeitsweisewird – parallelzu denfolgendenAusführungen– in Ab-

103

Page 112: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

Zug

ehör

igke

it

1

Temperatur T

µ µsn µµ (T) (T) (T)hn (T)sh

Abbildung5.5.:Zugehörigkeitsfunktionen.

bildung5.6 graphischillustriert. Dabeihandeltessichum keineumfassendeDiskussion,sondernum eineknappeDarstellungder wichtigstenElementeeinesFuzzy-Reglers.FüreineeingehendeDiskussionvon Verfahrender Fuzzy-Theoriesei auf die entsprechendeLiteraturverwiesen[Zad73, Zim93, Gra95, DeS95].

Fuzzifizierung

Die FuzzifizierungordneteinescharfdefinierteGrößev einer fuzzy Menge Ê zu. Sei ËderWertebereich derGrößev , d.h.sei vÌjoË . Dannist einefuzzyMengeÊ einTeilbereichvon Ë , dessenGrenzen– im Unterschiedzu klassischenMengen– nicht scharf,sondernunscharfdefiniertsind.DasMaßderZugehörigkeit von v zur fuzzyMenge Ê wird durcheineZugehörigkeitsfunktion Í_Î�fLv�Ï ausgedrückt,welchedie Elementev aus Ë auf einenWertausdemIntervall » § £&Ð8¼ abbildet,d.h.

Í_ÎoÑNvÌjoËÓÒÔÍ_Î)fCv�Ï j�» § £&Ð8¼´Õ (5.4)

Der Wert Í�Î)fCv�Ï�y�§ bedeutetdabei,daß v nicht in der fuzzyMenge Ê enthaltenist. FürWertezwischen§ und Ð ist einepartielleZugehörigkeit zu Ê gegebenundfür Í_Î)fCv�Ï�ysÐ ist� auf jedenFall Elementvon Ê , wasin beidenFällendurch vÅj�Ê gekennzeichnetwird.Für die analytischeForm von Í_Î+fLv�Ï sind die verschiedenstenAusdrücke vorgeschlagenworden.In dieserArbeit wird die Zugehörigkeitsfunktionaberimmer durchdie – auchin der Literatursehrüblichen– Trapez-,bzw. Dreiecksfunktionendargestellt[Gra95]. Essei angemerkt,daßeine Menge Ö×Ê�Ø´Ù von fuzzy Mengen ÊÚØ genaudanneine unscharfeZerlegungvon Ë bildet,wenngilt:Û Ø Í_Î0ܸfLv�Ï)ysÐÀ£ Ý2v3j?Ë?Õ (5.5)

In diesemFall lassensichdieZugehörigkeitsfunktionenalsbedingteWahrscheinlichkeitenÞ fÆÊ�Ø¸ß v+Ï rÄÍ_Î0ܸfLv�Ï der Zuordnungvon v zu heuristischdefiniertenKlassenÊÚØ auffassen[vgl. auchGleichung(2.43)].

Abbildung 5.5 veranschaulichtdasVorgehenan einemBeispiel.Der WertebereichË istdie Mengealler möglichenTemperaturen,die durcheinenMeßvorgangermittelt werden

104

Page 113: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5.3. ErfahrungsbasierteRegelungmit einemFuzzy-Regler

können.Innerhalbvon Ë werdenheuristischvier fuzzyMengen à&áq£Máq£Mâ und à&â definiert,die den unscharfenBegriffen sehrniedrige, niedrige, hohe und sehrhoheTemperaturzugeordnetsind.In derAbbildungsinddieZugehörigkeitsfunktionenÍ�ãLäNfÆ��Ï , Í2ä5fÆ��Ï , Í2åÀfÆ��Ïund ͶãLåNfÆ��Ï dieservier Mengengezeigt.Für sehrniedrigebzw. sehrhoheTemperaturennehmendie ZugehörigkeitsfunktionenÍ�ãLäNfL��Ï und Í�ãLå5fÆ��Ï denkonstantenWert Einsan,sodaßauchextremekleineundgroßeTemperaturenerfaßtwerden.

Bekannterweisekönnenauf denscharfdefiniertenMengender klassischenMengenlehreOperationenderzweiwertigenLogik ausgeführtwerden[BS91]. In derFuzzy-Logik wer-dendieseOperationenverallgemeinertunddurchZugehörigkeitsfunktionenentsprechen-derfuzzyMengenausgedrückt.Im folgendenwerdenjeneVerallgemeinerungenzweiwert-iger logischerOperationendargestellt,die für einenFuzzy-Regler benötigtwerden.In derLiteraturfindensicheineganzeReiheverschiedenerFormulierungen[Gra95]. Hier ist da-hernurdiegebräuchlichstebeschrieben[DeS95]. DabeiseienÊ , æ fuzzyMengenausdemWertebereichË und ç einefuzzyMengeausdemWertebereichè .

} Das Komplement éÊ einer fuzzy Menge Ê ist gegebendurchdie Zugehörigkeits-funktion

ÍëêÎ fLv+Ï�ysÐDt3Í_Î�fLv�Ï�Õ (5.6)

} Die Disjunktion Êíì«æ zweierfuzzyMengenÊ und æ ist definiertdurchdieZuge-hörigkeitsfunktion

Í�Î�î×ïwfLv�Ï)y�ðòñ�óqÖ×Í_Î+fLv+Ïô£�Í_ïwfCv�Ï�ÙÕ (5.7)

} Die Konjunktion Êöõ÷æ zweierfuzzyMengenÊ und æ ist definiertdurch

Í_Î�ø×ï fLv�Ï�y�ð¦ù]ú�Ö×Í_Î�fLv�Ï�£�Í_ïwfCv�Ï�ÙÕ (5.8)

} Die fuzzy Implikation Ê Ò ç ist eine Abbildung der beidenfuzzy Mengen Êund ç auf eine fuzzy Menge ÊûÒ ç ausdemkartesischenProdukt Ë üuè , dieüblicherweisedurch

Í�Î�ýÿþ)fCv £�e Ï�y�ð¦ùJúqÖ×Í_Î)fCv�Ïô£�Ͷþ)fCe�Ï�Ù (5.9)

definiertwird [DeS95]. Da dieseOperationim Gegensatzzur Implikation derzwei-wertigenLogik kommutativ ist, ist (5.9) im Grundenicht befriedigend.Verwendetmansiejedochim Zusammenhangvonwenn-dann-sonst-Strukturen,die in derFuzzy-Logik durch��� áá¤Ê ��� áá¤æ�à��×á2à¤ç rsfÆʹÒûæ¤Ï8ì�f éÊ¹Ò çPÏ gegebensind,so liefert siedort ähnlicheResultatewie die entsprechendenStrukturenderbinärenLogik [DeS95].

105

Page 114: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

Regelbasis und kompositorisc he Inferenz

Am Anfangder KonstruktioneinesFuzzy-Reglersstehtdie Entwicklungeinergeeigne-tenRegelbasis� aufGrundlageeinersprachlichenBeschreibungderKontrollregelndurcheinenmenschlichenExperten.DieserSchritt ist analogzur Identifikation der Parameterbei der Entwicklung einesmodellbasiertenReglers. Die Regelbasisist auseiner Reihevonwenn-dann-Regelnaufgebaut,welchedie Eingaben� und ¥ in Bezugzur Stellgrö-ße � setzen.Währendder Regelungwird die Regelbasismit Hilfe der kompositorischenInferenzregel periodischauf die aktuellenEingabegrößenangewendetundsodie Stellgrö-ßebestimmt.DiesesVorgehenwird nun für denFall einesSISO-Reglersnähererläutert(vgl. auchAbbildung5.6)

è"Ø , �� und Ë�� seienfuzzyMengenauf denWertebereichenderRegelgröße� , Führungs-größe ¥ und Stellgröße� . Da für jedeKombinationvon è"Ø und �� eine fuzzy Stellgrö-ßenmengeË�� vorhandensein muß, ist der Index º eine Funktion von f��M£�� Ï , d.h. º rº_f���£�� Ï . EineRegel � ��� Ø�� �� ausderRegelbasis� ist danneinefuzzyMengeim Produktraumè�ü�� ü?Ë undkannals

� ��� Ø�� �� Ñ ��� áá �A��joè"Ø"!$#á � ��� áá �A¥ j%�oØ"! ��� áá �A�?joË ��� Ø�� �� ! (5.10)

formuliertwerden.Die AusdrückevomTyp �·��joè"Ø"! werdendabeidurchdieentsprechen-denZugehörigkeitsfunktionenÍ'&9ܸfÆ�ÂÏ quantifiziert.DadieRegel (5.10) auseinerKonjunk-tion undeinerImplikation aufgebautist, kanndie Regel � ��� Ø�� �� auchmit Hilfe derbeidenVorschriften(5.8) und(5.9) ausgedrücktwerden,

Í'(�)+* Ü-, .0/ fL�q£�¥ë£���Ï+y�ðòù]ú�Ö×Í'&9ܸfL�"Ï�£�Í213.×fÆ¥ Ï�£�Í545)+* Ü6, .7/ fÆ��Ï�Ù£ (5.11)

welchedie fuzzyMenge � ��� �� �� definiert.

Alle Regeln aus � sind durchDisjunktionen(5.7) verknüpft,so daß � selbsteine fuzzyMengeist.DaherkanndieZugehörigkeitsfunktionÍ58ÚfL�q£�¥ £���Ï dergesamtenRegelbasis�auchausdenZugehörigkeitsfunktionenÍ'( )9* Ü-, .7/ fL�q£�¥ë£���Ï derEinzelregelnberechnetwerden[DP80, DeS95]:

Í58ÿfÆ�2£�¥ë£���Ï�y�ðòñ�óØ�� Ö×Í'(�)+* Ü-, .0/ fL�q£�¥ £���Ï�ÙÕ (5.12)

Mit Hilfe von (5.12) kannalsodasMaßderZugehörigkeit einesWertetripelsfÆ�2£�¥ë£���Ï zurRegelbasis� ausdenZugehörigkeitsfunktionenvon è"Ø , �� und Ë���� Ø�� �� bestimmtwerden.Die Zugehörigkeitsfunktion Í58ÚfL�q£�¥ë£���Ï ist im allgemeinenin einemhochdimensionalenRaumdefiniertundbeinhaltetdasgesamtefuzzyRegelwerk.

Ist einmaldasfuzzyRegelwerk als fuzzyMenge � definiert,sobenötigtmannocheinenAlgorithmus,um ausder aktuellenFührungsgröße¥¤» h�¼ und der Regelgröße�¶» h�¼ auf eineStellgröße��» h�¼ zu schließen.Dazu bemerktman,daßdie Zugehörigkeitsfunktion(5.12)

106

Page 115: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5.3. ErfahrungsbasierteRegelungmit einemFuzzy-Regler

: : : :: : : :: : : :: : : :: : : :; ; ; ;; ; ; ;; ; ; ;; ; ; ;; ; ; ;

< < < < < << < < < < << < < < < << < < < < <= = = = = == = = = = == = = = = == = = = = =

> > >> > >> > >? ?? ?? ?

@ @ @ @@ @ @ @A A A AA A A A

B B B B B BB B B B B BC C C C C CC C C C C C

D D D D D D D D D DD D D D D D D D D DD D D D D D D D D DD D D D D D D D D DD D D D D D D D D DD D D D D D D D D DE E E E E E E E E EE E E E E E E E E EE E E E E E E E E EE E E E E E E E E EE E E E E E E E E EE E E E E E E E E E

(x)Xµ4

x

X[t]

x

x[t]

µ (x)

4(2,2)

(y)Yµ1

y

(y)Yµ2

y

(y)Yµ2

y

(y)Yµ1

y

(w)µ1

w

W

(w)µ2

w

W

(w)µ1

w

W (x)Xµ1

x

(x)Xµ2

x

(x)Xµ3

x

(w)µ2

w

W

y[t] w[t]

R 1(1,1)

R

R

R

2(1,2)

3(2,1)

Abbildung5.6.:KompositorischeInferenzregel.Skizziertwird dasVorgehenfür einenfuzzySISO-Regelkreis,für denvier fuzzyRegeln FHG�IKJ�L M+N aufgestelltwordensind(Zeilen1–4).Ent-sprechendwurdendie Regel- undFührungsgrößenmit jeweils zwei Zugehörigkeitsfunktionenfuzzifiziert,die in denbeidenlinkenSpaltendargestelltsind.Die Zugehörigkeitsfunktionen derentsprechendenvier Stellgrößensindin derrechtenSpaltegezeigt.FüreineSituationOQP R0S�T�UVP R0Swerdenzunächstdie durch(5.11) definiertenW�XZY+[]\6^ _7`+abO�T�UcT�dfe derRegeln F G�IgJ�L M�N auf Zugehö-rigkeitsfunktionen W X�Y+[h\-^ _0` abO�P R7S�T�UiP R7S�T�d�e eingeschränkt(schraffierte Funktionenin der rechtenSpalte).Die AusführungderkompositorischenInferenzregel (5.12) führt zur Zugehörigkeits-funktion WfjHk lnm�abdfe (untenrechts).Die Defuzzifizierungnachder Schwerpunktmethode(5.15)liefert schließlichdie exakteStellgrößedoP R0S .

107

Page 116: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

bei vorgegebenenWerten poq r�s und tuq r�s die Regelbasisv wyx{z}| z�~ auf eine fuzzyStellgrößenmenge~�q r�sow�~ einschränkt,derenZugehörigkeitsfunktiondurch

� jHk lnm����5��� ��� � p2q r�s0��t�q r�s0� �5� (5.13)

gegebenist. Im RahmenderFuzzy-Logik ist diesefuzzyMenge ~�q r�s daseigentlicheEr-gebnisderAnwendungderRegeln � G�IKJ�L M�N . Wegen(5.11) und(5.12) kannsieauchgemäß

� j�k lnm ���5���������J�L M q �����'� �'� \ � p2q r�s � � �'� _ � tuq r�s � � � j Y9[]\-^ _7` ���5��� s (5.14)

ausdeneinzelnenRegelnberechnetwerden.Die Auswertungvon (5.14) wird alskompo-sitorischeInferenzregelbezeichnetundwird in Abbildung5.6aneinemBeispielillustriert.Zur FestlegungdereinzustellendenGröße� q r�s mußdiesesErgebnisanschließendnochde-fuzzifiziertwerden.

Defuzzifizierung

Hierzu sind verschiedeneVerfahrenvorgeschlagenworden[Gra95]. Dasüblichsteist dieSchwerpunktmethode,bei der der Schwerpunktder Zugehörigkeitsfunktion � j�k lnm ���5� alsexakterWert für die Stellgrößeverwendetwird:

� q r�s �� � � jHk lnm ���5������ � j�k lnm ���5�����¡  (5.15)

� q r�s wird alsStellgrößeandie Strecke weitergegeben.DiesesDefuzzifizierungs-Verfahrenführt – im GegensatzzuanderenVerfahren– zueineretwasträgenaberrechtrobustenRe-gelung[DeS95]. Abbildung5.6 illustriert dashier skizzierteVorgehenaneinemBeispiel.

Zwar läßt sich dasKonzeptder Fuzzy-Regelungauf MIMO-Regler verallgemeinern.IndiesemFall müssenaberwesentlichmehrZugehörigkeitsfunktionenundRegelndefiniertwerden,sodaßdie ErarbeitungeineskonsistentenundsicherarbeitendenRegelwerkszueinersehrzeitaufwendigenundkompliziertenAufgabewerdenkann.

Fuzzy -Regler nach M. Sugeno

Für die Evaluationvon verschiedenenRegelungsaufgabenin Kapitel 6 und 7 wurdeeinFuzzy-Regler nach M. Sugenoeingesetzt,der einen Spezialfall des oben dargestelltenMamdaniFuzzy-Reglers darstellt[Sug88]. Bei einemSugenoFuzzy-Regler werdendieZugehörigkeitsfunktionender Stellgröße� in (5.10) durch fuzzysingletons � j Y+[]\6^ _7` ���5�¢�£ ���¥¤¦��G�IKJ�L M+N�� beschrieben,wobei ~ G�IgJ�L M�N eineentarteteMengeist, diegenaudenWert ��G§IgJ�L M+Numfaßt.Wird mit dieserZugehörigkeitsfunktiondieDefuzzifizierung(5.15) ausgeführt,soerhältmandenAusdruck

� q r�s �©¨ G � G � X Y � p2q r�s0��tuq r�s �¨ G�ª � X Y ª � p2q r�s7��t�q r�s � � (5.16)

108

Page 117: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5.4. DatenbasierteRegelungmit neuronalenNetzen

wobei � X Y«� pQ��t � nun die Zugehörigkeitsfunktionzur ¬ -ten Regel ist. Sowohl ein Fuzzy-SystemnachE. MamdanialsauchnachM. SugenokannstetigeFunktionenbeliebiggenauapproximieren[Jou92]. DadieAuswertungvon(5.16) aberwesentlicheinfacherist alsvon(5.15), werdendie Fuzzy-Regler in Kapitel 6 und7 nach(5.16) realisiert.

Der Vergleich von (2.62) und (5.16) zeigt die engeBeziehungzwischendem GRBF-Netzwerkund einemFuzzy-System.Wie die Aktivierungsfunktion(2.59) beim GRBF-NetzwerkkannderAusdruck� X Y­� poq r�s7��tuq r�s �¯® ¨ G ª � X Y ª � p2q r�s7��t�q r�s � alsPartitionierungsfunk-tion einesMerkmalsraumsverstandenwerden,dervon poq r�s und tuq r�s aufgespanntwird. AufGrundder vielfältigen Gemeinsamkeitenvon Fuzzy-Systemenund künstlichenneurona-len Netzwerkenist in denletztenJahreneineReiheverschiedenerNeuro-Fuzzy-Systemenentwickelt worden(z.B. [Kos92, Hay92, NK95]).

5.4. Datenbasier te Regelung mit neur onalen Netzen

DatenbasierteRegelungsverfahrenwerdenvorzugsweiseauf Regelkreiseangewendet,beidenenentwederkeineanalytischeModellbildungmöglichist oderbeideneneineFormali-sierungvon Erfahrungenzu kompliziert ist [MSW92]. In diesenFällenverbleibtnur nochdie Möglichkeit, durchdie Analysevon Meßdaten,die für denRegelkreisarchiviert wur-den,eineRegelungzu konstruieren.Eine solchedatenbasierteRegelungzielt daraufab,dasEingabe-Ausgabe-Verhaltender Strecke oderdie Vorgehensweisebei manuellerRe-gelungdurchanalytischeFunktionenzu approximieren.Wie in Abschnitt2.3.1dargestelltwurde,stellt sichhier dasProblemderWahl einergeeignetenFunktionenklasse,welchesdurchdasFehlenanalytischerModellvorstellungenüberdasEingabe-Ausgabe-Verhaltender Strecke oderüberdie Regelungsstrategie desStreckenbetreibersverschärftwird. DaneuronaleNetze,wie dasGRBF-Netzwerk,universelleFunktionenapproximatorensind,die für hinreichendglatteZielfunktionensowohl guteApproximations-alsauchGenerali-sierungsfähigkeitenaufweisenundderenParameterzahldennochin Grenzengehaltenwer-denkann,scheinensie für die genannteAufgabenstellunggeradezuprädestiniertzu sein.DieseHypothesewar, wie ich mehrfach betonthabe,auchder Grund für meineeigeneAnstrengung,ein Regelungskonzeptzu entwickeln,dasArchitekturprinzipienvon GRBF-Netzwerkenübernimmt.

Bei der Entwicklung einer neuronalenRegelungkann zwischendrei grundsätzlichver-schiedenenAnsätzengewähltwerden,dieunabhängigvonderWahldesneuronalenNetzessind[Bar90]. Bei derKonstruktioneinesspeziellenReglerswird häufigaufErweiterungenoderKombinationendieserdrei Ansätzezurückgegriffen (siehe[MSW92] für eineReihevon Anwendungen).Bei dendrei Möglichkeitenhandeltessich um (i) dasKopierenei-nervorhandenenRegelung,(ii) die Systemidentifikationund(iii) die inverseSystemiden-tifikation. Im folgendenwerdendiesedrei Ansätzefür denFall einesSISO-Regelkreisesvorgestelltunddiskutiert,ohnedaßauf die konkreteRealisierungeinersolchenRegelungeingegangenwird. Eswird hier wiederdavonausgegangen,daßdie für eineRegelungnot-

109

Page 118: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

e[t]Regler

yStrecke

neuronalesNetz Verzögerung

Zielausgabe

^ [t]x

[t]x

[t]e~

w[t]

[t]

Abbildung5.7.:Kopiereneiner Regelung. Die SkizzezeigtdenInformationsflußfür dasVor-gehenbei derKopieeinerschonvorhandenenRegelung.Hierzuwird dasneuronaleNetzwerkparallelzur Regelunggeschaltet.Die ArbeitsrichtungdesNetzwerkswird durchdendickenPfeil innerhalbderBox angedeutet.WährenddesTrainingswerdendemNetzwerkdieEingabe-undZielausgabedaten(dünnePfeile)zugeführt.

wendigenFührungs-,Regel- undStellgrößenin zeitlich diskretisierterForm tuq r�s , poq r�s und� q r�s vorliegen.

Kopieren einer Regelung

DiesesVerfahrennimmteineZwitterstellungzwischenerfahrungs-unddatenbasierterRe-gelungein, da vorausgesetztwird, daßschonErfahrungenbei der Regelungder StreckevorliegenundentsprechendeineinigermaßenzuverlässigarbeitenderReglerexistiert.Die-serRegler – z.B. ein PID-Regler odererfahrenesBedienpersonal– soll durchdasTrainingeinesneuronalenNetzwerkskopiertwerden.Erfahrungen,die in Bezugauf die RegelungeinerStrecke gesammeltwurden,sollenalsonicht durcheinenRegelsatz,wie z.B. bei derFuzzy-Regelung,formalisiert,sonderndurchdasTrainingmit denarchiviertenDatenaufeinneuronalesNetzabgebildetwerden.

Wie im SchaltbildausAbbildung5.7gezeigtist, bildenbeimKopiereneinesReglersdurchein neuronalesNetz die Führungsgrößenabweichungen°Zq r�s die Eingabedatenfür diesesNetz und die Stellgrößen� q r�s desReglers die von ihm zu approximierendenZielausga-bedaten.WährenddesTrainingswerdender vorhandeneRegler und dasneuronaleNetzparallel geschaltet.WenndasTraining abgeschlossenist, wird der ursprünglicheReglerausdemRegelkreisentferntunddie Strecke mit derStellgrößenausgabe±� q r�s desneurona-len Netzesgeregelt. Um auchdie dynamischenEigenschaftender Regelungkopierenzukönnen,ist essinnvoll, nicht nur die aktuellenFührungsgrößenabweichungen°Zq r�s für dasTraining zu verwenden,sondernEingabevektoren ²³ q r�s � � °Zq r�s7��°Zq r ¤µ´ s  ¶ ¶  °Zq r ¤�·Q¸ s � zugenerieren,die die ·Q¸¹¤�´ vergangenenFührungsgrößenabweichungenumfassen[WS85].Dieskannin einersog.Verzögerungsstrecke erfolgen.FürdasKopierenwird alsoeinEin-

110

Page 119: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5.4. DatenbasierteRegelungmit neuronalenNetzen

Strecke

neuronalesNetz

y

Zielausgabe

Verzögerung

[t]x

x [t]~y [t]

[t] Strecke

neuronalesNetz

y

Verzögerungy [t]~

Zielausgabe

^ [t]x

[t]x [t]

Abbildung 5.8.: Systemidentifikation und inverse Systemidentifikation. Bei der System-identifikation(links) sind Ein- und Ausgangder Strecke und desneuronalenNetzesparallelgeschaltet.Bei der inversenSystemidentifikation(rechts)werdenStrecke undNetzwerkanti-parallelverbunden.

gabedatensatzº �»� ²³ q r�sf¼�r �½´  ¶ ¶ +¾ � undeinAusgabedatensatz¿ �»�� q r�sf¼�r �À´  ¶ ¶ �¾ �benötigt.

DasKopiereneinerschonvorhandenenRegelungkannauszweiGründenangemessensein[Bar90]:

Á HandeltessichumeinemanuelleRegelung,dannkanndurchdasKopierendieReak-tionsgeschwindigkeit unddie Zuverlässigkeit derRegelungdeutlicherhöhtwerden.

Á Wird für die Kopie ein neuronalesNetzwerkherangezogen,desseninterneReprä-sentationderFunktionenapproximationgut interpretierbarist (wie z.B.beimGRBF-Netzwerk),dannkönnendie vom PersonalverwendetenKontrollregeln durch dieAnalyseder Netzwerkparameteroffengelegt werden.Durch eineJustierungdieserParameterkannsoeineVerbesserungderRegelungerreichtwerden[WS64].

Systemidentifikation

Im Gegensatzzum obigenVorgehenberuhtdie SystemidentifikationausschließlichaufMeßdaten,die dasEingabe-Ausgabe-Verhaltender Strecke beschreiben[Bar90]. Abbil-dung5.8 zeigt den Informationsflußfür diesesVerfahren,bei demdie Ein- und Ausga-bedatender Strecke die Ein- und AusgabedatendesneuronalenNetzesbilden. Um diedynamischenEigenschaftenderStreckezuapproximieren,kannwiederumdurcheineVer-zögerungsstrecke ein neuerEingabevektor ²Â q r�s � ��� q r�s0� � q r ¤Ã´ s  � ¶  � q r ¤Ä·QÅ s � gebildetwerden.Esgilt also º �Æ� ²Â q r�sf¼�r �Ç´  ¶ � �¾ � und ¿ �Æ� poq r�sf¼�r �È´  � ¶ �¾ � . Man erhältsodurchdasTrainingdesneuronalenNetzes(2.50) mit denTrainingsdatenÉ �Ã� ºÊ��¿ � einrein datenbasiertesModell derStrecke,welchesdieAbbildung ±p'q r�s � ±Ë � ²Â q r�s7ÌÎÍ � ausführt.

Wie kannmit Hilfe einersolchenSystemapproximation±Ë � ²Â q r�sÏÌÎÍ � ein Regler konstruiertwerden?EineersteMöglichkeit bietetsichan,wennausderfür die SystemapproximationverwendetenFunktionenschar±Ë �  Ì�Í � direkt ein Regler entwickelt werdenkann.DiesesVorgehensetztnicht zwingenddie Anwendungvon neuronalenNetzenvorausund wird

111

Page 120: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

z.B. auchbei der KonstruktionadaptiverRegler verfolgt [GS84]. Wenndie Funktionen-schar ±Ë �  ÌÎÍ � einanalytischesModell derStrecke ist, dannzeigensolcheadaptivenReglereinegroßeÄhnlichkeitmit denmodellbasiertenReglern.DerwesentlicheUnterschiedliegtdannnur nochdarin,daßdie ParametereinesmodellbasiertenReglers(z.B. PID-Regler)vor und die Parametereinesadaptiven Reglerswährend der Regelungangepaßtwerden[Föl92].

EineweitereMöglichkeit zurReglerkonstruktionergibt sich,wenndieSystemapproximati-on ±Ë � ²Â q r�sÏÌÎÍ � alsprädiktivesModell derStrecke aufgefaßtwird. WennzueinemZeitpunktr die Führungsgrößetuq r�s durcheine– zunächstnicht bekannte- Stellgröße� q r�s eingestelltwerdensoll, dannmußgeradetuq r�s � ±p'q r�s unddamit

tuq r�s � ±Ë �+��� q r�s7� � q r ¤Ð´ s  ¶ ¶  � q r ¤Ñ·�Å s � ÌÎÍ � (5.17)

gelten.Da alle vergangenenStellgrößen� q r ¤Ò´ s  ¶ �  � q r ¤�·�Å s bekanntsind, kann(5.17)nachder Stellgröße� q r�s aufgelöstwerden.DieseStellgrößeführt zu einer Netzausgabe±p'q r�s , die im RahmenderQualitätderSystemapproximationmit dergewünschtenAusgabep2q r�s � tuq r�s derStrecke übereinstimmenwird [MSW92].

Inverse Systemidentifikation

Die in Abbildung 5.8, rechts,skizzierteinverseSystemidentifikationstellt einendirek-terenZugangzumReglerentwurfdar[Bar90]. Hier wird die verzögerteRegelgröße²Ó q r�s �� p2q r�s7��p2q r ¤�´ s  ¶ ¶  poq r ¤�·�Ô s � alsEingabeunddieStellgröße� q r�s alsZielausgabeeinesneuro-nalenNetzesgewählt.Der Trainingsdatensatzsetztsichalsoaus º �µ� ²Ó q r�sf¼�r �Ç´  ¶ � �¾ �und ¿ �Æ�� q r�sf¼�r �ô  ¶ ¶ +¾ � zusammen.Wird ein Netzwerkmit einemsolchenDatensatztrainiert, dannerhältmanmit ±� q r�s � Ë � ²Ó q r�s7ÌÎÍ � ein inversesModell der Strecke. DiesesinverseStreckenmodellkanndirektzurRegelungderStreckeverwendetwerden,indemandieEingabedesNetzwerksdieFührungsgröße²Õ q r�s �½� t�q r�s0��p2q r ¤ ´ s  ¶ ¶  poq r ¤Ö·QÔ s � angelegtwird. Die Netzwerkausgabe±� q r�s ist danngeradediejenigeStellgröße,die an die Streckeweitergegebenwird.

DaswesentlicheProblembeiderApproximationeinesinversenModellstritt auf,wennver-schiedeneStellgrößen� q r�s eineähnlicheStreckenausgabepoq r�s zur Folgehaben,d.h.wenndie Strecke nicht eineeineindeutigeAbbildungdarstellt[Bar90]. Die meistenneuronalenNetzeneigenin diesemFall dazu,überdie verschiedenenZielausgaben� q r�s zu mitteln.Trotz dieserSchwierigkeit ist die inverseSystemidentifikationauf Grund der einfachenMöglichkeit desReglerentwurfsfür eineReihevon Kontrollaufgabendokumentiert,wiez.B.beiderKontrolleeinesRoboterarms[WMS91] (sieheauch[MSW92] für weitereBei-spiele).

Die geradevorgestelltenMethodenzum Entwurf einerdatenbasiertenRegelungsind zu-nächstnuralsprinzipielleLösungsvorschlägezuverstehen.Bei derkonkretenRealisierung

112

Page 121: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5.4. DatenbasierteRegelungmit neuronalenNetzen

einerKontrollaufgabewird esaberzumeistnotwendigsein,eineKombinationbzw. Mo-difikation dieserdrei Verfahrenanzuwenden.In Kapitel 6 wird als Beispiel für eineda-tenbasierteRegelungdie Kontrolle eineseinfachenbiochemischenProzessesdiskutiert.Dazuwird eineSystemidentifikationderStreckemit einemmodifiziertenGRBF-Netzwerkdurchgeführt.Um guteReglereigenschaftenzuerhalten,wird esdortnotwendigsein,nichtnur die Stellgröße²Â q r�s sondernauchdie Führungsgrößepoq r�s alsEingabefür dasneuronaleNetzzuverwenden.

113

Page 122: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

5. Regelungstheorie

114

Page 123: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. Regelung eines Bioreaktor s imComputere xperiment

Die beidenletztenKapitelhabenim wesentlichenzuzweiErgebnissengeführt:(i) eswurdeein sicherkonvergierenderAlgorithmuszur DichteschätzungdurcheineMischungmulti-variaterNormalverteilungenbereitgestelltund daraufaufbauendder LLM-Approximatorabgeleitet;darauswurde (ii) eineKonstruktionsvorschrift für ein Systemlokaler Exper-tenentwickelt, welchesin engerBeziehungzumGRBF-Netzwerksteht.Dasvorliegendeund dasfolgendeKapitel habenzum Ziel, diesebeidenErgebnisseauf jeweils ein Re-gelungsproblemanzuwenden.Dabeiwerdenwir unszunächstdemProblemwidmen,einnur alsmathematischesModell existierendesSystem– einenBioreaktor – durcheinein-verseSystemidentifikationmit einemLLM-Approximator zu regeln.Die Dynamik einessolchenBioreaktorsist verschiedenennichtlinearenEinflüssenunterworfen [ALLR82].Entsprechendschwierigist die Regelungeinessolchenkomplexen,dynamischenSystems[PJ93, KLP × 94, MSW92].

DasfolgendeKapitel ist in drei Teile gegliedert.Zunächstwird die Systembeschreibungvorgestelltunddie DynamikdesBioreaktorsuntersucht.Anschließendwerdenmit einemPID-, Fuzzy-, undNeuro-Regler drei verschiedeneMöglichkeitenzur Regelungbeschrie-benunddiskutiert.DenAbschlußbildet die DarstellungderquantitativenErgebnisse,diemit denuntersuchtenReglernerzieltwurden.

6.1. Dynamik des Bioreaktor s

DerZweckeinesBioreaktorsist dieHerstellungbiologischerProdukte(z.B.vonHefeodervon Insulin)unterAusnutzungderReproduktionsfähigkeit unddesStoffwechselsgeeigne-terZelltypen.Im einfachstenFall ist einBioreaktorauseinemTankaufgebaut,derWasserundZellenenthält.Abbildung6.1zeigteineSkizzeeinessolchenReaktorszusammenmiteinemRegler, der Einfluß auf die Ventilstellung Ø � r � nimmt. Die Zellen im ReaktortankverbrauchenNährstoffe, erzeugendurchihrenStoffwechselerwünschtewie unerwünschteProdukteundreproduzierensich,fallsdieUmgebungsbedingungen(z.B.Temperatur, Kon-zentrationenvonNähr- undAbfallstoffen)geeigneteingestelltsind.DerTankverfügtüber

115

Page 124: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

NährstoffkonzentrationS(t)

X(t) Zellkonzentration

F

Durchfluß F(t)

Reaktionstank mit

Durchfluß F(t)

MessungRegler

Stellventil

Nährstoffe und Zellen

Substrat mit Nährstoffkonzentration S

konstantem Volumen V

Abbildung6.1.:SchematischeDarstellung einesBioreaktors.

einenZu- undeinenAbfluß, sodaßeinenährstoffhaltigeFlüssigkeit bei konstanterTank-füllung eingebrachtwerdenkann.Bioreaktorenkönnenin ihrem dynamischenVerhaltensehrkomplex werden,da die ZellenselbstregelndeSystemesind,derenWachstums-undProduktionsratestarkvonderUmgebungabhängt.Die einfachstemathematischeBeschrei-bungeinesBioreaktorsist dercontinuousflowstirredtankreactor (CFSTR)[MSW92]. IndiesemModell hängtdie Zellkonzentration~ � r � nur von derNährstoffkonzentrationÙ � r �ab,die sichbei einemDurchfluß Ú � r � durcheinenBehälterdesVolumensÛ einstellt.DieKonzentrationÙ5Ü derhinzugefügtenNährstoffe seikonstant.Damit läßtsichdasDifferen-tialgleichungssystem

�� r ~ � r ��� ¤ Ú � r � ~ � r �Û Ý ²� � Ù � r ��� ~ � r � (6.1)

�� r Ù � r ��� Ú � r � Ù5Ü ¤ Ù � r �Û ¤ ²Þ � Ù � r ��� ~ � r � (6.2)

aufstellen.Die zeitlicheÄnderungderZellkonzentration~ � r � hängtlinearvomDurchflußÚ � r � undüberdie Wachstumsrate ²� � Ù � r �+� nichtlinearvon deraktuellenZellkonzentration~ � r � ab. Analognimmt die NährstoffkonzentrationÙ � r � zu,wennmehrNährstoffe in denTankeingebrachtwerdenals in diesemgeradevorhandensind.Die Nährstoffkonzentrati-on Ù � r � hängtwegender Nährstoffverbrauchsrate ²Þ � Ù � r �+� wiederin nichtlinearerWeisevon derZellkonzentration~ � r � ab. DasSystemist alsolinearim Durchfluß Ú � r � undwe-genderWachstumsrate²� � Ù � r ��� undderNährstoffverbrauchsrate²Þ � Ù � r ��� im allgemeinennichtlinearin derNährstoffkonzentrationÙ � r � .

116

Page 125: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6.1. DynamikdesBioreaktors

Abbildung 6.2.: Wachstumsrate Woa�ß�àÎe und Nährstoffverbrauchsrate áoa�ß�àâe als FunktiondesNährstoffverhältnisses ß�à . DasMaximum W�ã'ä7å derWachstumsratebei ß$ã'ä7åà hateinenentscheidendenEinflußaufdie Existenzvon Fixpunten(vgl. auchTabelle6.1).

Mit denDefinitionen[ALLR82]

æèç � r �êé ~ � r �Ù5Ü � æ à � r �ëé Ù5Ü ¤ Ù � r �Ù5Ü � ì � r �êé Ú � r �Û (6.3)

und

� � æ à � r ���íé ²�¥î Ù5Ü �9´$¤ æ à � r �+�¯ï � Þ � æ à � r ���íé ²Þ î Ù5Ü �+´�¤ æ à � r ����ï (6.4)

könnendieseGleichungenin einedimensionsloseundkompaktereFormgebrachtwerden.æ à � r � ist ein dimensionslosesNährstoffverhältnis, welchesimmer im Intervall qhð�� ´ s liegt.Ein großes

æ à � r � bedeuteteineniedrigeNährstoffkonzentrationundviceversa.Im folgen-denwird auchdie Zellkonzentration

æèç � r � auf dasIntervall qhðZ� ´ s undder Durchfluß ì � r �auf q ð��âñs eingeschränkt[ALLR82]. Mit denDefinitionen(6.3) und (6.4) kanndasDiffe-rentialgleichungssystem(6.1) und(6.2) zu

�� r æèç � r ��� ¤ æèç � r � ì � r � Ý � � æ à � r ��� æèç � r �êé Ëòç �Ïóô� r ��� (6.5)

�� r æ à � r ��� ¤ æ à � r � ì � r � Ý Þ � æ à � r ��� æèç � r �íé Ë à �Ïóô� r ��� (6.6)

117

Page 126: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

Fixpunkt óöõ L ÷ ð�øùìúø ´ Sattelpunktwashout ´iû ì û � ã5ä7å stabilerKnotenFixpunkt ó õ L ç ð�øùìÖüÄð   ñþý­ðòñ stabilerKnotenð   ñþýòðòñiüÿìÖüÄð  �� ñ ��� stabilerFocusð  �� ñ ��� üÿì û � ã'ä7å instabilerFocusFixpunkt ó õ L à ´iû ì û � ã5ä7å Sattelpunkt

Tabelle6.1.:Eigenschaftender Fixpunkte desBioreaktors.

umgeformtwerden.Der Punkt ó é � æèç � æ à � beschreibtzusammenmit demDurchflußì � r � vollständigdenZustanddesBioreaktors.

Ein einfachesModell für dieWachstumsrate� � æ à � unddieNährstoffverbrauchsrateÞ � æ à �ist dassog.substrateinhibition model [ALLR82] mit

� � æ à �íé½�9´¥¤ æ à � ° ����� (6.7)

und

Þ � æ à �êé � � æ à � ´ Ý �´ Ý � ¤ æ à   (6.8)

Die beidenParameter� und�

werdenentsprechenddemVorgehenvon [MSW92] für denRestdiesesKapitelsauf � � ð   ý � und

� � ð   ðòñ festgehalten.Abbildung 6.2 zeigt denVerlauf der beidenFunktionen(6.7) und (6.8). Bemerkenswertund für dasdynamischeVerhaltendesSystemsvongroßerBedeutungist dieExistenzeinesMaximumsderWachs-tumsrate� � æ à � . EineanalytischeDiskussionderFunktion � � æ à � zeigt,daßdasMaximumbeiæ ã5ä7åà �½´$¤ � � ð   ñ liegt unddaß

� ã5ä7å é � � æ ã'ä7åà ��� ��°��������� ´   ý ´ � (6.9)

gilt.

Die Dynamikdesdurch(6.5)–(6.8) definiertenModellseinesBioreaktorswird in AnhangA.2 detailliert untersucht.Im Besonderenwerdendort die Fixpunkteund ihre Stabilitäts-eigenschaftenberechnet.Tabelle6.1 undAbbildung6.3 fassendie ErgebnissedieserDis-kussionzusammen.Der Bioreakor hat für ì�ø � ã'ä7å drei Fixpunkte ó õ L ÷ , ó õ L ç und ó õ L à ,wobeilediglichderFixpunkt ó õ L ç im Bereichð�øùìÖüÄð  �� ñ ��� stabilist.DerFixpunkt ó õ L ÷kannzwar auchstabil sein,beschreibtaberdie wenigwünschenswerteSituation,daßbeimaximalerNährstoffkonzentrationalleZellenausdemReaktortankgespültwerden.DieserZustandwird auchalswashoutbezeichnet.

Konsequenz en für die Regelung des Bioreaktor s

118

Page 127: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6.1. DynamikdesBioreaktors

Abbildung 6.3.: Lage der Fixpunkte im Phasenraumin Abhängigkeit vom Durchfluß � .Die LagederFixpunkteist durchdieLösungenderGleichungen(A.32) bzw. (A.33) und(A.34)gegeben.Die StabilitäteinesFixpunkts,diedurchdenSymboltypgekennzeichnetist, wird ausderAnalysederJacobimatrix(A.40) bestimmt.

Soll in derindustriellenPraxismit demobenskizziertenBioreaktoreinbestimmtesProdukthergestelltwerden,so ist eswünschenswertdenReaktorsozu regeln,daßeinemöglichsthoheAusbeutean Zellen erreichtwird. Die Ausbeutean Zellmaterialwird von der Kon-zentration

æèç � r � undvom Durchfluß ì � r � durchdenReaktorbestimmt.Daherwird in derDiskussionderverschiedenenRegelungendieAusbeute� � r �ê� æèç � r � ì � r � bzw. diemittle-re Ausbeute �� ��·i��� ´· ���÷ æèç � r � ì � r ��� r (6.10)

eine wesentlicheRolle spielen.Die Frageist nun, mit welchemPhasenraumpunkteinemaximaleAusbeuteerreichtwerdenkann,d.h. welchesdie Zielgrößenfür die RegelungdesBioreaktorssein sollen. Aus Abbildung 6.3 läßt sich schließen,daßan den beidenFixpunkten ó õ L ç und ó õ L à für ì � � ã'ä7å die gleichemaximaleAusbeute� ã'ä7å erreichtwird. Da derFixpunkt ó õ L à immerein Sattelpunktist unddaherfür die UntersuchungderLeistungsfähigkeit einesReglerswenig interessantist, wird die Diskussionder Ausbeuteauf denFixpunkt ó õ L ç beschränkt,dersowohl stabil alsauchinstabil seinkann.DenZu-sammenhangzwischenderZellkonzentration

æ õ L çç undderdort erreichtenAusbeutezeigt

119

Page 128: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

Abbildung6.4.:Ausbeutein Abhängigkeit von der Zellkonzentration ß õ�� çç . Mit dengestri-cheltenLinien sindGebieteverschiedenerFixpunktegetrennt.Die punktiertenLinien markie-rendie PositionderZielgrößenfür SzenarioA bzw. B/C.

Abbildung6.4. Manerkennt,daßdieAusbeutenichtlinearvomWertderZellkonzentration� � �"!! amFixpunkt # � �"! abhängt.EbenfallseingetragensinddieBereiche,in denendieent-sprechendeAusbeuteim Rahmeneinerstabilenbzw. instabilenDynamikerreichtwerdenkann.Offensichtlichwird eineErhöhungderAusbeutedurcheinezunehmendeDestabili-sierungderDynamikerkauft.Demzufolgeist zu erwarten,daßeineRegelung,die auf dieEinhaltungeinesgroßenSollwerts

�%$! unddamiteinerhohenAusbeuteabzielt,zunehmendschwierigerwird.

Für die Untersuchungder Regelungenwerdenim folgendendrei verschiedeneSzenariengenauerbetrachtet:& Im SzenarioA soll der Bioreaktorauf eineZellkonzentrationvon

�('�) $! *,+.-0/�12+�3geregeltwerden.Wie ausAbbildung6.3abgelesenwerdenkann,führt dieszueinemstabilenFocus.Der Wert

� '�) $! wird nach(A.33) und (A.34) für einenDurchfluß4 '5) $ *6+.-7328 undeinNährstoffverhältnis� '�) $9 *:+;-�<�<2+=/ erreicht.WenndieZielgröße� '�) $! durcheinenRegler eingehaltenwird, sollte die mittlere Ausbeutebei >?A@ ) $ *�('�) $! 4 '5) $ *:+.-�+�B�+�8 liegen.& DasSzenarioB ermöglichteinehöhereAusbeute,indemdie Zielgrößeauf

� C ) $! *120

Page 129: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6.2. RegelungdesBioreaktors

+.-71;/D+�3 erhöhtwird. DieserPunktist mit 4 C ) $ *E/2-�1�8 und�FC ) $9 *:+.-�3�1�12G ein instabi-

ler Focusundwird voraussichtlichdurcheineRegelungschwierigerzu haltensein.Die mittlereAusbeutewird soaberauf >?AH ) $ *I+.-�12G�J2K angehoben.In denSzenari-enA undB wird angenommen,daßdasDurchflußventil, durchwelchesein ReglerEinflußaufdieDynamikdesBioreaktorsnehmenkann,einelineareKennlinie L !NMPORQhat,d.h.esgilt 4 * L !NMPORQ * O5S (6.11)

wobeidieVentilstellungO im Intervall T + S 1VU liegt.& SzenarioC hatdieselbenZielgrößenwie SzenarioB. Allerdingswird nundemBio-reaktoreine schnelleSystemveränderunghinzugefügt,indem dasDurchflußventilzufällig undschlagartigzwischeneinerlinearenund einerquadratischenKennliniewechselnkann.DasDurchflußventil kanndaherim SzenarioC neben(6.11) aucheinerKennlinie 4 * L 9 MWO=Q * O 91 (6.12)

folgen.Die beidenZuständeX *Y/ und X *Z1 sollengleichwahrscheinlichseinundeinemittlereLebensdauer[ haben.DurchdieseModifikation erhältderBioreaktorein multifunktionalesVerhalten,welchesin Abschnitt4.3 näherdargestelltwurde.Es ist naheliegend,daßdadurchdie RegelungdesBioreaktorsnochmalserschwertwird.

Die zunächstartifiziell erscheinendeErweiterungdesBioreaktorsim SzenarioCspiegelt dasVerhaltenrealerVentile wider, die zur Regelungder Anlage für dieRückstandsverbrennungder Wacker-ChemieGmbH benötigtwerden.In Abschnitt7.2.3wird nochnäheraufdieseProblematikeingegangen.

6.2. Regelung des Bioreaktor s

6.2.1. Simulation des Bioreaktor s

Im folgendensoll die RegelungdesBioreaktorsmit verschiedenenMethodenuntersuchtwerden.Dazumüssenfür die SimulationdesBioreaktorsdie Gleichungen(6.5) und(6.6)integriert werden.Allerdings wird ein chemischerProzeß,der im industriellenMaßstabeingesetztwird, in derRealitätnie exakt irgendwelchenanalytischenBeschreibungenge-horchen.Vielmehrwird durch wechselndeUmgebungsbedingungen,variierendeGrund-stoffe und verschiedeneVerschmutzungenein ad hoc nicht bekanntesRauschenin dasSystemeingebracht.Hinzu kommenSensoren,die zu Meßrauschenführen,undAktoren,

121

Page 130: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

die vorgegebeneStellaktionennicht exakt ausführen.EineweitereErschwernisderRege-lung stellenMeßgerätedar, die nicht kontinuierlich ein Meßsignalliefern, sonderneinegewisseTotzeitbenötigen,biseineneueMessungvorgenommenwerdenkann.

Dieseanalytischnur schwerbeschreibbarenEffektewerdenfür die SimulationdesBiore-aktorsdurchdrei künstlicheStörungsquellenbeschrieben:(i) Nicht optimaleBedingungenzu Beginn desProduktionsprozesseswerdendurchein starkesVerrauschenderStartwerteerreicht.(ii) Die nur endlicheGenauigkeit einerMessungwird durchein leichtesVerrau-schenderMeßwertewährendderIntegrationvon(6.5) und(6.6) simuliert.(iii) Die TotzeitderMeßgerätewird dadurchberücksichtigt,daßdie Regelungnur alle \^] ZeitschritteindasSystemeingreifenkann.

Für die IntegrationdesDifferentialgleichungssystems(6.5) und (6.6) mußeinezeitlicheDiskretisierungvorgenommenwerden(sieheauchAbschnitt5.2). Die Integrationsschritt-weite _ wird entsprechendder Literatur [MSW92] auf +.-�+=/ festgelegt. Um die QualitätdesReglersbeurteilenzu können,werden\ H Simulationsläufemit jeweils \�` Regelungs-schrittenberechnet.Für dasgesamteSimulationsszenarioergibt sichderin Abbildung6.5dokumentierteAblauf.

Die Größenacb und acd sindZufallsvariablen,die gleichverteiltauseinemendlichenInter-vall gewürfelt werden,undim Mittel Null sind.Die Streuungvon acb beträgte=b *f+.-g/ unddie StreuungdesMeßrauschensahd ist e=d *i+.-�+�+=/ . Für die BeurteilungeinerRegelungwerdenimmer \ H *E/D+2+ Simulationsläufeausgeführt.JederSimulationslaufsetztsichaus\�` *j8k+�+ Regelungsschrittenzusammen,zwischendenendasSystemjeweils \l] Zeit-schrittesimuliertwird. \^] *m/ bedeutet,daßdie MessungohneTotzeitarbeitet,d.h. dieRegelungsofort auf Abweichungenreagierenkann.Mit \^]on / wird eineMessungmitTotzeitrealisiert,wassicherlichdie RegelungdesBioreaktorserschwerenwird.

Ein DatenpunktM^p� ! T q U Srp� 9 T q U S 4 T q U QFs IRt beschreibtdenZustandderSimulationzumdis-kretenZeitpunkt q . WegendieserDiskretisierungumfaßt q dieZeitdauervonderBereitstel-lung derMessungenp� ! T q U und p� 9 T q U bis zumErreicheneinesDurchflusses4 T q U auf GrundderVentilstellungO T q U , dievomReglerausgegebenwurde.Esist alsozubeachten,daß p� ! T q Uund p� 9 T q U nichtvon 4 T q U , sondernvomDurchfluß4 T q=uv\^] U abhängen,der \^] Simulations-schrittvorherherrschte.

6.2.2. Kriterien zur Beur teilung einer Regelung

Der RestdiesesKapitels wird von der qualitativen Beschreibung dreier Regler für denBioreaktorundderDarstellungderquantitativenErgebnisse,diedieseReglerbeiderKon-trolle desBioreaktorserreichen,eingenommen.Für die Konstruktionder Regler und dieDiskussionderquantitativenErgebnisseist eszunächstnotwendig,Kriterien einzuführen,mit derenHilfe dieverschiedenenReglerbeurteiltwerdenkönnen.DieseBeurteilungwirdsichandrei Gesichtspunktenorientieren:

122

Page 131: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6.2. RegelungdesBioreaktors

Schleifeüber \ H Simulationsläufe:bestimmeAnfangsbedingungen:� ! T +kU5* � $!xw acb� 9 T +kU5* �%$9 w acb4 T +kU5* 4 $ w ahbSchleifeüber \^` Regelungsschritte:

Schleifeüber \^] Simulationsschritte:q�y q w /� ! T q Uz* � ! T q{u /|U w _ M u � ! T q{u /NU 4 T q}u /NU w � ! T q~u /NU0� M � 9 T q}u /NU Q�Q� 9 T q Uz* � 9 T q{u /|U w _ M u � 9 T q{u /NU 4 T q}u /NU w � ! T q~u /NU e M � 9 T q~u /NU Q�QMessung:p� ! T q U�* � ! T q U w acdp� 9 T q U�* � 9 T q U w acdRegelung:O T q U�* Regler( p� ! T q U Sxp� 9 T q U S � $! S � $9 )Ventil:4 T q U�*����;�N���R�k�����r���.�=�h��� L !�MPO T q U Q�;�N���R�k������� � L���� ��� MWO T q U Q � �����N� X;T q U s � / S 1¢¡ £ ��¤ [ *6J�82+

Abbildung6.5.:Vorgehenbei der Simulation desBioreaktors.

& Das washout bezeichnetdie Situation,daßdie Zellen vollständigausdem Reak-tor gespültwurden.Beim sog.steady state schließtderRegler dasDurchflußventil( 4 *¥+ ), dieNährstoffkonzentrationnimmtstetigab(

� 9�¦ / ), wasschließlichzuei-nerkleinen,aberkonstantenZellkonzentrationführt. Sowohl washoutalsauchstea-dy state sind äußerstunerwünschteZustände,die der Regler möglichstvermeidensollte.Tritt einerder beidenSituationenin einemSimulationslaufauf, so wird derkompletteLauf alsVerlustaufgefaßt.Wir sprechendannauchvoneinemverlorenenLauf undbezeichnendieZahl derverlorenenLäufemit >\ H .

& Die obenschoneingeführtemittlereAusbeute(6.10) ist einMaßfür diemittlerePro-duktionsrateanZellen.DadieseGrößemaßgeblichdieWirtschaftlichkeit einesBio-reaktorsunddamitdie Auswahl einerRegelungbestimmt,wird siein derPraxiseingroßesGewicht haben.Für die Berechnungder mittlerenAusbeute >? T \ U , die wäh-rendaller Simulationsläufeerreichtwird, wird überdie Gesamtzeit\ * \ H \^`§\^]

123

Page 132: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

desVersuchsmit >? T \ U�* /\ H \�`¢\^] ¨��© !�ª"ª"ª¬«®­N¯�°r±­�¯;²7­�³�­�´ � ! T q U 4 T q U (6.13)

gemittelt.Die Summein (6.13) umfaßtnurdiejenigen\ H uE>\ H Simulationsläufe,beidenenkeinwashoutodersteadystateaufgetretenist.VerloreneSimulationsläufege-henin (6.13) alsomit einerAusbeutevonNull ein.Die mittlereAusbeute >? T \ U kannzum Einendurchdie Wahl desSzenariosB beeinflußtwerden.DabeimußaberinKauf genommenwerden,daßdieRegelungaufGrundderNichtlinearitätderStreckezunehmendschwierigerzu handhabenseinwird. Zum Anderenkanndie AusbeutedurcheineRegelungerhöhtwerden,deresgelingt,mit einemkleinenFehlerzuver-lässigdenSollwerteinzuhalten.In diesemFall wird diemittlereAusbeute(6.13) dietheoretischerwarteteAusbeute >? $ erreichen.& DerFehler >µ T \ U ist einMaßfür dieStreuungderMeßwerte p� ! T q U umdenSollwert

�%$!undquantifiziertdie Genauigkeit einerRegelung.Beiträgefür denmittlerenFehler

>µ T \ U5* ¶··¸ /M \ H u >\ H Q \^` ¨��© ! ) ­D´ ) 9 ­�´�ª"ª"ª"«¬­N¯5° ±­N¯=²7­N³¹­�´ Mlp� ! T q U u � $! Q 9 (6.14)

werdenfür alle \ H u¥>\ H Simulationsläufeundfür jedenRegelungsschrittgenommen,d.h.nurzujenenZeitpunkten,zudenentatsächlichauchMessungenvorliegen.Esistzu erwarten,daß >µ T \ U immerüberderStreuunge=d desRauschensliegt, dasbei derMessungaufdenWert

� ! T q U aufaddiertwird.

Die obendefiniertemittlere Ausbeute >? T \ U und der Fehler >µ T \ U sind zwei Größen,diedeutlichmit derZahl >\ H derverlorenenLäufekorreliert ist. Viele verloreneLäufewerdeneinerseitsdazuführen,daßdie mittlereAusbeuteabnimmt.Anderseitswird manin einemsolchenFall einenrelativ kleinenFehlererhalten,obwohl bei einemwashoutoderstea-dy state die Zellkonzentrationstarkvon derSollkonzentration

� $! abweicht,daverloreneLäufenicht in die BerechnungdesmittlerenFehlerseingehen.

6.2.3. Drei Regler für den Bioreaktor

Nachdemim letztenAbschnittdargestelltwurde,wie der Bioreaktorim Detail simuliertwird und nachwelchenKriterien eine Regelungbeurteilt werdenkann,soll nun daraufeingegangenwerden,welcheReglerverwendetwerdensollenundwie dieseparametrisiertund an die Strecke angekoppeltwerden.Entsprechendder Klassifikation,die in Kapitel5 vorgenommenwurde,soll jeweils ein modellbasierter, ein erfahrungsbasierterund eindatenbasierterRegler untersuchtwerden.Bei denfolgendenAusführungensollte im Ge-dächnisbehaltenwerden,daßdieseRegler ohneKenntnisder auf denletztenSeitenun-tersuchtenDynamikdesBioreaktorskonstruiertwerdensollen.Die obigeDiskussionder

124

Page 133: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6.2. RegelungdesBioreaktors

DynamikundStabilitätdesBioreaktorsdientenureinembesserenVerständnisderStrecke,nicht jedocheinerVerbesserungderRegelung.

PID-Regler

Der PID-Regler (sieheauchAbschnitt5.2) ist ein klassischerRegelungsalgorithmus.ZurKonfigurationund Parametrisierungsind eineVielzahl von Verfahrenveröffentlicht wor-den,die auf der KenntniseinesanalytischenModellsder Strecke beruhen(z.B. [Föl92]).Da im folgendendavon ausgegangenwird, daßein solchesanalytischesModell nicht zurVerfügungsteht,könnendieseVerfahrennicht verwendetwerden.Dies entsprichtauchder üblichenSituationin der Praxis,in der häufigdie zu regelndeStrecke nur durchEr-fahrungswertebeschriebenwerdenkann.In diesenFällenwird häufigder ParametersatzdesPID-ReglersdurcheinegrobeAbschätzungdesStreckenverhaltensinitialisiert undan-schließendin einemzyklischenProzeßderleichtenVariationderParameteroptimiert.

DiesesVorgehenwird für die OptimierungderRegelungdesBioreaktorsmit einemPID-Regler durchdie Verwendungder downhill simplex Methode[PTVF92, NM65] imitiert.DiesesVerfahrendient der Minimierung einerFunktion º � IR» ¦ IR. DabeiwerdeninjedemIterationsschritt¼ w / Punkte½ s IR» ausgewertet.DiesePunktebilden– verbindetmanjedenPunktmit allenanderen– einensog.Simplex. DerSimplex wird nun,abhängigvon denFunktionsauswertungenº M ½lb Q , ¾ *I/¿-D-�- ¼ w / S undunterErhaltungseinesVolu-mens,so deformiert,daßer in RichtungeinesMinimums von º M ½ Q wandert.Der VorteildieserMethodeliegt darin,daßkeinepartiellenAbleitungenÀ�º M ½ QÂÁ ÀRÃ§Ä benötigtwerden.

Die StellgrößedesPID-Regler für denBioreaktorist dieVentilstellungO T q U , dieRegelgrößeist p� T q U und die Führungsgrößeist abhängigvom gewähltenSzenario,

� @ ) $! *Å+.-�3�8 oder� H ) $! *�/2-7128 . FürdieOptimierungdesReglerswird derjenigePunkt ½ * MWÆ Ç�S \ » S \^È S \^É Qim 4-dimensionalenParameteraumgesucht,derzueinerminimalenFehlerfunktionº M ½ QËÊ>µ T \ U wÍÌ >? T \ U führt. Ausgehendvon einemStartpunkt½ ÷ wird dasVerfahrenso langeite-riert, bis keinewesentlicheVerringerungderFunktion º M ½ Q feststellbarist. Üblicherweisesinddazuca.150Auswertungenvon º M ½ Q notwendig.

Fuzzy-Regler

Für eineerfahrungsbasierteRegelungdesBioreaktorssoll der in Abbschnitt5.3beschrie-benefuzzy Sugeno-Regler verwendetwerden,dessenParametermit der obenerwähntendownhill simplex Methodeoptimiertwerden.Dazuwird mit denDefinitionen_ � $! T q U Ê � $! u p� ! T q U �=�=� _ � $9 T q U Ê � $9 u p� 9 T q U (6.15)

125

Page 134: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

Abbildung6.6.:Die Zugehörigkeitsfunktionen ÎRÏ.ÐVÑ�ÒFÓÕÔ×ÖØÖØÖÚÙ�Ñ zu den fuzzy Regeln.

einkleinerSatzvon sechsfuzzyRegelnÛRÜVÝ§Ý M _ � $! T q U s a !ÞQ~ß.à Ý¢Ý _ O�! * _âá Û�Ü¹Ý§Ý M _ � $9 T q U s acã Q~ß.à Ý§Ý _ O ã * _âäÛRÜVÝ§Ý M _ � $! T q U s a 9 Q~ß.à Ý¢Ý _ O 9 *¥+ Û�Ü¹Ý§Ý M _ � $9 T q U s aæå Q~ß.à Ý§Ý _ O å *:+ÛRÜVÝ§Ý M _ � $! T q U s a t Q~ß.à Ý¢Ý _ O t * uæ_çá Û�Ü¹Ý§Ý M _ � $9 T q U s aAè Q~ß.à Ý§Ý _ O è * uA_âä(6.16)

aufgestellt,derenZugehörigkeitsfunktionen� Ï.Ð , é *�/Ë-�-D-�G , in Abbildung6.6dargestelltsind.Die Regeln (6.16) beinhaltendie einfacheAussage,daßbei einerAbweichungderMeßwerte p� ! T q U bzw. p� 9 T q U von denSollgrößen

�%$! T q U bzw.� $9 T q U dasDurchflußventil um

einenkleinenBetraggeöffnetbzw. geschlossenwird.

Wenngefordertwird, daß � Ï.ê M _ � !ØQ und � Ï;ë M _ � 9 Q jeweils symmetrischum Null ange-ordnetsindund � Ï5ì M _ � !ÞQ *Z� Ï;í M uA_ � !ØQ bzw. � Ï¢î M _ � 9 Q *�� Ï.ï M uæ_ � 9 Q gilt, dannsindsechsParameterfür die Beschreibung der Zugehörigkeitsfunktionennotwendig.Da dieAusgabenderRegeln(6.16) nur die beidenweiterenParameter_âá und _âä enthalten,um-faßtdieserfuzzyRegler achtParameter.

Die Ausgabedes durch die Regeln (6.16) definiertenSugeno-Reglers ergibt sich nach(5.16) durch

O T q U�* O T q}uð\^] U wòñ èó © ! _ O ó � Ï Ð M _ �%$! T q U S _ �%$9 T q U Qñ èó © ! � Ï.Ð M _ � $! T q U S _ � $9 T q U Q - (6.17)

Für die Optimierungeinessolchesfuzzy Reglerswird mit der downhill simplex Metho-de ein Punkt ½ s aæô im achtdimensionalenParameterraumgesucht,der die Funktionº M ½ Q�Ê >µ T \ U w�Ì >? T \ U minimiert. DiesesMinimum wird überlicherweisenachca. 250Auswertungenvon º M ½ Q gefunden.

126

Page 135: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6.2. RegelungdesBioreaktors

Regelung mit einem LLM-Appr oximator

Für die KonstruktioneinesdatenbasiertenReglers soll der in Abschnitt 3.3 entwickelteLLM-Approximator verwendetwerden.Dieserwird mit Datentrainiert,die einePrädik-tion desdynamischenVerhaltensdesBioreaktorserlauben.Zu diesemZweck wird eineTrainingsdatenfolgeõ÷ö0øúù�û"ü * � � ! T q U S � 9 T q U S�O T q U S _ � ! T q w \^] U S _ � 9 T q w \^] U=ý q *�/ S \l] S 1 \l] -�-D- \ H \^`§\l] ¡

(6.18)

mit_ � ! T q w \^] U Ê � ! T q w \^] U u � ! T q U �=�=� _ � 9 T q w \l] U Ê � 9 T q w \^] U u � 9 T q U(6.19)

erzeugt,wobeidie O T q U von einem“Regler” herrühren,derdie VentilstellungenO T q U unab-hängigvonjeglicherMessungwürfelt.Die O T q U sindgeradesogewählt,daßsicheinmittler-er Durchflußvon 4 @ ) $ *þ+.-�3�8 bzw. 4 H ) $ *I/2-�1�8 mit einerStreuungvon +.-0/�1 einstellt.Fürdie Erstellungvon

õ ö0øúù�û"üwurde \ H *f82+2+ und \�` *E/D+�+�+ gewählt. In derTrainingsdaten-

folge

õ ögÿ��0öist somitkodiert,mit welcher“Geschwindigkeit” M _ � ! T q w \^] U S _ � 9 T q w \^] U Q

sichderBioreaktorvomZustandM � ! T q U S � 9 T q U SÞO T q U Q zumZeitpunkt q entfernenwird.

DiesedermaßengenerierteTestdatenfolge,die abhängigvom gewähltenSzenarioundderTotzeit \^] ist, wird nun einerML-DichteschätzungauseinerMischungvon

�multiva-

riatenNormalverteilungenunterzogen.Dazuwird der in Abbschnitt3.2 entwickeltemul-tivar -Algorithmusverwendet.Wie dort gezeigt,arbeitetdiesesVerfahrendichteorientiert,d.h.erverteiltdieZentren��� derNormalverteilungen(2.36) entsprechenddertatsächlichenDichte � M ½ Q so im Merkmalsraum,daßdie Komponentender Mischung(2.35) die loadbalance(2.21) zeigen.DiesesVerhaltenist aberfür denmit (6.18) gegebenenTrainingsda-tensatz

õ ögøgù�û"ünichtunbedingterwünscht,dageradegroßeaberselteneGeschwindigkeitenM _ � ! T q w \^] U S _ � 9 T q w \l] U Q für denzu entwickelndenRegler von Interessesind.Daher

wird der multivar-Algorithmus so modifiziert, daßdieseeherseltenenEreignisseüber-proportionalgenaudurchdie Normalverteilungen(2.36) repräsentiertwerden.Dies wirddadurcherreicht,daßderLernparameter�� in derLernregel (2.19) für dieZentren��� durchdenneuenLernparameter

p��DT q U�* �� ý M _ � ! T q w \l] U S _ � 9 T q w \l] U Q ýý M _ �� ù �! S _ � ù �9 Q ý (6.20)

ersetztwird. Dadurchwird dieLernschrittweitejeweilsandievorliegendeGeschwindigkeitM _ � ! T q w \^] U S _ � 9 T q w \^] U Q angepaßt.Dabeiist M _ � ù �! S _ � ù �9 Q die im BetraggrößteGeschwindigkeit, die im Datensatz

õ ö0øúù�û"üvorkommt.Mit demdurch(6.20) modifizierten

multivar-AlgorithmuserhältmanschließlicheineRepräsentationder Trainingdatenfolgeõ ö0øúù�û"ü

, die geradeim BereichgroßerGeschwindigkeitenaussagekräftigist.

127

Page 136: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

AusdieserDichteschätzungkannnuneinLLM-Approximatorextrahiertwerden,derdurchinverseSystemidentifikationals Regler verwendetwerdenkann.DieserRegler wird imfolgendenauchals LLM-Regler bezeichnet.Der LLM-Approximator muß dazugeradeeine Abbildung von einemZustand M � ! T q U S � 9 T q U Q und einer Geschwindigkeit M _ � ! T q w\^] U S _ � 9 T q w \^] U Q aufeineVentilstellungO T q U ausführen,also�º � M � ! T q U S � 9 T q U S _ � ! T q w \l] U S _ � 9 T q w \l] U Qrs IR

ã ¦ IR - (6.21)

Der LLM-Approximator prädiziertalsoauseinemZustandundeinerGeschwindigkeit ei-neVentilstellung,die zu geradedieserGeschwindigkeit führt. Mit derZielgeschwinigkeit(6.15) erhältmanschließlichdurchO T q U�* �º MÚM � ! T q U S � 9 T q U S _ � $! T q U S _ � $9 T q U Q ��� `2`2] Q (6.22)

einendatenbasiertenRegler für denBioreaktor.

6.3. Ergebnisse für verschiedene Szenarien undRegler

Die drei obendargestelltenRegler sollennun anHandder drei in Abschnitt6.1 definier-tenSzenarienverglichenwerden.Dabeiwird immereineTotzeitvon \l] *E/D+ eingehalten.JededieserSimulationenwird anschließendnachdenin Abbschnitt6.2.2eingeführtenKri-terienbeurteilt.Da dereinzigefreie ParameterdesLLM-Reglersdie Anzahl

�derNor-

malverteilungen(2.36) für die ML-Dichteschätzung(2.35) ist, werdendie entsprechendenSimulationsläufein Abhängigkeit von

�ausgeführt.In Abbildung6.7sinddieErgebnisse

allerVersuchezusammengefaßt.

Szenario A: Regelung im stabilen Bereic h

Im SzenarioA soll dieZellkonzentrationunddasNährstoffverhältnisaufdenstabilenFix-punkt # � ) ! mit denWerten

� @ ) $! *6+.-0/�12+�3 und� @ ) $9 *:+.-�<�<�+=/ geregeltwerden.Bei diesen

Zielgrößenist einemittlereAusbeutevon >?A@ ) $ *6+.-�+�B�+�8 zuerwarten.

Die ersteSpaltein Abbildung6.7 verdeutlicht,daßein offenerRegelkreisfür diesenFallzu einemsehrgutenErgebnisführt und daßder mittlere Fehler >µ T \ U für alle Regler ähn-lich klein ist. Da aberder Anteil der nicht verlorenenSimulationsläufefür denPID- unddenFuzzy-Regler bei nur 50%liegt, ergibt sichfür diesebeidenRegler einegeringemitt-lere Ausbeute >? T \ U . Der LLM-Regler regelt dagegendie Zielgrößenzuverlässigein underreichtdamitdie optimalemittlereAusbeute >? T \ U}* >?c@ ) $ bei einemsehrgeringenmitt-lerenFehler >µ T \ U .128

Page 137: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6.3. Ergebnissefür verschiedeneSzenarienundRegler

Abbildung6.7.: Ergebnissefür die RegelungdesBioreaktors. In dendrei Spaltensind dieErgebnissefür dieSzenarienA, B undC dargestellt.DiedreiZeilenzeigenjeweilsResultatefürdie drei verschiedenenKriterien.Dabeiwird die mittlereAusbeute �� � ��� aufdie für dasjewei-lige SzenarioerwartetemittlereAusbeute �� $ bezogen.Die mittlereZeile zeigtdasVerhältnisdernichtverlorenenSimulationsläufe

� H�� �� H zurGesamtzahl� H allerSimulationsläufeund

die letzte Zeile den mittleren Fehler �� � ��� normiert mit der Streuung� d desMeßrauschens� d (vgl. auchAbbildung6.5). Auf GrunddieserNormierungenist ein Wert von Einsfür alleKriterien optimal.Die RegelungdesBioreaktorsmit einemLLM-Approximator wurdein Ab-hängigkeit vonderAnzahl � derverwendetenNormalverteilungen(2.36) durchgeführt.NebendemPID-, Fuzzy- undLLM-Reglersindauchdie Resultatefür eineoffene Strecke,d.h.einennicht geregeltenBioreaktor, dargestellt.

129

Page 138: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

Szenario B: Regelung im instabilen Bereic h

Im SzenarioB soll die Zellkonzentrationund dasNährstoffverhältnisauf den instabilenFocus # � ) ! mit denWerten

� H ) $! *¥+.-71;/D+�3 und� H ) $9 *:+.-�3�1�12G geregeltwerden.Bei diesen

Zielgrößenist einemittlereAusbeutevon >?AH ) $ *:+.-�12G�J2K zuerwarten.

Auchhier ist derAnteil dernichtverlorenenSimulationsläufefür denPID- unddenFuzzy-Regler, aberauchfür denoffenenRegelkreis,mit ca.50%gering.DiesegeringeZuverläs-sigkeit derRegler zeigtsichauchin einergeringenmittlerenAusbeute >? T \ U . Der mittlereFehlerist dagegenim VergleichzumoffenenRegelkreisgering,dawegen(6.14) dieverlo-renenSimulationsläufenicht in dieBerechnungvon >µ T \ U eingehen.DerLLM-Reglerzeigtfür

� n 12+ einenahezuoptimalemittlereAusbeuteundzuverlässigesVerhaltenmit einemgeringenmittlerenFehler.

Szenario C: Regelung bei schnell wechselnden Systemzuständen

Bei diesemSzenariostimmendie Zielgrößen��� ) $! und

��� ) $9 mit denjenigenvon SzenarioB überein.Allerdingswird nunangenommen,daßdasStellventil auf Grundeinesstocha-stischenProzesseszwischender linearen(6.11) und der quadratischen(6.12) Kennliniewechselnkann.

In dieserSituationführenderPID- undderFuzzy-Regler zu einemgeringenAnteil nichtverlorenerSimulationsläufevon ca.35%.Entsprechendgeringist auchdie mittlere Aus-beute >? T \ U . Abgesehenvom mittlerenFehler >µ T \ U liefert ein offenerRegelkreisdeutlichbessereErgebnisseals der PID- oderFuzzy-Regler. DagegenmeisternLLM-Regler, dieausmehrals 30 multivariatenNormalverteilungenaufgebautsind, die gestellteAufgabehervorragend.Sowohl die mittlere Ausbeute >? T \ U als auchdie Zahl der nicht verlorenenSimulationsläufeist im optimalenBereich.Da dermittlereFehler >µ T \ U von PID- undFuz-zy-Regler auf GrunddergroßenZahl verlorenerSimulationsläufegeringist, erscheintal-lerdingsdermittlereFehlerdersehrzuverlässigenLLM-Reglersrelativ hoch.

Es bleibt anzumerken, daßdie sehrgute Qualität desLLM-Reglersauchmit einemda-tenbasiertenRegler erreichtwird, derauf demim Abschnitt4.3.1beschriebenenmGRBF-Systemvon M. Sonnerberuht[Son97]. Allerdings verfügt ein solcherRegler wegenderäquidistantenVerteilungder Zentren ��� im fünfdimensionalenMerkmalsraumüber we-sentlichmehrParameteralsderLLM-Regler undist daherauchentsprechendzeitintensivim Training.

Zusammenfassung

In diesemKapitel wurdeder Bioreaktorals Testsystemfür denVergleich einesdatenba-siertenReglers,deraufeinemLLM-Approximatorberuht,mit einemPID- undeinemFuz-zy-Regler, verwendet.Ein einfacherBioreaktorkann durch ein nichtlineares,gekoppel-tesDifferentialgleichungssytembeschriebenwerden.Die darausresultierende,komplexe

130

Page 139: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6.3. Ergebnissefür verschiedeneSzenarienundRegler

Dynamik wurdezunächstnäherdiskutiert,um einenEindruckvon der Schwierigkeit derRegelungeinesBioreaktorszu gewinnen.Der Vergleichdessog.LLM-Reglersmit einemPID- undeinemFuzzy-Reglerwurdefür dreiSzenarienvorgenommen,diesichdurcheinezunehmendeNichtlinearitätderDynamikdesBioreaktorsauszeichnen.Eszeigtesich,daßesdemLLM-Regler in dendrei untersuchtenFällengelingt,ein ausreichendgutesModellderDynamikzuerstellen,um– im VergleichzukonventionellenReglern– denBioreaktorsehrsicherundgenauzu regeln.

131

Page 140: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

6. RegelungeinesBioreaktorsim Computerexperiment

132

Page 141: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. Regelung derRückstandsverbrenn ung in einerindustriellen Anla ge

Bei denBeispielen,anHanddererin denletztenKapitelnVerfahrendemonstriertundver-glichenwurden,handelteessich immerum künstlicheundkonstruierteSysteme,die nuraufdemComputersimuliertwurden.Will manaberdiePraxistauglichkeit vonRegelungs-algorithmentesten,somußmansichauchandie Kontrollevon Systemenwagen,die tat-sächlichexistieren,und die in der Praxisauchvon Bedeutungsind. Dies soll in diesemKapitel geschehen.

Durch eine Kooperationmit der Wacker-ChemieGmbH bestanddie Möglichkeit, neueRegelungskonzeptefür einreales,industriellesRegelungsproblemanderAnlagefür Rück-standsverbrennungim WerkBurghausenzuimplementierenundzutesten.Bei dieserAnla-gehandeltessichumeingroßesundkomplexesSystem,dasmit allenEigenartenausgestat-tet ist, diedieUmsetzungtheoretischerVerfahrenin diePraxiserschweren:unzuverlässigeund instabileMessungen,stochastischeStörungen,Stellgliedermit unbekanntenKennli-nien, ein Prozeßleitsystemmit nur eingeschränkterFunktionalität,harteRandbedingun-gendurchWirtschaftlichkeit undUmweltschutz,ForderungnachsehrhoherVerfügbarkeitundWiderständederBetreiberbei derUmsetzungneuerMethoden.LangfristigesZiel derWacker-ChemieGmbHwar eineStabilisierungdesinstabilenVerhaltensderAnlageunterder Nebenbedingung,denVerbrauchan Stützbrennstoff zu reduzieren.Im RahmeneinerMachbarkeitsstudiewurdefür diesenZweckeinProgrammpaketentwickelt, welchesunterZuhilfenahmedesvorhandenenProzeßleitsystemsein Systemlokaler Expertenrealisiert.DiesesneueSystemgliedertsichin zweiTeile – RegelungderAbgaseundderFlüssigkei-ten – und ersetztbzw. unterstütztdie schonvorhandeneRegelung.Auf Grundder Kom-plexität derAnlageundderForderung,denlaufendenBetriebmöglichstwenigzu stören,konntennur bestimmteTeilbereichederAnlagemit denin Kapitel 4 und6 beschriebenenMethodenkontrolliert werden.DazuzählteineVerbesserungderLastenverteilungauf diedrei vorhandenenÖfenundeineLinearisierungderFlüssigkeitszufuhr.

133

Page 142: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

Abbildung7.1.:Gesamtansichtder Anlagefür Rückstandsverbrennung. Links sinddieausdemWerkeinlaufendenAbgasleitungenzuerkennen,diein dieAbgasübernahmemünden.Die-serAnlagenteilverdecktdiebeidenkleinerenÖfen1 und2 unddasBetriebsgebäude.Dermitt-lereTeil desBilds ist von verschiedenenFilteranlagen(RauchgaswäscheundNaßelektrofilter)undeinemgroßenFlüssigkeitstankgeprägt.RechtssindOfen3 undein Teil desKatalysatorszusehen.Im Vordergrundfließt derAlz-Salzach-Kanalvorbei.

7.1. Die Anla ge zur Rückstandsverbrenn ung

Um dieBedeutungunddieAufgabederAnlagefür Rückstandsverbrennungbessereinord-nenzukönnen,soll zunächstderStandortdesChemiewerkskurzbeschriebenwerden.DasWerk BurghausenderWacker-ChemieGmbHumfaßtetwa 30 Produktionsbetriebeauf ei-nerFlächevon ca.2 qkm. Dasum 1910gegründeteStammwerkproduzierthauptsächlichGrundstoffe für die chemischeIndustrie.Hauptzweigwar langeZeit die ChlorchemiefürVorprodukteder PVC-Herstellung.Neuerdingswird dieserBereichaberzunehmendvonderProduktionverschiedenerSilikone,organischerZwischenstoffeundReinstsiliziumsab-gelöst[WCG99]. Die auchauf demWerksgeländeangesiedelteWacker Silitronic AG pro-duziertseit 1962Siliziumwafer für die Halbleiterindustrieund hält weltweit inzwischeneinenMarktanteil von 14%. 1997warenetwa 10000Beschäftigteim Werk Burghausenangestellt.Der GesamtumsatzderWacker-ChemieGmbHlag 1997bei rund5 MilliardenDM [WCG97].

Der1967gebauteBetriebsteilfür Rückstandsverbrennung(RV) entsorgt nebenderwerks-eigenenKläranlageundDeponiefeste,flüssigeundgasförmigeAbfälle, die innerhalbdesWerks anfallen. Abbildung 7.1 zeigt die Anlage in der Totalen.Die folgendeBeschrei-bungwird kurz auf die wichtigstenAnlagenteileeingehen.Anschließendwerdendiejeni-

134

Page 143: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.1. Die AnlagezurRückstandsverbrennung

genAspekte,die für die weiteruntenvorgestellteRegelungvon Bedeutungsind,genauerdargestellt.Die RV läßtsichin vier Teile gliedern:

Abgasübernahmeund Flüssigkeitsanlieferung. Die gasförmigenAbfallstoffe wer-den über zum Teil langeRohrleitungen(1-2 km) zur RV transportiertund in derAbgasübernahme1 auf die verschiedenenÖfen verteilt. Bemerkenswertist, daßdieAbgase(bisauf Abgas10) von denTeilbetriebennicht gepuffert werden.Die RV istalsogezwungen, alle angeliefertenAbgasesofort zu verbrennen.Die Flüssigkeitenwerdendagegen in Tankwagenangeliefertund könnenin zwei großenTankszwi-schengelagertwerden. Drei Verbrennungsöfen. Dies sind zwei sog.Muffelöfen, die seit 1956 (Ofen 1)und1964(Ofen2) in Betriebsindundein neuererDrehrohrofenausdemJahr1982.Da die für die RegelungwesentlichenProzessein diesenÖfen ablaufen,wird imnächstenAbschnittnochnäheraufdenAufbauderÖfeneingegangen. Filteranlagen. Auf Grundder immer schärferwerdendenOfenabgasverordnungensind in diesemAnlagenteildie größtenVeränderungen,bzw. Anbautenvorgenom-menworden.In den fünfziger Jahrenarbeitetendie beidenMuffelöfen nochohneirgendwelcheFiltervorrichtungen.Seitdemist die Anlageschrittweisemit verschie-denenRauchgaswäschern,einemNaßelektrofilterundeinemKatalysatoraufgerüstetworden. Leitstand. Hier laufendie Wertevon ca.1000Messungen,die in der Anlagevor-genommenwerden,zusammen.Alle wichtigenSteuerungs-undRegelungsaufgabenwerdendort mit Hilfe einesProzeßleitsystems(PLS)zentralausgeführt.Im regulä-renBetriebwird dasProzeßleitsystemvonmindestenseinem/einerChemiefacharbei-ter/inbedient.Zusätzlichist mindestenseinePersonfür dieBedienungundÜberwa-chungder Anlagevor Ort notwendig.Die normaleBesetzungsstärke liegt tagsüberbei4-5Arbeiternundca.6 Angestelltenfür dieverfahrenstechnischeBetreuungunddie Verwaltung.

7.1.1. Öfen und Brennstrec ken

Bei denbeidenälterenundkleinerenÖfen(Ofen1 und2) handeltessichum Muffelöfen.Bei diesenÖfenist derzylinderförmigeBrennraumaufrechtstehendangeordnet,wobeidieBrennlanzen,welchediezuverbrennendenStoffe demBrennraumzuführen,radialin glei-cherHöheangebrachtsind.Ofen1 hateineHöhevon 4.2Meternbei einemDurchmesservon 2.2Metern.Mit 5.9m ! 2.5m ist derOfen2 etwasgrößer. Der neuereOfen3 ist alsmodernerDrehrohrofenausgeführt.Bei diesemist derzylindrischeBrennraum(ca.5 m !

1Im folgendenwerdendie gasförmigenAbfallstoffe auchals Abgasebezeichnet.Um Verwechslungenzuvermeiden,werdendieAbgasedesOfensalsOfenabgasbezeichnet.

135

Page 144: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

Volumenmessung Druckmessung

Schnellschlußventil Stellventil Handventil BrennerFlammschutzfilter

Ofen 1

Ofen 2

Ofen 3

Ofen 1,2,3

Ofen 1

Ofen 2

Ofen 3

Stützgas

Flüssigkeit

Abgas

Volumenmessung

Massenmessung

Abbildung7.2.:Aufbau der Brennstrecken von Abgas,Flüssigkeit und Stützbrennstoff.

4 m) waagrechtmit einer leichtenSchräglageund um die Längsachsedrehbarmontiert.Durchdie langsameRotationdesBrennraumswährenddesBetriebswird vor allemfür dieFeststoffe einebessereVerbrennungundeinAbfließenderSchlacke erreicht.

Die für dieKontrollederÖfenwichtigstenMeßgrößensinddie TemperaturunddieSauer-stoffkonzentration.JederOfenist mit jeweilszweiTemperaturfühlernim Feuerraum,in derAusmauerungundin derNachbrennkammerausgestattet.Die Messungenzeigenverschie-deneZeitkonstanten.SosprichtdieMessungderFeuerraumtemperaturmit 30sMittelungs-zeit amschnellstenan.Die MessungenderNachbrennkammer- undAusmauerungstempe-ratur sind mit ca. 45 s bzw. 60 s deutlich langsamer. Die mit etwa 30 s relativ schnelleMessungder Sauerstoffkonzentrationzeigt, wie durcheineMeßdatenanalysefestgestelltwerdenkonnte(vgl. Abbildung 7.3 weiter unten),erwartungsgemäßeinedeutlicheAnti-korrelationmit denverschiedenenTemperaturmessungen.Für die MessungdesOfenin-nendrucksexistiert nur eineMeßstelle.Nebendiesenfür die KontrollewichtigenGrößen,werdenim Ofenabgasdie KonzentrationenverschiedenerSchadstoffe gemessen(Staub,Stickoxide,Kohlenmonoxid,organischeKohlenwasserstoffe).

Bei allenÖfenkanndiefür dieVerbrennungnotwendigeLuftmengedurcheineLuftklappebeeinflußtwerden.Die MessungdesLuftstromsliefert typischerweiseWertevon 2000-4000 "$#&%(' . DasmaximaleVolumen,welchesdurcheinenOfenbewegt werdenkann,diesog.hydraulischeGrenze,liegt jeweilsbei etwa10000-12000")#*%+' .

136

Page 145: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.1. Die AnlagezurRückstandsverbrennung

Abgase

JederOfen verfügt über jeweils 12 Brennlanzen,die sog.Brenner, für gasförmigeAb-fallstoffe. Da die Abgasleitung7 nicht mehr existiert, werdendie Abgasleitungenmit,.-/-0-2143�56-/-0-0,/7

durchnumeriert2. Abbildung 7.2, oben,zeigt dasSchemader AufteilungeinesAbgasesauf die drei Öfen. Für jedesAbgas ist eine Volumen-und eine Druck-messunginstalliert.DieseMessungenerfolgen,bevor die Abgaseauf die drei Öfen auf-geteilt werden.Der Volumenstromliegt typischerweisebei ca. 100 ")#*%+' . Abgas6 undAbgas8 könnenaberauchüber längereZeit Durchflüssevon etwa 600 ")#*%+' erreichen.JedeBrennstrecke bestehtausder Sequenz3 Schnellschlußventil, Stellventil, Handventil,Flammschutzfilterund Brenner. Mit demSchnellschlußventil (SS-Ventil) kannein Bren-ner im Notfall innerhalbeinigerZehntelsekundenabgeschaltetwerden.Um ein SS-Ventilzu öffnen,mußallerdingsausSicherheitsgründenvor Ort amSS-Ventil ein Tasterbetätigtwerden.Die eigentlicheSteuerungdesVolumenstromswird aberdurchdieStellventilebe-wirkt. Mit demHandventil kannzusätzlichder Durchflußmanuellangedrosseltwerden.Die StellungdesHandventilswird abernicht gemessenundliegt somitauchnicht in elek-tronischauswertbarerFormvor. Derkurzvor demBrennerangebrachteFlammschutzfilterhatdieAufgabe,einZurückschlagenderFlammein dieAbgasleitungzuverhindern.Obenwurdeschonerwähnt,daßalle Abgase(bis auf Abgas10) ungepuffert angeliefertwerden,d.h.esbestehtfür dieRV einAbnahmezwang.DadieProduktionsbetriebeeinenannäherndkonstantenUnterdruckamEndederAbgasleitungenfür ihreProzeßführungerwarten,kanndasteilweiserecht großeLeitungsvolumen(bis 30 ")# ) nur eingeschränktals Notpufferverwendetwerden.EntsprechendmußderAbgasdruckdurchVariationderdrei Stellventi-le aufeinenkonstantenWert (üblicherweiseim Bereichvonetwa40bis150mbar)geregeltwerden.

Flüssigkeiten

DerAufbauderBrennerstreckenfür dieFlüssigkeiten(sieheAbbildung7.2) ähneltsehrdenobenbeschriebenenAbgasbrennstrecken.AllerdingswerdendieFlüssigkeitennichtaufdiedrei Öfen aufgeteilt.Vielmehrist jederBrennereinembestimmtenTank oderdemStell-platzeinesTankwagenszugeordnet.Ofen1verfügtübervierFlüssigkeitsbrenner(Stellplät-zeCADMA, LOESM, ANFAHR undTankB202), Ofen2 über8 Brennerstrecken(StellplätzeCADMA, LOESM, ANFAHR, KONDENS, DIKETEN, SILAN und die TanksB104, B202)und Ofen 3 über8 Brenner. Man beachte,daßdie Namendie Brennerstrecken bezeich-nenundnur bedingtRückschlüsseauf die Art derFlüssigkeitenzulassen.Auf GrundihrersehrunterschiedlichenphysikalischenundchemischenEigenschaftenwerdendie Flüssig-

2 Auf GrundderlangsamenVeränderungenderAnlageim LaufederletztenJahrzehntehatsicheineReihevonverwirrendenBezeichnungeneingebürgert.

3Tatsächlichverfügt jedeBrennstrecke überdeutlichmehrElemente;soz.B. überVentilezumSpülenderLeitungenmit Stickstoff. Fürdie folgendenAusführungenist diesabernicht von Bedeutung.

137

Page 146: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

keitennichtmit PumpenzudenÖfenbefördert,sondernmit Stickstoff unterDruck zudenBrennerngepreßt.Die MassenströmekönnendabeiWertevon biszu400kg/herreichen.

Stützbrennstoff

NebendenAbgasenundFlüssigkeitenwird in denÖfenein sog.Stützbrennstoff (ErdgasoderWasserstoff) verfeuert,um die VerbrennungschlechtbrennbarerAbfallstoffe zu er-möglichen.DadieAbgaseaufGrundihrervariablenZusammensetzung(z.B.abwechselndverunreinigtesSchutzgasund Acetylen)einenausgeprägtstochastischenEinfluß auf denphysikalischenZustandderÖfenhaben,führt dieZufeuerungvon Stützbrennstoff auchzueinergewollten StabilisierungderVerbrennungsdynamik.Zusätzlichwird derStützbrenn-stoff beimAnfahreneinesOfensdazuverwendet,diemindestenserforderlicheBrennraum-temperaturvon900 8:9 zuerreichen.Als Stützbrennstoff wird sowohl Wasserstoff alsauchErdgaszugefeuert.AllerdingskannwährenddeslaufendenBetriebsnichtzwischendiesenbeidenGasenumgeschaltetwerden.

7.1.2. Randbedingung en und Sicherheitsaspekte

Um die Sicherheitder Anlagezu gewährleistenunddie Abgabevon Schadstoffen in denOfenabgasenzu begrenzen,dürfen bestimmteGrenzwertenicht unter- oder überschrit-ten werden.Die EinhaltungdieserGrenzwertewird überwacht, indem eine vom Tech-nischenÜberwachungsverein (TÜV) bereitgestelltespeicherprogrammierbareSteuerung(SPS)laufenddieAnlagekontrolliert.Wird einederuntengenauerspezifiziertenVorgabenverletzt,schaltetdie SPSdenentsprechendenOfensofortaus,indemautomatischalle SS-Ventilegeschlossenwerden.Daein neuesAnfahrendesbetroffenenOfensca.10 Minutenin Anspruchnimmt, ist ein solchesÜber- bzw. Unterschreitender GrenzwertenatürlichauchausbetrieblicherSichtnicht erwünscht.Erschwerendkommthinzu,daßbei AusfalleinesOfensdie beidenverbleibendenÖfendurchÜberlastungebenfalls ausfallenkönnen,da danndort diejenigenAbgase,die ungepuffert zur RV geleitetwerden,zusätzlichver-branntwerdenmüssen.So kanneineregelrechteKettenreaktionablaufen,die schließlichzumAusfall dergesamtenRV führt unddamitauchzumStillstandvon Produktionsbetrie-benim Werk,dieaufeinezuverlässigeAbgasentsorgungangewiesensind.GeradewennzuWartungszweckenein Ofen(undhier besondersderdurchsatzstarke Ofen3) abgeschaltetist, wird die Wahrscheinlichkeit einersolchenKettenreaktiongroß.Die vom TÜV vorge-gebenenGrenzwerte,die zueinerOfenabschaltungführen,sind:

DerOfeninnendruckdarfnurfür einigeSekundendenNormaldruckum1 mbarüber-steigen.Die Verbrennungläuft in allenÖfenim leichtenUnterdruck(ca. ; mbarunterNormaldruck)ab,umeinZurückschlagenderFlammein dieBrennerzuverhindern.

138

Page 147: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.1. Die AnlagezurRückstandsverbrennung

Die Sauerstoffkonzentrationdarf nur für einigeSekunden4 Volumenprozentunter-schreiten.Diesverhindertdie Bildung einerexplosionsfähigenGasmischungdurchunvollständigeVerbrennung.

Derin einenOfeneingesaugteLuftstrommußeinenWertvon1700 " # %+' überschrei-ten.Diessoll ebenfallsdieEntstehungeinerexplosionsfähigenGasmischungverhin-dern.

Die Temperaturin derNachbrennkammereinesOfensmußstetseinenWertvon9008 9 überschreiten.EinehoheTemperaturist notwendig,um organischeKohlenstoffeim ausreichendenMaßezuzerstören.

7.1.3. Prozeßleitsystem der Rückstandsverbrenn ung

Auf die meistenSensorenundAktoren der AnlagekannüberdasProzeßleitsystemCon-tronic P der Fa. Hartmann& Braun zugegriffen werden.Ein PLS wird zur Steuerung,RegelungundVisualisierungvon verfahrenstechnischenProzessenverwendet.SolcheSy-stemesind meistals sehrzuverlässigeSpezialcomputer4 ausgeführt,die mit einemEcht-zeitbetriebssystemausgestattetsind.Damit wird einedefinierteReaktionszeitaufwichtigeEreignissegarantiert.Ein PLS liest zyklisch (beim Contronic P alle 20 ms) MeßdatenderverschiedenenSensorenein,verrechnetdieseundgibt anschließendStellgrößenandieAktorenaus.Die KonfigurationdieserSysteme(wie auchdesContronic P ) erfolgt durchVerknüpfenvordefinierterFunktionsblöcke mit denEingabe-und Ausgabekanälen.EineProgrammierungvon selbstdefiniertenFunktionenist dagegenerstbei SystemenjüngsterBauartmöglich.Nebender Visualisierungaller relevantenMeßdaten,hat dasPLS in derRV die folgendenregelungstechnischenAufgaben:

Regelungder Stellventile auf eine gewünschteStellgröße.Ein Stellventil ist imwesentlichenauseinemVentil, einemElektromotorundeinemWinkelabnehmerauf-gebaut.Daherkanndie EinstellungeinerbestimmtenVentilöffnungmit einemein-fachenRegelkreisvorgenommenwerden.Im folgendenwerdendieseRegelkreisejedochstetsvernachlässigt.Wennvon einerbestimmtenVentilstellgrößedie Redeist, wird angenommen,daßdasPLSdieseStellgrößeauchkorrekteinregelt.

Regelungder Flüssigkeitsventile auf einen vorgegebenenMassenstrom. Obenwurdeerläutert,daßjedeFlüssigkeitszuleitungmit einerMassenstrommessungaus-gestattetist. Die im PLSimplementiertenPID-Regler zur EinstellungvorgegebenerMassenströmesindaberausverschiedenenGründen(siehenächsterAbschnitt)nursehrbedingtbrauchbar.

4Auf GrundderLeistungsfähigkeit der neuestenComputergenerationwird inzwischeneineReihemoder-nerProzeßleitsystemeangeboten,die auf workstationsberuhen(z.B. SimaticPCS7 von SiemensoderDeltaV vonFisher-Rosemount).

139

Page 148: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

PhysikalischerOfenzustand<>=?A@ 8�B Feuerraumtemperatur< =C4D 8 B Nachbrennkammertemperatur< =EGF 8 B AusmauerungstemperaturH =Vol% SauerstoffkonzentrationI =mbar Ofeninnendruck

Zustand der AbgasleitungenJ�K mbar AbgasdruckL K M #�N0O AbgasvolumenstromP =K % StellungdesAbgasventilsQ =K 0/1 ZustanddesSS-Ventils

Zustand der FlüssigkeitsleitungenR =K kg/h MassenstromderFlüssigkeitS =K % StellungdesFlüssigkeitsventilsT =K 0/1 ZustanddesSS-Ventils

FührungsgrößenU&V WYX J K mbar AbgasdruckU&V WYX R =K kg/h MassenstromderFlüssigkeit

StellgrößenZ[\X]X P =K % StellungdesAbgasventilsZ[\X]X S =K % StellungdesFlüssigkeitsventils

Tabelle7.1.: Die für die Beschreibung der Öfen wichtigsten Größen. Der hochgestellteIndex ^`_badc\efc\g kennzeichnethierbeiden jeweiligen Ofen.Generellgilt für alle folgendenAusdrücke,daßeingriechischerIndex dieÖfenindiziert.DertiefergestellteIndex h kennzeich-netdasentsprechendeVentil. Bei denAbgasenist hi_jalk�k�knmfc\opk�k�k:a*g , bei denFlüssigkeitenh�_qalk�k�ksr für Ofen 1 und h�_talk�k�ko für Ofen 2. Um die Ventile derAbgaseundderFlüs-sigkeiteneinfachunterscheidenzu können,werdendie ersterenmit Kleinbuchstabenunddieletzterenmit Großbuchstabengekennzeichnet.Ein SS-Ventil im Zustand0 ist geschlossenundim Zustand1 geöffnet.

Regelungder Abgasdrücke auf einen konstantenDruck. Um einesder Abgaseauf die drei Öfen aufzuteilen,wird ein sog.split-range-Regler verwendet[Föl92].Dabeiberechnetzunächstein PID-Regler ausdemaktuellenAbgasdruckund demSolldruckeine Stellgrößezwischen0% und300%. DieseStellgrößewird anschlie-ßendin einerfest vorgegebenenReihenfolgean die drei Ventileweitergegeben.Sowird bei einerReihenfolge2-3-1 zunächstnur dasAbgasventil von Ofen 2 geöff-net. Wenndie AusgabedesReglers100%überschreitet,wird dasAbgasventil desdrittenOfensgeöffnetundab200%sindalle ÖfenanderVerbrennungdesAbgasesbeteiligt.

Die obenskizzierteRegelungdurchdasPLSnimmt auf etwa 50 VentilstellungenEinfluß,wobeideraktuelleZustandderdrei Öfendurchca.150Größenbeschriebenwird. Tabelle7.1faßtdieseGrößenin Gruppenzusammenundgibt eineÜbersichtüberdieverwendetenFormelzeichenundEinheiten.

7.1.4. Probleme bei der Regelung derRückstandsverbrenn ung

Wie obenschonaneinigenStellenangedeutetwurde,führt derAufbauderRV zu einigenRegelungsproblemen,die nungenauerdiskutiertwerdensollen.Dabeiwird im folgendenstetszwischenderRegelungderFlüssigkeitenundderAbgaseunterschieden.

140

Page 149: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.1. Die AnlagezurRückstandsverbrennung

Flüssigkeiten

DadiechemischeZusammensetzungderangeliefertenFlüssigkeitennureingeschränktbe-kanntist, kannihreVerbrennungsenthalpienurgrobodergarnichtgeschätztwerden.Aller-dingslassendie verschiedenenFlüssigkeitsbrennstreckeneinengewissenRückschlußaufdieBrennbarkeit zu.SowerdenüberdieLeitungenLOESM undANFAHR meistFlüssigkei-tenmit hohemBrennwertverfeuert.EineersteAbschätzungüberdie EigenschafteneinerFlüssigkeit erhaltendie Anlagenfahrerdadurch,daßsie beim erstenZufeuernvermittelsderVeränderungderTemperaturundSauerstoffkonzentrationdie ReaktiondesOfensbe-obachten.Entsprechenderhöhenoderverringernsie die Zufeuerungvon Stützbrennstoff.DieseEinstellungmußaberimmerwiederüberprüftwerden,dasichdieZusammensetzungeinerFlüssigkeit langsam(d.h. innerhalbeinigerStunden)auf Grundvon Dichtegradien-tenbildungenin denTanksbzw. Tankwagenändernkann.

Abbildung 7.3 illustriert an einemfünfstündigenAusschnittausden archivierten Datendie Dosierungfür einetypischeFlüssigkeit. Aus diesemBeispielwird klar deutlich,wieunberechenbarsich ein Flüssigkeitsventil verhaltenkannund wie starkein Massenstromtrotz konstanterVentilstellungvariierenkann.

EinigeFlüssigkeiten(besondersdie LeitungenCADMA undB202) sindnurschwerdosier-bar. Die GründedafürsindeinehoheZähflüssigkeit, schnellvariierendeKonsistenzdurchKlümpchen-BildungundmöglicherweiseAblagerungvon Feststoffen in denVentilen.AlsFolgesinddie KennlinienderVentilestarknichtlinear. Teilweiseist sogarein rapiderAn-stieg desDurchflussesbei nur minimalerVentilverstellungzu beobachten.VermutlichistdiesesVerhaltendarin begründet,daßsich bei einemhohenDurchflußAblagerungenimVentil ablösen.Allerdings ist aberauchdie Massenstrommessungzeitweiseäußerstun-zuverlässig,sodaßhäufignur durcheineeingehendeAnalysedie Ursachenvon Schwan-kungendingfestgemachtwerdenkönnen.AuchdieobenschonangesprocheneSchichtungin den Tankshat einenEinfluß auf die zeitliche Entwicklung desDurchflussesund derOfendynamik.EineweitereSchwierigkeit stelltdiegelegentlichemanuelleVerstellungderHandventiledurchdie Anlagenfahrerdar. Da die StellungenderHandventilenichtgemes-senwerden,kanndaherhäufigausdenim PLSvorliegendenDatenkeinekorrekteAussageüberdie effektiveVentilstellungeinerZuleitunggemachtwerden.

Auf GrundderschwierigenDosierbarkeit wird dieim PLSvorgeseheneRegelungderFlüs-sigkeitennur bei denbeidenLeitungenLOESM undANFAHR häufigerangewandt.Bei denrestlichenLeitungenbestehtdasüblicheVorgehender Anlagenfahrerdarin, die Flüssig-keitsventilenachAnschlußeinesTanksoderTankwagensaufeinenmittlerenMassenstrom(ca.200kg/h)einzustellen.DieseVentilstellungwird dannmöglichstnichtmehrverändert,bis der Tank nachvielen Stundenentleertist. Durch diesesVorgehenwird die möglicheKapazitäteinesOfensbewußt nicht ausgenutzt,um sich durch eine relativ hoheSauer-stoffkonzentration(7-9 Vol%) genügendSpielraumfür Belastungsspitzen(z.B. plötzliche,unvorhergeseheneZufuhr gutbrennbarerAbgase)zuerhalten.

141

Page 150: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

Abbildung 7.3.: TypischesVerhalten einer Flüssigkeitsstrecke. DasBeispielzeigt die Lei-tungB202 von Ofen 1 am 27. April 1997.Die manuellenVentilverstellungeninnerhalbdererstenfünfzig Minuten zeigen– bis auf einenkurzenund starken Schwall – zunächstkaumeineWirkung auf denDurchfluß.ErstnachdemdasVentil bis auf 12 % zu- und dannwiederaufgedrehtwurde(bei 55 min), kommt ein einigermaßenkonstanterDurchflußzustande,deraberinnerhalbdernächstenStundedeutlichabfällt und erstdurcheineweitereVentilverstel-lung (bei115min) wiedererhöhtwerdenkann.DiesesVerhaltenwiederholtsichanschließendwieder. Deutlichist derEinflußdesDurchflussesauf die Sauerstoffkonzentration zu erkennen.InsbesonderederersteSchwall (bei 35 min) führt zu einemstarken Abfall derSauerstoffkon-zentrationund damit fastzu einemAusfall desOfens.Die Temperaturist zur Sauerstoffkon-zentrationantikorreliert.

142

Page 151: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.1. Die AnlagezurRückstandsverbrennung

Abgase

Im Gegensatzzu den Flüssigkeiten verursachtdie Verbrennungder Abgaseeine starkeKopplungzwischendenÖfen,dahoheAbgasvolumenströmenichtnur in einemOfenver-branntwerdenkönnen.VielmehrmüssenmehrereÖfen zusammenarbeiten,um denvondenTeilbetriebengefordertenkonstantenAbgasunterdruckan denLeitungsendenin derRV einzuhalten.DieseKopplungkannbei sehrhohenBelastungenauchzumAusfall dergesamtenAnlageführen.Eine für denlaufendenBetriebüblicheSituationist daher, daßdurchdie split-range-Regelungplötzlich Abgasan einenOfen geleitetwird, um Druck-spitzenin denLeitungenzuvermeiden.

Die meistenAbgasproduzentenbringenkeinenkonstantenVolumenstromin dieLeitungenein,sodaßVolumenschwankungenzuständigenstochastischenStörungenderOfenzustän-de führen.Da kein elektronischerInformationsaustauschzwischenProduzentenund demPLSderRV existiert, sindauchkeinePrognosenüberzukünftigeBelastungsspitzenmög-lich. Tritt ein hoherVolumenstromauf,mußdahervon denAnlagenfahrerninnerhalbvoneinigenMinuten eineFlüssigkeit manuellangedrosseltwerden,um einenkritischenZu-standzu vermeiden.Um die stoßartigenBelastungen,die durchdie split-range-Regelungauf einenOfen einwirken, etwas abzumildern,wird von den Anlagenfahrernhäufig dieAbgaszufuhrdurchVerwendungder Handventile reduziert.Da – wie bei denFlüssigkei-ten – die Stellungender Handventile abernicht aufgezeichnetwerden,kanndadurchdienachträglicheAnalyseder Ventilstellungenund Abgasdruckverläufesehrerschwertwer-den.Hauptursachefür die Notwendigkeit einerschnellenReaktiondurchdie Anlagenfah-rer sinddie PID-Regler desPLS,die ständigversuchendenSolldruck

U&V WuX v K in denAbgas-leitungenexakt einzuhalten.Hier ist kritisch anzumerken,daßdieseGenauigkeit von denAbgasproduzentenim Grundegarnichtgefordertwird.

Abbildung7.4 zeigtaneinemca.einstündigenBeispieldie Arbeitsweisedersplit-range-Regelung.DieseRegelungerreichtdurch ein massivesEingreifen,daßder Abgasdrucktrotz dessehrschnellenVolumenstromanstiegsnur für kurzeZeit vom Sollwert abweicht.Ofen 2 reagiertauf dieseMehrbelastungdurcheinenAbfall der Sauerstoffkonzentration.DagegenzeigtdieSauerstoffkonzentrationin Ofen3 keineReaktionaufdasvoll geöffneteAbgasventil. Möglicherweiseist beidiesemOfendasentsprechendeHandventil angedros-seltwordenoderdasStellventil hatbeieinerÖffnungvonca.35%schonseinenmaximalenVolumenstromerreicht.

AuchdasplötzlicheAusbleibeneinesgutbrennendenAbgasesführt zuProblemen,dadanndie üblicheFeuerraumtemperaturvon etwa 1100 8 9 innerhalbeinigerMinuten unterhalbdernotwendigen900 8 9 fallenkann.Daherwird stetsmit einer“guten” Flüssigkeit zuge-feuertoder– wenndiesnichtmöglichist – einzusätzlichesStützgasverbrannt.EinestarkeStützflammeberuhigtsodie SchwankungenderTemperaturundderSauerstoffkonzentra-tion.

JedeAbgasleitungist – im GegensatzzudenFlüssigkeiten– eindeutigeinemProduzentenzugeordnet.DahersindbestimmteErfahrungswerteüberdie Brennbarkeit derAbgasebei

143

Page 152: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

Ofen 3

Ofen 1

Ofen 1

Ofen 2

Ofen 2Ofen 3

Abbildung7.4.:TypischesVerhalten der split-range -Regelung. DargestelltsindMessungenvom25.April 1997,diedieGrößenvonAbgas8 betreffen.DerVolumenstromsteigtinnerhalbeinerMinutesehrstarkanunderreichtmit 1020 M #*N0O sogardieGrenzedesvomPLSdarstell-barenMeßbereichs.Um dieGrundlastvonca.350 M #�N0O zuverbrennen,ist dasVentil vonOfen1 zu 100% unddasVentil von Ofen3 zu etwa 35 % geöffnet. Auf GrunddesDruckanstiegsdurchdenerhöhtenVolumenstromwird durchdie RegelungdasVentil von Ofen3 voll aufge-drehtund dasVentil von Ofen 2 auf etwa 45 % geöffnet. Durch diesesdrastischeEingreifendesReglersweichtderAbgasdrucknur kurz vom gefordertenSollwert von 60 mbarab. DiesehoheRegelgütewird abermit einemAbfall derSauerstoffkonzentration von Ofen2 auf fast5Vol% erkauft.Die Sauerstoffkonzentration desdeutlichgrößerenOfen 3 scheintaberauf dieMehrbelastungnichtzu reagieren.

144

Page 153: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.2. Entwurf einerneuenRegelung

denAnlagenfahrernvorhanden.Allerdings kanngelegentlichdie Situationauftreten,daßvon denProduzentendie Leitungenmit Stickstoff gespültwerden.In diesemFall scheintfälschlicherweiseauf GrunddeshohenVolumenstromseinehoheBelastungvorzuliegen,die sichabernicht im VerlaufvonTemperaturundSauerstoffkonzentrationwiderspiegelt.

Nebender AufgabeeinenkonstantenDruck einzuhalten,bestehtfür einigeAbgasleitun-gen(Abgas1,3,5,6und11) die Auflage,einenbestimmtenUnterdruckauf keinenFall zuunterschreiten.Dadie split-range-RegelungnichtdenZustandderSS-Ventileberücksich-tigt, kannesdurchausvorkommen,daßein Stellventil bei einemgeschlossenemSS-Ventilzu 100%geöffnet ist. WennnundasSS-Ventil geöffnet wird, wird derUnterdruckin derentsprechendenAbgasleitungschlagartigweiterverringert.DiesesProblemtritt häufigauf,wennein OfennacheinemAusfall wiederhochgefahrenwird.

Bevor im nächstenAbschnittauf die neuartigeRegelungderRV eingegangenwird, sollennochmalsdie wichtigstenProblemezusammengefaßtwerden:

w unbekannteBrennwertederFlüssigkeitenw schlechteDosierbarkeit derFlüssigkeitendurchnichtlineareVentilkennlinienw langsamezeitlicheVariationder EigenschafteneinerFlüssigkeit durchSchichtbil-dungin denTanksw Abnahmezwangfür die Abgasew KopplungzwischendenÖfendurchdie split-range-Regelungfür dieAbgasew BrennwerteinesAbgaseskannbeiderSpülungmit Stickstoff sehrstarkvariierenw Die ÖffnungeinesSS-VentilskannzueinemDruckabfall in derAbgasleitungführen

7.2. Entwurf einer neuen Regelung

7.2.1. Zielsetzung und Konzeption

Die wesentlicheZielsetzungder Wacker-ChemieGmbH zu Beginn der KooperationimFrühjahr1995war die ErhöhungdesStoffdurchsatzesdurchdie RV. DamalsbestandeindringenderHandlungsbedarf,dadie vorhandeneVerbrennungskapazitätvoll ausgeschöpftwerdenmußte,um die im Werk anfallendenAbfallstoffe verbrennenzu können.Der of-fensichtlichsteWeg denDurchsatzzu erhöhen,schienzunächstdie Reduktionder Ofen-ausfällezusein.Zu diesemZweckwareinSystemvorgesehen,dasaufkritischeMomentelauscht undim Falle einesdrohendenOfenausfalls eingreift.Schnellzeigtesichaber, daßfür einsinnvollesEingreifenin dieAnlageeinumfassendesWissenüberdieAnlagendyna-mik notwendigist.SomitverwandeltesichdasursprünglichgeplanteNotfallsystemimmer

145

Page 154: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

mehrzu einerRegelungfür denständigenBetrieb. DieseRegelunghataberaucheineRe-duktion der Ofenausfällezum Ziel. Sie versuchtdiesabernicht durchein EingreifeninletzterSekundezuerreichen,sonderndurchdie PräventiongefährlicherSituationen.

GrundlagedieserPräventionsstrategie ist eineandiemomentaneBelastungangepaßteBe-feuerungder Öfen. DiesesZiel wird sowohl für die Abgaseals auchfür die Flüssigkei-ten verfolgt. Bei denAbgasenist hierzueinedynamischeAufteilung der Abgaseauf dieÖfen notwendig,wobei – analogzur schonim PLS installiertensplit-range-Regelung–bestimmtePräferenzenvorgegebenwerdenkönnen.Für die Flüssigkeitenwird ein Reg-ler eingesetzt,derdie KennlinienabschätztunddengewünschtenMassenstromnachdie-serSchätzungeinstellt.Der Massenstromwird ausderaktuellenBelastungdesjeweiligenOfensberechnet.NebendiesenHauptregelkreisenarbeiteteineReihevon Notfallreglern,dienur in extremenSituationenin Aktion treten.

Im Gegensatzzu denverfahrenstechnischenZielen der Wacker-ChemieGmbH lagenfürmichzuBeginnderKooperationandereMotivevor: (i) ZunächstbotdieKooperationeineguteGelegenheit,einengroßenchemischenProduktionsbetriebausder Nähekennenzu-lernen.(ii) InnerhalbderKooperationwar esmöglich,RegelungsverfahrenunterBerück-sichtigungder technischenRealisierbarkeit zu entwicklen.(iii) Die sehrgroßenMengenarchivierter Datenbotenviele Möglichkeitenzur Datenanalyseund zur Erprobung neuerVerfahren.LetztendlichdientedieAnlagederRV dazu,dieRealisierbarkeit vonKonzeptenausder Neuroinformatikund im BesonderendesSystemsder lokalenExpertenin einemtechnischanspruchsvollen Umfeld zu überprüfen.Die im folgendenbeschriebenenArbei-ten für eineneueRegelungder RV habendahervor allem denCharaktereinerMachbar-keitsstudie,dienichtdenAnspruchhatproduktreife Lösungenanzubieten.

Die Komplexität derAnlageunddie Vielschichtigkeit derRegelungsaufgabenläßtahnen,daßeineLösungdesvorliegendenRegelungsproblemsausschließlichmit datenbasiertenNeuro-Reglern,wie sie in Abschnitt5.4 beschriebenwurden,nicht praktikabelist. Viel-mehrist eineausgewogeneMischungvon altenund neuenVerfahrenzweckmäßigerunderfolgversprechender, um zu einertatsächlichenVerbesserungzu kommen.Da dasinzwi-schenimplementierteGesamtsystemzumeinensehrumfangreichist undzumandereninvielenBereichenauchmit konventionellenMethodenarbeitet,soll hier keineumfassendeDarstellunggegebenwerden.Für einevollständigeDokumentationseidaherauf dasKon-figurationshandbuchverwiesen[Alb97b]. DerSchwerpunktderfolgendenAbschnittewirdeherauf der Konzeptionder Regelung,der Beschreibung der neuentwickeltensoftwarePCSundderRealisierungeinesReglersfür die Flüssigkeitenliegen.

Die zentraleIdee,diehinterdemKonzeptdesneuenReglerssteht,ist die Verwendungdesin Kapitel 4 entwickeltenSystemslokalerExperten.Da die Zahl der für die RegelungderRV notwendigenExpertenbei etwa 20 liegt, wurdendiesenochmalsin sechsBlöcke ein-geteilt,umdenÜberblicküberdasGesamtsystemzuerleichtern.Abbildung7.5zeigtdieseBlöcke unddie dazugehörigenExperten.Die Aufteilung in Blöcke undExpertenspiegeltdie starkmodulareStrukturdesGesamtsystemswieder. DiesehoheModularitäthat zumeinenbei derEntwicklungvon Regelungsstrategienundzumanderenbei derErweiterung

146

Page 155: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.2. Entwurf einerneuenRegelung

PREFILTPREABG

READ

MIM

WRITE

FLK

MIMREC

MIMWATCH

ABGCHIEF

ABGVER

ABGPID ABGPMIN

ABGOPMAX ABGO2MIN

ABGEIN

MIMON

READ

WRITE

FLKBED FLKCRASH FLKEIN

FLKECOFLKRBF

FLKCHIEF

PRESTATE

Abbildung7.5.:Blockstruktur desmit PCSimplementierten Regelungssystems.Die sechsBlöcke (hellgraueGebiete)gliedernsich jeweils in einegewisseAnzahlvon Experten(abge-rundeteRechtecke). Die dunkelgrauenBerreichedeutenan,daßzwischendenangrenzendenBlöckenDatenausgetauschtwerden.

desSystemsum neueFunktionalitätengroßeVorteile.Im folgendenwerdendie AufgabenderverschiedenenBlöckeundExpertenkurzcharakterisiert:

w Block READ und WRITE: Einlesenvon Datenvom PLS und Schreibenvon Stell-größenundbinärenSignalenandasPLS.DiesebeidenBlöcke bestehenjeweils auseinemExperten,derdie Kommunikationmit demPLSabwickelt.w Block MIM: VerschiedeneVerwaltungsaufgabeninnerhalbdesRegelungssystems:

– ExperteMIMON: Mimik zumEinschaltenderRegelung.Nur wenndasgesamteSystemdurcheinenBedieneramPLSfreigeschaltetist, könnenStellgrößenandieAnlageweitergebenwerden.

– ExperteMIMWATCH: ÜberprüfungderkorrektenKopplungzumPLS.

– ExperteMIMREC: Archivierungvon Daten,um die Möglichkeit zur späterenAnalysezuhaben.w Block PRE: BearbeitungvonMeßgrößen,für die mehrereMessungenvorliegen.Da

die Temperatur- undSauerstoffmessungenausGründenderRedundanzjeweilsdop-pelt vorliegen,ist eswünschenswert,jeweils nur einenMeßwertauszuwählen,mitdemdie nachgeschaltetenExpertenarbeiten.Die Auswahl dermomentanzuverläs-sigstenMessungberuhtauf einerperiodischenAnalysederKreuzkorrelationsfunk-tioneneinerMessungmit allenanderenMessungen.WenneineerwarteteKorrelati-on, z.B. die starke AntikorrelationzwischenFeuerraumtemperaturund Sauerstoff-konzentration,nicht vorliegt, kann darausauf eine defekteMessunggeschlossen

147

Page 156: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

werden.Eine Beschreibung diesesvon A. Wiesmüllerentwickelten Verfahrensistin [Alb97b] nachzulesen.w Block FLK: RegelungderFlüssigkeiten,LuftklappenunddesStützbrennstoffs:

– ExperteFLKEIN: Einschaltmimikfür die RegelungderFlüssigkeiten.

– ExperteFLKBED,FLKRBF,FLKCRASH,FLKECO: VerschiedeneExperten,diezurFlüssigkeitsregelungbeitragen.

– ExperteFLKCHIEF: VerknüpfungderdiversenFlüssigkeits-Experten.w Block ABG: RegelungderAbgasdrückeaufdie Solldrücke x:y zu{ |~} :– ExperteABGEIN: Einschaltmimikfür die Abgasregelung.

– ExpertenABGPID, ABGVER, ABGPMIN, ABGOPMAX und ABGO2MIN: Ver-schiedeneExperten,die zurAbgasregelungbeitragen.

– ExperteABGCHIEF: VerknüpfungderdiversenAbgas-Experten.

Bevor die beidengroßenBlöckeABG undFLK genauerbeschriebenwerden,soll zunächstauf die Möglichkeiten und die Realisierungdesneu entwickelten RegelungsprogrammsPCSeingegangenwerden.

7.2.2. Programm PCS zur Regelung industrieller Prozesse

PCSist ein software-Systemzur Realisierungkomplexer Regelungs-undSteuerungsauf-gabenvon großentechnischenAnlagenauf konventionellenMicrocomputern[Alb97a].Viele Anlagender chemischenIndustriesind mit Prozeßleitsystemenzur Steuerung,Re-gelungundVisualisierungderProduktionsprozesseausgestattet.SolcheProzeßleitsystemesind in aller Regel Spezialcomputer, die gleichzeitigsehrviele Aufgabenausführen,wiez.B.AbfragevonSchnittstellen,DarstellungvondiversenGrößenaufdemBildschirm,In-teraktionmit dem Benutzer, Anwendungvon Regelungsalgorithmenund Steuerlogiken.Wegender sich darausergebendenvielfältigen Anforderungensind solcheSystemeabermeistnur bedingtgeeignet,neuartigeAlgorithmenoderKonzeptezu implementierenundzu erproben.DieseSituationliegt auchmit demPLSContronic P bei derRückstandsver-brennungvor.

Um die geplantenRegelungsalgorithmenumsetzenzukönnen,wurdedasProcessControlSystem(PCS)alsErweiterungdesbestehendenPLSentwickelt. DasPLSist dabeiweiter-hin für elementareFunktionenwie Ansteuerungund Abfragevon Aktoren und Sensorenzuständig.Esübernimmtnunaberzusätzlichdie AufgabedenDatentransferzumPCSzubedienen.

Die wesentlichenKriterien,diebei derEntwicklungdesPCSein Rolle spielten,sind:

148

Page 157: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.2. Entwurf einerneuenRegelung

seriell/VT100

PLS/Anlage

Experte BExperte A

socket

DateiDateiDatei Datei Datei Datei Datei Datei

zum PLS

Speicherbereich mit Kanälen

pcsd

Mod

ul

Mod

ul

Mod

ul

Mod

ul

Mod

ul

Mod

ul

Mod

ul

Mod

ul

Schnittstelle

pct

graphischeOberfläche

hbpcd

pc_read_cp

pc_write_cp

Abbildung7.6.:Aufbau desPCS.DasGesamtsystemgliedertsichin Kommunikationmit demPLS(hbpcd), Datenverarbeitung(pcsd) undgraphischerOberflächezur VisualisierungundInteraktion(pct).

w Modularität : DasSystemgliedertsichin vieleunabhängigeundselbständigeModu-le . Diesewerdenzentralgestartetundführenanschließenddie ihnenzugewiesenenOperationenaus.w Erweiterbark eit: Bei derDefinition derSchnittstellederEinzelmodulezumrestli-chenPCSwurdeauf größtmöglicheprogrammtechnischeEinfachheitgeachtet.Essind nur wenigeProgrammzeilenerforderlich,um ein Modul in dasSystemeinzu-gliedern.Entsprechendist esleicht möglich,dasSystemum selbstentwickelteMo-dulezuerweitern.

Abbildung7.6zeigtdiewichtigstenElementedesPCS.Die drei im folgendenbeschriebe-nenProgrammepcsd, hbpcd undpct laufenvor Ort auf einerworkstationDEC AXP255mit 233MHz Taktfrequenzund96MB Hauptspeicher.

pcsd

Die zentraleStellungim PCSnimmt dasProgrammpcsd ein. Diesesstartetnacheinan-derdieModule5, dieanschließendjeweilsauseigenenDateienihrespezielleKonfigurationeinlesen.Eskönnenalsodurchausviele identischeModulegleichzeitigim Systemarbei-ten,dieaber– durchihreKonfigurationspezifiziert– verschiedeneAufgabenhaben.Wenndie Initialisierungaller Moduleerfolgreichwar, kommtpcsd in die Arbeitsphase.In die-serwerdendie Moduleperiodischundin einervorgegebenenPhasenbeziehungvonpcsd

5 JedesModul arbeitetals sog.thread [Her96]. Bei pcsd handeltessich daherum ein multi-threading-Programm.Bei dieserTechnikführt einProgrammnichtnureineBefehlssequenz,sondernvieleSequen-zennebeneinanderaus.

149

Page 158: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

aufgefordert,die ihnenzugeordnetenOperationenauszuführen.Somitkannfür die einge-lesenenDatenein beliebigerAblauf von Operationenkonfiguriertwerden.Die Periodender verschiedenenModule müssenhierbeinicht übereinstimmen,so daßauchasynchro-neOperationen,wie z.B. ArchivierungsaufgabenoderAdaptionsvorgänge,vorgenommenwerdenkönnen.

Die Kommunikationzwischenden einzelnenModulen erfolgt über sog.Kanäle. Diesewerdenwährendder Startphasevon pcsd angelegt und sind für alle Module beschreib-bareundlesbareSpeicherbereiche.ÜbersolcheKanälewird derAustauschderMeß-undStellgrößender Anlageund der intern berechnetenGrößenabgewickelt. An jedenKanalangeheftetsind verschiedeneInformationen,wie z.B. der Zeitpunkt des letztenSchrei-bens,GrößeneinheitundKommentare.Zusätzlichist esmöglich,die InhalteeinesKanalsübereinenbestimmtenZeitbereichzupuffern.In gewisserWeisestellt dasPCSsomiteineEchtzeit-Datenbankdar, welcheim starkenMaßefähigist, verschiedeneeingeleseneDatenzuverrechnenundnachaußenweiterzugeben.

hbpcd

Für die Kommunikationmit demPLSsinddie beidenpcsd-Modulepc_read_cp undpc_write_cp zuständig,die socket-Verbindungen6 zum Programmhbpcd aufbauen.hbpcd ist wiederumübereineserielleSchnittstellemit demPLSverbunden.Da dasPLSnur übereineVT100-Schnittstellemit einerBandbreitevon 9600Bit/s verfügt,stellt derDatentransferzwischenPLSundPCSdenFlaschenhalsin Bezugauf die erreichbareAnt-wortzeitdesPCSdar. Zusammenmit demuneffektivenÜbertragungsprotokoll ConLinkV ,überwelchesmit demPLSkommuniziertwerdenmuß,führt diesdazu,daßfür dasLesenundScheibenvon Datenca.2.0s benötigtwerden.Werden0.5s für die BerechnungeinesRegelschrittsund 0.5 s als Reserve eingerechnet,dannergibt sich eineAbtastperiode���von3.0s.

pct

Die KontrolleundManipulationdesPCSerfolgt überdie graphischeOberflächeProcessControl Tool (pct), die weitestgehendunabhängigvon pcsd läuft, um die Ausfallsi-cherheitdereigentlichenRegelungzuerhöhen.Diesesinteraktiveundfrei konfigurierbareProgrammaktualisiertonline diealphanumerischeDarstellungderKanalinhalte.Danebenerlaubtes,manuellKanälezu verändern,Informationenzu Kanälenabzurufenund denZeitverlaufvonKanälengraphischdarzustellen.

6Ein socket ist eineunterUnix standardisierteMethode,DatenzwischenProgrammenauszutauschen,dienicht zwingendauf einemRechnerlaufenmüssen[Her96].

150

Page 159: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.2. Entwurf einerneuenRegelung

�������� ���Y��� � � ������ ��FLKBED��A� �} � �����*� �} � ���Y� � �� ��FLKRBF� � � � � � � � � � �Y�

����4� � ���Y��� � � ���� �} � ���Y�*� �} � ������ ��FLKCRASH� � � ��

����4� � ������ ��FLKECO���� �

� �} � ������ ��FLKEIN            ¡�� ��

FLKCHIEF�¢£ {]{ � �} � ���Abbildung7.7.:Die Experten desBlocksFLK.

7.2.3. Exper ten zur Regelung der Flüssigkeitszufuhr

Bei der EntwicklungdesBlocksFLK standdie ImplementierungeinerbedarfsgerechtenRegelungfür die Flüssigkeitenim Vordergrund.Der Aufbauderbeidendafürverantwort-lichenExpertenFLKBED undFLKVER wird im folgendenAbschnittnochausführlichdar-gestellt.Da die verbleibendenExperten(sieheAbbildung 7.7) jeweils speziellereZieleverfolgen,soll derenRealisierunghier nurkursorischskizziertwerden:

¤ FLKCRASH: DieserExperteversuchtdurchkurzfristigeEingriffe, die mit einerho-henKompetenzerfolgen,denAusfall einesOfenszu vermeiden.DabeiwerdendreibedrohlicheSituationenberücksichtigt:(i) Bei niedriger, bzw. sehrniedrigerundfal-lenderTemperaturwird dasStützgasventil geöffnet. (ii) Wennauf GrundeinessehrgroßenGradienten¥�¦§�¨ª© ¥¬«��¨ einschlagartigerAnstieg desMassenstromsdetektiertwird, dannwird dasentsprechendeFlüssigkeitsventil gedrosselt.(iii) Bei einemstar-kenAbfall derSauerstoffkonzentrationwerdenalle Flüssigkeitsventilegeschlossen.Die obigenVorschriftensinddurcheinenSatzvon Fuzzy-Regelnformuliert.

¤ FLKECO: DieserExpertehatzumZiel, denVerbrauchanStützbrennstoff zureduzie-ren.Dieswird dadurcherreicht,daßdasentsprechendeVentil sehrlangsamzugedrehtwird, wennein günstigerOfenzustandvorliegt.

¤ FLKEIN: Wenn die Flüssigkeitsregelungnicht vom Bedienpersonalfreigeschaltetist, gibt dieserExpertedie tatsächlichin der AnlagevorliegendenVentilstellungenan FLKCHIEF weiter. Wenn die PCS-Regelungvom Bedienpersonaleingeschal-tet wird, dannnimmt die lokale KompetenzdiesesExpertenlangsamab. Da dieübergeordneteKompetenzvon FLKEIN sehrgroß ist, wird dahernachEinschal-ten der RegelunglangsamzwischendenVorgabendesPLS und der RegelungdesPCSumgeschaltet.Die Freigabeder Flüssigkeitsregelungbeziehtsich immer auf

151

Page 160: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

ST

RE

CK

E

FLKRBF

mGRBF-System

Abfrageder

Kennlinie

FLKBED

Bedarf ­®°¯°±°²°³µ´�¶ �¸· ¹�º Massen-strom»¼ �½· ¹�º ­

¼ � · ¹�º ­¾ ���� · ¹�º ­

« �¨ · ¹�º ­­¦§�¨ · ¹�º ­¿¦ �¨ÁÀ « �¨ÃÂ�Ä�Å

Æ

Ç&È ÉuÊ®°¯°±°²°³µ´ ¦§�¨ · ¹�º

ÆÌËsÍ Ê]Ê®°¯°±°Î°²µ® «��¨ · ¹�ºÏ ËsÍ Ê]Ê «Ã�¨ · ¹�ºAbbildung 7.8.: Struktur der Regelung für die Flüssigkeiten. Die neuen Ventilstel-lungen ËÍ Ê]Ê®°¯°±°Îµ²°®ÑÐ ¨�ÒªÓ Ô�Õ werden in einem mehrstufigenProzeßaus dem aktuellen Ofenzustand( Ö ��4� Ó ÔYÕ�×\Ø � Ó Ô�Õ�×�ÙØ � Ó ÔYÕ ), demDurchfluß Ú �¨ Ó ÔYÕ und der geschätztenKennlinie ÛÚ �¨>Ü Ð �¨ ÝsÞ�ß ge-wonnen.

ein bestimmtesVentil. ÜblicherweisewurdenureineFlüssigkeit pro OfendurchdiePCS-Regelungkontrolliert.

¤ FLKCHIEF: Hier werdendie AusgabenundlokalenKompetenzendervorgeschal-tetenExpertennach(4.1) verknüpft.Die so resultierendenVentilstellungenwerdenüberdenExpertenWRITE andie Anlageweitergegeben.

Die obengenanntenExpertensindim wesentlichenfür spezielleAufgabenzuständig.Diekontinuierlicheund bedarfsgerechteDosierungeinerFlüssigkeit wird von zwei Expertenübernommen,dienun– alsBeispielfür denhybridenAufbauderGesamtregelung– detail-lierterbeschriebenwerden.

7.2.4. Zwei spezielle , bedarfsorientier te Exper ten

Abbildung 7.8 zeigt dasSchemadiesesRegelkreises,der sich in zwei großeTeile glie-dert.DieserRegler hat nicht – wie der schonim PLS implementierteRegler – zum Ziel,einenmanuellvorgegebenenMassenstromeinzuregeln, sondernermittelt zunächsteinenbedarfsgerechtenMassenstrom

Ç:È ÉuÊ®°¯°±µ²°³°´ ¦§�¨ · ¹�º ausdemOfenzustand.Anschließendwird eineVentilstellungËÍ Ê]Ê®°¯µ±°Î°²°® «��¨ · ¹�º auf GrundlagedesMassenstroms

Ç:È ÉuÊ®µ¯°±°²°³°´ ¦§�¨ · ¹�º undeinerSchätzung¿¦§�¨ À «��¨ Â�ÄáàªâGã4ä¸åªÅ mit einemmGRBF-Systembestimmt.

152

Page 161: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.2. Entwurf einerneuenRegelung

wenn À ¾ ���� · ¹�ºçæ ¾lèué>êë¾ ��4� · ¹�ºçæ ¾¸é ÅlìíÀ ¼ � · ¹�ºçæ ¼áî ê ¼ � · ¹�ºçæ ¼ è î Ådann ¶ �¬· ¹�ºðïjñ�òôó sonst ¶ �¸· ¹�ºðïõó4òöówenn À ¾ ���� · ¹�ºçæ ¾lèué>êë¾ ��4� · ¹�ºçæ ¾¸é Ålì ¼ �¸· ¹�ºçæ ¼�÷dann ¶ � · ¹�ºðïøó4òöù sonst ¶ � · ¹�ºðïõó4òöówenn

¾ ��4� · ¹�ºçæ ¾ ÷ ìúÀ ¼ �¸· ¹�ºçæ ¼áî ê ¼ �¬· ¹�ºçæ ¼ è î Ådann ¶ �¬· ¹�ºðïøó4òöù sonst ¶ �¸· ¹�ºðïõó4òöówenn À ¾ ���� · ¹�ºçæ ¾lè î êë¾ ��4� · ¹�ºçæ ¾ î Ålì ¼ � · ¹�ºçæ ¼ édann ¶ �¬· ¹�ºðïüûýó4òþù sonst ¶ �¸· ¹�ºðïõó4òöówenn À ¼ �½· ¹�ºçæ ¼ èué�ê ¼ �½· ¹�ºçæ ¼ é>ê ¼ �½· ¹�ºçæ ¼�÷ Ålì »¼ �¸· ¹�ºçæ »¼ è�ÿdann ¶ �¬· ¹�ºðïüû�ñ�òöó sonst ¶ �¸· ¹�ºðïõó4òöówenn

¼ �½· ¹�ºçæ ¼ èuédann ¶ �¬· ¹�ºðïüû�ñ�òöó sonst ¶ �¸· ¹�ºðïõó4òöówenn

¼ �½· ¹�ºçæ ¼�÷ ì »¼ �½· ¹�ºçæ »¼ ÿdann ¶ �¬· ¹�ºðïüûýó4òþù sonst ¶ �¸· ¹�ºðïõó4òöówenn

¼ � · ¹�ºçæ ¼ é ì »¼ � · ¹�ºçæ »¼ ÿdann ¶ � · ¹�ºðïüûýó4òþù sonst ¶ � · ¹�ºðïõó4òöówenn

¼ �½· ¹�ºçæ ¼ è î ìíÀ »¼ �½· ¹�ºçæ »¼ è�èªê »¼ �½· ¹�ºçæ »¼ è Ådann ¶ � · ¹�ºðïjñ�òôó sonst ¶ � · ¹�ºðïõó4òöówenn

¼ �½· ¹�ºçæ ¼áî ìúÀ »¼ �½· ¹�ºçæ »¼ è�èpê »¼ �½· ¹�ºçæ »¼ è Ådann ¶ � · ¹�ºðïøó4òöù sonst ¶ � · ¹�ºðïõó4òöówenn

¼ �½· ¹�ºçæ ¼�÷ ì »¼ �½· ¹�ºçæ »¼ è�èdann ¶ �¬· ¹�ºðïüûýó4òþù sonst ¶ �¸· ¹�ºðïõó4òöó

Tabelle7.2.:Fuzzy Regelnfür die BestimmungdesFlüssigkeitsbedarfs.

Bestimm ung der MassenströmeÇ:È ÉuÊ®°¯°±µ²°³°´ ¦ �¨ · ¹�º

Für die BestimmungeinesderMassenströmeÇ&È ÉuÊ®°¯°±°²°³µ´ ¦ �¨ · ¹�º wird vom zugeordnetenExperten

FLKBED zunächstein “Bedarf” ®°¯°±µ²°³°´Ñ¶ � · ¹�º bestimmt,der denmomentanenZustandeinesOfens � widerspiegelt.Der Bedarfist klein, wennderOfendurchzusätzlicheAbfallstoffein Gefahrgerätauszufallenundgroß,wennsichderOfen in einemZustandbefindet,derweitereVerbrennungskapazitätenerlaubt.EinezweckmäßigeBestimmungdesBedarfsistüberdieAufstellungvonFuzzy-Regelnmöglich,dasodiegewünschtenEigenschaftenein-fachund intuitiv formuliert werdenkönnen.In Zusammenarbeitmit denAnlagenfahrernwurdendaherFuzzy-Regelnfür einensituationsangepaßtenBedarf®°¯°±µ²°³°´Ñ¶ �¬· ¹�º formuliert.InTabelle7.2sinddieseRegelnzusammengefaßt.Abbildung7.9zeigtdiedafürnotwendigenmembership-Funktionen.Mit demdadurchdefiniertenFuzzy-Regelsatzwird ausderTem-peraturundderSauerstoffkonzentrationnachderSugeno-Regel(5.16) einBedarf®°¯°±°²°³µ´�¶ � · ¹�ºberechnet.

Um die ZufeuerungderFlüssigkeitennicht zu starkandie stochastischenSchwankungenderTemperaturundderSauerstoffkonzentrationzu koppeln,wird ®°¯°±°²°³µ´�¶ �¸· ¹�º nachAuswer-

153

Page 162: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

Abbildung7.9.:Die drei Gruppen von membership -Funktionen zur fuzzy BerechnungdesBedarfs ®°¯°±°²°³µ´�� � Ó Ô�Õ .

tungderFuzzy-Regelnmit einerZeitkonstantevon20 Sekundenzeitlich geglättet.

DerBedarf ®°¯°±°²°³µ´Ñ¶ �¸· ¹�º bietetnundieMöglichkeit einengeeignetenMassenstromÇ&È ÉuÊ®°¯°±°²°³µ´ ¦§�¨ · ¹�º

zu bestimmen.Dieserfolgt durcheinezumBedarfproportionaleAnpassungdesMassen-stromsin jedemRegelungsschrittdurchÇ&È ÉuÊ®°¯°±°²°³µ´ ¦ �¨ · ¹��õñ:ºbï Ç:È ÉuÊ®µ¯°±°²°³°´ ¦ �¨ · ¹�º���� À ®°¯°±µ²°³°´\¶ � · ¹�º Å ®°¯µ±°²°³°´\¶ � · ¹�º (7.1)� À ®°¯°±°²µ³°´�¶ � · ¹�º Å ï � òôó kg/h � ®µ¯°±°²°³°´\¶ �¸· ¹�º� ó� òôó kg/h � ®µ¯°±°²°³°´\¶ �¸· ¹�º�� ó ò (7.2)

Die Nichtlinearitätder Proportionalitätsgröße� À ®°¯°±°²µ³°´�¶ �¬· ¹�º Å führt dazu,daßder Massen-stromlangsamerhöhtwird, währendin kritischenSituationen( ®°¯°±°²µ³°´�¶ �¬· ¹�º�� ó ) die Flüs-sigkeitszufeuerungdreimalschnellerreduziertwird. Bei einemvollständiggeschlossenenVentil benötigtder Regler dahermindestens200 s, um einenMassenstromvon 200 kg/heinzustellen.DasSchließendiesesVentilsdauertdagegennur etwa70s.

Schätzung der Ventilkennlinie mit einem mGRBF-System

Wie kann nun der MassenstromÇ:È ÉuÊ®µ¯°±°²°³°´ ¦ �¨ · ¹�º am Ventil eingestelltwerden?Obenwurde

schonmehrfacherwähnt(vgl. auchAbbildung7.3), daßeinigeFlüssigkeitsventileeinüber-raschendesVerhaltenzeigen,welchesstarkvon der zu dosierendenFlüssigkeit abhängt.Die im PLSkonfiguriertePID-Regelungmußzwangsläufigfür ein solchnichtlinearesSy-stemversagen.In Kapitel 6 hattenwir aberbei derRegelungeinesBioreaktors,derdurchein Ventil mit einervariablenKennliniekontrolliert werdenmuß,gesehen,daßein Regler,deraufeinerFunktionenapproximationeinermultifunktionalenDatenfolgeberuht,zusehrgutenErgebnissenführt. DabeidenFlüssigkeitsventilenderRV eineäquivalenteSituationvorliegt, soll diesesKonzeptnunauf die Schätzungder KennlinienderFlüssigkeitsventi-le übertragenwerden.Weil damals(Oktober1997)der für die RegelungdesBioreaktors

154

Page 163: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.2. Entwurf einerneuenRegelung

verwendeteLLM-ApproximatornochnichtzurVerfügungstand,wurdedieFunktionenap-proximationmit demim Abschnitt4.3.1dargestelltenmGRBF-Systemrealisiert.

Die SchätzungderVentilkennlinien ¦§�¨ À «��¨ Å wird vomExpertenFLKRBF mit Hilfe einesmGRBF-Systemvorgenommen.DiesesSystemlokaler GRBF-Netzwerke lernt ausdemTrainingsdatensatz�Ã�¨ ï��A«��¨ · ¹�º��*¦§�¨ · ¹���� ¾ ®°¯°± º���¹Áï ñ�ò0ò/ò���� die Funktionenapproxima-tion ¿¦ �¨ �f« �¨ · ¹�º� ¿¦ �¨ · ¹��!� ¾ ®°¯µ± ºYò (7.3)

Die Totzeit � ¾ ®µ¯°± beschreibtdie Verzögerungauf Grund der Messungund beträgtnacheinerAnalysederKreuzkorrelationzwischendemDurchflußundderVentilstellungca.6s.

Aus Gründender Übersichtlichkeit werdenim folgendendie Indizes für die Öfen unddie Ventileweggelassen.Ebensowird zunächstdasTrainingnur einesGRBF-Netzwerksfür die Schätzung

¿¦ À « Â�Ä âGã�ä¬å Å einerVentilkennliniebetrachtet.EntsprechenddemVor-gehenvon M. Sonner[Son97] wird das Intervall ·]ó��dñ/ófó+º der möglichenVentilstellun-gen in ¦ äquidistanteStützstellendiskretisiert.In Abbildung 7.10, links, ist ein typi-scherTrainingsdatensatzzusammenmit einer geschätztenKennlinie

¿¦ À « Â�Ä âGã4ä¸å Å ï"$#&% #(')# À « Â�Ä âGã�ä¬å Å dargestellt.Offensichtlichist die in der linken Abbildung gezeigteSchätzung

¿¦ À « Â�Ä âGã4ä¸åªÅ wenig sinnvoll, da sie nicht die von einer Ventilkennlinieer-warteteMonotonieerfüllt. Für einevernünftigeSchätzung

¿¦ À « Â+*Ä âGã�ä¬åªÅ mußvielmehr¥ ¿¦ À « Â,*Ä âGã4ä¸å Å\© ¥¸« - ó gelten.Außerdemwird verlangt,daßein geschlossenesVentilkeinenDurchflußerlaubt,also

¿¦ À ó  *Ä âGã�ä¸å Å ï ó gilt. Im folgendenwerdendie Größen,die einemonotoneKennliniebetreffen,mit einemQuerstrichversehen.

Um die beidenobenerwähntenRandbedingungenzu erfüllen,wird eineMonotonisierungderKennlinienschätzungvorgenommen.Hierzuwird die Lernregel (2.64) für die Bestim-mungderAusgabegewichte . # beimGRBF-NetzwerkdurchdieAnwendungzweierlokalerExpertenerweitert:DadieKennlinievonlinks betrachtetmonotonsteigend,vonrechtsbe-trachtetabermonotonfallendseinmuß,werdenfür jedesZentrum/ # desGRBF-Netzwerkszwei lokaleExperten

¿¦10# und¿¦32# eingeführt,diedieGewichte

% #soanpassensollen,daß

diejeweiligeEigenschafterfüllt ist. In Abbildung7.10, rechts,wird dieArbeitsweisedieserExpertenillustriert.DerExperte

¿¦10# erzwingtdieMonotonie,indemerausdenGewichten% #neueGewichte

% 0# berechnet,für die% 0# 2,4 % 0# �(5 ï766ò0ò/ò�¦ , gilt:% 08 ï ó (7.4)% 0# ï % # � % # � % 0# 2,4% 0# 2,4 � sonst

5 ï16 ò/ò/ò2¦õò (7.5)

Analog gehtder Experte¿¦32# vor, der die Gewichte

% #so modifiziert,daßsie von rechts

gesehenimmerkleinerwerden:% 29 ï % 9 (7.6)% 2# ï % # � % # � % 2# 0&4% 2# 0&4 � sonst5�ïõ¦ û ñ.ò/ò0ò0ñ�ò (7.7)

155

Page 164: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

Abbildung 7.10.:Training einer Ventilkennlinie. Links sind exemplarischdie PunkteeinesTrainingsdatensatzes:<;>= Ð Ó Ô�Õ�× Ú Ó Ô@?BA Ö ®°¯°± ÕDC�Ô ;<E�FGFGFHEHIKJMLMNPO einesFlüssigkeitsventilsabgebildet.DieseDatenverteilungwurdemit einemGRBF-Netzwerk,welchesaufeinemäqui-distantemGitter basiert,approximiert.Die Gewichte Q # ×�R ;SE�FGFGFUTWV , sind als grüne X unddie mittlere Aktivität Y[Z #]\_^ als dünneLinie eingezeichnet.Die darausresultierendeModell-funktion ÛÚ Ü Ð ÝsÞ âGã4ä¸å ß desGRBF-Netzwerksist alsdicke Linie eingetragen.RechtssinddieAusgabender Experten ÛÚ 0# und ÛÚ 2# dargestellt.Die roten ? (blauen ` ) kennzeichnendieAusgabegewichte Q 0# ( Q 2# ) unddie gestrichelterotebzw. blaueLinie zeigtdie lokaleKompe-tenz a 0# ( a 2# ). Als ErgebnisderbeidenExpertenerhältmandieGewichte bQ # (grünec ). Die nunmonotoneModellfunktion ÛÚ Ü Ð Ý bÞ âGã4ä¸å ß desGRBF-Netzwerksist wiederalsdickedurchge-zogeneLinie eingetragen.

DieseGewichte sind in Abbildung 7.10, rechts,als rote + (% 0# ) und blaue d (

% 2# ) ein-getragen.Um die Ausgaben

% 0# und% 2# der beidenExpertendurcheinenübergeordneten

Expertenverknüpfenzukönnen,ist dieBestimmunglokalerKompetenzenef0# und e+2# not-wendig.Dadie mittlereAktivität g ')#ihj^ ein Maßfür die Zuverlässigkeit einesGewichts

% #ist, beschreibendie rekursiv definiertenlokalenKompetenzene 0# ï e 0# 2,4 �kg 'l#Hhj^ 5 ï166ò0ò/ò2¦ (7.8)e 2# ï e 2# 0&4 �kg 'l#Hhj^ 5 ïø¦ û ñ.ò/ò0ò/ñ (7.9)

wie repräsentativ dieGewichte% 0# und

% 2# sind.Die Verknüpfungvon¿¦ 0# und

¿¦ 2# erfolgtschließlichentprechend(4.1) durch*% # ï % 0# e 0# � % 2# e 2#e 0# �me 2# � 5 ïjñ.ò/ò/òn¦7� (7.10)

wobei hier die übergeordnetenKompetenzen�n0# und �o2# auf Eins gesetztwurden.AufdieseWeiseapproximiertdasGRBF-NetzwerkdieVentilkennliniemit dernunmonotonen

156

Page 165: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.2. Entwurf einerneuenRegelung

Abbildung7.11.:Schätzungder Ventilkennlinien mit einemmGRBF-System.Links ist diemonotonisierteSchätzung ÛÚ Ü Ð Ý bÞ àpâGã�ä¸å ß derVentilkennliniefür dieFlüssigkeitANFAHR anOfen2 mit einemmGRBF-Systemausfünf Modellendargestellt(durchgezogenenLinien).DieAusgabegewichtederfünf GRBF-Netzwerke,die zu dieserSchätzungführen,sindalsgrüneceingetragen.Rechtsist dieentsprechendeSchätzungfür B202 anOfen1 dargestellt.

Schätzung

¿¦ À « Â,*Ä âGã4ä¸å Å ï 9p #jq 4 *% #(')# À « Â,*Ä âGã�ä¬å Å (7.11)

Abbildung 7.10 illustriert, wie durch eine solcheMonotonisierungdie obenverlangtenRandbedingungenerfüllt werden.

DasgeradedargestellteVorgehenläßtsichohneSchwierigkeitenaufdieFunktionenappro-ximation

¿¦ À «  *Ä àªâGã4ä¸å Å mit einemmGRBF-Systemübertragen.Für die SchätzungderVentilkennliniemit demExpertenFLKRBFwurdeeinmGRBF-Systemaus5 Modellenmitjeweils ¦ ï36fù Stützpunktenverwendet.Abbildung7.11illustriert exemplarischanzweiFlüssigkeitsventilendasErgebnisdermultifunktionalenFunktionenapproximationmit ei-nemmGRBF-System,welchesdurchdie obengeschilderteMonotonisierungmodifiziertwurde.DaslinkeTeilbild zeigtdiemit fünf GRBF-NetzwerkengeschätztenKennliniendererfahrungsgemäßrelativ gut dosierbarenBrennerstrecke ANFAHR unddasrechteTeilbilddie KennliniendermeistproblematischenBrennerstreckeB202. Da die fünf Modelle fürANFAHR sichnicht sostarkunterscheidenwie für B202, spiegelt sichdasErfahrungswis-sender Anlagenfahrerauchin der FunktionenapproximationdurchdasmGRBF-Systemwider.

157

Page 166: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

Bestimm ung einer Ventilstellung ËÍ Ê]Ê®°¯°±µÎ°²°® « · ¹�º zu einem Massenstr omÇ:È ÉuÊ®°¯µ±°²°³°´jr · ¹�º

Um denin Abbildung7.8skizziertenRegelkreiszu schließen,stehtnochdie BestimmungeinerVentilstellungËÍ Ê]Ê®°¯°±µÎ°²°®�s · ¹�º aus.Diesewird durchdenExpertenFLKRBF durcheineNull-stellenbestimmungvon ¿r À ËsÍ Ê]Ê®°¯°±°Î°²µ® s · ¹�º Â+*Ä àªâGã4ä¸å Å û Ç:È ÉuÊ®µ¯°±°²°³°´tr · ¹�º�ïøó (7.12)

berechnet.Die lokaleKompetenz®°¯µ±°Î°²°® eç· ¹�º desExpertenFLKRBFwird durchdieGesamtak-tivität u

À ËÍ Ê]Ê®°¯µ±°Î°²°® s · ¹�º Âv*Ä àpâGã�ä¸å Å ï wp x q 4 *yxÀ ËÍ Ê]Ê®°¯µ±°Î°²°® s · ¹�º Å

uÀ ËÍ Ê]Ê®°¯°±µÎ°²°® s · ¹�º Â+*Ä âGã4ä¸åx

Å (7.13)

bestimmt,die durch die Ventilstellung ËÍ Ê]Ê®°¯°±°Îµ²°® s · ¹�º auf der ZwischenschichtdesmGRBF-Netzwerksausgelöstwird. DieselokaleKompetenzwird zusammenmit derVentilstellungzU{j|}|~���������~ s�� ��� andenExpertenFLKCHIEF weitergegeben,derdiesemit denEingabenderan-derenbeteiligtenExpertenverrechnetund schließlicheine Ventilstellung

zU{j|}| s�� ��� an dieAnlageweitergibt (vgl. auchAbbildung7.8).

7.2.5. Exper ten zur Regelung der Abgaszufuhr

Die Regelungder Abgaseist konzeptionellähnlich der Flüssigkeitsregelungaufgebaut.Auch hier werdenviele – sich zum Teil widersprechende– Zielsetzungenverfolgt, diean verschiedenelokale Expertendelegiert werden.Abbildung 7.12 zeigt die beteiligtenExperten.Da mit denExpertenFLKBED undFLKRBF dasVorgehenbeimReglerentwurfschonexemplarischdemonstriertwurde,wird im folgendennur kurz die Zielsetzungunddie Umsetzungder verschiedenenExpertenbeschrieben.Die genaueKonfigurationkannin [Alb97b] nachgelesenwerden.� ABGPID undABGVER: DiesebeidenExpertenübernehmendie Hauptarbeitbei der

RegelungdesAbgasdrucks�i� � | �)� � ��� . ABGPID ist ein konventionellerPID-Regler,welchereinenGesamtvolumenstrom�i� � |��i� � ��� als “fikti ve” Stellgrößeausgibt.Die-ser Volumenstrom,der von den zur VerfügungstehendenÖfen verbranntwerdenmuß,wird durchdenExpertenABGVER auf die Öfenaufgeteilt.Dabeiwird derBe-darf ~����������j��� � ��� einesOfens,dieStellungderSchnellschlußventile � �� � ��� unddiedurchdenAnlagenbetreibervorgegebeneAbnahmereihenfolgeberücksichtigt.Hierausbe-rechnetABGVER einenVolumenstrom� ��������� � �� � ��� , ausdemdurcheineSchätzung7 derVentilkennlinieneineVentilstellung

zU{j|}|� ����������� �� � ��� bestimmtwird.

7 DieseSchätzungist rein erfahrungsbasiert.Auf GrunddergemeinsamenVolumenmessung�i� &¡ ¢¤£ ist einedatenbasierteSchätzungnur schwermöglich.

158

Page 167: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.3. BeispieleundDiskussion�l� � ���¥�i� � | �l� ¦¨§© ª«ABGPID¥� �� � ���~�������������� � ��� ¦¨§© ª«ABGVER¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬�­

�l� � ���¥§© ª«ABGPMIN® ® ® ® ® ® ®°¯

± � � ���¥§© ª«ABGOPMAX¥

² �,³ ´�µ¥§© ª«ABGO2MIN¶¶¶¶¶¶¶ ·

� �� ³ ´�µ¥§© ª«ABGEIN¸¸¸¸¸¸¸¸¸¸¸¸¸¸ ¹§© ª«

ABGCHIEF¥ºU»j¼}¼ � �� ³ ´�µAbbildung7.12.:Die Experten desBlocksABG.� ABGPMIN: In einigenAbgasleitungen(1,3,5,6und11)darfderDrucknurmöglichst

seltenunterhalbeinesvorgegebenenMinimaldrucksfallen, da die Produktionsbe-triebe,die dieseAbgaseerzeugen,auf die EinhaltungeinesbestimmtenDrucksan-gewiesensind.Bei Gefahr eineszu starken Druckabfalls drosseltABGPMIN daherdie entsprechendenVentileundunterstütztsoAPBPID undABGVER.� ABGOPMAX: DieserExpertetritt nurdannin Aktion, wennderOfeninnendrucküberdenAußendruckanzusteigendroht.In diesemFall werdenalle Abgasventilemit ei-nerhohenKompetenzgeschlossen.� ABGO2MIN: Bei einerkleinenundfallendenSauerstoffkonzentrationkannein OfenwegenUnterschreitungdesSauerstoffgrenzwertsausfallen.Bei Auftreteneinersol-chenSituationwerdendie Abgasventile kurzfrisitig geschlossenund anschließendlangsamwiedergeöffnet.� ABGEIN: AnalogzumExpertenFLKEIN sorgt ABGEIN dafür, daßdasUmschaltenzwischenPLS-undPCS-Regelunglangsamerfolgt.

7.3. Beispiele und Diskussion

Zunächstsollenzwei AusschnitteausdenarchiviertenDatenbetrachtetwerden,um dieArbeitsweisedesneuenRegelungssystemsderRV zu illustrieren.

Abbildung 7.13 zeigt einenAusschnittvom 11. November1997,der die RegelungderFlüssigkeit B202 amOfen1 betrifft8. DasRegelungssystemwurdezumZeitpunkt24 min

8Im folgendenwerdendie Indizesfür denOfen1 unddie Flüssigkeit B202 weggelassen.

159

Page 168: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

a)

b)

d)

Temperatur

c)

Sauerstoffkonzentration

Abbildung 7.13.:TypischesVerhalten der Flüssigkeitsregelungdurch das PCS. Für eineDiskussionsieheText.

eingeschaltet.Die rotenKurvenmarkierendenZeitbereich,in demdasRegelungssystemin dieFlüssigkeitendosierungeingreifenkonnte.Teilbild a)zeigtobendenVerlaufderFeu-erraumtemperaturunduntendendazuantikorreliertenVerlaufderSauerstoffkonzentration.Manerkennt,wie ca.10min vor EinschaltenderRegelungeinAbfallenderSauerstoffkon-

Abbildung7.14.:TypischesVerhalten der Abgasregelungdurch dasPCS.Für eineDiskus-sionderAbbildungaufSeite161sieheText.

160

Page 169: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.3. BeispieleundDiskussion

Ofen 3

Ofen 1Ofen 2Ofen 3

Ofen 1Ofen 2Ofen 3

Ofen 1Ofen 2Ofen 3

Ofen 1

d)

Ofen 2

Volumenstrom

Abgasdruck

a)

b)

c)

e)

161

Page 170: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

zentrationeinsetzt.Derin Teilbild b)dargestellteBedarf½�¾�¿�À ���j� �+³ ´�µ ist dahernegativ,wasbeiEinschaltenderRegelungzueinersofortigenAbsenkungdesSollmassenstroms�H� � ¼½�¾�¿�À ���jÁ �&³ ´�µführt. In Teilbild c) ist derSollmassenstrom�H� � ¼½�¾�¿�À ��� Á �&³ ´�µ (rot) zusammenmit demgemesse-nenMassenstromÁ � (schwarz)dargestellt.Teilbild d) zeigtschließlichdie VentilstellungºU»j¼}¼½�¾�¿�Â�À�½_à �v³ ´�µ , dieausderSchätzungderVentilkennliniemit einemmGRBF-Systemresultiert.DasdargestellteBeispielzeigtdeutlich,wie die Regelungin die Dosierungeingreift,undesletztendlichauchschafft, einendrohendenOfenausfall zu vermeiden.Allerdings führtdieserEingriff auchzueinigenSchwingungen,die erstnachetwa40min gedämpftsind.

In Abbildung7.14wird die Arbeitsweiseder neuenAbgasregelungam Beispielvon Ab-gas6 für einenAusschnittvom 1. Oktober1997illustriert. DasobersteTeilbild zeigtdenaktuellenVolumenstrom

�ÅÄ ³ ´�µ und Druck�,Ä ³ ´�µ desAbgaseszusammenmit demSollwert�i� � ¼ �,Ä . In denTeilbildern b)–e) ist dasVerhaltenvon Meßgrößen,bzw. lokalenExperten

dargestellt.Dabeiwerdendie drei Öfenjeweils farblichkodiert.In demgewähltenDaten-ausschnittsollenzweiSituationengenauerbetrachtetwerden:� DergelbmarkierteBereichkennzeichneteinenAusfall vonOfen3. Dieswird durch

denverfahrenstechnischbedingtenAbfall der Sauerstoffkonzentrationauf Null er-sichtlich.DurchdenAusfall verändernsichdie vomExpertenABGVER berechnetenZuordnungen,durchwelchedie AbgasabnahmedereinzelnenÖfenbestimmtwird.Im Teilbild e) ist schließlichzu erkennen,wie die RegelungdasAbgasventil vonOfen1 öffnetundsodenAbgasdruck

�,Ä ³ ´�µ trotzAusfall vonOfen3 nahezukonstanthaltenkann.Zusätzlichschließtdie RegelungdasAbgasventil von Ofen 3, um einAbfallendesAbgasdrucksdruchdasschlagartigeÖffenendesSchnellschlußventilszuvermeiden.� DerbraunmarkierteBereichkennzeichneteinschnellesAbfallenderSauerstoffkon-zentrationvon Ofen 2, dasvermutlich in einerstarken SchwankungeinesFlüssig-keitsstromsbegründetist. ExperteABGVER reagiertdarauf,indemer langsamdieZuordnungvon Ofen 2 verringert.Wesentlichschnelleragiert der ExperteABG-O2MIN, der immereinenVentilwert von Null ausgibt.ABGVER erreichtdurcheinekräftige Anhebung seinerlokalenKompetenz,daßdie Abgasventilstellung(unter-stesTeilbild) angedrosseltwird. DurchdasEingreifenvon ABGO2MIN werdenalleAbgasventile von Ofen 2 angedrosselt,wodurchnacheinigenMinuten die Sauer-stoffkonzentrationwiederansteigt.

Die objektive Untersuchungder Leistungsfähigkeit der beidenneuenRegelungenfür dieFlüssigkeitenund Abgasegestaltetesich schwierig,da ein quantifizierbaresMaß für dieQualitätderOfenregelungnurmit einemgroßenFehlerzuermittelnist. Die Ausführungenvon Abschnitt7.1.4habendeutlichgemacht,daßnicht die EinhaltungeinesbestimmtenSollwerts – wie bei einemeinfachenSISO-Reglerkreis– sonderndie BerücksichtigungeinerReihevon Randbedingungen,die zu einerErhöhungder Ausfallsicherheitund desStoffdurchsatzesführensollen,von Bedeutungist. Mögliche Qualitätsmaßewärendaher

162

Page 171: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7.3. BeispieleundDiskussion

Meßwerterfassung:163.3TagePCS-Abgasregelungin Betrieb:36.0%

Ofen1 in Betrieb:91.7% Ofen2 in Betrieb:94.3% Ofen3 in Betrieb:85.3%ÆPÇDÈWÉËÊ Æ¨Ç)ÈMÉUÌiÍ Æ¨Ç)ÈMÉUÊ ÆPÇDÈWÉËÌiÍ Æ¨Ç)ÈÅÉËÊ ÆPÇ)ÈMÉËÌÎÍÏ[1/d] 2.69 2.70

Ï[1/d] 3.82 3.55

Ï[1/d] 3.35 3.36Ð ÏÒÑKÏ

[%] 8.0 6.0Ð ÏÒÑKÏ�Ó ÔÖÕ

6.7 5.2Ð ÏÒÑKÏ

[%] 7.1 5.3

Tabelle7.3.: Ausfallraten der Öfen. Ein Ofenausfall liegt vor, wennalle Schnellschlußven-tile einesOfensgeschlossenwerden.Die Tabellevergleicht die Ausfallraten

Ï(in Ereignis-

senpro Tag), für denFall, daßdie PCS-und die PLS-Regelungder Abgasein Betriebwar.Der statistischeFehler

Ð ÏÒÑKÏberechnetsich ausder absolutenAnzahl × der Ausfälle,alsoÐ ÏÒÑKÏÙØ�ÚHÑ¨Û × .

die mittlereAusfallrateunddermittlereStoffdurchsatzeinesOfens.Da die RegelungmitBlock FLK nur überkurzeZeiträume(einigeTage)für eine Zuleitungin Betriebwar, istesabernichtzuverlässigmöglich,denmittlerenMassenstrommit undohnePCS-Regelungzuvergleichen.Ebensoist einVergleichdesmittlerenAbgasvolumenstromsnichtsinnvoll,da für die Abgaseein Abnahmezwang bestehtund Schwankungendaherausschließlichauf die Produktionsbetriebezurückzuführensind.EineweitereMöglichkeit bestehtin derGegenüberstellungdermittlerenAusfallratenfür diePLS-unddie PCS-Regelung.Tabelle7.3 zeigt dieseAusfallratenzusammenmit denstatistischenFehlern.Offensichtlichsindhier aberkeinesignifikantenUnterschiedefestzustellen.

Die generelleSchwierigkeit einerBeurteilungder implementiertenPCS-Regelungist indrei Punktenbegründet:� DeralltäglicheBetriebsablaufderRV ist vonsehrvielenexternen,nichtquantifizier-

barenEinflüssenabhängig.Die angeliefertenAbgase,Flüssigkeitenund Feststoffespiegelndie ProduktionsverhältnisseinnerhalbdesWerkswider, die wiederumstar-kensaisonalenSchwankungenunterworfensind.Daherist esunmöglich,bestimmteBetriebssituationenzu reproduzieren,um einevergleichendeEvaluationverschiede-nerRegelungenzuerarbeiten.� Die Anlagebefindetsichständigim Umbau.SowurdenwährendderProjektlaufzeitsukzessive alle Flüssigkeitsventile ausgetauscht,einegroßePufferungsmöglichkeitfür dasdurchsatzstarke Abgas10 eingerichtetund ein Katalysatorfür die Gesamt-anlageerrichtet.Die ÖfenfallendaherimmerwiederwegenWartungs-undUmbau-arbeitentage-bis wochenlangaus.DiesebetriebsbedingtenAusfällekönnenin denDatennichteindeutigvonsicherheitsbedingtenAusfällenunterschiedenwerden.� Auch die KonfigurationderPCS-Regelungwurdeständigverändert,umSchwächenundSchwierigkeitenauszumerzen.Vor allemfür denBlock FLK wurdenauf Grundder schwerbeherrschbarenFlüssigkeitsventileverschiedeneRegelungskonzepteer-

163

Page 172: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

7. RegelungderRückstandsverbrennungin einerindustriellenAnlage

probt.Die obendargestelltKonfigurationspiegelt dahernur denZustandder PCS-RegelungzumAbschlußderProjektswider.

Manmußalsoletztendlichfesthalten,daßeineobjektiveAussagedarüber, obdasneueRe-gelungssystemfür dieRV zudenvonderWacker-ChemieGmbHanvisiertenZielengeführthat,nurschwermöglichist.Esseiaberangemerkt,daßetwavonderHälftederAnlagenfah-rer dasneueRegelungssystemaktiv eingeschaltetwurde9. Diesesubjektive EinschätzungderAnlagenfahrerscheintzumindestaufeinegewisseStabilisierungderRV durchdieneueRegelunghinzuweisen.

DaswichtigsteErgebnisausder Kooperationmit der Wacker-ChemieGmbH ist, daßesgelungenist mit einemrelativ geringenGesamteinsatzanPersonal(ca.2 Mannjahre)einfunktionsfähigesund alltagstauglichesRegelungssystemfür eine industrielleAnlage zuentwicklen.EinenwesentlichenAnteil daranhatdasdemRegelungssystemzugrundelie-gendeKonzeptder lokalenExperten.Nur sowar esmöglich,neueAlgorithmenschnellindasGesamtsystemzu integrierenundzuerproben.

9DiesesVerhaltenkanngut in denarchiviertenDatenkurznachdemSchichtwechselbeobachtetwerden.

164

Page 173: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A. Anhang

A.1. Der LLM-Appr oximator

A.1.1. Herleitung des LLM-Appr oximator s

In diesemAnhangsollendie Integraleaus(3.34) ausgewertetwerden.WenndieMischung(3.30) in (3.34) eingesetztund die Integrationmit der Summationvertauschtwird, erhältman ÜÝ)Þ¤ßáàGâÖãPãPäæå@ç è äé�ê&ëíì é Þîßïåè äé°ðñê&ëvò é ð Þîßïå (A.1)

mit ì é ÞîßïåáóõôIRöm÷

Ü� Þ¤ßùø ÷Òú û ø]âÖü+ý�þé å ÿ ÷ (A.2)

und ò é Þîß åùó ôIRö

Ü� Þîßùø ÷ ú û ø]â ü+ý�þé å ÿ ÷ � (A.3)

Zunächstsoll dasIntegral (A.2) berechnetwerden.Dazudefinierenwir� é ó�� � é�� �� é�� � ç�� ß÷ �� �� éÝ é� � (A.4)

Fernerstellenwir fest, daßdie inverseKovarianzmatrix��� ëé , wie in (3.37)-(3.40) ange-geben,in Blockmatrizenzerlegt werdenkann.Damit kanndasArgument

��� é � � ëé � é derExponentialfunktionin (3.31) als� � é ��� ëé � é ç � � é�� ��� � ëé � é�� ����� � � é�� ��� � ëé � é�� ��� � � é�� ��� � ëé � é�� � (A.5)

165

Page 174: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A. Anhang

geschriebenwerden.Nun läßt sich die Exponentialfunktionfaktorisierenund manerhältmit derSubstitution÷ ç1Ý é � � é�� � für (A.2)ì é Þîßïå@ç !" é�#%$'&)( � !� � � é�� � � � ëé � é�� �+*-, é Þ � é�� � å (A.6)

mit ,�é Þ � é�� � å ó1ô1Þ�Ý é.� � é�� � å #%$'& ( � � � é�� � � � ëé � é�� � � !� � � é�� � � � ëé � é�� � * ÿ � é�� � � (A.7)

DerNormierungsfaktorin (A.6) ist dabeidurch" é ó�Þ ��/ å103214WÞ65 #-7 � é å ë 214 (A.8)

gegeben.DasverbleibendeIntegral (A.7) wird durcheinequadratischeErweiterungdesArgumentsderExponentialfunktionausgewertet.Mit derDefinition8 é ó � é�� ��� � é Þ � � ëé å � � é�� � (A.9)

kanndiesesArgumentin zwei Summandenzerlegt werden,wobeinur einerderSumman-denvon 8 é abhängigist:� � � é�� � � � ëé � é�� � � !� � � é�� � � � ëé � é�� � ç � !� 8 �é � � ëé 8 é � !� � � é�� � � � ëé � é Þ � � ëé å � � é�� � � (A.10)

DieExistenzderzu � é inversenMatrix � � ëé aus(A.9) wird weiteruntennochbewiesen.Da(A.9) nureinevon ÷ unabhängigeVerschiebungdesVektors

� é�� � bewirkt, giltÿ � é�� � ç7ÿ 8 é .

Soerhältmanfür ,�é Þ � é�� � å aus(A.7) zunächst, é Þ � é�� � åïç (A.11)#%$'&9( !� � � é�� � � � ëé � é Þ � � ëé å � � é�� �+* ô Þ�Ý é � 8 é � � é Þ � � ëé å � � é�� � å #%$'&9( � !� 8 �é � � ëé 8 é:* ÿ 8 éunddurchIntegration, é Þ � é�� � åïç " é�� � #;$<& ( !� � � é�� � � � ëé � é Þ � � ëé å � � é�� � * Þ Ý é � � é Þ � � ëé å � � é�� � å (A.12)

mit demNormierungsfaktor" é�� � ó�Þ ��/ å�= 214 Þ>5 #%7 � � ëé å � ë 214 � (A.13)

WerdennundieHilfsgrößen� é und 8 é resubstituiertbekommtmanfür (A.2) denAusdruckì é Þîß å>ç " é�� �" é #;$'&)( � !� Þîß � é å �@?� � ëé Þîß � é å *BA Ý é � � é Þ � � ëé å � Þîß � é å1Cç " é�� � " é�� �" é A Ý é � ?� é Þ¤ß � é å C ?� Þ¤ß ú û ø]â ü+ý�þé å � (A.14)

166

Page 175: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A.1. DerLLM-Approximator

Die Matrix ?� é ó � � é Þ � � ëé å �(A.15)

projeziertdabeidenDifferenzvektorß � é@D IR

0in denAusgaberaumIR

=. Die Matrix?� � ëé ó � � ëé � � � ëé�� é Þ � � ëé å �

(A.16)

ist nach(3.38) und(3.39) symmetrischunddefinierteineneueMetrik im UnterraumIR0

,die von der lokalenVerteilungderDatenim IR

=FEIR0

abhängigist. Mittels dieserneuenMetrik wird eineneuelokaleNormalverteilung?� Þîß ú û øGâ ã¨ãDäé åáó !" é�� �G#%$'& ( � !� Þ¤ß � é å � ?� � ëé Þîß � é å * (A.17)

auf dem UnterraumIR0

definiert, derenParametersatzdurchâ ãPãDäé ç H é ø ?� � ëé ú û ç! �+�I� ÁKJ gegebenist und vermöge(A.16) aus

â ü+ý�þé zu bestimmenist. Dazuist eineIn-versionderdurch(3.39) gegebenenMatrix � � ëé nötig.FürdenNormierungsfaktorgilt wieüblich " é�� � ó�Þ ��/ å 03214 Þ>5 #-7 ?� � ëé å � ë 214 � (A.18)

In (A.1) stehtnochdie BerechnungdesIntegrals ò é Þîßïå aus.Mit derzumobigenVorgehenanalogenRechnungerhältmanfür diesesIntegralò é Þîßïå@ç " é�� � " é�� �" é ?� Þîß ú û øGâ ã¨ãDäé åGø

(A.19)

sodaßabschließendlediglich die BerechnungderKonstanten" é�� � " é�� �IL " é verbleibt.Mit

denDefinitionen(A.8), (A.13) und(A.18) berechnensichdiesezuA " é�� � " é�� �" é C 4 ç 5 #-7 Þ � � ëé å5 #%7 Þ � � ëé åM5 #-7 Þ � � ëé � � � ëé � é Þ � � ëé å � å � (A.20)

AusdemDeterminatenentwicklungssatzfolgt für dieDeterminantevonMatrizenin Block-form derAusdruck[Ait69, Fis86]5 #-7 � � ëé çN5 #%7 � � � ëé � � ëéÞ � � ëé å � � � ëé ç�5 #-7 Þ � � ëé åM5 #-7 Þ � � ëé � � � ëé � é Þ � � ëé å � å

(A.21)

undsomit,wie zuerwartenwar, " é�� � " é�� �" é ç ! � (A.22)

Da5 #%7 Þ � � ëé å@çN5 #-7 Þ

Ü� � ëé å@çPO éRQ � 4S éUTçWV, folgt aus(A.21), daßimmer

5 #-7 Þ � � ëé å TçNVgilt.

Damit ist � � ëé regulärunddie ExistenzderinversenMatrix � é gesichert.

Als Ergebnisfür dieFunktionenapproximation(A.1) erhältmanschließlichaus(A.14) und(A.19) undmit denDefinitionen(3.42) und(3.43) die Gleichung(3.41).

167

Page 176: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A. Anhang

A.1.2. Klassifikation mit einem LLM-Appr oximator

Für die BerechnungdesAnsatzes(3.2) müssendie Integrale(A.2) und(A.3) ausgewertetwerden.Dazu wollen wir zunächstfür den gegebenenFall desKlassifikationsproblemsdieEigenschaftenderzugehörigenVerbundwahrscheinlichkeitsdichte

� Þîßùø ÷ å derDatenXgenaueruntersuchen.EinessolcheDichtekannimmeralseineSumme� Þîßùø ÷ åïç

=Y Z ê&ë ± Z � Þîß@ø ÷Òú\[ å (A.23)

ausden ] Produktendera priori -Wahrscheinlichkeiten± Z

undderklassenlokalenDichten^ Þ¤ßùø ÷Òú\[ å geschriebenwerden.Diesekönnenjeweilsgemäß^ Þ¤ßùø ÷Òú\[ å ç ^ Þ ÷Òú\[ å ^ Þ¤ß ú ÷ ø [ å (A.24)

weiter zerlegt werden.Auf Grund unsererspeziellenKodierungder Klassenzugehörig-keit sind alle Datenpunkte

ßeinerKlasse [ geradedurch ÷ ç`_ Z

markiert.Folglich gilt^ Þ ÷ úa[ åÖçcb�Þ ÷ � _ Z åund ^ Þîß ú ÷ ø [ åÖç ^ Þ¤ß ú\[ å . Wir könnendaherdie klassenlokalenVer-

bunddichtenaus(A.24) auchals^ Þîß@ø ÷Òú\[ åïçNb�Þ ÷ � _ Z å ^ Þîß úa[ å (A.25)

schreiben.DieseDichtenhabenalsoin ÷ -RichtungverschwindendeVarianzenundsindim

÷ -Unterraumumdie Punkte_ Z

zentriert.

DieKomponenten

Ü^ Þ¤ßùø ÷Òú û ø]â ü+ý�þé åeinerML-SchätzungderVerbunddichte

Þ¤ßùø ÷ å müssennunebenfallsdieseEigenschaftenhaben.Diesist geradederFall für dieZerlegungÜ^ Þîß@ø ÷Òú û ø]â ü+ý�þé å@çNb�Þ ÷ � Ý é å Ü^ Þîß ú ÷ ø û øGâ ü+ý�þé å

(A.26)

mit Ý édD H�_ Z ú\[ ç ! �+�+� ] J ø (A.27)

sodaßjedemultivariateNormalverteilung û eindeutigeinerKlasse [ zugeordnetist. MitderEigenschaft(A.26) der in die ML-Mischungsdichte

Ü^ Þ¤ßùø ÷Òú â ä å eingehendenKompo-neten

Ü^ Þîßùø ÷ ú û ø]â ü+ý�þé åkönnendie Integrale(A.2) und (A.3) leicht berechnetwerdenund

manerhältfür denLLM-ApproximatorÜe@ÞîßùàGâ ãPãDä å@ç è äéjê&ë Ý é Ü^ Þîß ú Ý é ø û ø]â ü+ý�þé åè äé ð ê&ë Ü^ Þîß ú Ý é ð ø û�f ø]â ü+ý�þé ð å � (A.28)

Wegen(A.27) könnenalle Normalverteilungenû ç ! �+�+� Á vermittelsderZerlegungH û+ú û ç ! �+�+� ÁPJ ç =gZ ê&ë H ûZú ûZ ç ! �I�+� Á Z J (A.29)

168

Page 177: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A.2. DynamikdesBioreaktors

aufdie ] Klassenaufgeteiltwerden,wobeifür die Mächtigkeiten hjikl i hjinmWh (A.30)

gilt. Auf GrundderEigenschaftderloadbalance, welchedermultivar-Algorithmusgaran-tiert, teilensichdieZentrenderNormalverteilungenentsprechendderapriori -Wahrscheinlichkeiteno i derKlassenaufdie p disjunktenUntermengenq�r+its auf [Der95]. Fürgroßeh gilt da-her huih v o ixw (A.31)

Mit (A.27) und (A.29)–(A.31) könnennundie Summenin (A.28) in Teilsummenzerlegtwerden,die jeweilsnureineKlassey betreffen.Man erhältsomit(3.58).

A.2. Dynamik des Bioreaktor s

A.2.1. Fixpunkte des Bioreaktor s

Die Gleichungen(6.5) und(6.6) definierenfür einenkonstantenDurchflußz anjedemZu-standspunkt{}|�~>�@�;�����%� eineRichtung,die angibtwie sichderZustanddesBioreaktorsin einerinfinitesimalkleinenZeitspanneentwickeln wird. DieseRichtungensindTangen-tialvektorenandie TrajektoriendesSystems.WerdendieseTangentialvektorenalskleinePfeile in denZustandsraum,welcherdurch �@� und ��� aufgespanntwird, eingetragen,er-hältmanein Abbild desPhasenraums.AbbildungA.1 zeigtPhasenräume,diesichfür vierverschiedeneDurchflüssez ergeben.Der Phasenraumläßt sich in Gebieteunterteilen,indenen�'�@�����x����� oder �M�@�:���x����� bzw. �M�������x����� oder �M�������x����� gilt. DieseGe-bietesinddurchKurvengetrennt,aufdenendie Konzentrationenvon �@� bzw. ��� konstantbleiben.Für dieGleichungen(6.5) und(6.6) ist dies– trivialerweise– füre���'���B� ~��@�;�����%���P�@��m�� (A.32)

erfüllt. Als nichttrivialeLösungergibt sich� ��'���B� ~��@�;�����%����z mN¡�~>���%� (A.33)� ��x¢1�B� ~��@�;�����%���P�@��mW���<£�¤¦¥)§ ���£�¤¦¥ w (A.34)

Offensichtlichist � �� � �B� ~>�@�;�����%� lediglichnumerischlösbar, dafür einengegebenenDurch-fluß z dieKonzentration��� in (A.33) nur implizit gegebenist.Die Kurve � �� ¢ �B� ~��@�;�����;� istdagegenexplizit gegeben.Ein Blick aufAbbildung6.2zeigt,daßz m�¡�~����%� für z9� £ eine

169

Page 178: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A. Anhang

Abbildung A.1.: PhasenraumdesBioreaktors. Die Teilbilder zeigendurchPfeile der Stei-gung ¨ª© �;« ¨ª© � an, in welcheRichtungsich die LösungendesDifferentialgleichungssystems(6.5) und(6.6) für konstanteDurchflüsse¬®­�¯x°²±´³ªµ�¶´°\·�³ªµ�¶´°a¸ und ¶´°²±´³ entwickeln. Der farbi-ge Hintergrundkodiert denBetrag ¹»º¼¨ª© �½« ¨�¾½µ1¨t© �%« ¨�¾À¿%¹ (weiß symbolisierteinenkleinenBe-trag und blau einengroßen).Für die eingezeichnetenKurven Á ��'�Â�B� º6© � µ�© � ¿ (durchgezogen)bzw. Á ��x¢1�B� º6© � µ�© � ¿ (gepunktet)gilt ¨t© �½« ¨�¾Ã­Ä¯ bzw. ¨ª© ��« ¨�¾�­�¯ . Die KurventrennenalsoGebiete,in deneneineRichtungskomponenteª© �½« ¨�¾ bzw. ¨ª© �;« ¨�¾ dasVorzeichenwechselt.

Lösung,für £ÆÅ z Å ¡ÈÇÈÉÂÊ genauzwei Lösungenundfür zË��¡ÈÇÈÉÂÊ keineLösunghat.DieGerade� �� � �B� ~��@�;�����%� , die sich durchdie numerischeLösungder Gleichung zÄmÌ¡�~>���;�nach ��� ergibt unddieKurve � �� ¢ �B� ~��@�������%� , sindin AbbildungA.1 eingetragen.

170

Page 179: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A.2. DynamikdesBioreaktorsÍ1Î ~ÂyBÏ��ÐmN� Í1Î ~ÂyBÏ��@ÑmW�ÒGÓ ~�yÔÏ>���Õ� stabilerKnoten stabilerFocusÒGÓ ~�yÔÏ>���Õ� instabilerKnoten instabilerFocusÒGÓ ~�yÔÏ>�ÐmN� ZyklusÒGÓ ~�yÈ�½�Ö���<� ÒGÓ ~�y×�%����� Sattelpunkt

TabelleA.1.: Stabilität von Fixpunkten. FixpunktewerdennachdemVorzeichendesReal-und Imaginäranteileder EigenwerteØ Ï der Jacobimatrixklassifiziert,da diesedasVerhaltenderNäherungslösung(A.38) bestimmen.

An denSchnittpunkten{�Ù�mÚ~��ÛÙ� ���ÆÙ� � der in AbbildungA.1 eingetragenenKurvengiltgleichzeitig �'�@�����x�Üm�� und �M�������Ý�Þmß� . Dies sind die sog.Fixpunkte desDifferenti-algleichungssystems,andenendie DynamikdesBioreaktorsstationärwird. Man erkennt,daßesdrei verschiedeneArten vonFixpunktengibt:à TrivialeLösung{�Ù´á � mâ~��<���Ý� . DieserauchalswashoutbezeichneteZustandcharak-

terisierteineSituation,bei der trotz maximalerNährstoffkonzentration( ���´~6���@m�� )alle ZellenausdemTankgespültwurden( �@�-~6���Ðm�� ) [ALLR82].à Fixpunkt { Ù�á � , dernur für z Å ¡ ÇÈÉÂÊ exisitiert. In AbbildungA.1 ist diesderobereSchnittpunkt.à Fixpunkt {�Ù�á � , der nur für £)Å z Å ¡ãÇÈÉÂÊ exisitiert. In Abbildung A.1 ist diesderuntereSchnittpunkt.

Abbildung6.3 zeigtdie Lageder Fixpunktein Abhängigkeit vom Durchfluß z . In dieserAbbildung ist zusätzlichauchdasVerhaltender Reaktordynamikin der Näheder Fix-punkteeingetragen.Die dafür notwendigeStabilitätsanalysewird im nächstenAbschnittvorgenommen.

A.2.2. Stabilitätsanal yse der Fixpunkte

Die Stabilitätsanalyse[Hak82] beruhtauf der UntersuchungeinergenähertenLösunginderUmgebungeinesFixpunkts { Ù . Dazuwird dasDifferentialgleichungssystem(6.5) und(6.6) umeinenFixpunkt { Ù bis zur1. Ordnungentwickelt:ä �-~�{�� v ä �-~1{ Ù � ¤Úå ä �å �@�ãææææ»çãè ~��@� § � Ù� � ¤Úå ä �å ���3ææææéçÈè ~���� § � Ù� � (A.35)ä �´~�{�� v ä �´~1{ Ù � ¤Úå ä �å �@� ææææ»çãè ~��@� § � Ù� � ¤Úå ä �å ��� ææææéçÈè ~���� § � Ù� ��w (A.36)

171

Page 180: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A. Anhang

AbbildungA.2.: Eigenwertein Abhängigkeit vom Durchfluß ¬ . Ø Ù�á � , Ø Ù�á � und Ø Ù´á � sinddieEigenwerteder Fixpunkte ê Ù´á � , ê Ù�á � und ê Ù�á � . Die Abbildung zeigt die Real- und Imagi-närteiledieserEigenwertein Abhängigkeit vom Durchfluß ¬ . Beispielsweisesind die beidenEigenwerteØ Ù´á � immer reell und für ¬ìëí¶ negativ. Daherhandeltessich um denFixpunktê Ù´á � für ¬ïîK¶ um einenSattelpunktund sonstum einenstabilenKnoten(vgl. auchTabelleA.1).

In vektoriellerNotationkanndieseinfacherals��Ý� {KmFðÆ~�{ Ù �òñM~�{ó~6��� § { Ù � (A.37)

geschriebenwerden,wobei ðÆ~�{ Ù � die Jacobimatrixdes Differentialgleichungssystems(6.5) und(6.6) ist. Mit demLösungsansatz{ó~6���ßm { Ù ¤ { ��ô i�õm { Ù ¤ { ��ô+öÝ÷�ø i%ùúõ ô Ïüû Ç ø i%ùúõ (A.38)

erhältmanschließlichdasEigenwertproblemyã{ � mFðÆ~1{ Ù �òñª{ � w (A.39)

Die AnalysederbeidenEigenwerteyã� und y×� von (A.39) ermöglichteineBeurteilungderStabilitäteinesFixpunkts { Ù . Aus(A.38) ist zuersehen,daßeinnegativerRealteilderbei-denEigenwertedämpfendaufdieLösungwirkt undsomitzueinemstabilenFixpunkt,ein

172

Page 181: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A.2. DynamikdesBioreaktors

positiverRealteildagegenzu eineminstabilenFixpunkt führt. Ein von Null verschiedenerImaginärteilliefert nochzusätzlicheperiodischeAnteile. TabelleA.1 faßtdie verschiede-nenEigenschaftenvonFixpunktenzusammen[Hak82]. Zusätzlichist in dieserTabelledasdynamischeVerhaltenin derUmgebungeinesFixpunktsskizziert.

Wird der Formalismusder Stabilitätsanalyseauf die GleichungendesBioreaktorsange-wendet,soerhältmanfür dieJacobimatrixdenAusdruckðÆ~1{ Ù �.m�ý � �ÆÙ�ÐþÀÿ ø � è¢ ùþ �x¢� ~�� Ù� � § z ¤ � Ù� þ � ø � è¢ ùþ �x¢

� w (A.40)

EineweitereanalytischeAnalysevon(A.40) gestaltetsichaberalsschwierig,dadieGröße� Ù� über(A.34) nur implizit gegebenist. Daherwerdendie Eigenwertey Ù´á � �;y Ù�á � und y Ù´á �derdrei verschiedenenFixpunktevon (A.40) numerischin Abhängigkeit von z bestimmt.DasErgebnisdieserBerechnungzeigtAbbildungA.2, in derdieverschiedenenEigenwertein Abhängigkeit von z dargestelltsind.Mit Hilfe derTabelleA.1 kannausdenVerläufendieserKurven die Stabilität der FixpunktedesBioreaktorsabgelesenwerden.DieseEi-genschaftender verschiedenenFixpunktesind nochmalsin Tabelle6.1 aufgeführtund inAbbildung6.3zusammenmit derLagederFixpunkteim Phasenraumdargestellt.

173

Page 182: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

A. Anhang

174

Page 183: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Literatur verzeichnis

[ABK � 99] S. Albrecht, J. Busch,M. Kloppenburg, F. Metzeund P.Tavan. Generalizedradial basisfunction networks for classificationandnovelty detection:Self-organizationof optimalBayesiandecision.Neural Networks, 1999.submitted.

[Ado92] U. Adolphs. SelbstorganisierendePerzeptronstrukturenmit radialenBasis-funktionen.Diplomarbeit,Physik-Department,TU München,April 1992.

[Ait69] A.C. Aitken. DeterminantenundMatrizen. BibliographischesInstitut,1969.

[AJ96] E. Alpaydin undM. Jordan.Local linearperceptronsfor classification.IEEETransactionson Neural Networks, 7(3):788–792,1996.

[Alb71] J.S.Albus.A theoryof cerebellarfunction.MathematicalBiosciences, 10:25–61,1971.

[Alb95] S.Albrecht.Ein neuronalerKlassifikatorfür Phoneme.Diplomarbeit,Inst.fürMed.Optik, LMU München,1995.

[Alb97a] S. Albrecht. ProcessControl System1.4, Handbuch. Inst. für Med. Optik,LMU München,1997.

[Alb97b] S. Albrecht. Regelungder Rückstandsverbrennungmit demProcessControlSystem1.4. Inst. für Med.Optik, LMU München,1997.

[ALLR82] P. Agrawal, C. Lee, H. Lim und D. Ramkrishna. Theoreticalinvestigationsof dynamicbehavior of isothermalcontinuousstirredtankbiologicalreactors.ChemicalEngineeringScience, 37(3):453–462,1982.

[And97] J.A. Anderson.An Introductionto Neural Networks. MIT Press,Cambridge,MA, 1997.

[AW73] K.J. Astrom und B. Wittenmark. On self-tuning regulators. Automatica,9:185–199,73.

[Bäc96] T. Bäck. EvolutionaryAlgorithmsin TheoryandPractice. Oxford UniversityPress,1996.

175

Page 184: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Literaturverzeichnis

[Bar90] G. Barto. Connectionistlearningfor control:An overview. In W. Miller, R.S.SuttonundP.J.Werbos,Herausgeber, Neural Networksfor Control. MIT Press,Cambridge,MA, 1990.

[BF95] S.Billings undC. Fung.Recurrentradialbasisfunctionnetworksfor adaptivenoisecancellation.Neural Networks, 8(2):273–290,1995.

[BFG95] M. Bianchini,P. FrasconiundM. Gori. Leariningwithout local minimain ra-dial basisfunctionnetworks. IEEE Transactionson Neural Networks, 6:749–756,1995.

[Bir99] F. Birkhahn. Prozeßleittechnikim SpannungsfeldneuerStandardsundTech-nologien.AutomatisierungstechnischePraxis, 41(1):17–26,1999.

[Bis95] C.M. Bishop. Neural networksfor patternrecognition. ClarendonPress,Ox-ford, 1995.

[BS91] I.N. BronsteinundK.A. Semendjajew. Taschenbuch der Mathematik. VerlagHarri Deutsch,ThunundFrankfurt/Main,1991.

[BS93] T. BäckundH.-P. Schwefel.An overview of evolutionaryalgorithmsfor pa-rameteroptimization.EvolutionaryComputation, 1(1):1–23,1993.

[Bus97] J.Busch.NeuronaleNetzealsapproximativeBayesscheKlassifikatoren.Di-plomarbeit,Inst. für Med.Optik, LMU München,1997.

[CCG91] S. Chen,F. CowanundP. Grant. Orthogonalleastsquareslearningalgorithmfor radial basisfunction networks. IEEE Transactionson Neural Networks,2:302–309,1991.

[Cri89] F. Crick. Therecentexcitementaboutneuralnetworks. Nature, 337:129–132,1989.

[Cyb89] G. Cybenko. Approxiamtionby superpositionsof a sigmoidalfunction. Ma-thematicsof Control, Signals,andSystems, (2):303–314,1989.

[Czi89] H. Czichos.Hütte. Springer, Berlin, 1989.

[Der95] D. Dersch.EigenschaftenneuronalerVektorquantisierer undihreAnwendungin derSprachverarbeitung. VerlagHarri Deutsch,1995.

[DeS95] C.W. DeSilva. Intelligentcontrol. CRCPress,1995.

[DH73] R. O. DudaundP. E. Hart. PatternClassificationandSceneAnalysis. Wiley,New York, 1973.

[DL89] F. DörrscheidtundW. Latzel.GrundlagenderRegelungstechnik. B.G.TeubnerStuttgart,1989.

176

Page 185: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

[DLR77] A. P. Dempster, N. M. Laird und D. B. Rubin. Maximum likelihood fromincompletedatavia theEM algorithm. J. RoyalStatist.Soc.Ser. B, 39:1–38,1977.

[DLT95] R. Der, T. List und P. Tavan. VerbundprojektREMÜVÖ: Regelung vonChemiemüll-Verbrennungsöfen,1995.BMBF-Antrag.

[DP80] D. DuboisundH. Prade.FuzzySetsandSystems. AcademicPress,1980.

[DT94a] D. R.DerschundP. Tavan.Controlof annealingin minimal freeenergy vectorquantization.In Proceedingsof theIEEE InternationalConferenceon NeuralNetworks, Seiten698–703,1994.

[DT94b] D. R.DerschundP. Tavan.Loadbalancedvectorquantization.In Proceedingsof the InternationalConferenceon Artificial Neural Networks, Seiten1067–1070.Springer, Berlin, 1994.

[Ecc73] J.C.Eccles. The cerebellumascomputer. Journal of Physiology (London),229,1973.

[EIS67] J.C.Eccles,M. Ito undJ.Szentágothai.Thecerebellumasa neural maschine.Springer, Berlin, 1967.

[EKS94] A. Engel,P. König undW. Singer. GehirnundNervensystem, KapitelBildungrepräsentationalerZuständeim Gehirn,Seiten42–48. SpektrumderWissen-schaftVerlagsgesellschaft,1994.

[Fis86] G. Fischer. LineareAlgebra. Vieweg, 1986.

[Föl92] O. Föllinger. Regelungstechnik. Hüthig,1992.

[Fun89] K.-I. Funahashi.On the approximaterealizationof continuousmappingsbyneuralnetworks. Neural Networks, 2:183–192,1989.

[Gar97] C.W. Gardiner. Handbookof stochasticmethodsfor physics,chemistryandthenatural sciences. Springer, Berlin, 1997.

[Gee94] H.P. Geering.Regelungstechnik. Springer, Berlin, 1994.

[GJ79] M.R. Garey und D.S. Johnson.Computers and intracability: A guideto thetheoryof NP-completeness. 1979.

[Gol23] C. Golgi. Opera omnia. Mailand,1923.

[Gra95] A. Grauel.Fuzzy-Logik. BI Wissenschaftsverlag,Mannheim,1995.

[Gro74] S.Grossberg. Progressin TheoreticalBiology, 51(3),1974.

177

Page 186: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Literaturverzeichnis

[Gro95] V. Groll. SelektionundGewichtungselbstorganisierenderMerkmalsdetekto-ren zur Phonemerkennung. Diplomarbeit,Inst. für Med. Optik, LMU Mün-chen,1995.

[GS84] G.C. Goodwin und K.S. Sin. Adaptive filtering prediction and control.Prentice-Hall,1984.

[Hak82] H. Haken. Synergetik. Springer, Berlin, 1982.

[Hay92] I. Hayashi. Constructionof fuzzy inferencerulesby neuralnetwork drivenfuzzyreasoningwith learningfunctions.InternationalJournalof ApproximateReasoning, 6:241,1992.

[Heb49] D. Hebb. Organisationof Behavior. Wiley, New York, 1949.

[Her96] H. Herold. UNIX-Systemprogrammierung. Addison-Weseley, Bonn,1996.

[HH52] A.L. HodginundA.F. Huxley. A quantitativedescriptionof membranecurrentandits applicationtoconductionandexcitationin nerve.Journalof Physiology(London), (117):500–544,1952.

[Hin94] G.Hinton.GehirnundBewußsein, KapitelWieneuronaleNetzeausErfahrunglernen.SpektrumAkademischerVerlag,1994.

[HK92] K. Hornik undC.-M. Kuan. Convergenceanalysisof local featureextractionalgorithms.Neural Networks, 5:229–240,1992.

[HKRT94] C. Hillermeier, N. Kunstmann,B. Rabus und P. Tavan. Topologicalfeaturemapswith self-organizedlateralconnections:A population-codedone-layermodelof associativememory. Biological Cybernetics, 72:103–117,1994.

[Hop82] JohnJ.Hopfield.Neuralnetworksandphysicalsystemswith emergentcollec-tivecomputationalabilities.Proceedingsof theNationalAcademyof Sciences,79:2554–2558,5 1982.

[Hor91] Kurt Hornik. Approximationcapabilitiesof multilayerfeedforwardnetworks.Neural Networks, 4:251–257,1991.

[HSW89] K. Hornik, M. StinchcombeundH. White. Multilayer feedforwardnetworksareuniversalapproximators.Neural Networks, 2:359–366,1989.

[Hub90] D.H. Hubel. AugeundGehirn,NeurobiologiedesSehens. SpektrumderWis-senschaft,1990.

[JJ92] M. JordanundR.Jacobs.Hierarchiesof adaptiveexperts.In J.Moody, S.Han-sonundR. Lippmann,Herausgeber, Advancesin Neural InformationProces-singSystems, Nummer4, Seiten985–993.MorganKaufmann,1992.

178

Page 187: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

[JJ93a] R. JacobsundM. Jordan.Learningpiecewisecontrolstrategiesin a modularneuralnetwork architecture.IEEE TransactionsonSystems,Man,andCyber-netics, 23(2),1993.

[JJ93b] M. Jordan und R. Jacobs. Hierarchical mixtures of experts and theEM algorithm. A.I. Memo 1440, MassachusettsInstitute of Technology,ftp://publicatios.ai.mit.edu,1993.

[JJ94] M. JordanundR. Jacobs.Hierarchicalmixturesof expertsandtheEM algo-rithm. 6:181–214,1994.

[JJNH91] R. Jacobs,M. Jordan,S.J.Nowlan und G.E. Hinton. Adaptive mixturesoflocal experts.Neural Computation, 3:79–87,1991.

[Jou92] C.O.Jou.On themappingability of fuzzy inference-systems.In Proceedingsof InternationalJoint ConferenceonNeural Networks, Seiten708–713,1992.

[JX93] M. JordanundL. Xu. Convergenceresultsfor theEM approachto mixturesofexpertsarchitectures.A.I. Memo1458,MassachusettsInstituteof Technology,ftp://publicatios.ai.mit.edu,1993.

[Kal60] R.E. Kalman. A new approachto linear filtering and predictionproblems.Transacionof theASME– Journalof BasicEngineering, (3):35–45,1960.

[KGB86] S.R.Kelso,A.H. GanongundT.H. Brown. Hebbiansynapsesin hippocampus.Proceedingsof theNationalAcademyof Sciences, 83:5326–5330,1986.

[KL98] A. Krzyzak und T. Linder. Radial basisfunction networks and complexityregularizationin function learning. IEEE Transactionson Neural Networks,9:247–256,1998.

[Klo96] M. Kloppenburg. Lokale Hauptkomponentenanalysein hochdimensionalenMerkmalsräumen.Diplomarbeit,Inst. für Med.Optik, LMU München,1996.

[KLP � 94] S. Kim, M. Lee, S. Park, S.-Y. Lee und C. Park. Neural linearizingcontrolwith radialbasisfunctionnetwork for chemicalprocesses.In World Congresson Neural Networks-SanDiego. 1994 InternationalNeural NetworkSocietyAnnualMeeting, BandII, Seiten94–99,1994.

[Koh82] T. Kohonen.Self-organizedformationof topologicallycorrectfeaturemaps.Biological Cybernetics, 43:59–69,1982.

[Koh90] T. Kohonen.Theself-organizingmap.Proceedingsof theIEEE, 78(9):1464–1480,1990.

[Kos92] B. Kosko. Neural Networksand FuzzySystems:A DynamicalSystemsAp-proach to MachineIntelligence. Prentice-Hall,1992.

179

Page 188: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Literaturverzeichnis

[KS97] F. KursaweundH.-P. Schwefel.Optimierungmit evolutionärenAlgorithmen.AutomatisierungstechnischePraxis, 39(9):10–17,1997.

[KT97] M. Kloppenburg undP. Tavan. Deterministicannealingfor densityestimationby multivariatenormalmixtures.PhysicalReview E, 55:2089–2092,1997.

[Küh94] J. Kühnel. Datenrepräsentationdurch Prototypen:ErweiterteKonzepteundihre Anwendungin der Bild- und Spracherkennung. Dissertation,Inst. fürMed.Optik, LMU München,1994.

[LBD � 90] Y. LeCun,B. Boser, J.S.Denker, D. Henderson,R.W. Howard,W. HubbardundL.D. Jackel. Backpropagationappliedto handwrittenzipcoderecognition.Neural Computation, (1):541–551,1990.

[LBG80] Y. Linde,A. BuzoundR. M. Gray. An algorithmfor vectorquantizerdesign.IEEE Transactionson Communications, 28:84–95,1980.

[LG88] R. Lenk und W. Gellert, Herausgeber. Fachlexikon Physik. Verlag HarriDeutsch,1988.

[Llo82] S.P. Lloyd. Leastsquaresquantizationin PCM. IEEE Transactionson Infor-mationTheory, 28:129–137,1982.

[Lud89] G. Ludyk. TheoretischeRegelungstechnik I. Springer, Berlin, 1989.

[LVB � 93] M. Lades,J. C. Vorbrüggen,J. Buhmann,J. Lange,C. v. d. Malsburg, R. P.Würtz undW. Konen. Distortion invariantobjectrecognitionin thedynamiclink architecture.IEEE Transactionson Computers, 42(3):300–311,1993.

[Mac67] J. MacQueen. Somemethodsfor classificationandanalysisof multivariateobservations.In L.M. LeCamundJ.Neyman,Herausgeber, Proceedingof theFifth BerkelySymposiumonMathematics,Statistics,andProbability, Berkely,1967.U. CaliforniaPress.

[MAC� 95] M. Musavi, W. Ahmed,K. Chan,K. FabrisundD. Hummels.On thetrainingof radialbasisfunctionclassifiers.Neural Networks, 5:595–603,1995.

[Mal73] C.v.d. Malsburg. Self-organizationof orientationsensitivecells in striatecor-tex. Kybernetik, 14:85–100,1973.

[Mal81] C.v.d. Malsburg. The correlationtheoryof brain function. Technicalreport,MPI for BiophysicalChemistry, 1981. InternalReport81-2.

[Mar69] D. Marr. A theory of cerebellarcortex. Journal of Physiology (London),202:437–470,1969.

[Mas84] I. Masao.Thecerebellumandneural control. RavenPress,New York, 1984.

180

Page 189: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

[Mat99] TheMathWorks,Inc.,www.mathworks.com.MATLABNeural NetworkTool-box, 1999.

[MBS93] T. Martinetz,S. Berkovich und K. Schulten. Neural-gasnetwork for vectorquantizationandits applicationto time-seriesprediction. IEEE Transactionson Neural Networks, 4:558–569,1993.

[MD88] J.Moody undC. Darken. Learningwith localizedreceptivefields. In D. Tou-retzky, G. HintonundT. Sejnowski, Herausgeber, Proceedingsof theConnec-tionist ModelsSummerSchool, Seiten133–143,SanMateo,1988.(Pittsburg1988),MorganKaufmannPublishers.

[MD89] J.MoodyundC.Darken.Fastlearningin networksof locally-tunedprocessingunits. Neural Computation, 1:281–294,1989.

[Met98] F. Metze.IntegrationneuronalerMethodenzurPhonemerkennungausfließendgesprochenerSprache.Diplomarbeit,Inst. für Med. Optik, LMU München,1998.

[MG87] E.H. MamdaniundB.R. Gaines.Fuzzyreasoningandits applications. Aca-demicPress,London,1987.

[MGPS96] T. Martinetz,O. Gramckow, P. Protzelund G. Sörgel. NeuronaleNetzezurSteuerungvonWalzstraßen.AutomatisierungstechnischePraxis, 10,1996.

[MKB94] K.V. Mardia, J.T. Kent und J.M. Bibby. Multivariate Analysis. AcademicPress,London,9 edition,1994.

[MP43] W.S. McCulloch und W. Pitts. A logical calculusof the ideasimmanentinnervousactivity. Bulletinof MathematicalBiophysics, 5:115–133,1943.

[MP69] M. Minsky undS.Papert.Perceptrons. MIT Press,CambridgeMassachusetts,1969.

[MS91] T. MartinetzundK. Schulten.A ’neural-gas’network learnstopologies.Arti-ficial Neural Networks, Seiten397–402,1991.

[MS94] R. Murray-Smith.A LocalModelNetworkApproach to NonlinearModelling.Dissertation,Departmentof ComputerScience,Univ. of Strathclyde,1994.

[MSE97] R. Murray-SmithundT. A. Johansen(Eds.),Herausgeber. TaylorandFrancis,London,1997.

[MSW92] T. Miller, R.SuttonundP. Werbos,Herausgeber. Neural Networksfor Control.MIT Press,3 edition,1992.

181

Page 190: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Literaturverzeichnis

[NK95] D. NauckundR.Kruse.NEFCLASS– aneuro-fuzzyapproachfor theclassifi-cationof data.In Proceedingsof theACM SymposiumonAppliedComputing.ACM Press,1995.

[NM65] J.NelderundR. Mead.ComputerJournal, 7:308–313,1965.

[PG89] T. PoggioundF. Girosi. A theoremof networks for approximationandlear-ning. A. I. Memo1140,MassachusettsInstituteof Technology, 1989.

[PG90a] T. PoggioundF. Girosi. Networks for approximationandlearning. Procee-dingsof theIEEE, 78:978–982,1990.

[PG90b] T. PoggioundF. Girosi. Regularizationalgorithmsfor learningthatareequi-valentto multilayernetworks. Science, 247:978–982,1990.

[PJ93] M. PottmanundP. Jörgl. Radialbasisfunctionnetworksfor nonlinearprocesscontrol - an internalmodelcontrol approach.Elektrotechnik und Informati-onstechnik (e&i), 110(7/8):336–341,1993.

[Pow87] M.J.D.Powell. Radialbasisfunctionsfor multivariableinterpolation:areview.In J.C. Masonund M.H. Cox, Herausgeber, Algorithmsfor Approximation,Band2, Seiten143–167.ClarendonPress,Oxford,1987.

[PTVF92] W. Press,S. Teukolsky, W. VetterlingundB. Flannery. NumericalRecipesinC. CambridgeUniversityPress,1992.

[RGF90] K. Rose,E. Gurewitz undG. C. Fox. Statisticalmechanicsandphasetransiti-onsin clustering.PhysicalReview Letters, 65:945–948,1990.

[RGF93] K. Rose,E.Gurewitz undG.C.Fox. Constrainedclusteringasanoptimizationmethod.Dept.of Electr. andComp.Eng.,Univ. of California,SantaBarbara,CA 93106,1993.

[RHW86] D.E.Rumelhart,G.E.HintonundR.J.Williams. Learninginternalrepresenta-tionsby errorpropagation.In D.E.RumelhartundJ.L.McClelland,Herausge-ber, Parallel DistributedProcessing, Band1, Kapitel 8, Seiten318–362.MITPress,Cambridge,1986.

[Rip96] B.D. Ripley. PatternRecognitionandNeural Networks. CambridgeUniversityPress,1996.

[RMS92] H. Ritter, T. Martinetz und K. Schulten. Neural Computationand Self-organizingMaps. Addison-Wesley, New York, 1992.

[Roj93] R. Rojas.Theorieder neuronalenNetze. Springer, Berlin, 1993.

[Ros58] F. Rosenblatt.Theperceptron:Theprobabilisticsmodelfor informationstro-ageandorganizationin thebrain. Psychological Review, 65:386–408,1958.

182

Page 191: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

[RS90] J. Rubner und K. Schulten. Developmentof feature detectorsby self-organization.Biological Cybernetics, 62:193–199,1990.

[RT89] J. Rubnerund P. Tavan. A self-organizingnetwork for principal-componentanalysis.EurophysicsLetters, 10:693–698,1989.

[Rub89] J. Rubner. Modelle zur Farberkennung. Dissertation,Fakultät für Physik,TechnischeUniversitätMünchen,1989.

[Sch86] P. Schefe.KünstlicheIntelligenz– Überblick undGrundlagen. Bibliographi-schesInstitut,Mannheim,1986.

[Sch96] J.S.Schwegler. Der Mensch – AnatomieundPhysiologie. Thieme,1996.

[Sem85] Sempé.Radfahrer. Diogenes,1985.

[Son97] M. Sonner. SelbstorganisationparallelerExpertenzur IdentifikationundRe-präsentationwechselnderSystemzustände.Diplomarbeit,Inst.für Med.Optik,LMU München,1997.

[Sor70] H.W. Sorenson.Least-squaresestimation:from gaussto kalman. IEEE Spec-trum, 7(7):63–68,1970.

[SR87] T.J.Sejnowski undC.R.Rosenberg. Parallelnetworksthatlearnto pronounceEnglishtext. Complex Systems, 1:145–168,1987.

[ST85] R.f. Schmidtund G. Thews. Physiologie desMenschen. Springer, Berlin,1985.

[Ste88] C.F. Stevens.GehirnundNervensystem, KapitelDie Nervenzelle,Seiten3–31.SpektrumderWissenschaftVerlagsgesellschaft,1988.

[Sug88] M. Sugeno.FuzzyControl. NikkanKogyo,Tokyo, 1988.

[TCA71] Y. Takahashi,C. Chanund D. Auslander. Parametereinstellungbei linearenDDC-algorithmen.Regelungstechnik, 19:237–244,1971.

[TGK90] P. Tavan,H. GrubmüllerundH. Kühnel. Self-organizationof assoziativeme-mory and patternclassification:Recurrentsignal processingon topologicalfeaturemaps.Biological Cybernetics, 64:95–105,1990.

[Tho90] R.F. Thompson.DasGehirn. SpektrumderWissenschaftVerlagsgesellschaft,1990.

[Uni99] UniversitätTübingen,www-ra.informatik.uni-tuebingen.de/SNNS.Stuttgar-ter Neural NetworkSimulator, 1999.

[WCG97] Wacker-ChemieGmbH. Geschäftsbericht.Broschüre,1997.

183

Page 192: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Literaturverzeichnis

[WCG99] Wacker-ChemieGmbH. Bilder, DatenundFakten.Broschüre,1999.

[Wer74] P. Werbos.BeyondRegression:New Tools for PredictionandAnalysisin theBehavioral Sciences. Dissertation,HarvardUniversity, 1974.

[WH60] B. Widrow undM.E. Hoff. Adaptiveswitchingcircuits.In 1960IREWESCONConventionRecord, Band4, Seiten96–104.IRE, New York, 1960.

[Wie63] N. Wiener. Kybernetik. Econ-Verlag,Düsseldorf,1963.

[Wil98] A. Wilden. Mustererkennung,Restmengenklassifikationund derenAnwen-dungin derSpracherkennung.Diplomarbeit,Inst.für Med.Optik, LMU Mün-chen,1998.

[WMS91] J. Walter, T. Martinetzund K. Schulten. Industrialrobot learnsvisuo-motorcoordinationby meansof ’neural-gas’network. Artificial Neural Networks,Seiten357–364,1991.

[WS64] B. Widrow undF.W. Smith.Pattern-recognizingcontrolsystems.In ComputerandInformationSciences(COINS)Proceedings. Spartan,Washington,1964.

[WS85] B. Widrow undS.D.Stearns.AdaptiveSignalProcessing. Prentice-Hall,NewYork, 1985.

[yC52] Ramóny Cajal. Histologiedu SystèmeNerveuxdel’HommeetdesVertebres.Aus demSpanischenübersetztvon L. Azoulay, Madrid,1952.

[YC98] Z. YangundS.Chen.Robustmaximumlikelihoodtrainingof heteroscedasticprobabiliticneuralnetworks. Neural Networks, 11:739–747,1998.

[YSU94] A. L. Yuille, P. StolorzundJ.Utans.Statisticalphysics,mixturesof distribu-tions,andtheEM algorithm.Neural Computation, 6:334–340,1994.

[Zad73] L.A. Zadeh. Outline of a new approachto the analysisof complex systemsanddecisionprocesses.IEEETransactionsonSystems,Man,andCybernetics,3(1):28–44,1973.

[Zim93] H.-J.Zimmermann.Fuzzy-Technologien. VDI-Velag,1993.

184

Page 193: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Lebenslauf

Name: SebastianAlbrechtGeburtstag: 25.April 1966Geburtsort: Hamburg

Schule

8/73 – 12/75 Grundschulein Kristinehamn/Schweden1/76 – 7/78 Grundschulein München9/78 – 6/86 Gymnasiumin Haar/München

Studium und Beruf

11/88– 12/94 StudiumderPhysikanderTechnischenUniversitätMünchen2/95 Diplom im FachPhysik2/95 – 9/99 wissenschaftlicherMitarbeiteramInstitut für MedizinischeOptikseit1/98 PromotionanderLudwig-Maximilians-UniversitätMünchen

Page 194: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.
Page 195: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.

Danke !

DieseArbeit verdanktihr Entstehender engagiertenUnterstützungdurchProf. Dr. PaulTavan,demLeiter derTheoriegruppeamInstitut für MedizinischeOptik. SeinesteteDis-kussionsbereitschaftund seinedirekte Kritik sind dieserArbeit sehrzugutegekommen.Für diese– zeitweisesehranstrengende– abersehrfruchtbareZusammenarbeitmöchteich ihm sehrdanken.BesondererDankgebührtihm auchfür dashervorragendausgestatte-te ArbeitsumfeldundseinstetesEngagementfür meinefinanzielleAbsicherung.

Paul Tavan stellte1995denKontaktmit der Wacker-ChemieGmbH her. Die darausent-standeneZusammenarbeitliefertefür dievorliegendeArbeit wesentlicheImpulse.Als ent-scheidenderMotor dieserZusammenarbeiterwiessichThomasList. ErstseineOffenheitund Experimentierfreudemachtedie – manchmalsehrspannende1 – Realisierungder indieserArbeit beschriebenenVerfahrenin die Praxismöglich.Die “Wacker-Tage”unddievielenDiskussionenmit ihm werdeich in besterErinnerungbehalten.

Der graueTheoretikeralltagwurdemir durchdie vielen Kollegen,mit denenich in denletztenJahrenzusammenarbeitendurfte,erheblicherleichtert.Dieswaren,ohneAnspruchauf Vollständigkeit, namentlich:Erik Baigar. JanBusch,Dominik Dersch,KlausDöhring,BerhardEgwolf, MarkusEichinger, BasamElia, VolkerGroll, HelmutGrubmüller, IngmarHartl, Helmut Heller, BertholdHeymann,Martin Kloppenburg, Niels Kunstmann,HansKühnel,Alain Laederach,GeraldMathias,FlorianMetze,ChristophNiedermeier, MarcoNonella,Brita Schulze-Fiehn,MarcusSonner, Paul Strodel,AndreasWilden und Alex-anderWörl. Geradeim letztenJahrhabeich die vielen Gesprächemit Paul Strodelunddie – auchsportliche– Gewitztheit von AlexanderWörl alssehrangenehmunderholsamempfunden.

Besondersin derSchlußphasewar für michdie ideelleundpraktischeUnterstützungdurchBasamElia, FlorianWiest,KarenMeinberg undmeineGeschwisterChristoph,DorotheeundThomassehrwichtig. Dafürbin ich ihnensehrdankbar. MeineFreundinBettinaGais-serhat esimmer wiederverstanden,mich von einergewissenGeistesabwesenheitzu be-freien,undhatmich unermüdlichausjedemnochsotiefenMotivationslochherausgeholt.Ohneihre Hilfe könnteich dieseZeilenletztendlichnicht schreiben.

Der größteDankgilt jedochmeinenEltern.Ihre Unterstützungundihr VertrauenmachtenerstmeinStudiumunddamitdieseArbeit möglich.

1 SoführtederStartdesvon unsentwickeltenRegelunssystemsnichtnureinmalzuwerksweitenLautspre-cherdurchsagenüberdenAusfall großerTeile derProduktion

Page 196: Multivariate GRBF-Netzwerke und Systeme lokaler Experten ... · Sebastian Albrecht aus Hamburg 27. September 1999. Erster Gutachter: Prof. Dr. P. Tavan Zweiter Gutachter: Prof. Dr.