Sprachen und Automaten Einsatz der Software AtoCC (Kurs: 07C404101) Fortbildungsveranstaltung des...

Post on 06-Apr-2015

108 views 2 download

Transcript of Sprachen und Automaten Einsatz der Software AtoCC (Kurs: 07C404101) Fortbildungsveranstaltung des...

Sprachen und AutomatenEinsatz der Software AtoCC

(Kurs: 07C404101)

Fortbildungsveranstaltung des Staatlichen Schulamts Cottbus

Christian Wagenknecht, Michael Hielscher Cottbus, am 22.01.08

Das Wichtigste zuerst!

Vielen Dank an

Herrn Thomas Lösler.

2

3

Veranstaltungsort: Oberstufenzentrum I, 03044 Cottbus, Sielower Str. 10

TI-Inhalte in der Schulinformatik:Probleme und Chancen

Blick in die Lehrpläne verschiedener Bundesländer

4

Lehrplan Ziele und Inhalte

5

Nr.  Bundesland   Lehrplaninhalt (Lernbereich) Pflichtbestandteil

1 Baden-Württemberg Bereich der theoretischen Informatik (Automaten, Berechenbarkeit)

nein

2 Bayern  3. Formale Sprachen (noch Entwurf)  3 Berlin  4.4 Sprachen und Automaten ja (auch GK)4 Brandenburg 4.4 Sprachen und Automaten Ja (auch GK)

5 Bremen Grundlagen der Theoretischen Informatik (Automaten, formale Sprachen)

nein

6 Hamburg Formale Sprachen, endliche Automaten, Keller-automaten, Scanner, Parser, Ableitungsbaum

nein 

7 Hessen Formale Sprachen und Grammatiken Automaten, Fakultativ: Übersetzerbau

ja (auch GK)

8 Mecklenburg-Vorpommern 4.4 Sprachen und Automaten ja (auch GK) 

9 Niedersachsen Eigenschaften endlicher AutomatenAspekte formaler Sprachen

nein 

10 Nordrhein-Westfalen Endliche Automaten und formale Sprachen nein

11 Rheinland-Pfalz Formale Sprachen und Automaten zur Sprachbeschreibung und Spracherkennung  

ja (nur LK)

12 Saarland Automaten und formale Sprachen Fakultativ: Übersetzerbau

ja (auch GK)

13 Sachsen  8 A: Formale Sprachen, Kellerautomat, Akzeptor nein 14 Sachsen-Anhalt Endliche Automaten und formale Sprachen nein 15 Schleswig-Holstein Automaten als mögliches Themengebiet nein16 Thüringen Themenbereich 7.3: Einblick in formale Sprachen nein 

In den meisten Bundesländern sind ausgewählte Inhalte der TI Lehrplaninhalt der Sek. II:

TI-Inhalte in der Schulinformatik:Probleme und Chancen

Blick in die Lehrpläne verschiedener Bundesländer Konkrete Inhalte

6

Lehrplanauszug Hessen

Verbindliche Unterrichtsinhalte/Aufgaben:

Formale Sprachen und Grammatiken

reguläre und kontextfreie Grammatiken und Sprachen

Anwendung mit Syntaxdiagrammen

Chomsky-Hierarchie (LK)

kontextsensitive Sprachen (LK)

Endliche Automaten Zustand, Zustandsübergang, Zustandsdiagramm Zeichen, Akzeptor

Simulation realer Automaten (z. B. Getränkeautomat)

Anwendung endlicher Automaten (z. B. Scanner)

deterministische und nicht-deterministische Automaten (LK)

reguläre Ausdrücke (LK)

Mensch-Maschine-Kommunikation (LK)

Kellerautomaten

(LK, GK fakultativ)

Automat mit Kellerspeicher

kontextfreie Grammatiken

Klammerausdrücke, Rekursion Turing- oder Registermaschine

(LK, GK fakultativ)

Turing- oder registerberechenbar

Churchsche These

Computer als universelle symbolverarbeitende Maschine

Verhältnis Mensch-Maschine

Fakultative Unterrichtsinhalte/Aufgaben:

Übersetzerbau Scanner, Parser, Interpreter und Compiler

z. B. Steuersprache für Roboter, LOGO, Plotter oder miniPASCAL

7

TI an Hochschulen – NICHTS für Schulen8

Typischerweise: Begrifflich orientiert, deduktiv

• Zeichen, Alphabet, Wort, Verkettung, Wortmenge• Sprache, formale Grammatik, Ableitung• reguläre Sprachen: Chomsky-Typ-3-Grammatik, reguläre Ausdrücke, DEA, NEA, L(DEA)=L(NEA), Minimalautomat, diverse Sätze (Nerode/Myhill, Pumping Lemma, ...), ...• kontextfreie Sprachen: Typ-2-Gr., DKA, NKA, L(DKA)<L(NKA), Transformation G >>> NKA (1 Zustand), diverse Sätze, ...• ksS / unbeschr. Sprachen: Typ-1- und Typ-0-Grammatiken, Turing-Maschine (beschränkt/unbeschränkt)

* Theorie der formalen Sprachen* Automatentheorie* Berechenbarkeitstheorie* Komplexitätstheorie

Lernbereich 8 A (Sächs. Lehrplan)9

GK Informatik f. Jahrgangsstufen 11 und 12, wird ab Schuljahr 2008/09 wirksam

endlicher Automat

Informatik-Lehrplan: S II, Brandenburg

10

1. Auflage: 2006, gültig für Qualifizierungsphase ab Schuljahr 2008/9

gemeinsames Kerncurriculum mit Berlin und MeckPomm= Basis für schulinterne Lehrpläne

Kompetenzerwerb im Themenfeld (Auszug)

Die Schülerinnen und Schüler verstehen die zur Problemlösung eingesetzten Programmiersprachen als spezielle formale Sprachen, die es ihnen erlauben, Probleme mit den Methoden der Informatik zu lösen.

Hoffentlich nicht!!!

Durch die Einführung des Automatenmodells vertiefen sie ihr Verständnis von Informatiksystemen.

Naja, die LehrerInnen werden's schon machen!

11

Abbildung der Kompetenzbereiche auf Kurshalbjahre

12

Klassen 11 und 12 (Qualifikationsphase): 4 Kurshalbjahre3-5 Stunden pro Kurshalbjahr

TI-Inhalte in der Schulinformatik:Probleme und Chancen

Blick in die Lehrpläne verschiedener Bundesländer Konkrete Inhalte:

totale Überfrachtung mit Fachinhalten TI-Kompetenz der LP-Autoren? (Fachsystematik,

Formulierung von Wunschvorstellungen, ...)

13

Gefühlssituation der Lehrenden

"TI wollte ich nie machen." "TI hat mich nie richtig interessiert." "TI war mir immer zu theoretisch und abstrakt." "Die TI-Dozenten waren suspekt – TI im

postgradualen Studium erinnere ich mit Grausen."

"Die TI-Inhalten helfen mir nicht, wenn das Schulnetzwerk mal wieder zusammenbricht."

...

14

TI-Inhalte in der Schulinformatik:Probleme und Chancen

Zeit-Problem, Inhalte-Problem (Zusammenfassung von oben)

Manche Lehrende mögen es nicht. – Motivationsproblem

Manche Lehrende können es nicht richtig. - Qualifikationsproblem

SchülerInnen/Studierende fragen gelegentlich: "Wann geht es denn nun endlich richtig los mit der Informatik? Ach so, das ist es schon." - Vermittlungsproblem

"Ergebnis": Wenn möglich, TI weglassen. FALSCH!!!

Chance: Informatik als Wissenschaft repräsentieren!

(wie Mathematik und Naturwissenschaften)

Sonst: Studienabbrecher als konkrete Folge!!!

15

Didaktische Software für TI

in Schulen: diverse Simulationstools oder Lernumgebungen, wie Kara; meist von enthusiastischen LehrerInnen entwickelt

in Hochschulen: Systeme für die Lehre, wie JFLAP

LEX und YACC für die Hand des Ingenieurs

16

Simulationstool – Bildungsserver HessenSimulationstool – Bildungsserver Hessen

Defizite existierender Systeme

Systeme bzw. separate Module thematisieren Einzelaspekte

nicht definitionskonform und/oder nicht an Lernprozessen orientiert, sondern die Prozess-Simulation dominiert

Suggerieren abstrakten Automat als physikalisches Objekt

Systeme können nur simple Beispiele bearbeiten – zu große Distanz zur Praxis

17

Lernumgebungen (Quelle: LP Brandenburg)

"Lernumgebungen werden so gestaltet, dass sie das selbst gesteuerte

Lernen von Schülerinnen und Schülern fördern. Sie unterstützen durch

den Einsatz von Medien sowie zeitgemäßer Kommunikations- und

Informationstechnik sowohl die Differenzierung individueller

Lernprozesse als auch das kooperative Lernen. Dies trifft sowohl auf

die Nutzung von multimedialen und netzbasierten Lernarrangements

als auch auf den produktiven Umgang mit Medien zu.

Moderne Lernumgebungen ermöglichen es den Lernenden, eigene

Lern- und Arbeitsziele zu formulieren und zu verwirklichen sowie

eigene Arbeitsergebnisse auszuwerten und zu nutzen."

18

Lern- und Arbeitsumgebung für TI: Anforderungen (1/2)

ganzheitlicher Ansatz: Praxis Theorie Praxis, s. Lehrplanforderung

einheitliche Bedienung der Module (für Automatentheorie und Sprachübersetzer)

Handlungsorientierung auf hohen Abstraktionsniveaus (wenig technischer Ballast auch für anspruchsvolle Aufgabenstellungen)

19

AtoCC - Vom abstrakten Automaten zur automatisierten Entwicklung von Sprachübersetzern

Typische Kopplung von Automatentheorie mit Aspekten des Compilerbaus (s. Lehrpläne)

Wichtige didaktische Entscheidung: Zielsprache sollte nicht Maschinencode sein!!

ein enger Bezug der Herstellung eines Sprachübersetzers zu den theoretischen Grundlagen erfordert hohe Abstraktion

Modellierung des Übersetzungsprozesses mit "ausführbaren" T-Diagrammen

21

Unsere Ziele22

1. Belastbare Motivation für TI-Inhalte durch herausfordernde

Start-Fragestellung mit Praxisrelevanz und Modellierung

eines Zielsystems (Sprachübersetzer) am Anfang

2. Vermittlungs-/Anwendungszyklen für TI-Wissen mit Projekt-

bezug (Praxis nicht als "Anhängsel" zur Theorie)

3. Komplexe Anwendung von TI-Inhalten auf sehr hohem

Abstraktionsniveau (automatisierte Compiler-Generierung),

Rückkehr zur und Konkretisierung der Modellierungsebene

Behauptung: Dabei ist AtoCC ein unverzichtbares Hilfsmittel.

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Installationshinweise: Installieren Sie .NET Framework 2.0 oder höher

(unter www.atocc.de Fortbildung Software) Installieren Sie GhostScript 8.60 Installieren Sie „AtoCC Setup.exe“ Wenn nicht vorhanden einen PDF Reader (Adobe

Reader oder Foxit Reader) installieren. (Wenn noch nicht vorhanden MSXML 4 oder 6

installieren. Downloadseite wird von AutoEdit automatisch beim ersten Start geöffnet, wenn dies fehlen sollte.)

23

Beispiel: ZR – eine Sprache für einen Zeichenroboter

24

Praxisnahe (echte!) Aufgabe mit grafischer Ausgabe:Entwickeln Sie einen Compiler, der die Sprache ZR (ZeichenRoboter) in PDF übersetzt. (Schülergerecht formulieren!)

Eingabewort (in ZR): WH 36 [WH 4 [VW 100 RE 90] RE 10]

Ausgabewort (in PS):%!PS-Adobe-2.0/orient 0 def /xpos 0 def /ypos 0 def 0 0 0 setrgbcolor/goto { /ypos exch def /xpos exch def xpos ypos moveto} def/turn { /orient exch orient add def} def /draw { /len exch def newpath xpos ypos moveto /xpos xpos orient sin len mul add def /ypos ypos orient cos len mul add def xpos ypos lineto stroke } def 300 400 goto100 draw 90 turn 100 … turn 10 turn

Beispiel: ZR – eine Sprache für einen Zeichenroboter

25

Weiterer Ablauf:

1.Modellierung der Problemlösung mit TDiag

2.Syntax-Definition von ZR: formale Grammatik, Ableitungsbaum mit kfGEdit

3.Parser Akzeptoren Automatenmodelle (EA, KA) mit AutoEdit

4.Arbeitsteilung: Scanner, Parser

5.Zielsprachenbezug automatisierte Compiler-Entwicklung mit VCC

6.Teilsysteme werden in Modellierung eingebracht (TDiag)

7.Ergebnis: lauffähiger (nichttrivialer) Übersetzer, den man benutzen kann!

TDiag, kfGEdit, AutoEdit, und VCC sind Bestandteile von AtoCC.

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Wir wollen zunächst den Compilerprozess entwerfen. (Modellierung)

Verwendung von T-Diagrammen: T-Diagramme bestehen aus 4 Bausteintypen. Compilerbaustein, Programmbaustein,

Interpreterbaustein und Ein/Ausgabe-Baustein

26

Compiler Programm Interpreter Ein/Ausgabe an Programmbaustein

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Entwerfen eines T-Diagramms für Zeichenroboter Compiler:

ZR2PS werden wir entwickeln, PS2PDF und Acrobat Reader wird vom System bereitgestellt.

27

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Nachdem wir nun wissen, wie unser Compiler später eingesetzt werden soll, wenden wir uns der Entwicklung des Compilers zu.

Sprache näher betrachten Terminale und Nichterminale festlegen formale Grammatik definieren Ableitungsbäume erzeugen

28

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Betrachten wir die Sprache ZR und versuchen wir ihren Aufbau zu beschreiben: VW 50 RE 270 WH 2 [VW 100] WH 4 [VW 100 RE 100] WH 36 [WH 4 [VW 100 RE 90] RE 10]

Magnetkarten an der Tafel

29

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Beschreiben wir den Baustein Zahl genauer: 0 soll keine Zahl in ZR sein, da VW 0 oder RE 0

keine Veränderung herbeiführen. Vorangestellte Nullen wie 0815 wollen wir auch

nicht erlauben. Ergänzen wir unsere Grammatik um:

Zahl ErsteZiffer Ziffern

Ziffern Ziffer Ziffern | Ziffer 0 | 1 | ... | 9

ErsteZiffer 1 | 2 | ... | 9

30

Beispiel: ZR – eine Sprache für einen Zeichenroboter

31

Beispiel: ZR – eine Sprache für einen Zeichenroboter

32

Beispiel: ZR – eine Sprache für einen Zeichenroboter

33

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Programm Anweisungen

Anweisungen Anweisung Anweisungen | EPSILON

Anweisung VW Zahl

| RE Zahl

| WH Zahl [ Anweisungen ]

| FARBE Farbwert

| STIFT Zahl

Farbwert rot | blau | gruen | gelb | schwarz

Zahl ErsteZiffer Ziffern

Ziffern Ziffer Ziffern | EPSILON

Ziffer 0 | 1 | ... | 9

ErsteZiffer 1 | 2 | ... | 9

34

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Automaten als Akzeptoren für Sprachen Akzeptor prüft, ob ein Wort zur Sprache gehört oder

nicht. (Keine Ausgabe Wort akzeptiert) (Thema: Programmiersprachen und Syntaxfehler)

Wir nehmen zwei Ausschnitte aus den Produktionen:Zahl ErsteZiffer Ziffern

Ziffern Ziffer Ziffern | EPSILON

Ziffer 0 | 1 | ... | 9

ErsteZiffer 1 | 2 | ... | 9

Anweisungen Anweisung Anweisungen | EPSILON

Anweisung VW Zahl | WH Zahl [ Anweisungen ]

35

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Kleiner Sprachausschnitt:Zahl ErsteZiffer Ziffern

Ziffern Ziffer Ziffern | EPSILON

Ziffer 0 | 1 | ... | 9

ErsteZiffer 1 | 2 | ... | 9

36

Beispiel: ZR – eine Sprache für einen Zeichenroboter

37

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Anweisungen Anweisung Anweisungen | EPSILON

Anweisung VW n

| WH n [ Anweisungen ]

38

Beispiel: ZR – eine Sprache für einen Zeichenroboter

39

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Aus der Kombination von kleinen endlichen Automaten und einem Kellerautomat wird später unser Compiler bestehen.

Für DEA-Sprachen können auch reguläre Ausdrücke verwendet werden: Beispiel Zahl: [1-9][0-9]*

40

Arbeitsweise des Compilers

41

Arbeitsweise eines Scanners

42

Ein- und Ausgabe des Scanners:

Viele kleine endliche Automaten entscheiden welche Schlüsselworte im Quelltext stehen.

Quelltext besteht aus Zeichen und der Rechner weiß noch nicht wie diese zusammengehören.

Token als Paare[Tokenname, Lexem] z.B.: [Wiederhole, "WH"][Zahl, "12"][KlammerAuf, "["]

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Programm Anweisungen

Anweisungen Anweisung Anweisungen | EPSILON

Anweisung VW Zahl

| RE Zahl

| WH Zahl [ Anweisungen ]

| FARBE Farbwert

| STIFT Zahl

Farbwert : rot|blau|gruen|gelb|schwarz

Zahl : [1-9][0-9]*

43

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Endliche Automaten (RegExp) für alle unsere Terminale:

KlammerAuf : \[

KlammerZu : \]

Wiederhole : WH

Rechts : RE

Vor : VW

Stift : STIFT

Farbe : FARBE

Farbwert : rot|blau|gruen|gelb|schwarz

Zahl : [1-9][0-9]*

44

Beispiel: ZR – eine Sprache für einen Zeichenroboter

45

Beispiel: ZR – eine Sprache für einen Zeichenroboter

46

per Hand ergänzen

Arbeitsweise des Parsers

47

Ein- und Ausgabe des Parsers:

#false erfolgt meinst durch Ausgabe von „Syntax Error“

Grammatik von ZR in Form eines Kellerautomaten Prüft ob Wort zur Sprache gehört

Beinhaltet die aufgetretenen Terminale der Grammatik des Parsers

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Entwicklung des ZR2PS Compilers in VCC Übertragen der EA in die Scannerdefinition Übertragen der vereinfachten Grammatik in die

Parserdefinition Entwickeln sogenannter S-Attribute für die

Zielcodegenerierung

48

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Zielcodegenerierung: Der Compiler soll PostScript erstellen nicht nur

#true und #false ausgeben. Entwicklung von S-Attributen S-Attribute sind kleine Quelltextfragmente die für

jede rechte Regelseite definiert werden können. Wird eine Regel angewendet wird auch das

entsprechende Quellcodefragment ausgeführt.

49

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Die Platzhalter $1 bis $n: In S-Attributen verwenden wir Platzhalter für die

Ergebnisse der einzelnen Regelbausteine.

50

$1$1 $2$2

VWVW 2020

Eingabewort sei: VW 20 RE 10Eingabewort sei: VW 20 RE 10Eingabewort sei: VW 20 RE 10Eingabewort sei: VW 20 RE 10

Von einem Token ist $n immer des Lexem des Tokens !

Von einem Nichtterminal ist $n immer das Ergebnis $$ des Nichtterminals !

Von einem Token ist $n immer des Lexem des Tokens !

Von einem Nichtterminal ist $n immer das Ergebnis $$ des Nichtterminals !

$$ = "20 draw "$$ = "20 draw "

Von einem Token ist $n immer des Lexem des Tokens !

Von einem Nichtterminal ist $n immer das Ergebnis $$ des Nichtterminals !

Von einem Token ist $n immer des Lexem des Tokens !

Von einem Nichtterminal ist $n immer das Ergebnis $$ des Nichtterminals !

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Die Platzhalter $1 bis $n: In S-Attributen verwenden wir Platzhalter für die

Ergebnisse der einzelnen Regelbausteine.

51

$1$1 $2$2

WHWH 44

Eingabewort sei: WH 4 [ VW 20 ]Eingabewort sei: WH 4 [ VW 20 ]

$3$3

[[

$5$5

]]

$4$4

20 draw20 draw

$$ = "20 draw 20 draw 20 draw 20 draw "$$ = "20 draw 20 draw 20 draw 20 draw " Alle $n und $$ sind vom Datentyp String !!!

Alle $n und $$ sind vom Datentyp String !!!

Arbeitsweise des Compilers

52

Programm Anweisungen Anweisungen Anweisung Anweisungen | Anweisung VW Zahl | RE Zahl | WH Zahl [ Anweisungen ] | FARBE Farbwert | STIFT Zahl

Programm Anweisungen Anweisungen Anweisung Anweisungen | Anweisung VW Zahl | RE Zahl | WH Zahl [ Anweisungen ] | FARBE Farbwert | STIFT Zahl

WH 36 [WH 4 [VW 100 RE 90] RE 10]WH 36 [WH 4 [VW 100 RE 90] RE 10]

[Wiederhole, "WH"][Zahl, "12"][KlammerAuf" "["]…

[Wiederhole, "WH"][Zahl, "12"][KlammerAuf" "["]…

%!PS-Adobe-2.0/orient 0 def /xpos 0 def /ypos 0 def 0 0 0 setrgbcolor/goto { /ypos exch def /xpos exch

def xpos ypos moveto} def…

%!PS-Adobe-2.0/orient 0 def /xpos 0 def /ypos 0 def 0 0 0 setrgbcolor/goto { /ypos exch def /xpos exch

def xpos ypos moveto} def…

Beispiel: ZR – eine Sprache für einen Zeichenroboter

Anwenden des Compilers auf der Modellierungsebene der T-Diagramme in TDiag.

53