Beschreibungssprachen für Texte - ki.informatik.uni...

5
1 Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 1 Einführung in die Informatik für Hörer aller Fakultäten Prof. Frank Puppe (FP) Prof. Jürgen Wolff von Gudenberg (JWG) Prof. Rainer Kolla (RK) Prof. Dietmar Seipel (DS) Vorlesung (Di & Do 15:15-16:45 im Zuse-Hörsaal): FP: Form und Darstellung von Informationen (ca. 6 DS) JWG: Grundlagen der Programmierung (ca. 9 DS) RK: Aufbau von Rechnern und Betriebssystemen (ca. 5 DS) DS: Datenbanken (ca. 5 DS) FP: Tabellenkalkulation und deskriptive Statistik (ca. 1 DS) Übungen: Üben mit Office-Tools, Java, Betriebssystemen usw. Literatur (spezielle Literatur auch in den Vorlesungsabschnitten) Gumm / Sommer: Einführung in die Informatik, Oldenbourg. Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 2 Übersicht über 1. Vorlesungsabschnitt Form und Darstellung von Informationen Frank Puppe 1. Computermetaphern 2. Beschreibungssprachen für Texte 3. Grammatiken zur Beschreibung syntaktischer Strukturen 4. Beispiel einer Textbeschreibungssprache: HTML 5. Übersicht über Textsysteme 6. Schablonen und Generierung von Texten (z.B. Serienbriefe) 7. Nützliche Hilfsmittel in Textsystemen 8. Das World Wide Web als Hyperdokument 9. Funktionsweise von Suchmaschinen 10. XML Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 3 Computermetaphern Leitfrage: Was ist ein Computer? Hardware Software Funktion • Maschine • Werkzeug • Medium Partner (?) Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 4 Beschreibungssprachen für Texte Einführung: Wie kann man den Aufbau von Texten beschreiben? Texte haben oft einen regulären Aufbau, z.B. Folien bestehen aus einer Überschrift, einer Kopf- & Fußzeile und geschachtelten Aufzählungen Bücher bestehen aus: Vorwort, Inhaltsverzeichnis, Kapitel, Literaturverweise, Index Kapitel bestehen aus Unter(unter)kapitel, die wiederum aus Überschrift, Bilder und Abschnitten bestehen. Abschnitte bestehen aus Texten in verschiedenen Formatanweisungen (z.B. Fett, kursiv, ...) Nachrichten-Artikel bestehen aus: Aufreißer, Titel, Kurztext, Bild, Abschnitte Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 5 Grammatiken zur Beschreibung syntaktischer Strukturen Definition von Grammatiken Typen von Regeln Beispiel: EBNF (Extended Backus Naur Form) und Syntaxdiagramme Nutzung von EBNF zur Beschreibung von Textstrukturen Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 6 Beispiel einer Textbeschreibungssprache: HTML HTML: Hyper Text Markup Language Standard im Internet Beschreibt nur die Struktur von Texten, nicht das Layout

Transcript of Beschreibungssprachen für Texte - ki.informatik.uni...

1

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 1

Einführung in die Informatik für Hörer aller Fakultäten

Prof. Frank Puppe (FP) Prof. Jürgen Wolff von Gudenberg (JWG)

Prof. Rainer Kolla (RK)Prof. Dietmar Seipel (DS)

Vorlesung (Di & Do 15:15-16:45 im Zuse-Hörsaal):FP: Form und Darstellung von Informationen (ca. 6 DS)JWG: Grundlagen der Programmierung (ca. 9 DS)RK: Aufbau von Rechnern und Betriebssystemen (ca. 5 DS)DS: Datenbanken (ca. 5 DS)FP: Tabellenkalkulation und deskriptive Statistik (ca. 1 DS)

Übungen:• Üben mit Office-Tools, Java, Betriebssystemen usw.

Literatur (spezielle Literatur auch in den Vorlesungsabschnitten) • Gumm / Sommer: Einführung in die Informatik, Oldenbourg.

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 2

Übersicht über 1. Vorlesungsabschnitt

Form und Darstellung von InformationenFrank Puppe

1. Computermetaphern2. Beschreibungssprachen für Texte3. Grammatiken zur Beschreibung syntaktischer Strukturen4. Beispiel einer Textbeschreibungssprache: HTML5. Übersicht über Textsysteme6. Schablonen und Generierung von Texten (z.B. Serienbriefe)7. Nützliche Hilfsmittel in Textsystemen8. Das World Wide Web als Hyperdokument9. Funktionsweise von Suchmaschinen10. XML

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 3

Computermetaphern

• Leitfrage: Was ist ein Computer?–Hardware–Software–Funktion

• Maschine• Werkzeug• Medium• Partner (?)

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 4

Beschreibungssprachen für Texte

• Einführung: Wie kann man den Aufbau von Texten beschreiben?

• Texte haben oft einen regulären Aufbau, z.B.–Folien bestehen aus einer Überschrift, einer Kopf- &

Fußzeile und geschachtelten Aufzählungen–Bücher bestehen aus: Vorwort, Inhaltsverzeichnis, Kapitel,

Literaturverweise, Index–Kapitel bestehen aus Unter(unter)kapitel, die wiederum

aus Überschrift, Bilder und Abschnitten bestehen.–Abschnitte bestehen aus Texten in verschiedenen

Formatanweisungen (z.B. Fett, kursiv, ...)–Nachrichten-Artikel bestehen aus: Aufreißer, Titel,

Kurztext, Bild, Abschnitte

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 5

Grammatiken zur Beschreibung syntaktischer Strukturen

• Definition von Grammatiken• Typen von Regeln• Beispiel: EBNF (Extended Backus Naur Form) und

Syntaxdiagramme• Nutzung von EBNF zur Beschreibung von Textstrukturen

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 6

Beispiel einer Textbeschreibungssprache: HTML

• HTML: Hyper Text Markup Language• Standard im Internet• Beschreibt nur die Struktur von Texten, nicht das Layout

2

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 7

Übersicht über Textsysteme

• HTML-Editoren• WORD und RTF• LaTex• Power-Point • Postscript und PDF

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 8

Nützliche Hilfsmittel in Textsystemen

• Rechtschreibkorrektur• Grammatik-Check• Silbentrennung• Dokumentenvergleich• Konvertierungen von Textformaten• Übersetzungen

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 9

Generierung von Texten

• Struktur von Textschablonen• Definition von Ersetzungsregeln• Beispiel: Word-Serienbriefe, Makros• (Parser)

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 10

Das World Wide Web als Hyperdokument

• Geschichte• Verteilte Dokumente• Browser• Plug-Ins

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 11

Funktionsweise von Suchmaschinen

• Browsen und Suchen• Beschreibung von Dokumenten als Wortvektoren• Anfragen

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 12

XML – eXtensible Markup Language

• Vorteile im Vergleich zu HTML• Aufbau von XML-Dokumenten• Definition der Struktur von XML-Dokumenten mit DTD• Beispiele für XML-Schema• Verarbeitung von XML-Dokumenten

3

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 13

Form und Darstellung von Informationen

1. Computermetaphern2. Beschreibungssprachen für Texte3. Grammatiken zur Beschreibung syntaktischer Strukturen4. Beispiel einer Textbeschreibungssprache: HTML5. Übersicht über Textsysteme6. Schablonen und Generierung von Texten (z.B. Serienbriefe)7. Nützliche Hilfsmittel in Textsystemen8. Das World Wide Web als Hyperdokument9. Funktionsweise von Suchmaschinen10. XML

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 14

1. Was ist ein Computer?

• Hardware-Sicht: Rechner + Peripherie

• Software-Sicht: Schichtenmodell

• Funktionale Sicht: Bezug zum Menschen

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 15

Hardware-Sicht: Rechner + Peripherie

• Rechner: CPU, Cache, Hauptspeicher, BIOS, Taktgeber

• Peripherie:–Eingabegeräte: Maus, Tastatur; Scanner, Mikrophon, ...–Ausgabegeräte: Bildschirm, Drucker; Lautsprecher, ...–Ein-&Ausgabe: Laufwerke für Festplatte, CD-ROM, Diskette;

Modem, ...

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 16

Komponenten eines Rechners

Controller dienen dem Ansteuern der Peripherie (Bildschirm, Mikrophon, Tastatur usw.).

Sie befinden sich teils auf Karten, bzw. fest auf dem Mother-board (Haupt-platine). Oft sind die CPU und der Cache aber auf einer extra Pro-zessorplatine.

Die Karten stecken in Slots, die über den Busverbunden sind.

BIOS = Basic Input Output System

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 17

Software-Sicht: SchichtenmodellPhysikalische Ebene:Komponenten: Integrierte Schaltkreise, Leitungen, Platten ...Medium: Strom, SpannungVerhalten: Gesetze der Physik

Logische Ebene:Komponenten: (Und-) Gatter, Inverter, Flip-FlopsMedium: BitsVerhalten: Boolsche Logik

Symbolische Ebene (Ebene der Programmiersprachen):Komponenten: Speicher, OperationenMedium: Symbole (Buchstaben, Zahlen, Wörter), AusdrückeVerhalten: Sequentielle Interpretation

Wissensebene:Komponenten: Aktionen, Ziele, KörperMedium: WissenVerhalten: Gesetz des rationalen Verhaltens:

Alle Aktionen dienen optimal den Zielen des Agenten.

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 18

Schichten der symbolische Ebene

• Betriebssysteme (z.B. Unix, WINDOWS)• Programmiersprachen

–Assembler (Maschinennahe Sprachen)–imperative (prozedurale) Sprachen (z.B. Basic, Pascal, C)–objektorientierte Sprachen (z.B. Java, C++)–funktionale Programmierung (z.B. LISP)–regelbasierte / logische Programmierung (z.B. PROLOG)– Datenbankabfrage-Sprache (SQL)

• Anwendungsprogramme (z.B. Excel, WORD, ...)

4

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 19

Programmiersprachen-Einteilung

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 20

Funktionale Sicht auf Computer

• Maschine: (Rechen)Automat

• Werkzeug: Instrument, Arbeitsmittel

• Medium: Kommunikation – Unterhaltung – Information

• Partner: Gegner in Spielen, Tutor, Berater, Atavar (Vision?)

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 21

Computer als Maschine (1)• Lat. Machina: Kriegs- und Belagerungsmaschinen.

• Maschinen werden bis ins 18. Jahrhundert nur zu einem geringen Teil zur Rationalisierung von Arbeit eingesetzt; sie verkörpern die Faszination vom technisch Machbaren und dienen der Unterhaltung.

• Erst seit der Industrialisierung dienen Maschinen im wesent-lichen der Rationalisierung von Arbeit.

• Maschinen werden vom Menschen vorbereitet bzw. konfigu-riert & angeschaltet - ihre Arbeit leisten sie relativ autonom; Beispiele: Briefsortieranlage, Stromgenerator; Straßenkehr-fahrzeug (?), elektrische Säge (?),

• In der Informatik geht es ganz wesentlich um die Maschi-nisierung von Kopfarbeit oder, anders ausgedrückt, um die Übertragung geistiger Momente der Arbeit auf Computer.

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 22

Computer als Maschine (2)

• Computer sind keine Maschinen im klassischen Sinn: Sie verarbeiten Zeichen. Um Objekte oder Prozesse auf Computern bearbeiten zu können, sind drei Reduktionen notwendig:

–Semiotisierung: Transformation des Gegenstands in Zeichen: Nicht das Werkstück, der Arbeitsprozess oder die Personalakte selbst wird bearbeitet, sondern deren Abbild in der Zeichenwelt.

–Formalisierung: Abstraktion vom Konkreten zum Allgemei-nen: Z.B. werden bei der Lagerhaltung nicht konkrete Orte, sondern Positionen in einem Bezugssystem bearbeitet.

–Algorithmisierung: Entwicklung berechenbarer Funktionen, z.B. Suchalgorithmen.

• Beispiele: Taschenrechner, Programmausführung, [Roboter], Batch-Jobs (Lohnbuchhaltung, Serienbriefe), Expertensysteme, ..

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 23

Computer als Werkzeug• Werkzeuge:

–Hilfsmittel zur leichteren Handhabung, zur Herstellung oder Bearbeitung von Gegenständen

–Technische Mittel zur Erweiterung menschlicher Fähigkeiten –„Verlängerungen“ der Extremitäten –Immer unter menschlicher Führung und Kontrolle –Stehen im Kontext handwerklicher Produktion –Werkzeuge werden beherrscht, Maschinen bedient.

• Computer als Werkzeuge:–ab 70er Jahre: Programme zur Unterstützung der Software-

Entwicklung–Slogan bei der Verbreitung des PCs und Motto der

sozialverträglichen Technikgestaltung. –Beispiele: Bürosoftware, Programmierumgebungen,

elektronische Arbeitsumgebungen, ..

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 24

Vergleich Werkzeug und Computer• Computer sind Mittel für universelle

Zwecke der Informationsverarbeitung.• Primäres Ziel ist die Einwirkung auf

Daten zum Zwecke ihrer Veränderung.• Computer sind in weiten Grenzen

veränderbar (Programmierung, Anpassung an Aufgaben/Benutzer).

• Der Computer als Werkzeug bedarf der Einbindung in die Tätigkeit, der Computer als Maschine funktioniert ohne Einbindung in die Tätigkeit.

• Handhabung des Computers alsWerkzeug verlangt Wissen/Erfahrung, (über Wirkungsweise, Programmie-rung), als Maschine deutlich weniger.

• Computer(programme) bedürfen zu ihrer Herstellung anderer Programme (z.B. Editoren).

• Werkzeuge sind Mittel für bestimmte Zwecke.

• Primärer Zweck der Werkzeuge: Unmittelbare Einwirkung auf ein Werkstück mit dem Ziel seiner Veränderung; Sekundärer Zweck: Unterstützung einer Einwirkung (z.B. Anschlagleiste; Messwerkzeug).

• Veränderbarkeit in bestimmten Grenzen (Instandsetzung, Anpassung an Aufgaben/Benutzer).

• Einbindung in Tätigkeit (Werkzeug bedarf der Führung & Handhabung)

• Werkzeughandhabung verlangt Wis-sen/Erfahrung (über Bauart, Wirkungsweise usw.).

• Werkzeuge bedürfen zu ihrer Herstellung anderer Werkzeuge.

5

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 25

Computer als Medium

• Massenmedien (Presse, Rundfunk, Fernsehen, Film) – dienen der Herstellung und Verbreitung von Informationen in Schrift,

Wort, Musik, Bild; bieten keine Möglichkeit zur Rückkopplung über das Medium;

– Empfänger können nur rezipieren; – Informations-Produktion und Rolle des technischen Mediums bleiben

verborgen.

• Zwei-Weg-Medien (Telefon, Telefax)– ermöglichen Kommunikation; – ermöglichen wechselseitiges Senden und Empfangen;

– erlauben Gegenseitigkeit.

�Die Digitalisierbarkeit aller Medien (Sprache, Bild usw.), ihre Integration im Computer und die allseitige Vernetzung lassen den Computer als ideales Medium erscheinen.

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 26

Geschichte der Medien• Sprache• Schrift

– Bilderschrift - Konsonantenschrift - Lautschrift – unstrukturierte Schrift (mittelalterl. Handschriften) - strukturierte Schrift

(Kapiteln, Absätzen, Fußnoten usw.) - reproduzierte Schrift (Gutenberg)– Text - Hypertext

• Entwicklung elektrischer/elektronischer Medien– Telegrafie, Telephonie – Schallplatte – Funk (Radio, Fernsehen, Individualkommunikation) – Video

• Entwicklung digitaler Medien– CD/CD-ROM – Computer (Wissensspeicher; Integrator von Druck- und

Kommunikationsmedien)– Netze als verteilter Wissensspeicher und Wissensübermittler

• Entwicklung virtueller Medien: Virtual Reality

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 27

Eigenschaften von informationellen Medien

• Der Begriff „Medium“: etwas in der „Mitte“– Mittel zum Aufbewahren, z.B. Speichermedium, Flugblatt, Buch – Mittel zum Transport von Stoffen oder Informationen z.B. Luft,

elektromagnet. Wellen– Vermittlung zwischen Dingen, Personen, Positionen, (aktiver) Vermittler.

Beispiele: Zeitung mit Nachricht und Kommentar, [parapsych. Medien]

• Eigenschaften von (informationellen, technischen) Medien– Technische Vermittlung von Informationen zw. Menschen in sozialen

Kontexten (Kommunikation, Kooperation) [also nicht Vermittlung im Sinne von Ausgleich zwischen strittigen Positionen]

– Synchronie: Je synchroner die Vermittlung, um so geringer die Speicherfähigkeit des Mediums (z.B. Laufzeiteffekt bei Telefonie; Buch)

– Unaufdringlichkeit/Unauffälligkeit versus Eingriff: Rücknahme der eigenen Identität/Aktivität, (aber auch) Veränderung der Welt

– (All)gegenwärtigkeit - ubiquitous computing (Luft, weltumspannende Telefonnetze, Computernetze, Bibliotheken)

– Virtuelle Nähe: Mittel zur Distanzüberwindung (räumlich, gedanklich, ...)

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 28

Vision: Computer als Partner

Aktuell:• In Spielen (z.B. Schach, Civilization, usw.)• in Manövern (militärische Simulationen mit künstlichen und

echten Teilnehmern)• Sprachauskunftsystemen (Kinoreservierung,

Fahrplanauskunft usw.) • Automatische Email-Beantwortung • In intelligenten Tutorsystemen mit Feedbackgenerierung• Hilfesysteme (z.B. MS-Büroklammer)• Atavare (z.B. Expo-2000)• Haustier-Roboter (z.B. Aibo von Sony)• Stellvertreter (z.B. zur Terminplanung)

Zukünftig: ???

Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen 29

Einordnung von Beispielanwendungen

• Schreiben: Computer (Textsystem) ist Werkzeug• Email: Computer ist Medium (und Werkzeug)• WWW: Computer ist Medium• Drucken von Bahn-Fahrkarten: Computer ist Maschine• Informationen suchen: Computer ist (Such)Maschine, Werk-

zeug (Verfeinerung der Suchanfrage) & Medium (Info-Quelle)• Programmieren: Programmierumgebung ist Werkzeug• Sortieren von Daten: Computer ist Maschine• Musik abspielen: Computer ist Medium• Taschenrechner: Computer ist Maschine• ...