Linguistik mit Schwerpunkt Computerlinguistik ... · Nebenfach/Anwendungsfach Linguistik mit...

17
Nebenfach/Anwendungsfach Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität Jena

Transcript of Linguistik mit Schwerpunkt Computerlinguistik ... · Nebenfach/Anwendungsfach Linguistik mit...

Nebenfach/Anwendungsfach

Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie

Prof. Dr. Udo Hahn

Lehrstuhl für Computerlinguistik

Institut für Germanistische Sprachwissenschaft

Friedrich-Schiller-Universität Jena

2

„Informatiken“• Kern-Informatik– Theoretische I.: Automaten-/Grammatiktheorie, Komplexitätstheorie, Codierungstheorie, …

– Praktische I.: Programmiersprachen/Compilerbau, Betriebssysteme, Datenbanken, …

• Angewandte Informatik: Bindestrich-Informatiken– Bioinformatik

– Medizinische Informatik

– Wirtschaftsinformatik

– Computerlinguistik/Sprachtechnologie

3

„Sprachen“: Syntax & Semantik

• Algebraisch/logisch– Formal, konstruiert

• Bsp: Programmiersprache, PL1

• Chemisch– Empirisch, naturgesetzlich

• Benzol als chemische (Kekulé-)Strukturformel

• Biologisch– Empirisch, naturgesetzlich + Evolution (+ Pathologien)• DNA-Struktur, Pathway-Diagramme

• Natürliche Sprachen – Empirisch, sozial determiniert

• Leitartikel aus der „Süddeutschen Zeitung“

INFORMATION

4

Informationsstrukturaus Informatiksicht

5

Warum Sprachtechnologie ?

6

Textmengenwachstum in der Biomedizin

MEDLINE

7

Informationsstrukturin natürlicher Sprache

8

Informationsstrukturin natürlicher Sprache

UNSTRUKTURIERTEINFORMATION

9

Studium an der FSU Jena

• Bachelor-Studiengänge– B.Sc. Informatik

– B.Sc. Angewandte Informatik

• Master-Studiengänge– M.Sc. Informatik

– M.Sc. Computational Science

10

B.Sc. InformatikNebenfach Linguistik++

• Einführung in die Phonetik und Phonologie der deutschen Sprache (Laut) (5 LP)

• Einführung in die Lexikologie (Wort) (5 LP)• Einführung in die Grammatiktheorie I (Satz I)

(5 LP)• Einführung in die Textlinguistik (Text) (5 LP)• Einführung in die Computerlinguistik und Sprachtechnologie* (B-GSW-01 … -04) (10 LP)

• Es müssen 24 (30) LP erworben werden• Bei Wahl dieses NFs werden 6 ASQ LP erworben

11

B.Sc. Angewandte InformatikAnwendungsfach Linguistik++ (P)

• Einführung in die Phonetik und Phonologie der deutschen Sprache (Laut) (5 LP)

• Einführung in die Lexikologie (Wort) (5 LP)

• Einführung in die Grammatiktheorie I (Satz I) (5 LP)

• Einführung in die Textlinguistik (Text) (5 LP)

• Einführung in die Computerlinguistik und Sprachtechnologie* (B-GSW-01 … -04) (10 LP)

• Es müssen 60 LP erworben werden

12

• Einführung in diachrone germanistische Sprachwissenschaft* (5 LP)

• Sprachtheorie (5 LP)• Linguistische Stilistik (5 LP)• Theoretische und praktische Phonologie (5 LP)• Grammatiktheorie II (5 LP)• Angewandte Textlinguistik (*) (10 LP)• Norm und Varianz (10 LP)• Formen der Erweiterung des deutschen Wortschatzes (*) (10 LP)

B.Sc. Angewandte InformatikAnwendungsfach Linguistik++ (WP)

13

M.Sc. Informatik/Computational Sci.Nebenfach Linguistik++

• Computerlinguistik I:V+Ü+S (10 LP)• Computerlinguistik II/Sprachtechnologie V+Ü(+ S) (10 LP)

• Es müssen 12 (20) LPs erworben werden• Bei Wahl dieses NFs werden 9 ASQ LP erworben, und es können 6 Projektarbeit-LPerworben werden (27 LP)

14

Bezüge zur Informatik• Theorie formaler Sprachen/Grammatiken und Automatentheorie (Syntax von NS)

• Wahrscheinlichkeitstheorie (probabilistischeGrammatiken/Automaten; statistische Semantik)

• Graphentheorie• Informations- und Spieltheorie• Künstliche Intelligenz

– Wissensrepräsentation: Logiken (Semantik von NS)– Maschinelles Lernen (Wahrscheinlichkeits- und Informations-theorie)

• Informationssysteme– Datenbanken– Information Retrieval– Human Computer Interaction (HCI): Visualisierung

• Software Engineering• Web-Technologien (RDF, XML, OWL, Ontologien)

15

Sprachtechnologie

• Methoden …– Parsing, semantische Interpreter, OOP, …

• Sprachtechnologische Anwendungen– Information Retrieval

– Informationsextraktion / Text Mining

– Frage-Antwort-Systeme

– Textzusammenfassung

– Maschinelle Übersetzung

– … enge Bindung an biomedizinische Themen

• Chancen auf dem Berufsmarkt sind positiv

16

Bemerkungen

• Es gibt zwischen der Informatik und dem LS Computerlinguistik intensive Lehr-, Forschungs-und Prüfungsbeziehungen– Bioinformatik

– Projekte: Forschungskern JenAge

– Forschungsschwerpunkt „Komplexität“

– Prof. König-Ries, Rossak, Küspert, Schukat-T. …

• Der LS Computerlinguistik akquiriert in großem Maße Drittmittel– Projektarbeiten, Abschlussarbeiten

– Studentische Hilfskräfte

– http://www.julielab.de

Nebenfach/Anwendungsfach

Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie

Prof. Dr. Udo Hahn

Lehrstuhl für Computerlinguistik

Institut für Germanistische Sprachwissenschaft

Friedrich-Schiller-Universität Jena