Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf ·...

62
Einführung Computerlinguistik Morphologie I Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-21 1 / 62

Transcript of Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf ·...

Page 1: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Einführung Computerlinguistik

Morphologie I

Hinrich Schütze & Robert Zangenfeind

Centrum für Informations- und Sprachverarbeitung, LMU München

2013-10-21

1 / 62

Page 2: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Take-away

Einleitung: Was ist Morphologie, Flexion, Derivation

Morpheme

Morphologie in der Sprachgeschichte / Diachronie

Lemmata: Definition, Motivation

Morphologische Paradigmen

2 / 62

Page 3: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Overview

1 Einleitung

2 Morpheme

3 Diachrone Perspektive

4 Lemmata

5 Flexionsparadigmen

3 / 62

Page 4: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Outline

1 Einleitung

2 Morpheme

3 Diachrone Perspektive

4 Lemmata

5 Flexionsparadigmen

4 / 62

Page 5: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Morphologie

Formenlehre

griech. morphe ‘Form’

Wie werden Woerter aus kleineren Einheiten gebildet

interne Struktur der Wörter

Was sind die elementaren Einheiten des Wortes

Erste Annaeherung:kleinste sprachliche Einheiten, die Bedeutung habenEinheiten gleicher Bedeutung mit komplementärer Verteilung

5 / 62

Page 6: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Die zwei Bereiche der Morphologie

Flexionslehre / Wortformbildung / inflectionAufbau von Wortformen aus Wortstamm und FlexionsendungWort als Flexionsparadigma

Wortbildungslehre / Wortstammbildungslehre / derivationKomposition, Präfigierung, Suffigierung

6 / 62

Page 7: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Outline

1 Einleitung

2 Morpheme

3 Diachrone Perspektive

4 Lemmata

5 Flexionsparadigmen

7 / 62

Page 8: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Morpheme

Morpheme bestehen aus Silben

mehr als 20 000 Morpheme im Dt.

Beispiel 1: {mann}, {männ}

Beispiel 2: {er}, {e}, {en}

Beispiel fuer Flexion: “Männer”

Beispiel 3: {garten}, {zwerg}

Beispiel fuer Derivation: “Gartenzwerg”

8 / 62

Page 9: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Lexikalische vs grammatische Morpheme

lexikalisches Morphem: trägt lexikalische Bedeutung, z.B.{sag}

grammatisches Morphem (Grammem, funktionales Morphem):rein grammatische Funktion, z.B. {te} (→ sagte)

9 / 62

Page 10: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Freie vs gebundene Morpheme

freies (ungebundenes) Morphem: kann ohne Vorhandenseinanderer Morpheme ein Wort bilden; z.B. {Garten}, {Zwerg}

gebundenes Morphem: kann nicht selbständig ein Wort bilden,z.B. {s} als Genitiv Singular

10 / 62

Page 11: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Wurzel vs. Affix vs. Stamm

Wurzel = kleinste Einheit, die Bedeutung hat

Beispiel: “Familien”

kleinste Einheit, die Bedeutung hat: “familie”

“fam”, “fa”, “milie” haben keine Bedeutung

11 / 62

Page 12: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Wurzel vs. Affix vs. Stamm

Affix = Morphem, das keine Wurzel ist

gebundenes Morphem

reihenbildend: modifiziert verschiedene Staemme in analogerWeise

Suffixe (nach dem Stamm); z.B. {te}: “sagte”, “konnte”,“machte”

Präfixe (vor dem Stamm); z.B. {auf}: “aufmachen”,“aufdrehen”, “aufreißen”

Infixe (im Stamm): “fan-fucking-tastic”, “abso-bloody-lutely”

Zirkumfixe (um den Stamm herum, diskontinuierlich); z.B.{ge- -t} (→ gesagt)

Beispiele aus anderen Sprachen?

12 / 62

Page 13: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Wurzel vs. Affix vs. Stamm

Stamm = Bestandteil einer Wortform, der die Wurzel enthält

und eventuell weitere Teile, die keine Flexionsmorphemedarstellen

Beispiele“Heimat”. Stamm = “heimat”, Wurzel = “heim”Lateinisch “lector”. Stamm = “lector”, Wurzel = “leg”

Im Englischen und Deutschen sind Wurzel und Stamm oftgleich.

13 / 62

Page 14: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Definition Morphem

(vgl. Def. von Mel’čuk, I.A.: Aspects of the Theory of Morphology.Berlin 2006, S. 388): Ein Morphem ist ein nicht-leeres Set vonallen Morphen m1, m2, . . . mn = {mi}, die folgende dreiBedingungen erfüllen:

Die Signifikate von allen mi sind identisch.

Alle mi gehören zur gleichen Klasse von Morphen, d.h. alle mi

sind entweder Wurzeln oder Affixe.

Alle mi stehen in komplementärer Distribution, die durchallgemeine Regeln beschrieben werden kann (Affixe könnenauch identische Distribution haben)

Allomorphe des Morphems {M}: alle Morphe mi , die zu {M}gehören

14 / 62

Page 15: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Morphologisches Segmentieren

Zerlegen des Wortes in Morpheme

→ SMOR finite state morphology ist eine Möglichkeit derFormalisierung und Implementierung dieses Prozesses.

ohne Rest

meist intuitiv möglich

Beispiel: VersicherungsangestellterVer-sicher-ung-s-an-ge-stell-t-er

15 / 62

Page 16: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Segmentieren & Klammern

Klammerung zur Darstellung der Struktur:

x

x

angestellter

x

x

s

x

Versicherung

16 / 62

Page 17: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Segmentieren & Klammern

Segmentierung & Klammerung fuer: Straßenbahnfahrerin,Mädchenhandelsschule

Segmentierung in kleinstmögliche Einheiten:Straße-n-bahn-fahr-er-in

Talentwässerung, Gebirgstier, Wachstube, Tauschwert,Maisturm

falsche Trennung erschwert Segmentieren beim Lesen, z.B.:Talent-wässerung, Gebirg-stier, Wachs-tube, Tau-schwert,Mais-turm

17 / 62

Page 18: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

x

x

fahrerin

x

x

bahn

x

Straßen

18 / 62

Page 19: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

x

x

schule

x

x

s

x

x

handel

x

Mädchen

19 / 62

Page 20: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

x

x

x

schule

x

x

s

x

handel

x

Mädchen

20 / 62

Page 21: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Outline

1 Einleitung

2 Morpheme

3 Diachrone Perspektive

4 Lemmata

5 Flexionsparadigmen

21 / 62

Page 22: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Question: Why do we need something ascomplex as morphology? Why don’t we havean inventory of fixed unchangeable forms?This would be easier to learn and use.

22 / 62

Page 23: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

What is attractive about morphology

Morphology allows us to productively build a theoreticallyinfinite number of words from a limited number of morphemes.

This is very economical: We only need to learn the limitednumber of morphemes and the principles of combination, butstill have access to (theoretically) infinite many words inproduction and comprehension.

23 / 62

Page 24: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Productivity in language

productivity = generating new linguistic expressions from alimited inventory of smaller parts

Traditionally, linguistic theory posits two different domains ofproductivity: morphology and syntax.

Syntax productively combines words into phrases andsentences.

Morphology productively combines morphemes into words.

Diachronic perspective: Where does this productivity comefrom historically? . . .

. . . and can it end (= language loses productivity in someareas)?

Diachronic: roughly the same as historical linguistics

24 / 62

Page 25: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Example for things becoming less productive

Example for productivity that German is currently losing?

Genitive: especially if the forms are “awkward”: “Franz’Haus”, “Franzens Haus”; “der Ton dieser Debatte istniemandes wuerdig”, “ich machte in diesem Wirtshausjemandes Bekanntschaft”

Subjunctive: “er gab an, er kennte den Angeklagten nicht”

“hinterrücks” (alter Genitiv von “Ruecken”), frozen, cannotbe modified

25 / 62

Page 26: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Grammatikalisierung

Beispiel: dt. Präteritum-Affix -t-: urspr. sagen-tat → sagte

Wort geht in Richtung grammatisches Morphem

Grammatik entsteht im Sprachwandel:

pragmatic mode: autonome Elemente werdenaneinandergereiht

vs. syntactic mode: (strengere grammatische Regulierung →normierte Standardsprache)

Morphem verliert lexikalische Bedeutung und Freiheit in derStellung

Inhaltswörter werden zu Funktionswörtern

freie Morpheme zu gebundenen

26 / 62

Page 27: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Entstehung von Morphemen in der Derivation

Suffixe -keit, -heit, -tum, -lich: urspr. eigenständige Wörter:

-lich: ahd. ’Körper, Gestalt’

-keit, -heit: ’Art, Weise’

-tum: ’Würde, Stand’

derzeit im Übergang: Weise, frei, voll, mäßig, Zeug, Werk

27 / 62

Page 28: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Entstehung von Morphemen in der Derivation: -er

Nomen auf -er: urspruenglich: Ableitungen von Verben:Bohrer, Spieler, Seufzer

jetzt auch abgeleitet von Nomen: Fußballer, Berliner, Politiker

(kein Suffix, Teil des Stammes: Mutter, Schulter, Fenster)

28 / 62

Page 29: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Analog in der Grammatik: Neue

Konstruktionsmoeglichkeiten

bekommen: Er bekommt etwas geschenkt, aber auch Er

bekam den Zahn gezogen

franz. ne . . . pas: (nicht) ← ’keinen Schritt’

das Buch von Peter ← Peters Buch

29 / 62

Page 30: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Outline

1 Einleitung

2 Morpheme

3 Diachrone Perspektive

4 Lemmata

5 Flexionsparadigmen

30 / 62

Page 31: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Lemma

Das Lemma einer Wortform ist die Grundform eines Wortes.

Das Lemma dient als “Überschrift” im Eintrag einesWörterbuchs.

Was als Lemma verwendet wird, ist Konvention.

Deutsche Verben: Infinitiv

Lateinische Verben: erste Person Singular Präsenz AktivIndikativ

31 / 62

Page 32: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Das Wörterbuch/Lexikon

Für konventionelle Lexika (i.e., als Bücher gedruckte)brauchen wir Lemmata, weil alle Wortformen explizitaufzulisten Platzverschwendung wäre und der Struktur derSprache nicht gerecht würde.

Um dem Benutzer das Finden eines bestimmten Wortes zuerleichtern, ist eine systematische Anordnung derLemmata/Einträge notwendig.

Meistens: alphabetische Anordnung

Der Duden ist ein Beispiel fuer ein einsprachigesStandardwörterbuch.

Für andere Wörterbuchtypen braucht man ebenfalls Lemmata:Synonymwörterbücher, Fremdwörterbücher etc.

32 / 62

Page 33: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Ein Lexikoneintrag im Duden

33 / 62

Page 34: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Aufbau eines Lexikoneintrags

Am Anfang oft historische, syntaktische, Genre-Information

Aufgeteilt in Bedeutungen / Unterpunkte

Kriterien zur Unterscheidung der Bedeutungen oft unklar

Splitters: Lexikonautoren, die zu feinen Unterscheidungen undvielen Unterpunkten neigen

Lumpers: Lexikonautoren, die zu groben Unterscheidungenund wenigen Unterpunkten neigen

34 / 62

Page 35: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Ein Lexikoneintrag im Duden

35 / 62

Page 36: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Are there two items in the definition thatcould potentially be merged? Is there an itemin the definition that could potentially besplit?

36 / 62

Page 37: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Lemmatisierung

Wenn wir Sprache verarbeiten wollen, dann besteht der Inputaus Wortformen, nicht aus Lemmata.

Lemmatisierung = Zuordnung der Wortformen zu Lemmata

Diese Zuordnung ist kontextabhängig und nicht immereindeutig.

Beispiel?

SMOR ist ein Beispiel fuer einen Lemmatisierer (derAmbiguität aber nicht auflöst).

37 / 62

Page 38: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Tokenisierung

Von Lemmatisierung zu unterscheiden ist Tokenisierung.

Tokenisierung = Aufteilung von Text in Token

Peter J. O’Neill’s house in San Francisco sold after anine-month period.

“Peter” “J.” “O’Neill” “’s” “house” “in” “San Francisco”“sold” “after” “a” “nine” “-” “month” “period” “.”

38 / 62

Page 39: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

How do people “store” words?

A simple model of how people store words is the “mentallexicon”.

In the simplest case, we assume that people have a type oflexicon in their heads.

Elaborated forms of this model can explain different thingspeople can do with words.

Look up the meaning of a word that we have read/heard incomprehension

Look up the right word to use for a particular meaning wewould like to convey in production

Look up the morphological and grammatical properties of aword that we want to use in a sentence

In reality, all of this is very complicated

39 / 62

Page 40: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Example for complexity of the “mental lexicon”

40 / 62

Page 41: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Outline

1 Einleitung

2 Morpheme

3 Diachrone Perspektive

4 Lemmata

5 Flexionsparadigmen

41 / 62

Page 42: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Flexionsparadigmen

Flexion passt Wortformen an die Umgebung im Satz an.

Dies geschieht, indem Flexionsmorpheme mitStämmen/Wurzeln verbunden werden.

In der paradigmatischen Betrachtungsweise werden alleFormen eines bestimmten Stammes (oder eines Lemmas)systematisch angeordnet.

42 / 62

Page 43: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Konstruktion von Paradigmen

systematische Zusammenstellung der Formen nach Funktion

Merkmale: Singular, Plural, Nominativ, Genitiv, . . . , maskulin,feminin, . . . , Präsens, Imperfekt, . . . , 1.Person, . . .

Zusammenfassen der Merkmale in Kategorien:

Numerus, Kasus, Genus, Tempus, (grammatische) Person

Kombination der Merkmale zu Zellen

43 / 62

Page 44: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Konstruktion von Paradigmen

z.B. Tag:

sg plnom – egen es edat – enakk – e

Generalisierung der Paradigmen → lexikalische Kategorie

44 / 62

Page 45: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Konstruktion von Paradigmen

Flexionsendungen haben unspezifisches Bedeutungspotential ,vgl. Mensch:

sg plnom – engen en endat en enakk en en

insgesamt 6 Phoneme für Flexive (genuin dt.) /e, m, n, r, s, t/

45 / 62

Page 46: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Konstruktion von Paradigmen

Numerussysteme: auch z.B. zusätzlich Dual

Genussysteme: auch z.B. nur mask, fem

Kasus: große Differenzen in Sprachen

Person: Sprecher, Angesprochener, Besprochenes

Tempus: sprachspezifisch (Anzahl und Arten)

Beispiele aus anderen Sprachen?

46 / 62

Page 47: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Nominale Paradigmen: Deklination

versch. (Heringer: 8) Flexionsklassen für Substantive,Adjektive, Pronomina, Numerale und Artikel

Flexionsklasse = Menge aller Stämme, die nach dem gleichenParadigma flektieren

Nominativ, Plural: -e, -en, -er, -s (als genuin dt. Endungen)→ in komplementärer Verteilung: Allomorphe (z.B. Ding-e vs.Mensch-en)

auffällige Klassen (Synkretismus): Klasse 6 “Mutti” (sg nur –,pl nur -s) , Klasse 7 “Welt” (sg nur –, pl nur -en)

einige Ausnahmen, z.B. Herz (gen -ens)

manche Lexeme nur im sg (z.B. Gold), nur im pl (z.B. Leute)→ defekte Paradigmen

Beispiele aus anderen Sprachen?

47 / 62

Page 48: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Verbale Paradigmen: Konjugation

Kategorien:Person: 1., 2., 3.Numerus: sg, plTempus: Präsens, Präteritum (Imperfekt)Modus: Indikativ, Konjunktiv 1, Konjunktiv 2, Imperativ (+analytische Formen)

Infinitiv (flektiert wie Nomen)

Partizip (flektiert wie Adj.)

Komplizierung des Paradigmas durch:Vokalwechsel im Präsens (gebe, gibst, gibt) (starkes Verb)Stammalternationen (gebe, gab; singe, sang, sung-) → Ablaut

starke (Stammalternation) und schwache Konjugation(Wortstamm bleibt [meist] gleich)

bis zu 50 Flexionsklassen

48 / 62

Page 49: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Verbale Paradigmen: Konjugation

suppletive Formen , z.B.

sein

sg pl1.p bin sind2.p bist seid3.p ist sind

49 / 62

Page 50: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Aktiv Indikativ

50 / 62

Page 51: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Aktiv Konjunktiv 1

51 / 62

Page 52: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Aktiv Konjunktiv 2

52 / 62

Page 53: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Imperativ

53 / 62

Page 54: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Passiv Indikativ

54 / 62

Page 55: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Passiv Konjunktiv 1

55 / 62

Page 56: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Passiv Konjunktiv 2

56 / 62

Page 57: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Schwach

57 / 62

Page 58: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Stark

58 / 62

Page 59: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Gemischt

59 / 62

Page 60: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

schwach: stark:

gemischt:

60 / 62

Page 61: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

smor

61 / 62

Page 62: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:

Take-away

Einleitung: Was ist Morphologie, Flexion, Derivation

Morpheme

Morphologie in der Sprachgeschichte / Diachronie

Lemmata: Definition, Motivation

Morphologische Paradigmen

62 / 62