Ein Computermodell zur Bestimmung von Begriffstypen

6
1 Ein Computermodell zur Ein Computermodell zur Bestimmung von Bestimmung von Begriffstypen Begriffstypen Christof Rumpf Heinrich-Heine-Universität Tag der Forschung 05.11.2006

description

Ein Computermodell zur Bestimmung von Begriffstypen. Christof Rumpf Heinrich-Heine-Universität Tag der Forschung 05.11.2006. FOR 600, Projekt A5. DFG-Forschergruppe FOR 600: Funktionalbegriffe und Frames Projekt A5: Automatische Klassifikation von Nomen nach Begriffstyp - PowerPoint PPT Presentation

Transcript of Ein Computermodell zur Bestimmung von Begriffstypen

Page 1: Ein Computermodell zur Bestimmung von Begriffstypen

1

Ein Computermodell zur Ein Computermodell zur Bestimmung von BegriffstypenBestimmung von Begriffstypen

Christof RumpfHeinrich-Heine-Universität

Tag der Forschung05.11.2006

Page 2: Ein Computermodell zur Bestimmung von Begriffstypen

2

FOR 600, Projekt A5FOR 600, Projekt A5

• DFG-Forschergruppe FOR 600:– Funktionalbegriffe und Frames

• Projekt A5:– Automatische Klassifikation von Nomen

nach Begriffstyp

• Projektleiter:– Prof. Dr. James Kilbury

(Computerlinguistik)– Prof. Dr. Sebastian Löbner (Linguistik)

Page 3: Ein Computermodell zur Bestimmung von Begriffstypen

3

Gegenstand des Projekts A5Gegenstand des Projekts A5

• Problem– Automatische Klassifikation von Nomen nach

Begriffstyp aufgrund morphosyntaktischer Kontextmerkmale.

• Methode – Erlernen eines statistischen Modells für die

Klassifikation mit annotierten Texten, in denen Begriffstyp und Kontextmerkmale vermerkt sind.

Page 4: Ein Computermodell zur Bestimmung von Begriffstypen

4

BegriffstypenBegriffstypen

nicht inhärent eindeutig inhärent eindeutig

einstellig sortal SB funktional FB1

mehrstellig relational RB2, RB3, … funktional FB2, FB3

Page 5: Ein Computermodell zur Bestimmung von Begriffstypen

5

Kontextuelle MerkmaleKontextuelle Merkmale

• Morphologische Eigenschaften– Deadjektivische Nomen sind häufig funktional:

Grösse, Intelligenz, …– ebenso deverbale Nomen: Krümmung, Dauer, …– und Komposita mit: -wert, -grad, -grösse, …

• Grammatische Besonderheiten– Possessivkonstruktionen: seine Mutter (2-stellig)– Definitheit: der, die, das (FB) vs. ein, eine (RB)– Subkategorisierung: bestimmte Verben verlangen FB

als Komplement, z.B. die Temperatur messen

Page 6: Ein Computermodell zur Bestimmung von Begriffstypen

6

Annotierung von KorporaAnnotierung von Korpora

• Software zur auto-matischen Annotierung kontextueller Merkmale durch morphologische und syntaktische Analyse

• Manuelle Annotierung von Begriffstypen

Dieses PDAT Lehr- und Lernbuch NN_SB ist VAFIN der ARTDEF Versuch NN_RB1 , $, eine ARTUNDEF Einführung NN_RB1 in APPR die ARTDEF Semantik NN_FB1 zu PTKZU bieten VVINF , $, die PRELS einerseits ADV die ARTDEF wichtigsten ADJA Themen NN_RB1