Ein Computermodell zur Bestimmung von Begriffstypen
description
Transcript of Ein Computermodell zur Bestimmung von Begriffstypen
1
Ein Computermodell zur Ein Computermodell zur Bestimmung von BegriffstypenBestimmung von Begriffstypen
Christof RumpfHeinrich-Heine-Universität
Tag der Forschung05.11.2006
2
FOR 600, Projekt A5FOR 600, Projekt A5
• DFG-Forschergruppe FOR 600:– Funktionalbegriffe und Frames
• Projekt A5:– Automatische Klassifikation von Nomen
nach Begriffstyp
• Projektleiter:– Prof. Dr. James Kilbury
(Computerlinguistik)– Prof. Dr. Sebastian Löbner (Linguistik)
3
Gegenstand des Projekts A5Gegenstand des Projekts A5
• Problem– Automatische Klassifikation von Nomen nach
Begriffstyp aufgrund morphosyntaktischer Kontextmerkmale.
• Methode – Erlernen eines statistischen Modells für die
Klassifikation mit annotierten Texten, in denen Begriffstyp und Kontextmerkmale vermerkt sind.
4
BegriffstypenBegriffstypen
nicht inhärent eindeutig inhärent eindeutig
einstellig sortal SB funktional FB1
mehrstellig relational RB2, RB3, … funktional FB2, FB3
5
Kontextuelle MerkmaleKontextuelle Merkmale
• Morphologische Eigenschaften– Deadjektivische Nomen sind häufig funktional:
Grösse, Intelligenz, …– ebenso deverbale Nomen: Krümmung, Dauer, …– und Komposita mit: -wert, -grad, -grösse, …
• Grammatische Besonderheiten– Possessivkonstruktionen: seine Mutter (2-stellig)– Definitheit: der, die, das (FB) vs. ein, eine (RB)– Subkategorisierung: bestimmte Verben verlangen FB
als Komplement, z.B. die Temperatur messen
6
Annotierung von KorporaAnnotierung von Korpora
• Software zur auto-matischen Annotierung kontextueller Merkmale durch morphologische und syntaktische Analyse
• Manuelle Annotierung von Begriffstypen
Dieses PDAT Lehr- und Lernbuch NN_SB ist VAFIN der ARTDEF Versuch NN_RB1 , $, eine ARTUNDEF Einführung NN_RB1 in APPR die ARTDEF Semantik NN_FB1 zu PTKZU bieten VVINF , $, die PRELS einerseits ADV die ARTDEF wichtigsten ADJA Themen NN_RB1