Topologische Dependenzgrammatik fürs Arabische fileTopologische Dependenzgrammatik fürs Arabische...
Transcript of Topologische Dependenzgrammatik fürs Arabische fileTopologische Dependenzgrammatik fürs Arabische...
TopologischeDependenzgrammatik fürsArabische
Vortrag vonMarwan OdehBetreut von Ralph DebusmannnUnter der Aufsicht von Prof. Gert Smolka
ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration
ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration
AufgabeModellierung des Arabischen mit Extensible Dependency Grammar (XDG) (Debusmann, Duchier, Koller, Kuhlmann, Smolka, Thater2004)Phänomen-orientiert: viele Phänomene, kleines LexikonProof-of-concept: XDG geeignet zurBehandlung des Arabischen?
ArabischSemitische Sprache (wie Hebräisch, Aramäisch)Sprache des KoransEigenes AlphabetSchreibweise von rechts nach linksReiche MorphologieFreie Wortstellung auf SatzebeneEinzigartige grammatische Kategorien
Extensible Dependency Grammar (XDG)
Meta-Grammatikformalismus zurBeschreibung natürlicher SpracheBasiert auf Dependenzgrammatik (Tesniere1959, Melcuk 1988)Grammatische Beschreibung auf mehrerenDimensionenHier benutzt: Immediate Dominance (ID) und Linear Precedence (LP) wie in TDG (Duchierund Debusmann 2001, Debusmann 2001)
ID-Dimension (Immediate Dominance)
Beschreibt grammatische FunktionenKnoten entsprechen 1:1 WörternUngeordneter BaumKantenmarkierungen: Subjekt, Objekt…
ID-Beispielanalyse
LP-Dimension (Linear Precedence)
Beschreibt WortstellungGleiche Knoten wie ID-DimensionGeordneter, projektiver BaumKanten- und Knotenmarkierungen: topologische Felder
LP-Beispielanalyse
ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration
PhänomeneReiche MorphologieFreie Wortstellung auf SatzebeneMafool MotlakWeitere Phänomene in der Ausarbeitung
Reiche MorphologieFinites Verb bestimmt sogar Genus des Subjekts, z.B. yadhaku: Subjekt maskulin, tadhaku: Subjektfeminin:
Mohammedlachtضحكُ يمحمد
mohammedyadhak-u
Reiche MorphologieVerbform bestimmt Genus des Subjekts, z.B. yadhaku: Subjekt maskulin, tadhaku: Subjektfeminin:
Mohammedlachtضحكُ يمحمد
mohammedyadhak-u
Mohammedlachtتضحكُ محمد
mohammedtadhak-u
Reiche MorphologieVerbform bestimmt Genus des Subjekts, z.B. yadhaku: Subjekt maskulin, tadhaku: Subjektfeminin:
Mohammedlachtضحكُ يمحمد
mohammedyadhak-u
Mohammedlachtتضحكُ محمد
mohammedtadhak-u
*
Freie Wortstellung auf Satzebene
Ermöglicht durch reiche MorphologieGrammatische Funktion der NPs kann damit eindeutig bestimmtwerden
Beispiele
liebtdieFrauMohammed
محمد فتاة التحب
tuhib-ualfatat-umohammed-a
Beispiele
mohammed-a tuhib-u fatat al
liebtdieFrauMohammed
محمد فتاة التحب
tuhib-ualfatat-umohammed-a
Beispiele
mohammed-a tuhib-u fatat al
fatat al mohammed-a tuhib-u
liebtdieFrauMohammed
محمد فتاة التحب
tuhib-ualfatat-umohammed-a
Beispiele
mohammed-a tuhib-u fatat al
fatat al mohammed-a tuhib-u
fatat al tuhib-u mohammed-a
liebtdieFrauMohammed
محمد فتاة التحب
tuhib-ualfatat-umohammed-a
Beispiele
mohammed-a tuhib-u fatat al
tuhib-u fatat al mohammed-a
fatat al mohammed-a tuhib-u
fatat al tuhib-u mohammed-a
liebtdieFrauMohammed
محمد فتاة التحب
tuhib-ualfatat-umohammed-a
Beispiele
mohammed-a tuhib-u fatat al
tuhib-u fatat al mohammed-a
fatat al mohammed-a tuhib-u
tuhib-u mohammed-a fatat al
fatat al tuhib-u mohammed-a
liebtdieFrauMohammed
محمد فتاة التحب
tuhib-ualfatat-umohammed-a
Mafool MotlakEinzigartige grammatische KategorieSpezielle VerbformVerstärkt das VerbSteht am SatzendeWiederholung: Verstärkung der Verstärkung
Mafool Motlak: Beispiele
spielteKind dasspielen
لعباً الولُدلعَب
laib-awalad-u allaib-an
Mafool Motlak: Beispiele
spielteKind dasspielen
لعباً الولُدلعَب
laib-awalad-u allaib-an
laib-an laib-an walad-u al laib-a
Mafool Motlak: Beispiele
spielteKind dasspielen
لعباً الولُدلعَب
laib-awalad-u allaib-an
laib-an laib-an walad-u al laib-a
laib-an laib-an laib-an walad-u al laib-a
ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration
Modellierung in XDGVerwendung des XDG Development Kits(XDK) (Debusmann, Duchier, Niehren 2004)XDG-Instanz: wie in TDG (Duchier und Debusmann 2001, Debusmann 2001) fürsDeutsche
Reiche MorphologieLexikon: jedes Wort beschreibt Menge von Agreement-Tupeln aus Genus, Numerus und Kasus:
[ ]: $ &mohammed agrs masc sg=
[ ]: $ & &mohammed u agrs masc sg nom− =
[ ]: $ & &mohammed a agrs masc sg acc− =
: ( ) ( )v V agr v agrs v∀ ∈ ∈Analyse: jeder Knoten wählt ein Tupel aus:
Reiche Morphologie weiterVerben bestimmen Agreement ihrer Töchter
Beispiele:
: ( ) ( )( )h l d agr d outagrs h l∀ − → ∈
[ ][ ]nomfemsubjoutagrstadhaku &$::=
[ ][ ]nommascsubjoutagrsyadhaku &$::=
Freie Wortstellung auf Satzebene
Nutzung der sauberen ID/LP-Trennung in XDGBeschreibung der Wortstellung losgelöst von grammatischer Funktiontopologische Satzstruktur fürs Arabische:
Verb und andere Verb-Dependenten (sf)
Mafool Motlaks (mmf)
Beispielanalyse
ID
LP
Weitere Beispielanalyse
ID
LP
Beispiel-Lexikoneintrag
=
}{:*}*,{:
{}::
**,,!1,!{:{}:
:
sfonsfmmfout
inlp
advmmobjsubjoutin
id
tuhibu
ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration
AbschlussProof-of-concept: Arabisch kann mit XDG modelliert werdenFür Kombination reiche Morphologie + freieWortstellung sehr gut geeignetVermutung: Topologische Felder funktionierenauch fürs ArabischeGrundlage für größere Grammatik fürsArabische (mit großem Lexikon)
Demonstration
LiteraturRalph Debusmann 2001: A Declarative Grammar Formalism for Dependency Grammar, Diplomarbeit, Computerlinguistik, Universität des Saarlandes, Saarbrücken/GERRalph Debusmann, Denys Duchier, Alexander Koller, Marco Kuhlmann, GertSmolka und Stefan Thater 2004: A Relational Syntax-Semantics Interface Based on Dependency Grammar, Proceedings of COLING 2004, Genf/CHDenys Duchier und Ralph Debusmann 2001: Topological Dependency Trees: A Constraint-Based Account of Linear Precedence, Proceedings of ACL 2001, Toulouse/FRAIgor Melcuk 1988: Dependency Syntax: Theory and Practice, State University Press of New York, Albany/USALucien Tesniere 1959: Elements de Syntaxe Structurale, Klincksiek, Paris/FRAMahier s. Ahmed 1988: An Export System for Understanding Arabic Sentences, Cairo UniversityW. Wright 1967: A Grammar of the Arabic Language, Third Edition, Cambridge, England