Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter...

35
E BERHARD K ARLS U NIVERSITÄT T ÜBINGEN Seminar f ¨ ur Sprachwissenschaft Brauchen wir neue Wörter ? Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik Lothar Lemnitzer [email protected] unster, 12. November 2004 Brauchen wir neue W ¨ orter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.1

Transcript of Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter...

Page 1: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

t

Brauchen wir neue Wörter ?Neologismen als Problem und Aufgabe

von Lexikographie undComputerlinguistik

Lothar Lemnitzer

[email protected]

Munster, 12. November 2004

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.1

Page 2: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tVorspann

„Mit rund 5000 neu aufgenommenenWörtern, wie beispielsweise Billigflieger,Dosenpfand, Fotohandy, Genmais, Ich-AG,LAN-Party, Minijob und Sars, ist dasWörterverzeichnis auf den aktuellen Standgebracht.“ (Duden Band 1,Rechtschreibung, 23. Auflage 2004, Vorwort)

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.2

Page 3: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tVorspann

„One of our major concerns has beencompleteness ... Huge numbers of newwords and phrases, so essential for thosekeeping in touch with changes in ideas andtechnology, are included (CIDE, 1995,Foreword)

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.3

Page 4: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tStandardwörterbücher und neue Wörter

In Neuauflagen von (Lerner)Wörterbüchern werdenrelativ viele neue Wörter verzeichnet, weil:

bei diesen Wörtern die Normunsicherheit derBenutzerInnen besonders groß ist

die Aufnahme vieler neuer Wörter einMarketingargument für den Verlag ist

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.4

Page 5: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tNormunsicherheiten

Schreibt man Carsharing, Car-Sharing oderCar-sharing?

Wie wird E-Zine ausgesprochen?

Heißt es die E-Mail oder das E-Mail?

Welche Genitivform ist richtig: des Piercingsoder des Piercing?

Wie heißt der Plural von Flyer : die Flyer oderdie Flyers?

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.5

Page 6: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tNormunsicherheiten 2

Schreibt man ’up-talk’ oder ’up talk’ oder’uptalk’?

Kann man ’uptalk’ auch als attributives Adjektivverwenden?

Schreibt man ’monetize eyeballs’ oder ’monetizethe eyeballs’?

Was bedeutet diese Wendung? In welchemZusammenhang wird sie verwendet?

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.6

Page 7: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tSpezialisierte Sammlungen

Lexikographische Sammlungen von Neuwörterndes Deutschen:

Gertrude Harlass / Heinz Vater: Zum aktuellendeutschen Wortschatz. GNV Tübingen 1974

Alfred Heberth: Neue Wörter. Neologismen inder deutschen Sprache seit 1945. Wien 1977

Lemnitzer / Ule: die Wortwarte. Wörter für heuteund morgen. Tübingen (2000-2004; online)

Dieter Herberg/Michael Kinne/Doris Steffens:Neuer Wortschatz. Neologismen der 90er Jahreim Deutschen. de Gruyter, 2004

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.7

Page 8: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tSpezialisierte Sammlungen

Lexikographische Sammlungen von Neuwörterndes Deutschen:

The Barnhart Dictionary of New English Since1963. New York 1973 (Fortführung 1980)

online: http://www.highlands.com/Lexik/bdc.htm(Barnhart Dictionary Companion)

Burchfield: A Supplement to the Oxford EnglishDictionary. 4 vol., 1972-1988

Fifty Years Among the New Words: A Dictionaryof Neologisms, 1941-1991 (John Algeo, eineregelmäßige Kolumne in ’American Speech’)

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.8

Page 9: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tInhalt

Vorspann

Was sind Neuwörter / Neologismen?

Typologische Einordnung vonNeologismenwörterbüchern

Benutzung von Neologismenwörterbüchern

Struktur und Informationsprogramm vonNeologismenwörterbüchern

Wie enstehen Neologismensammlungen (amBeispiel der Wortwarte)

AusblickBrauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.9

Page 10: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tWas sind Neologismen?

„Ein Neologismus ist eine lexikalischeEinheit bzw. eine Bedeutung, die in einembestimmten Abschnitt der Sprachentwicklungin einer Kommunikationsgemeinschaftaufkommt, sich ausbreitet, als sprachlicheNorm allgemein akzeptiert und in diesemEntwicklungsabschnitt von der Mehrheit derSprachbenutzer über eine gewisse Zeit hinals neu empfunden wird“ (Herberg et al.20004, S. XII)

Stichwörter: Usualisierung, Lexikalisierung, Integra-

tion

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10

Page 11: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tWas sind Neologismen?

Kandidaten für ein Neologismenwörterbuch

sind Wörter, Wortteile oder Wortgruppen(downloadbar, Cyber-, monetize eyeballs)

sind Neuprägungen (Handy ) undNeubedeutungen (Maus)

sind bisher in keinem Wörterbuch verzeichnet (=Ausschluss bekannter Wörter)

werden von vielen Sprechern ausreichendhäufig verwendet (= Ausschluss vonOkkasionalismen)

diese Sprecher sind Durchschnittssprecher (=Ausschluss von Fachsprachen)

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.11

Page 12: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tWas wird ausgeschlossen?

Als Neologismen nicht berücksichtigt werden

transparente Komposita und Derivationen

übertragene Verwendungen bekannterBedeutungen von Wörtern

Okkasionalismen

Wörter von geringem Interesse

Modewörter

(nach: Barnhart and Barnhart: The dictionary of

Neologisms)

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.12

Page 13: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tTypologische Einordnung von Neologismenwörterbüchern

Neologismenwörterbücher sind Wörterbücher mit

pragmatisch beschränkter Lemmaauswahl. Ihr In-

formationsprogramm ähnelt dem allgemeinsprachli-

cher Gesamtwörterbücher.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.13

Page 14: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tSubtypen von Neologismensammlungen

Kumulative Sammlungen mit relativ kurzenPublikationszyklen (z.B. Algeo, Wortwarte),

Ergänzungslieferungen (Komplemente) zugroßen allgemeinsprachlichenGesamtwörterbüchern (z.B. Burchfield),

eigenständige Neologismenwörterbücher (z.B.Neologismen der 90er Jahre).

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.14

Page 15: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tBenutzung und Benutzergruppen

Als Benutzer eines spezialisiertenNeologismenwörterbuchs kommen in Frage:

am normgerechten Gebrauch von neuenWörtern Interessierte (SprachenlernerInnen,sprachlich Tätige);

an der lexikographischen oder linguistischenBeschreibung Sprache und des SprachwandelsInteressierte (LexikographInnen, LinguistInnen);

interessierte Laien, SprachkritikerInnen etc.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.15

Page 16: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tBenutzungssituationen

Die Wahl eines Neologismenwörterbuchs, umeine lexikalische Wissenslücke zu schließen,setzt einen hohen Grad an linguistischer und(meta)lexikographischer Kompetenz voraus.

Andere Benutzungssituationen (zuForschungszwecken oder zur Unterhaltung) sindwahrscheinlicher.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.16

Page 17: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tStruktur eines Neologismenwörterbuchs

Wir betrachten:

die Makrostruktur

die Mikrostruktur bzw. dasInformationsprogramm

von Neologismenwörterbüchern am Beispiel der

Wortwarte.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.17

Page 18: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tMakrostruktur

Die Elemente der Makrostruktur der Wortwarte:

Einleitung und Hintergrund,

chronologisch geordnete Tageswortlisten(alphabetisch),

sekundäre Zugriffsstrukturen (alphabetisch,thematisch)

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.18

Page 19: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tMikrostruktur und Informationsprogramm

Stichwort

Wortart und Flexion

Verwendungshäufigkeit (ermittelt über Google)

Lexikalisches Feld

Belegbeispiel

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.19

Page 20: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tMengengerüst der Rohdaten

Abkürzungen Eigennamen orth. Fehler Tokenisier−fehler

Gesamtzahl Token

neue Strings

Kandidaten f.Neologismen

Bindestrichwörter

472288609

701057

28198810000

27090*

orth. Varianten fremdsprachlichelexikalische Zeichen

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.20

Page 21: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tStatistisches Profil der Wortwarte

Eintragskategorien und -zahlen in der WW(Gesamt: 16700, 4. Nov. 2004)

Adjektive: 952, Verben: 326,

Informationstechnologie: 3137 Einträge (–>heise)

Wirtschaft: 2344 Einträge (–> FTD)

Techik, Politik, Gesellschaft: ca. 1100

Telekommunikation, Technik, TV, Verkehr,Biotechnologie, Sprache, Mediz in, Gesundheit,Sport, Bildung, Musik, Ernährung, Wissenschaft,Recht, Umwelt , Mode: < 1000 Einträge.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.21

Page 22: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tWörterbucherstellung - am Beispiel der WW

Bei der Wörterbucherstellung können wir diefolgenden Phasen unterscheiden

Festlegung von Wörterbuchgegenstand undWörterbuchbasis

Datensammlung und -auswertung

Lemmaselektion

Erstellung von Einträgen

Publikation

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.22

Page 23: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tWörterbuchgegenstand und -basis

Gegenstand: Gegenwartsdeutsch, repräsentiertdurch Zeitungstexte

Auswahl von Tageszeitungen (Datenerhebungtäglich)

z.Z. ausgewählt: Handelsblatt, Süddeutsche,Financial Times, Rheinische Post, Tagesspiegel,Zeit, Spiegel, heise Website, Perlentaucher

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.23

Page 24: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tDatensammlung und -auswertung

Herunterladen der Texte auf den eigenenRechner

Bereinigung und Segmentierung der Texte

Aufbau einer Wortliste (Index)

Filter 1: Abgleich mit Referenzkorpus (80er und90er Jahre)

Filter 2: Abgleich mit Bestand der Wortwarte

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.24

Page 25: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tLemmaselektion

Die Lemmaselektion ist ein rein intellektuellerProzess. Ausgewählt werden:

Relevante Neuprägungen

Interessante Neuprägungen (aus linguistischerSicht)

Nicht-transparente Komposita und Derivationen

Lehnwörter und Komposita mitLehnwortbestandteilen

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.25

Page 26: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tLemmaselektion

Nicht erfasst bzw. ausgewählt werden:

Wortbestandteile (Affixe)

Wortgruppen (wenn nicht durch Bindestrichgekoppelt)

Neubedeutungen bereits registrierterlexikalischer Einheiten

Transparente Komposita und Derivationen

Rechtschreibfehler und Zeichenketten, die keineWörter sind

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.26

Page 27: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tErstellung von Einträgen

Die ausgewählten Wörter werden

mit einem Eintragsschema und

mit Belegen aus dem Korpus verbunden

Weitere Aufgaben:

Rückführung auf die Grundform(Ansetzungsform)

Erstellung der Angaben (Wortart, Flexion,semantisches Feld)

Auswahl und minimale Bearbeitung des Belegs

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.27

Page 28: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tErgänzung des Datenangebots

In unregelmäßigen Abständen

werden die Lemmata mit Frequenzangabenversehen (über Google),

werden die sekundären Zugriffsstrukturen(alphabetische Liste, Themenliste) erzeugt bzw.aktualisiert.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.28

Page 29: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tPublikation

Die bearbeiteten Daten

1. werden in ein XML Format umgewandelt,

2. daraus wird eine HTML Datei erzeugt,

3. die HTML Datei wird als „neue Wörter“ auf denServer gestellt,

4. eine Kopie wird ins Archiv gestellt,

5. die Dateien für die Navigation im Archiv werdenaktualisiert.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.29

Page 30: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tSprachtechnologie für die Neologismenlexikographie

Rolle sprachtechnologischer Verfahren in derNeologismenlexikographie:

Tokenisierung und Satzsegmentierung

Lexikalische Statistik

(geplant: Lemmatisierung und morphologischeAnalyse)

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.30

Page 31: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tNeologismen für Sprach- und Texttechnologie

Nutzen der Aktualisierung lexikalischer Ressourcenfür Sprach- und Texttechnologie

Aktuellere Beschreibung von (neuen) Affixen

Präzise lexikalische Kategorisierung, z.B.simsen = Kommunikationsverb, erlaubtInferenzen

Erkennung und Zusammenführung vonSchreibvarianten

Erkennung und Analyse von unknown wordsund named Entities, z.B. beim Wortartentagging

Aus den Belegbeispielen: Muster fürdefinitorische Kontexte.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.31

Page 32: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tBeispiel Affixe

Cyber- - WW: 144/610; DEREKO: 1020/390

-[hH]opping - WW: 1199/112; DEREKO:3032/116

Ziel: valides statistisches Maß für die Differenz(en)

finden (Produktivitätsmaß).

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.32

Page 33: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tBeispiel ’unknown words’

Allgemeines ’Gesetz’ - Sehr viele Wörterkommen nur einmal in einem Textkorpus vor,unabhängig davon, wie groß das Textkorpus ist.D.h. dass sprachtechnologische Werkzeugenotwendigerweise mit ’Hapaxlegomena’konfrontiert sind.

Eigene Beobachtung: der Anteil unbekannterWörter neuer Texte, vor dem Hintergrund einesTextkorpus von 130 Mill. Token ist weit unter 1%, bleibt aber nahezu konstant.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.33

Page 34: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tFazit: Brauchen wir neue Wörter?

Die TextproduzentInnen (ge)brauchen neueWörter

denn: Sprache ist ein generatives System

also: ist es sinnvoll, diesem PhänomenAufmerksamkeit zu schenken.

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.34

Page 35: Brauchen wir neue Wörter ? Neologismen als Problem und ... · Brauchen wir neue Wor¨ ter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.10.

EB

ER

HA

RD

KA

RL

SU

NIV

ER

SIT

ÄT

BIN

GE

NS

emin

arfu

rS

prac

hwis

sens

chaf

tDas war’s

Vielen Dankfür Ihre Aufmerksamkeit!

Brauchen wir neue Worter ?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik – p.35