KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

27
KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010 Philipp Dorok M.A. Lehrstuhl für Germanistische Linguistik Prof. Dr. Karin Pittner

description

KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010. Philipp Dorok M.A. Lehrstuhl für Germanistische Linguistik Prof. Dr. Karin Pittner. Philipp Dorok M.A. Lehrstuhl für Germanistische Linguistik Prof. Dr. Karin Pittner. Gliederung. Einstieg: Korpuslinguistisches Arbeiten Recherche mit COSMAS II - PowerPoint PPT Presentation

Transcript of KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Page 1: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

KORPUSLINGUISTISCHE RECHERCHEN

04.11.2010

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Page 2: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Gliederung

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

1.Einstieg: Korpuslinguistisches Arbeiten

2.Recherche mit COSMAS II

3.Recherche in der Datenbank Gesprochenes Deutsch

4.Offene Fragen

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

Page 3: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Einstieg: Korpuslinguistisches Arbeiten

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 4: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Recherche mit COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Was ist COSMAS II?

Corpus Search, Management and Analysis System

Eine am IDS konzipierte Volltextdatenbank für das linguistisch motivierte

Recherchieren in den Textsammlungen (= Korpora) des IDS.

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 5: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

COSMAS IIhttp://www.ids-mannheim.de/cosmas2/

Windows-Vollversion 3.6.1 http://www.ids-mannheim.de/cosmas2/win-app/

Online-Version 1.1 (reduziert)https://cosmas2.ids-mannheim.de/cosmas2-web/

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 6: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

DeReKo und COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Deutsches Referenzkorpus (http://www.ids-mannheim.de/kl/projekte/korpora/

).

Umfang von ca. 3,2 Mrd. Wörtern (laut IDS-Homepage).

Das Deutsche Referenzkorpus umfasst Zeitungen, Sach-, Fach- sowie

schöngeistige Literatur aus Deutschland, Österreich und der Schweiz von

1772 bis heute.

Zugang über COSMAS II in der eingeschränkten Web-Version (keine

Installation nötig) oder der normalen Installations-Version.

Für den Zugang zu COSMAS II ist eine Registrierung aus urheberrechtlichen

Gründen erforderlich.

Die Nutzung von COSMAS II ist kostenlos.

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 7: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Mit COSMAS II arbeiten

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

So könnte eine Arbeitssitzung mit COSMAS II aussehen:

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 8: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Mit COSMAS II arbeiten

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Die Kookkurrenzanalyse gibt für die erzielten Treffer Auskunft über die

statistische Wahrscheinlichkeit von gemeinsam auftretenden Wörtern und

deren syntagmatischen Mustern.

Die KWIC-Ansicht (Key Word In Context) stellt zeilenweise die jeweiligen

Treffer farblich hervorgehoben in ihrem Kontext dar.

In der Beleg-Ansicht werden die Treffer - im Unterschied zur KWIC-Ansicht

- nicht in einem auf eine Zeile begrenzten Ausschnitt angezeigt, sondern in

einem größeren Kontext, der bis zur drei Absätze umfassen kann. Aus diesem

Grund spricht man auch von einer Volltext-Ansicht.

Zusätzlich werden Quelleninformationen eingeblendet, die als Zitierform

der Belege für wissenschaftliche Arbeiten benutzt werden können.

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 9: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Ergebnis-Ansicht in COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 10: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

KWIC-Ansicht

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 11: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Beleg-Ansicht

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 12: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Recherche mit COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 13: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Suchanfragen in COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Suchanfragen in COSMAS II werden u.a. gebildet aus

• Wörtern, Teilwörtern, Wortgrundformen,

• Wortklassen (z.B. Verb, Artikel) und grammatikalischen Mustern,

• Angaben zu Wort- und Satzabstand,

• Angaben zu Textbereichen und Position (z.B. erstes Wort eines Satzes).

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 14: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Suchoperatoren in COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

logische Operatoren: UND, ODER, NICHT (beziehen sich auf ganze Texte)

Platzhalteroperatoren:

* beliebig viele Zeichen als Lückenfüllung

+ 0 oder 1 beliebiges Zeichen als Lückenfüllung

? Genau ein Zeichen als Lückenfüllung

Grundformenoperator: &

Ignorierungsoperator: $

Abstandsoperatoren: /w (Wörter), /s (Sätze), /p (Absätze), /z (Zeilen)

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 15: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Recherche mit COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 16: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Beispiele für Suchanfragen in COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Suchanfrage: &blau /+w5 &Himmel

Viel Spass unter blauem Himmel

Im Judentum symbolisiert das Blau des Himmels Gott, den Glauben und die Offenbarung;

Die Farbe Blau erinnert an einen wolkenlosen Himmel, an das blaue Blut der Aristokratie, an einen herrlichen Gebirgssee oder das südliche Mittelmeer, vielleicht auch an einen Zustand oder eine politische Richtung.

Beide sagten aus - und einer log dabei das Blaue vom Himmel herunter.

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 17: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Beispiele für Suchanfragen in COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Suchanfrage: &blau /-w5 &Himmel

Denn der Himmel lacht in blassem Blau über dem See.

Schon früh am Morgen war der Himmel strahlend blau und die Sonne zeigte sich in voller Pracht.

Kreuzlingen hat die ersten Spiele unter freiem Himmel mit einem blauen Auge überstanden.

Als sie die Augen wieder öffnete, war der Himmel über ihr gewesen, ein blauer, riesiger Himmel, wie sie ihn noch nie gesehen hatte.

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 18: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Beispiele für Suchanfragen in COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Suchanfrage: entweder /+s0 "oder„

Geprobt wird einmal pro Woche, entweder am Donnerstag oder Freitag.

Die Gruppe trifft sich entweder zum theoretischen Büffeln oder zum konkreten Lernen vor Ort, nämlich in einem Stall.

«Alle Frauen schwimmen im Fluss der weiblichen Sexualität. Entweder sie dümpeln gemütlich vor sich hin, oder sie ertrinken fast in ihren Erotiksehnsüchten», schreibt Maya Onken in ihrem neuesten Buch.

Man hatte sich zu entscheiden - entweder oder.

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 19: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Beispiele für Suchanfragen in COSMAS II

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Suchanfrage: der /+w1 (kleine ODER große) /+w1 Mann

Der große Mann mit den kräftigen Händen hat Routine darin, nach Erdbeben vor Ort Soforthilfe zu leisten.

Der kleine Mann blieb stumm, fassungslos.

Der große Mann des deutschen Tischtennis bestreitet in Viernheim sein letztes Spiel als Einzelspieler, bevor er seine Trainer-Karriere startet.

Der kleine Mann wog bei seiner Geburt 3.200 Gramm und war 49 Zentimeter groß.

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 20: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Wie heißt die Suchanfrage?

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Beispiele für Belege:

rotnasigenRoto-HallenRotor-AnlagenrotorangenenRotrücken-TotenkopfäffchenRotsandplätzenRotzgören

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Suchanfrage: rot*en

Page 21: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Wie heißt die Suchanfrage?

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Beispiele für Belege:

SchachteinsturzSchauspielerherzSchlangenwurzSchleudersturzSchmerzSchnurzdiburzSchwarz-Silber-Schwarz

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Suchanfrage: sch*rz

Page 22: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Wie heißt die Suchanfrage?

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Beispiele für Belege:

3D-GestaltaufgestacheltaufgestapelteingestampfteingestelltFlugestablishmentFolgestreithingestottert

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Suchanfrage: ???gest*t

Page 23: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Wie heißt die Suchanfrage?

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Beispiele für Belege:

zerfallenhinfälligGammelfleischabfällenAlltagsfallenVerteidigungsfallesFriedhofallee

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Suchanfrage: *fall??

Page 24: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Recherche in der Datenbank Gesprochenes Deutsch

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Internetseite: http://dsav-wiss.ids-mannheim.de/DSAv/

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 25: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Recherche in der Datenbank Gesprochenes Deutsch

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 26: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Recherche in der Datenbank Gesprochenes Deutsch

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen

Page 27: KORPUSLINGUISTISCHE RECHERCHEN 04.11.2010

Offene Fragen

Philipp Dorok M.A.Lehrstuhl für Germanistische LinguistikProf. Dr. Karin Pittner

Haben Sie noch Fragen zur korpuslinguistischen Recherche?

Sie können mich unter [email protected] kontaktieren, wenn sich später

weitere Fragen ergeben sollten.

Eine gute Einführung zur Korpuslinguistik:

Lemnitzer, Lothar und Zinsmeister, Heike (2006): Korpuslinguistik. Eine Einführung.

Tübingen: Narr.

Online-Einführungskurs zur Korpuslinguistik von Noah Bubenhofer (IDS Mannheim):

Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge.

http://www.bubenhofer.com/korpuslinguistik/kurs/

KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010

1. Einstieg: Korpuslinguistisches Arbeiten2. Recherche mit COSMAS II3. Recherche in der Datenbank Gesprochenes Deutsch4. Offene Fragen