Statistische Suche nach melodischen Prototypen Musikwissenschaftliches Institut Hamburg WS 2005/06...

Post on 05-Apr-2015

102 views 0 download

Transcript of Statistische Suche nach melodischen Prototypen Musikwissenschaftliches Institut Hamburg WS 2005/06...

Statistische Suche nach melodischen Prototypen

MusikwissenschaftlichesInstitut Hamburg

WS 2005/06Klaus Frieler

1. Einleitung Der melodische Bogen

Huron (1996) untersuchte 36,075 Phrasen aus 6,251 Volkslieder aus der Essen Datenbank (EsAC) in Hiblick auf ihre grobe Kontur:

1. Nimm die erste und die letzte Note und den Mittelwert der dazwischen liegenden Noten.

2. Betrachte die Intervallrealtionen +, -, 03. 9 möglichen Kombinationen, z.B.

+- = konvex, ++ = aufsteigend, -- = fallend, -+ = konkav, 00 = horizontal

Wir machten dasselbe mit unseren Daten

1. Einleitung Grobkontur - Vergleich

1. Einleitung Idee

Untersuche die Kontur von melodischen Phrasen mit Polynom-Fits und Cluster-verfahren

Polynom-Fit zuerst vorgeschlagen vonSteinbeck 1982:

2. Daten Die ausgewählten Lieder

50 Songs von internationalen Boy- und Girlgroups

Jeder Song war in den offiziellen Top 50 Deutsch Single Charts zwischen 1990 and 2005

Melodien wurden aus Lead- und Backingvocals der Songs extrahiert.

Insgesamt 17,000 Noten

2. Daten Segmentierung

Ein Song kann in vier hierarchische Formebenen aufgegliedert werden:

Ebene 1 – Der Song als ganzes Ebene 2 – Formeinheiten (Strophe,

Refrain , Bridge etc.) Ebene 3 – Phrasengruppen Ebene 4 – Phrasen

2. Daten Segmentierung

Existierende Segmentierungswerkzeuge (z.B. Temperley & Sleator, 1999, Cambouropoulos 2001) ergaben keine hinreichend guten Resultate, also wurden die Songs von Hand segmentiert

Das ergab 1516 Phrasen Aussonderung von identische Phrasen in jedem Song Aussonderung von von Rap-Phrasen ohne erkennbare

Tonhöhenkontour

Es blieben 989 Phrasen. Phrasenlängen zwischen 2 und 26 Noten, Maximum bei 5

Noten pro Phrase

2. Daten Verteilung der Phrasenlängen

2. Daten Vorverarbeitung

Verwendete Informationen:1. Anzahl der Noten in jeder Phrase 2. Polynom-Fits zu Serien normierter

Tonhöhen und Einsatzzeiten

2. DatenNormierung der Phrasen

Alle Einsatzzeiten der Phrasen wurden in den Bereich von 0-1 skaliert

Allle Phrasen wurden so transponiert, dass die mittlere Tonhöhe bei 0 lag.

Tranponierte Tonhöhen wurden durch 12 geteilt Skalierung einer Oktave auf den Wert 1

p‘ = (p– pmittel) / 12 (Normierung des Ambitus auf [-1,1] wurde

untersucht, aber fallen gelassen)

2. Data Polynom-Fit

Polynom: p(t) = antn + an-1tn-1 +…+a1t + a0

n ist die Ordnung des Polynoms. Polynom-Fit: Suche Koeffizienten an…a0, so

dass die Kurven maximal nah beieinander sind Problem: Welche Polynomordnung soll

man wählen? Trade-off zwischen zu genau und zu grob. Nach Vorversuchen, Fits 2., 4. und 6. Ordnung

ausgewählt.

2. Data Polynom-Fit: Beispiele

´

3. ClusterungAlgorithmen

Wir benutzten folgende Methoden: Ward- und nachfolgende k-means-Clusterung

(SPSS), inklusive Zahl der Noten (ZdN) Einfaches k-means Verfahren ohne ZdN

(WEKA) „Cluster feature tree“ mit nachfolgender

hierarchischer Clusterung (mit ZdN, SPSS) Erwartungsmaximierungs-(EM)Clusterung (R

mit ZdN, WEKA ohne ZdN)

3. ClusterungResultate

Viele, viele verschiedene Clusterlösungen gefunden.

Lösungen zu Polynomen 4. Und 6. Ordnung hart zu interpretieren

Cluster feature tree war am schlechtesten Beste Ergebnisse: 2. Ordnung/EM (ohne

ZdN) und einfaches k-Means (4 Cluster ohen ZdN): Ergab ungefähr dieselben Cluster.

4. ErgebnisseEinige Beispiele (Clusterschwerpunkte)

Ward/kMeans (ZdN), 2. Ord. EM (ZdN), 4. Ord. EM, 4. Ord.

EM, 6.Ord k-Means, 6. Ord. Ward/k-Means (ZdN, 6. Ord)

4. Ergebnisse EM/k-Means 2. Ordnung

Jeweils 4 Cluster mit sehr ähnlichen Clustern! (Beide ohne ZdN)

4. ErgebnisseKonturenverteilung in den EM2-Clustern

.

Cluster Konkav-

fallend

Mischung Großer Bogen Kleiner Bogen

N 142 320 190 337

Fallend 40% 44% 0% 4%

Steigend 3% 26% 4% 26%

Konkav 57% 7.5% 0% 0%

Konvex 0% 14% 96% 70%

Horizontal 0% 8.5% 0% 0%

4. Ergebnisse EM(2.Ordnung) – Clusterplots

Cluster 1 (Konkav, fallend) Cluster 1 + 2 (Mischcluster)

Cluster 1, 2 + 3 (Großer Bogen) Cluster 1, 2, 3 + 4 (Kleiner Bogen)