09-Digital Audio edit - mherzog.com · Was ist Audio? Eigenschaften von Schallwellen Das...
Transcript of 09-Digital Audio edit - mherzog.com · Was ist Audio? Eigenschaften von Schallwellen Das...
DIGITAL AUDIO
Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in der PDF-Version nicht enthalten sind.
Was ist Audio?
Eigenschaften von Schallwellen
Das menschliche Ohr
Räumliches Hören, Töne, Klänge & Geräusche
Warum Audio digitalisieren?
Analog zu Digital
Probleme der AD/DA-Wandlung
Psychoakustik
Kompression (MP3)
Übertragung (MIDI)
Audio Retrieval
Übersicht
2AGENDA
3
Töne
Sprache
Geräusche
Musik
...
Was ist Audio? I
Was ist Audio?
4
Schall
! Schwingungen (Wellen) die sich in einem Träger
räumlich ausbreiten (Veränderung des Drucks)" Flüssigkeiten
" Festkörpern
" Gasen (Schallgeschwindigkeit: 330m/s = 1188 km/h)
! periodische Schwingungen (Klänge)" Musikinstrumente
" Gesang
" Wind
" ...
! nichtperiodische Schwingungen" Sprache
" Geräusche
" ...
Was ist Audio? II
Was ist Audio?
5
Amplitude! objektiv:
Energie des Klanges
! subjektiv:Lautstärke der Schwingung
Was ist Audio? II
Was ist Audio?
6
Frequenzen! Infraschall: 0 bis 20 Hertz (Hz)
! Hörschall: 20 bis 20 kHz
! Ultraschall: 20 kHz bis 1 GHz
! Hyperschall: 1 GHz bis 10 THz
Was ist Audio? III
Was ist Audio?
Was ist Audio? IV
7Was ist Audio?
Longitudinal- und Transversalwellen
Longitudinalwelle:
! Oszillatoren schwingen in der Ausbreitungsrichtung
Transversalwelle:
! Oszillatoren schwingen quer zur Ausbreitungsrichtung
8Eigenschaften von Schallwellen
Wellenlänge
Die Länge einer Welle (d.h. der Abstand bis zur nächsten Wiederholung) bestimmt sich aus der Periodenlänge T und der Ausbreitungsgeschwindigkeit c
9Eigenschaften von Schallwellen
Reexion
10
Reexionsgesetz (Einfallswinkel gleich Ausfallswinkel) gilt für Schallwellen nur, wenn die Grenzäche groß genug im Vergleich zur Wellenlänge ist
! d.h. in kleineren Räumen keine Reexion tiefer Frequenzen
Rauigkeit der Oberäche führt zu di!user (zerstreuender) Reexion, wenn Unebenheiten in der Größenordnung der Wellenlänge
! d.h. auch bei zentimetergroßen Unebenheiten wirkt Wand auf tie!requenten Schall als "glatt"
Eigenschaften von Schallwellen
Absorption, Brechung
Ein Teil der Schallenergie wird nicht reektiert
! Absorptionsgrad abhängig vom Material und der Schallfrequenz
Dissipation: Umwandlung in Wärmeenergie
Transmission: Weiterleitung im absorbierenden Medium
Aufteilung der absorbierten Energie in Dissipation und Transmission
! frequenzabhängig: niedrige Frequenzen höhere Transmission (Körperschall)
Auch Schall wird gebrochen, z.B. bei Luftschichten verschiedener Temperatur
11Eigenschaften von Schallwellen
Beugung
Schall-"Schatten" entsteht erst, wenn ein Gegenstand groß genug im Vergleich zur Wellenlänge ist
Bei Gegenständen in Größenordnung der Wellenlänge tritt Beugung auf
! Wellen iessen "um das Hindernis herum"
! Wellen werden von einem Spalt zerstreut
12Eigenschaften von Schallwellen
13
Das menschliche Ohr
Das menschliche Ohr
14
Das menschliche OhrAussenohr:
! HRTF = Head Related Transfer Function
Mittelohr:
! Trommelfell, Hammer, Amboss, Steigbügel: Verstärkung der Kraftwirkung
Innenohr:
! Schnecke (cochlea)
! Aufgerollte Röhren (Gänge), gefüllt mit Lymphüssigkeit
Das menschliche Ohr
Schnecke (Cochlea)
15Das menschliche Ohr
Räumliches HörenStereo-E!ekt
! Unterschiedliche Lautstärke des Schallereignisses an beiden Ohren
! Zeitliche Verzögerung des selben Schallereignisses in seiner Wahrnehmung durch beide Ohren
! Verzögerungsmessung liefert Information über Entfernung der Quelle
16Räumliches Hören
Kann ein einseitig tauber Mensch räumlich hören?
! Eingeschränkt: ja!
! Reexion und Beugung an Umwelt und Ohrmuscheln liefern umfangreiche Information
Frequenzabhängigkeit der Ortung:
! Niedrige Frequenzen generell schlechter zu orten
! Konsequenz physikalischer Tatsachen (Wellenlänge:Hindernis)
! Siehe z.B. „Subwoofer“-Technologie
Laufzeitdi!erenzen
17Räumliches Hören
Head Related Transfer Functions (HRTF)
18
Für alle Positionen rund um den Kopf Impulsantwort von der Position zu beiden Ohren messen (HRIR)
Fourier-Transformation davon ist die HRTF
! Enthält alle physikalischen cues für die Lokalisierung
! HRTF von Mensch zu Mensch verschieden
! Sobald HRTF für beide Ohren bekannt ist, kann mit einem Kopfhörer Raumklang (also auch vorne/hinten und oben/unten) erzeugt werden
Räumliches Hören
19
Ton, Klang und Geräusch
Töne sind vom Menschen wahrnehmbare kleine Luftdruckänderungen
Primärempndungen der Tonwahrnehmung: ! Tonhöhe (Bsp. verschiedene Klaviertasten)
! Lautstärke (Bsp. Trommelanschlag)
! Klangfarbe (Bsp. gleicher Ton auf verschiedenen Instrumenten)
Ton:! reine Sinusschwingung
Klang: ! Überlagerung von mehreren Sinusschwingungen
! alle drei Primärempndungen wahrnehmbar
Geräusch: ! entsteht durch unregelmäßige Schwingungen einer Schallquelle
! nur Lautstärke wahrnehmbar
20Klänge und Geräusche
21
Qualität der Reproduktion! Qualität ist NUR abhängig von der Analog/Digital/Analog-
Konvertierung
! Qualität ist unabhängig von" Verarbeitung (z. B. Geräte)
" Transport (z. B. Kabel)
" Speicherung (z. B. Festplatte, Magnetband, CD)
! Möglichkeiten der Konvertierung/Bearbeitung" verlustfreies Kopieren
" nicht-sequentieller Zugri!
" nicht-destruktives Editing
" platzsparendere Speicherung
" ...
Warum Digital ?
Warum Digital?
22
PAM (Puls Amplitude Modulation)! Ermittlung von Amplitudenwerten innerhalb eines Zeitintervalls
Analog zu Digital I
Analog zu Digital
PWM (Puls Width Modulation)! Ermittlung von Impulsen, deren Länge die Intensität des
analogen Signals wiedergibt
23
Analog zu Digital II
Analog zu Digital
24
PCM (Pulse Code Modulation)! universelles Verfahren zur
Digitalisierung von analogen Zeitreihen
! Sampling" Abtastung des analogen Signals in
einem festgelegten Zeitintervall
" Verwendung von PAM
! Quantisierung" Zuordung eines ganzzahligen
Wertes innerhalb eines festgelegten Zahlenbereiches
Analog zu Digital III
Analog zu Digital
Nyquist Abtast-Theorem! Harry Nyquist (1889 – 1976)
! Mathematisch bewiesen durch Claude E. Shannon und Vladimir Aleksandrovich Kotelnikov
! die Abtastrate (Sampling Frequenz) muss doppelt so hoch sein, wie die höchste Frequenz des abzutastenden Signals
! Folge: Frequenz-Überlappung (Aliasing)ggf. falsche Rekonstruktion des Signals
25
Probleme der AD/DA-Wandlung I
Nyquist
Shannon
Kotelnikov
Probleme der AD/DA-Wandlung
26
Quantisierungsrauschen! Fehler durch Rundung bei der Digitalisierung
Probleme der AD/DA-Wandlung II
Probleme der AD/DA-Wandlung
27
! Beispiele
Probleme der AD/DA-Wandlung II
Probleme der AD/DA-Wandlung
28
Verzerrungen (Clipping)! Übersteuerung des Eingangsignals
! Abschneiden der Spitzen eines Signals
! Folge von Variablenüberläufen
Probleme der AD/DA-Wandlung III
Probleme der AD/DA-Wandlung
29
Hörschwelle! unterschiedliche Empndlichkeit
(Lautstärkeeindruck) des Gehörs für verschiedene Frequenzbereiche
! höchste Empndlichkeit im Bereich von 2 kHz bis 4kHz
Psychoakustik I
Psychoakustik
Psychoakustik II
30Psychoakustik
31
Maskierung! Überdeckung eines Frequenzbereiches durch ein Störsignal
(gleichzeitige Maskierung)
! Zeitliche Maskierung verdeckt auch nach Abschalten des Störsignals den betre!enden Frequenzbereich(zeitliche Maskierung)
Psychoakustik III
Psychoakustik
32
Dynamikkompression! Einsatz nichtlinerarer (logarithmischer) Quantisierung
! kleine Signale werden mit niedrigeren Bitwerten kodiert
! Beispiele: A-law, u-Law
Psychoakustische Kompression! Verwendung von Subband-Kodierung & Maskierung
! dadurch Entfernung von irrelevanten Daten
! Reduktion der Datenrate
! Beispiel: MP3, AAC
Audio-Kompression
Kompression
33
Kurzform von MPEG-1 Audio Layer 3
! Verwendung der»psychoakustischen Kompression«
! Nicht für den Menschen hörbare Informationen werden entfernt
! Entfernung von Redundanzen
Kompression von Audiodaten bei vermeintlich geringem Qualitätsverlust
! Kanalkopplung (Stereo) – Di!erenzsignalbildung
! Entfernung nicht hörbarer Frequenzen und maskierter Audioinformation
Karl-Heinz Brandenburg, Harald Popp: An Introduction to MPEG Layer 3. EBU Technical Review, Juni 2000.
! http://www.iis.fhg.de/amm/
Kompression MP3 (I) Übersicht
Kompression
34
Algorithmus (Übersicht)
Kompression MP3 II
Kompression
35
Algorithmus (1)! Anwendung eines Faltungslters, um ein Signal in 32 Bänder zu
unterteilen
! Berechnung des Schallddruckpegels eines Bandes
! wenn der Schalldruckpegel eines Bandes kleiner ist als der Maskierungsschwellwert eines Nachbarbandes, wird dieses Band nicht kodiert.
! Andernfalls werden die Koe!zienten quantisiert
Kompression MP3 III
Kompression
36
Algorithmus (2)! Unterteilung des
Datenstromes in Frames
! Ein Frame entspricht einem Tonsignal über eine bestimmte Zeiteinheit
! Jeder Frame enthält 384 (1152) Samples, die Abtastwerte aus 32 Teilbändern repräsentieren
! Aus jedem Teilband stammen 12 Werte
Kompression MP3 IV
Kompression
37
Algorithmus (Übersicht)
Kompression MP3 V
Kompression
Kompression MP3 VI
Datenrate von 32 bis zu 320 KBit/s
Samplingrate 32/44,1/48 kHz16 Bit Stereo
Abb. zeigt typische Kompressionsartefakte bei der Fourier-Transformation
38Kompression
Advanced Audio Coding (AAC)Vergleich zu MP3
! bessere Qualität bei gleicher Dateigröße
! tonale und geräuschhafte Elemente im Eingangssignal e!ektiver erkannt und kodiert
! Pre-Echo Problem (Kompressionsartefakte) verbessert.
! Unterstützung für Multichannel-Audio (bis 48)
! Bis zu 96 KHz Abtastfrequenz
! DRM-Verfahren »FairPlay« implementiert
Entwicklung! Standardisiert bei der ISO MPEG2/MPEG4, EBU-Recommendation
! Dolby (AC3), Fraunhofer IIS (MP3), AT&T, Sony, Nokia ...
Erweiterung HE-AAC für niedrige Bitraten! MPEG-4 High E"ciency Advanced Audio Coding,
mit Spectral Band Replication (SBR) auch AACplus v1
! Mit Parametric Stereo (PS) auch AACplus v2
39Kompression
Hörbeispiele Audiocodecs
40
http://inka.fhtw-berlin.de/Herzog/
Kompression
41
MIDI (Musical Instrument Digital Interface)! standardisiertes Protokoll zur Steuerung
elektronischer Musikinstrumente und Musike!ektgeräte
! physikalische Schnittstelle
! Überbegri! für die Musik, die diesem Standard genügt
! 1984 entwickelt
! Standardisierung und Weiterentwicklung durch " International Midi Organisation (IMA)
" MIDI Manufacturers Association(MMA)http://www.midi.org/
Übertragung - MIDI (I)
Übertragung
42
Komponenten! Sequenzer
" Komponieren/Wiedergabe von Musik mit Rechner
" MIDI Sequenzen werden in MIDI-Dateien gespeichert
! Synthesizer" Synthetische Erzeugung und
Manipulation von Klängen
! Sampler" Wie Synthesizer, jedoch synthetisiert
ein Sampler Töne aus einer Palette von Instrument-Samples
Übertragung - MIDI (II)
Übertragung
43
Datenformat! instrumentenbezogene Kodierung
" Lautstärke
" Grundfrequenz
" Bezeichnung des Instruments
! MIDI-Nachrichten bestehen aus einem Statusbyte und bis zu 3 Datenbytes" Statusbyte 1 B B B K K K K
" Datenbyte 0 _ _ _ _ _ _ _
" Statusbyte kündigen eine Aktion an und gliedern sich in Kanal- und Systembefehle.
" Kanalbefehle (BBB) beziehen sich auf der insgesamt 16 Kanäle (KKKK), mit denen jeweils ein angeschlossenes Instrument assoziiert ist
Übertragung - MIDI III
Übertragung
44
Vorteile! MIDI-Dateien sind plattformübergreifend
! MIDI-Dateien sind sehr klein: 1 min Musik ca. 15- 30 Kbyte
! MIDI Kodierung entspricht der Vorgehensweise beim klassischen Komponieren
Nachteile! Ohne wirklich gute Instrumente kein schöner Klang,
da synthetische Klangerzeugung
! keine Sprache oder Geräusche
! MIDI-Dateien klingen auf unterschiedlichen Systemen, je nach eingesetzten Geräten unterschiedlich
Übertragung - MIDI (IV)
Übertragung
45
General Midi (GM)! Standard-Erweiterung
ermöglicht geräteunabhängig möglichst originalgetreue Wiedergabe
Midi über IEEE 1394 (FireWire)! Verwendung aktueller
Technologien und Protokolle
Übertragung MIDI V
Übertragung
Audio Retrieval
Tempoerkennung
! Verfahren zur automatischen Schätzung des Rhythmus beschreibenden Elemente Tempo, Taktart und Mikrotime
Query by Humming (QbH)
! Melodieerkennung/Musiktitelerkennung auf Grundlage gesungener oder anderer monophoner Melodien
! Bsp: http://www.musicline.de/de/melodiesuche/
Statistische Klassikation
! Jedes Geräusch hat typische Werte (loudness, pitch, brightness, bandwidth)
! Trainingsset von Geräuschen einer Klasse ermöglicht Einordnung (Bsp. Gelächter, Beifall, Kinder)
...
46Audio Retrieval
Film: http://www.celemony.com/
»Taschenbuch Multimedia«! HENNING, PETER A., Fachbuchverlag Leipzig,
2. Auage 2001, gebundene Ausgabe, 603 Seiten, ISBN 3446217517, ca. ! 20
»Multimedia Technologie«! Grundlagen, Komponenten und Systeme
Steinmetz, Henning, Springer Verlag Heidelberg, 3. überarbeitete Auage 2000, gebundene Ausgabe, 968 Seiten, ISBN 3-540-67332-6, ca. ! 55
»The Art of DIGITAL AUDIO«! Watkinson, John, Focal Press Oxford,
Third Edition 2001, Hardcover, 752 Seiten, ISBN 0-240-51587-0, ca. ! 84
48
Literatur
Literatur
49
http://www.ieee.org
http://www.itu.int/ITU-T/
http://www.cs.columbia.edu/~hgs/audio/
http://www.digitalaudioguide.com/glossary.htm
http://www.mp3encoding.de
http://www.midi.org/
http://www.superaudio-cd.com/
Links
Links