Ton II/ Animation I Überblick: MPEG Audiokompression: mp3 Grundlagen Videokompression

Click here to load reader

  • date post

    05-Apr-2015
  • Category

    Documents

  • view

    107
  • download

    1

Embed Size (px)

Transcript of Ton II/ Animation I Überblick: MPEG Audiokompression: mp3 Grundlagen Videokompression

  • Folie 1
  • Ton II/ Animation I berblick: MPEG Audiokompression: mp3 Grundlagen Videokompression
  • Folie 2
  • 1.Allgemeines zu MPEG MPEG (Moving Picture Experts Group) ist eine Arbeitsgruppe von ISO (International Standards Organization) und IEC (International Electro- Technical Commission). Die Arbeitsgruppe wurde 1988 in Ottawa, CA gegrndet. Ihre Aufgabe ist die Entwicklung von internationalen Standards zur Komprimierung, Dekomprimierung, Verarbeitung, Kodierung und Dekodierung von bewegten Bildern und assoziiertem Audio. Der offizielle Titel lautet: Coding of moving pictures and audio. Die Expertengruppe trifft sich in turnusmigen Abstnden, um Arbeitsergebnisse zu diskutieren und neue Arbeitsbereiche abzustecken. Das Ergebnis sind verschiedene Standards: bisher: MPEG-1, MPEG-2, MPEG-4, MPEG-7 und MPEG-21 (in Arbeit). 1.1MPEG-1 MPEG-1 ist seit 10/92 als Standard ISO/IEC 11172 definiert. Praktisch bedeutete dies, einen Standard fr die effiziente Speicherung und Wiedergabe von audio-visuellen Daten auf CDs zu erarbeiten, der eine max. Datenbertragungsrate von 1,5 Mbit/s untersttzt. Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s
  • Folie 3
  • 1.1.2MPEG-1 Definitionen MPEG-1 besteht aus 5 Teilen: Systems Video Audio Conformance testing Software simulation Normativ vs. Informativ in den ISO/IEC-Dokumenten gibt es sowohl normative als auch informative Bestandteile. Normativ bedeutet, dass die entsprechenden Abschnitte Teile der Standard-Spezifikation sind. Sie sind przise definiert, fr Implementierungen gedacht und sollten bei der Implementation strikt befolgt werden. Informativ bedeutet, dass die entsprechenden Abschnitte einzelne Konzepte, die an anderer Stelle definiert worden sind, illustrieren, bestimmte Entscheidungen nher erlutern und Beispiele zur Implementierung liefern. Die Teile 1-3 von MPEG-1 sind weitgehend normativ, die Teile 4/5 sind informativ.
  • Folie 4
  • Systems Der "Systems"-Teil beschreibt die zeitliche Synchronisation und das Multiplexen von Video- und Audio-Datenstrmen. (Multiplexen = gleichzeitiges bertragen von mehreren Informationen ber einen Kanal); Zweck: Aufbereitung der Daten zur Speicherung und effizienteren bertragung Video Der "Video"-Teil beschreibt die Kodierung von Videosignalen. Dabei werden verschiedene Bildtypen definiert, die verschiedene Funktionalitt untersttzen.
  • Folie 5
  • Audio Der "Audio"-Teil beschreibt die Kodierung von Audiodaten (Mono/Stereo). In diesem Teil des Standards werden drei verschiedene Methoden (layer) der Datenkompression definiert. Die drei Methoden werden mit I, II und III bezeichnet und zeichnen sich durch steigende Komplexitt und Leistungsfhigkeit aus. Die Layer sind hierarchisch kompatibel, d.h. die Funktionen der "niedrigeren" Methoden sind den "hheren" bekannt, die hheren Layer verfgen allerdings ber zustzliche Eigenschaften, die in besserer Kompression resultieren. Layer I: ermglicht eine Datenreduktion von 1:4. Dies entspricht 384 kBit/s fr ein Stereosignal. Layer II: ermglicht eine Datenreduktion von 1:6...1:8. Dies entspricht 256...192 kBit/s fr ein Stereosignal. Layer III: ermglicht eine Datenreduktion von 1:10...1:12. Dies entspricht 128...112 kBit/s fr ein Stereosignal.
  • Folie 6
  • Conformance testing Der "Conformance testing"-Teil spezifiziert Testdesigns um zu verifizieren, ob die Bitstrme und Dekoder den spezifizierten Anforderungen aus Teil I,II,III entsprechen. Software simulation Der "Software simulation"-Teil liefert eine Beispiel-Implementation (in C-Code) fr die ersten drei Teile (als technical report). 1.1.3Anwendungen von MPEG-1 VCD (Video CD), Digital Compact Cassette (DCC) MPEG-1, Teil 3, Layer III wird populr als mp3 bezeichnet. Zum Erzeugen/Abspielen/Darstellen von MPEG-Dateien braucht man sogenannte Codecs. Codec ist die Abkrzung fr Coder/Decoder, also die Soft- oder Hardwarebestandteile, die die Video- und Audiodaten im entsprechenden Format kodieren oder dekodieren.
  • Folie 7
  • 1.2MPEG-2 Die nchste Entwicklung der Arbeitsgruppe war MPEG-2. Der offizielle Titel lautet: Generic Coding of Moving Pictures and Associated Audio. MPEG-2 ist als Standard ISO/IEC 13818 definiert. Wurde berwiegend fr die Speicherung und bertragung von Videosignalen vorgesehen (digitales Fernsehen). bertragungsraten: 1,5 -15 Mbit/s. 1.2.1MPEG-2 Teilbereiche MPEG-2 besteht aus (8)9 Teilen: Systems Video Audio Conformance testing Software simulation System extension - DSM-CC (Digital Storage Media Command and Control) Audio extension - AAC (Advanced Audio Coding) System extension - RTI (Real Time Interface) Conformance extension - DSM-CC [IPMP (Intellectual Property Management and Protection) on MPEG-2 Systems]
  • Folie 8
  • Systems Der "Systems"-Teil ist in zwei Teile gegliedert: Der "Program Stream" ist analog zu MPEG-1, Teil 1 hnlich definiert und untersttzt die Speicherung auf digitalen Medien. Darber hinaus gibt es den "Transport Stream", der die Datenbertragung ber fehleranfllige Systeme regelt. Video Der "Video"-Teil beschreibt die Kodierung von Bilder, die zustzlich zu MPEG-1 im Interlacing-Verfahren aufgebaut sein knnen. MPEG-2 realisiert auerdem Verbesserungen in der Bildqualitt. Untersttzt drei Auflsungsstufen: low-main-high (letzteres fr HDTV vorgesehen) Advanced Audio Coding Der "AAC"-Teil definiert eine neue mehrkanalige Audio-Kodierung, die nicht rckwrtskompatibel ist zu MPEG-1 Audio. 1.2.2Anwendungen von MPEG-2 Video-Teil DVD AAC ist von Japan fr einen Standard fr nationales digitales Fernsehen gewhlt worden. Digitale Fernsehbertragungen
  • Folie 9
  • 1.3MPEG-4, MPEG-7, MPEG-21 Eine weitere Entwicklung der Arbeitsgruppe ist MPEG-4. Der offizielle Titel lautet: Coding of audio-visual objects. MPEG-4 ist als Standard ISO/IEC 14496 definiert. Die Version 1 wurde 10/98 verabschiedet, Version 2 12/99. Whrend MPEG-1 und -2 vor allem fr Audio- und Video- Kompression benutzt werden, ist das Ziel von MPEG-4 einen Standard fr Multimediaanwendungen zu schaffen mit Hilfe dessen Computer, Fernsehen und Telekommunikation zusammenwachsen knnen (Internet bers Handy, interaktives Fernsehen, Video on demand, Fernseh-Livebertragungen ber Internet etc.); MPEG-7 fokussiert im Gegensatz zu MPEG-4 nicht auf die Kodierung und Darstellung von audio-visuellen Objekten, sondern auf die Beschreibung von Multimedia-Inhalten (Multimedia Content Description Interface) Ziel: schnelle Suche, Identifizierung und Verarbeitung von multimedialen Inhalten. MPEG-21 ist die jngste Entwichlung von MPEG und noch in Arbeit. Die jngste Entwicklung der Arbeitsgruppe ist MPEG-21. Der offizielle Titel lautet: Multimedia Framework. MPEG-21 zielt ab auf eine zuknftige Umgebung, in der Inhalte unterschiedlichster Art von Usern verschiedener Kategorien ber multiple Anwendungen und Domnen bewegt werden knnen.
  • Folie 10
  • 1.3.1MPEG-4 Teilbereiche MPEG-4 besteht aus 16 Teilen: Systems Visual Audio Conformance testing Software simulation Delivery Multimedia Integration Framework Optimized Software for MPEG-4 tools 4 on IP framework Reference Hardware Description Advanced Video Coding Scene Description and Application Engine ISO Base Media File Format IPMP Extenions MP4 File Format AVC (Audio-Visual Content) File Format AFX (Animation Framework eXtension)
  • Folie 11
  • 2.Audiokompression: MPEG/ MP3 2.1Charakteristik MP3 ist eine andere (populre) Bezeichnung fr eine Realisierung der Spezifikation des MPEG-1, Audio Layer III, vom Fraunhofer Institut Anfang der 90er Jahre entwickelt. Der Kodierer (encoder) ist extrem komplex, dafr aber extrem leistungsfhig in Bezug auf die Kompressionsraten. Der Dekodierer dagegen ist viel einfacher aufgebaut und zudem abwrtskompatibel. 2.2Grundstzliche Funktionsweise von MPEG-1 Audio Layer III Das Kompressionsverfahren orientiert sich generell an den Gegebenheiten des menschlichen Gehrs, d.h. dessen Wahrnehmungsmglichkeiten von Tnen (perceptual audio coder). Ziel ist es also, Datenreduktion unter Beibehaltung der subjektiven Klangqualitt zu erreichen. Das psychoakustische Phnomen der Tonmaskierung wird dabei besonders ausgenutzt.
  • Folie 12
  • Frequenzmaskierung, zeitliche Maskierung
  • Folie 13
  • Modell 1: MPEG-1 Audio Layer III
  • Folie 14
  • Modell 2: MPEG-1 Audio Layer III
  • Folie 15
  • Teilschritte Das Audiosignal wird in bestimmten Zeitfenstern abgetastet und vom Zeit- in den Frequenzbereich bertragen (frequency domain mapping, frequency transformation); dabei wird das Signal auf Frequenzbnder abgebildet. Parallel dazu wird das Signal einem psychoakustischen Modell unter dem Aspekt der Maskierung verarbeitet; dabei wird die Maskierungsschwelle fr das Signal ermittelt (threshold of masking); die minimale Maskierungsschwelle ist die Hrschwelle. Quantisierung und Kodierung: Unter Bercksichtigung des ermittelten Maskierungsschwellenwerts wird fr jedes Frequenzband eine Quantisierung durchgefhrt. Liegt die Signalintensitt eines Subbandes unter der Maskierungsschwelle wird das Signal nicht kodiert. Die Anzahl der verwendeten Bits wird durch die vorgegebene Bitrate beschrnkt ( bit allocation algorithm).
  • Folie 16
  • 2.3 MP3-Kodierer MP3 verwendet fr die Frequenztransformation eine sog. Filterbank. Das Signal wird dabei auf 32 gleich lange Subbnder gemappt. Da sich die Subbnder berlappen kann ein Ton einer best. Frequenz zwei Bnder beeinfluen. Deshalb wird zustzlich eine modifizierte diskrete Kosinustransformation (MDCT) durchgefhrt. Im psychoakustischen Modell, das der MP3-Kodierer verwendet, werden einige Verfahren benutzt, die fr die h