Learning to Compress Images and Videos - ke.tu-darmstadt.de · 2 Motivation Bild & VideoKompression...

Learning to CompressImages and Videos

von Li Cheng &S.V. N. Vishwanathan

vorgetragen von Michael Wächter

Motivation● Bild & VideoKompression

– herkömmliche Verfahren sind frequenzbasiert– Aufsatz auf herkömmlichen Verfahren– zusätzlicher Platzgewinn ohne Qualitätsverlust

● SWBild & SWVideoKolorierung– herkömmliche Verfahren zeitaufwändig und manuell– jetzt semiautomatisch

Motivation

● BildKompression– Auswahl repräsentativer Pixel– Lernen eines FarbvorhersageModells– Speichern des SWBilds + Farbpixel– Rekonstruktion des Farbbilds

● VideoKompression analog

Motivation

● SWBild & SWVideoKolorierung– wie Kompression– automatische Pixelauswahl fällt weg– Farbinfos werden stattdessen vom Benutzer

vorgegeben

Überblick● Motivation● Begriffsklärung● Funktionsweise

– Kolorierung mit SemiSupervised Learning– Farbpixelauswahl mit Active Learning

● Experimente● Fazit● Bemerkungen

Begriffsklärung● SemiSupervised Learning

● Graphbasierte Methoden:– Beispiele als Knoten (gelabelte und ungelabelte)– Nachbarschaftsbeziehungen als Kanten

● Achtung: Glattheitseigenschaften

X BeobachtungsraumY ⊂ℝ Labelraum{x i , y i }i=1

m gelabelte Beispiele

{x i }i=m1n

⊂X ungelabelte Beispielef ∈H zuminimierende Zielfunktionl : X x Y x H ℝ Loss−Funktion

Begriffsklärung● Graph

– ungerichtet, gewichtet● AdjazenzMatrix

● GradMatrix

G=V ,E⊆V xV

WmitW ij∈0,∞ falls v i , v j∈EundW ij=0sonst

Dmit Dii=∑j

Begriffsklärung

● LaplaceMatrix

● normalisierte LaplaceMatrix

L=D−W

=D−1/2LD−1/2

Funktionsweise Kolorierung

– Kantengewichte:● räumliche Nachbarschaft und Bildtextur● rationale Funktion 2. Grades bzgl. Helligkeitsdifferenz● ggf. zeitliche Nachbarschaft

minimiere∑i=1

[f x i −∑i~ j

w ij f x j ]2∑i=1

l f x i , y i

l f x i , y i =0 falls f x i =y i und ∞ sonstoderl f x i , y i =f x i −y i

∀ i : w ij0und∑i~ j

w ij=1

● Laplacian Regularized Least Square algorithm:

minimiere J f =c∥f ∥H2

n2∥f ∥G

2 1m ∑

l x i , y i , f

mit f =[f x 1 ,... , f x m , ... , f x n ] ,

∥f ∥G2=f T ∇G f =f

T L2 f oder f T f

● Lösung von LapRLS:es existieren i so ,dass f x =∑

i k x i , x

=I mK cmI mn2

∇gK −1

mit =1 , ... ,m , ... ,n T ,

I m∈ℝn ,n mit mxm−Einheitsmatrix links oben und 0sonst ,

K mit K ij=k x i , x j ,

∇G=L2oder

und y =y 1 , ... , y m ,0 , ... ,0T

Funktionsweise Kolorierung● Implementationsdetails:

– YUVFarbraum, Vorhersage von U und V getrennt– Kernel: standard Gaussian kernel (mit Parameter σ)– Mean Square Loss statt ∂Loss– ∆ statt L²– keine zeitliche Nachbarschaft!– Problem: Matrixinvertierung

● Matrix zur Berechnung von α groß und dicht

● Berechnung einer SuperPixelRepräsentation des Ausgangsbilds ==> 10005000 Segmente

Funktionsweise Pixelauswahl● automatische Pixelauswahl wird für Handkoloration

abgeschaltet● ansonsten per Active Learning:

– Lerner wählt Beispiele aus und fragt nach Labels– muss dafür Kosten bezahlen (hier: Speicherplatz)

● Programmablauf:– Start mit ein paar zufälligen gelabelten Pixeln– Lernen des Modells

Funktionsweise Pixelauswahl– Bild wird mit Modell vorhergesagt und mit Zielbild

verglichen– Qualitätsmaß:

– Fehlerbereiche werden geclustert– aus jedem Fehlercluster wird ein Pixel gewählt, seine

Farbinfo abgefragt und der Labelmenge hinzugefügt– Abbruchkriterium:

● PSNR=38 oder 5000 abgefragte Pixel● außerdem möglich: PSNR in einem Plateau

PSNR=20log10255

MSE=1n2 ∑

i , j=1

I ij−I 'ij2

Experimente● SWBildKolorierung

Experimente● Vergleich: Active Learning vs. manuelle Pixelauswahl

Experimente● Ergebnis Bienen:

– Active Learning● PSNR = 31.49● 2534 Pixel● 7 Iterationen

– manuell● PSNR = 27.00● 8558 Pixel

Experimente● Vergleich: Active Learning vs. zufällige Pixelauswahl

Experimente● Ergebnis Mädchen:

– Active Learning● PSNR = 40.95● 2766 Pixel● 17 Iterationen

– zufällig● PSNR = 38.41● 2976 Pixel

Experimente

● Kompressionsraten:– Bienen: 0.754– Mädchen: 0.781

Experimente

● Videokolorierung

Experimente● Videokompression

Experimente

● Kompressionsrate 0.899– Berechnung allerdings unrealistisch, realistischer sind

eher 0.925

Fazit● optisch ansprechende kolorierte Bilder und Videos● Kompression mit guten Kompressionsraten als Aufsatz

auf herkömmliche Verfahren● Videokompression streamingfähig● mögliche Verbesserung:

– „Vergessen“ von Labels ==> selber PSNR bei niedrigeren Kosten

– Beweis von performance boundaries

Bemerkungen

● weitere Verbesserungsmöglichkeiten:– evtl. Verwendung von spezialisierten SW

Kompressionsverfahren● nach welchen Kriterien wurden die Bilder und Videos

der Experimente ausgewählt?– „nonstationary video sequences“

● evtl. muss α auch gespeichert werden

Vielen Dank für Ihre Aufmerksamkeit!

Quellen

● sämtliche Bilder entstammen der Seite http://sml.nicta.com.au/~licheng/LearnCompressImgVid/LearnCompressImgVid.html oder dem Artikel „Learning to Compress Images and Videos“, welcher auch auf dieser Seite zu finden ist.

Learning to Compress Images and Videos - ke.tu-darmstadt.de · 2 Motivation Bild & VideoKompression...

Documents

Transcript of Learning to Compress Images and Videos - ke.tu-darmstadt.de · 2 Motivation Bild & VideoKompression...

6WHOODU 3KRHQL[ · Entourage AirDrop Applications La Desktop Documents Movies Music Pictures Downloads Open Recovery Screen C Tool- Systemvoraussetzungen Move to Trash Cet Info Compress

compress 6598906 3021235166 0 - schautauben.com · Es wird, wie der Name schon sagt, rezessiv (verdeckt) vererbt. Das bedeutet, dass beide E/terntiere den Faktor auf den Nachkommen

System zur Videokompression Simone Buzzi Simon Häne Giuseppe Schiavello.

Bridge - ke.tu-darmstadt.de · Bridge partition search. 12 auch mit 52 Karten getestet: 18.000 Knoten/deal ca. 1 sec CPU-Zeit Bridge expandierte Knoten 12-48 Karten partition search.

Naive Bayes für Regressionsprobleme - ke.tu- · PDF fileEinleitung Annäherungsfunktion Algorithmus Evaluation Quellen Naive Bayes für Regressionsprobleme Vorhersage numerischer

PANOLIN Schmierstoffe für Bergbahnbetreiber€¦ · Leistungsniveau DIN 51 506 VB, VBL, VC, VCL, VDL. ISO 6 743/3 A D PANOLIN COMPRESS Kompressoren-Schmierstoff auf Mineralölbasis.

PARTS LIST - Nilfisk-Alto Shop · 7 9100002049 1 sensor capacitive kit 8 9100001977 4 holder squeegee plast. sip 9 9100001984 4 spring compress. d.e.17.6 wire d.1.2 sip 10 9100001975

6WHOODU - Stellar Information Technology Pvt. Ltd€¦ · Pictures Downloads Screen C Tool- Systemvoraussetzungen Open Move to Trash Cet Info Compress Stellar Phoenix" gurn "Stellar

Ton II/ Animation I Überblick: MPEG Audiokompression: mp3 Grundlagen Videokompression.

SANCESmartHorneSicherheit MadeEasy...Diese Serie NVR ist ein Hochleistungs-Netzwerk-Videorekorder, kombiniert mit H.264 Videokompression, Festplattenspeicher mit hoher Kapazität,

Classification and Regression Trees - ke.tu-darmstadt.de · node.add(branch, result) branch.add(child) end for End function. ID3-Algorithmus

Genetic Algorithms - ke.tu- · PDF file06-07-27 Thema: „Genetic Algorithms“ 3/33 Evolutionstheorie Jeder Organismus hat einzigartige Attribute, die an die Nachkommen weitergegeben

3. Basiskonzepte von Java - ke.tu-darmstadt.de · Nonsens-Beispiel. TU Darmstadt 23 Allgemeine Informatik II, SS 05 ...

Anforderungen an den idealen CCTV Video Codec · Anforderungen an den idealen CCTV Video Codec 1. Einführung Dem Thema Videokompression kommt in digitalen CCTV Systemen eine zentrale

ZEnsus 2011 BBu-mArkt- mOnItOr mItGLIEDEr- land macht 2010 ... · 13, 10785 Berlin, S 030-2110095, Fax 211 00 99 · Zurzeit gilt Anzeigen-preisliste 8 vom 1.1.2002 · Satz: ComPress

Ein- und Ausgabe in Java - ke.tu- · PDF fileTU Darmstadt 1 Allgemeine Informatik II, SS 05 Ein- und Ausgabe in Java Das Package java.io enthält eine Sammlung von Klassen, die die

Vorlesung Semantic Web - ke.tu-darmstadt.de · Vorlesung Semantic Web Vorlesung im Wintersemester 2012/2013 Dr. Heiko Paulheim Fachgebiet Knowledge Engineering

Aircraft Cabin Air - Quality or Contamination · Adapted from (FCOM A340) 1) compress the air 1) compress the air "Bleed Air" Generation and Treatment compress and cool the air 2a)

Platz schaffen auf dem Domino - Compact, Compress, De-Duplicate - Ulrich Krause (eknori) SNoUG 2013

3.2.1. Variable, Konstante, Literale - ke.tu- · PDF fileTU Darmstadt 2 Allgemeine Informatik II, SS 05 Eine Variable ist wie auf der letzten Folie beschrieben ein symbolischer Name