DIGITAL

Multimodal Deep Learning auf der "MMM 2019"

Das Institut DIGITAL präsentierte Forschungsergebnisse im Bereich Multimedia Analytics auf der "25th International Conference on MultiMedia Modeling in Thessaloniki".

Multimodal Deep Learning auf der "MMM 2019"
Video Browser Showdown bei der MMM 2019. Credit: JOANNEUM RESEARCH/Bailer

Von 8. bis 11. Jänner 2019 fand eine der führenden Veranstaltungen für Forscher/innen und Praktiker/innen aus der Industrie statt. Die MMM 2019 diente dazu, neue Ideen, Forschungsergebnisse und Erfahrungen aus der Anwendung in allen Bereichen rund um Multimedia auszutauschen. Insgesamt umfasste das Konferenzprogramm 119 Beiträge in Form von Vorträgen, Posters oder Demos und den Video Browser Shutdown. Ein reichhaltiges Programm, das sich über vier Konferenztage erstreckte. Multimedia-Indizierung, Multimodale Fusion, Repräsenation und Verarbeitung von Multimediadaten, Audio-, Bild-, Videoverarbeitung, Kodierung und Komprimierung, mobile Multimedia-Anwendungen sowie webbasierte Multimedia Anwendungen gehörten zu den Hauptthemen. 

DI Dr. Martin Winter und DI (FH) Werner Bailer, Key Researcher des Instituts DIGITAL, hielten zwei Vorträge auf der Konferenz. Dr. Martin Winter stellte einen Ansatz für Online Training von Gesichtserkennungsalgorithmen vor, der die Erkennung von Personen mit wenigen (auch nur einem) annotierten Beispielen ermöglicht. Das Verfahren kann auch verwendet werden, um das Gesichtserkennungssystem für unbekannte Personen, die im Bild-/Videoinhalt gefunden wurden, automatisch zu trainieren und die Erkennungen später mit einem Namen zu verknüpfen, ohne die Analyse des Inhalts erneut auszuführen. DI Werner Bailer stellte eine Methode vor, um Gesichter in Bildinhalten durch künstlich (durch Generative Adversarial Netzworks, GANs)  erzeugte Varianten zu ersetzen, um die Verwendung und Speicherung der Bilder ohne Datenschutzproblemen zu ermöglichen, die sich aus identifizierbaren Gesichtern ergeben. Diese Präsentation war Teil einer Session zum Thema Multimedia Analytics, die sich mit der Verwendung von automatische Multimedia-Analyse-Tools zur Unterstützung der menschlichen Entscheidungsfindung beschäftigt. Die Session beinhaltete auch eine Podiumsdiskussion mit allen Vortragenden zu den Themen Privatsphäre, Content Verification und Usability von Multimedia Retrieval Anwendungen.


Der von DI Werner Bailer mitorganisierte Video Browser Showdown (VBS) ist ein jährlicher Wettkampf für Live-Videosuche, der seit der im Jahr 2012 in Klagenfurt veranstalteten MMM ein integraler Bestandteil des Events ist. Bei VBS bewerten und demonstrieren Forscher die Effizienz ihres interaktiven Video-Retrieval-Tools auf einem gemeinsamen Datensatz vor Publikum. In diesem Jahr nahmen sechs Teams aus Europa und Asien teil, um Videoclips zu finden, die durch visuelle oder textuelle Fragestellungen in einer 1.000 Stunden umfassenden Videosammlung innerhalb weniger Minuten zu finden waren. Der Wettbewerb umfasste "Novizen"-Runden, bei denen die Zuschauer die Suchwerkzeuge verwendeten, um deren Verwendbarkeit für Nicht-Experten zu messen. Sowohl die Präsentationen als auch der Video Browser Showdown stießen auf sehr positive Resonanz beim Publikum und motivierten die MMM 2020-Konferenz und der VBS in Daejeon, Korea, zu besuchen.

 

Links
 

MMM 2019

Video Browser Showdown – The Video Retrieval Competition

Connected Computing @ DIGITAL