Silvan Mertes M.Sc.

Wissenschaftlicher Mitarbeiter
Lehrstuhl für Multimodale Mensch-Technik Interaktion
Telefon: +49 (821) 598 - 2342
E-Mail:
Raum: 2038 (N)
Adresse: Universitätsstraße 6a, 86159 Augsburg

Forschungsinteressen

  • Deep Learning
  • Adversarial Learning
  • Generative Modelle
  • Sound und Image Processing

Abschlussarbeiten und Projektmodule

Die folgenden Themen können in Umfang und Ausrichtung flexibel variiert werden, sodass die Durchführung als Bachelorarbeit, Masterarbeit oder Projektmodul möglich ist. Außerdem kann der inhaltliche Schwerpunkt selbstverständlich auf die Interessen des durchführenden Studenten ausgerichtet werden.

Darüber hinaus freue ich mich jederzeit über eigene Themenvorschläge, sofern sie eine gewisse Überschneidung mit meinem Forschungsschwerpunkt aufweisen.

 

 

Facial DeepFake

DeepFake-Systeme sind in der Lage, täuschend echte Fälschungen von Videos/Fotos zu generieren. Im Rahmen dieser Arbeit soll ein System entwickelt werden, das DeepFakes von Gesichtern erzeugt. Hierzu sollen Facial Landmarks als Zwischenrepräsentation verwendet werden.

 

 

Explainable GANs

In dieser Arbeit sollen konventionelle Techniken aus dem Bereich der erklärbaren KI auf Generative Adversarial Nets (GANs) angewandt werden. GANs sind eine Form des Deep Learning, welche darauf abzielt, neue, künstliche und täuschend echte Daten wie z.B. Bilder oder Audio zu erzeugen.

 

 

Natural Language Style Transfer

In dieser Arbeit sollen Möglichkeiten untersucht, verglichen und implementiert werden, mit denen auf Basis von GANs natürlichsprachige Texte in andere Stilistiken überführt werden können. So könnte beispielsweise aus der Phrase „Guten Tag“ die Phrase „Hallo“ werden.

 

Privacy-Protective GANs

Es existieren GAN-basierte Verfahren, welche Bilddaten so verfremden, dass darauf zu erkennende Personen nicht mehr identifiziert werden können. Gleichzeitig bleiben dabei wichtige, nicht-persönliche Strukturinformationen erhalten, sodass weiterführende Datenanalysen durchgeführt werden können. In dieser Arbeit soll untersucht werden, inwieweit sich resultierende anonyme Daten zur Emotionserkennung eignen. Zusätzlich sollen existierende Verfahren aus der Bild-Domäne in den Audiobereich überführt werden, um auch hier eine anonymisierte Emotionserkennung zu ermöglichen.

 

Audio Phonem Mapping

Phoneme stellen die kleinsten sprachlichen Einheiten dar. In dieser Arbeit soll ein Konzept entwickelt und implementiert werden, dass Audioaufnahmen menschlicher Sprache in ein zeitliches Mapping von Phonemen überführt.

Projekte

Suche