Johanna Kuch M.Sc.

Research Associate
Chair for Human-Centered Artificial Intelligence
Phone: +49 821 598 - 2345
Email:
Room: 2039 (N)
Address: Universitätsstraße 6a, 86159 Augsburg

Themen für Abschlussarbeiten

Folgende Themen betreue ich gerne im Rahmen einer Bachelor- oder Masterarbeit.

Der inhaltliche Schwerpunkt kann dabei angepasst werden, sodass Interessen und Kompetenzen der Studierenden optimal abgedeckt werden.

Auch eigene Themenvorschläge sind willkommen.

 

 

Voice Cloning in einer Webapp

Untersuche, wie synthetische Stimmen direkt im Browser erzeugt und manipuliert werden können. Ziel ist die Entwicklung oder Integration eines Voice-Cloning-Systems in eine existierende Webanwendung mit Fokus auf einfache Nutzbarkeit. Untersucht wird speziell, wie aus bestehenden Stimmen zusätzliche TTS-Varianten generiert und für Endnutzer praktisch zugänglich gemacht werden können.

 

Voice Design mit einem evolutionen Algorithmus und Voice Cloning

In dieser Arbeit soll ein evolutionärer Algorithmus (existiert schon) an geklonte Embeddings (XTTSv2 oder ähnliche) angebunden werden, der die geklonten Stimmen automatisch an Zielkriterien anpasst z. B. Persönlichkeitsmerkmale, Sympathie, .... Durch schrittweise Anpassung durch Nutzende wird dann die Stimme iterativ verbessert. Ziel ist ein interaktives System, das „ideale“ Stimmen für bestimmte Charaktere oder Anwendungen generiert.

 

Kann man Stimmen so gestalten, dass sie bestimmte Persönlichkeitsmerkmale und Attributionen gezielt abbilden?
Evaluation/Erweiterung eines existierenden Design Tools

Diese Arbeit untersucht, wie wahrgenommene Persönlichkeitsmerkmale (z. B. freundlich, kompetent, dominant) gezielt über Stimmparameter beeinflusst werden können. Dazu sollen systematisch Parameter wie Tonhöhe, Sprechtempo oder Timbre variiert und ihre Wirkung auf Hörer*innen empirisch evaluiert werden. Ziel ist es, Gestaltungsrichtlinien für „Voice Personality Design“ zu formulieren. In dieser Arbeit kann auch ein bestehendes Voice-Design-System (z. B. VoiceX) hinsichtlich seiner Nutzbarkeit und Gestaltungswirksamkeit untersucht werden. Neben einer Evaluation der User Experience kann auch eine konzeptionelle oder technische Erweiterung erfolgen, etwa durch neue Kontrollparameter oder interaktive Visualisierungen, um die kreative Arbeit mit synthetischen Stimmen zu erleichtern.

 

Training eines Classifiers zur Erkennung des Voice Genders (m/w/d)
(Evaluation und Einbau in eine Webapp ebenfalls möglich)
Ziel dieser Arbeit ist die Entwicklung und Evaluation eines Machine-Learning-Modells, das zwischen männlichen, weiblichen und gender-ambiguous Stimmen unterscheiden kann. Neben der Trainings- und Testphase kann das Modell in eine Webanwendung integriert und hinsichtlich Fairness, Genauigkeit und Interpretierbarkeit untersucht werden. Für diese Arbeit kann auch ein Datensatz zusammengetragen werden um das Training vorzubereiten.

Links

2025 | 2024 | 2023 | 2020

2025

Withanage, Daksitha, Lingenfelser, Florian, Kuch, Johanna, Grothe, Otto, Schlagowski, Ruben, André, Elisabeth, & Mertes, Silvan (2025). VoiceX as a design tool for virtual agents' voices. https://doi.org/10.1145/3717511.3749296
BibTeX | RIS | DOI

2024

Kuch, Johanna Magdalena, Nasir, Jauwairia, Mertes, Silvan, Schlagowski, Ruben, Becker-Asano, Christian, & André, Elisabeth (2024). Evaluating gender ambiguity, novelty and anthropomorphism in humming and talking voices for robots. https://doi.org/10.1109/ro-man60168.2024.10731423
BibTeX | RIS | DOI
Schlagowski, Ruben, Volanti, Maurizio, Weitz, Katharina, Mertes, Silvan, Kuch, Johanna, & André, Elisabeth (2024). The feeling of being classified: raising empathy and awareness for AI bias through perspective-taking in VR. https://doi.org/10.3389/frvir.2024.1340250
BibTeX | RIS | DOI
Mertes, Silvan, Withanage Don, Daksitha, Grothe, Otto, Kuch, Johanna, Schlagowski, Ruben, & André, Elisabeth (in press). VoiceX: a text-to-speech framework for custom voices. https://doi.org/10.48550/arXiv.2408.12170
BibTeX | RIS | DOI

2023

Kuch, Johanna Magdalena, Melchior, Frank, & Becker-Asano, Christian (2023). Effects of gender neutralization on the anthropomorphism of natural and synthetic voices. https://doi.org/10.1109/ro-man57019.2023.10309479
BibTeX | RIS | DOI

2020

Kuch, Johanna Magdalena & Wiedenroth, Saskia Johanna (2020). Evaluation of interactive sound in a gamified learning application. https://doi.org/10.21125/iceri.2020.0963
BibTeX | RIS | DOI

Search