Das sind wir: Hannes Diemerling

6. Januar 2025

Hannes Diemerling ist Doktorand an der International Max Planck Research School on the Life Course (IMPRS LIFE) und arbeitet im Forschungsbereich Entwicklungspsychologie. Sein Schwerpunkt liegt auf der maschinellen Emotionserkennung. Er entwickelt eine Software, die in der Lage ist, Emotionen in Audio- und Videoaufnahmen zu analysieren. Diese Technologie könnte künftig als Unterstützung in der Psychotherapie eingesetzt werden, um die emotionale Entwicklung von Patient*innen gezielt nachzuverfolgen.

Du beschäftigst Dich im Forschungsbereich Entwicklungspsychologie mit der maschinellen Emotionserkennung. Was fasziniert Dich daran? 

Hannes Diemerling: Ich finde es faszinierend, wie maschinelles Lernen dazu beitragen kann, komplexe menschliche Emotionen besser zu verstehen und vorherzusagen. Die Möglichkeit, emotionale Zustände anhand von Video- und Audiomaterial zu analysieren, eröffnet neue Perspektiven und Anwendungen in der Psychologie. Besonders interessiert mich die Herausforderung, subjektive Erfahrungen in quantifizierbare Daten zu übersetzen, um Einsichten zu gewinnen, die sowohl für die Forschung als auch für praktische Anwendungen wertvoll sein könnten. 

Du hast erst kürzlich eine Studie zum Thema veröffentlicht. Kannst Du Deine Ergebnisse kurz erläutern? 

Hannes Diemerling: In unserer Studie nutzten wir kurze Audioschnipsel von Schauspielenden, die gezielt Emotionen wie Trauer oder Freude darstellten. Nach einer Vorverarbeitung wurden daraus Daten gewonnen, die wir zum Training neuronaler Netze verwendeten. Diese Netze, inspiriert von der Funktionsweise des Gehirns, konnten Emotionen in den Audios erkennen und mit einer Genauigkeit klassifizieren, die mit menschlichen Einschätzungen vergleichbar ist. Unsere Ergebnisse zeigen, dass Emotionserkennung bereits mit sehr kurzen Audioabschnitten möglich ist – schon 1,5 Sekunden reichen aus. Da kann man gerade mal „Hallo“ sagen. Obwohl noch Arbeit nötig ist, bieten die Ergebnisse viel Potenzial für den Einsatz in psychologischer Forschung und Therapie.  

Kannst Du genauer auf die Anwendung im therapeutischen Bereich eingehen? Wo siehst Du Potenziale für die Anwendung? 

Hannes Diemerling: Unsere Forschung hat das Potenzial, die Arbeit in therapeutischen Settings erheblich zu verbessern. Ziel ist es, Therapeuten eine zusätzliche Variable bereitzustellen, die es ermöglicht, emotionale Entwicklungen über den Therapieverlauf hinweg objektiv zu messen. Dies kann besonders hilfreich sein, um den Therapieerfolg zu bewerten oder emotionale Zustände wie Frustration, Trauer oder Freude besser zu dokumentieren. 

Darüber hinaus gibt es Zusammenhänge zwischen emotionalem Ausdruck und psychischen Erkrankungen, wie Depressionen oder Angststörungen. Unsere Modelle könnten hier unterstützend wirken, indem sie spezifische emotionale Muster identifizieren, die mit solchen Diagnosen korrelieren. Dies könnte Therapeut*innen helfen, Diagnosen zu bestätigen oder frühzeitig auf mögliche Entwicklungen hinzuweisen. 

Zudem arbeiten wir an Modellen, die Emotionen nicht nur kategorisch („diese Person ist traurig“), sondern auch detailliert beschreiben können, z. B. „diese Person zeigt einen niedergeschlagenen Gesichtsausdruck mit gesenkten Schultern“. Solche detaillierten Einblicke können für die Dokumentation, die Analyse von Therapieverläufen und auch für die Forschung zu emotionalen Mustern und deren Zusammenhang mit Diagnosen oder Therapieerfolgen äußerst wertvoll sein. 

Dabei ist es mir wichtig zu betonen, dass wir mit unserer Arbeit keine Therapeut*innen ersetzen wollen. Unsere Modelle sollen als zusätzliche Werkzeuge dienen. 

Du arbeitest an einem neuen Datensatz aus der Münchner Hochschulambulanz. Worum geht es in Deiner neuen Studie? Was macht den Datensatz so besonders?  

Hannes Diemerling: In meiner neuen Studie steht der Aufbau eines Datensatzes im Mittelpunkt, der echte, natürliche Emotionen umfasst und als Grundlage für das Training von Modellen zur Emotionserkennung dient. Ziel ist es, eine hochwertige Sammlung von Daten zu schaffen, die nicht nur die Vielfalt menschlicher Emotionen widerspiegelt, sondern auch zur Entwicklung effektiver maschineller Lernmodelle beiträgt. 

Der Datensatz aus der Hochschulambulanz erweist sich dabei als besonders wertvoll, da er authentische therapeutische Sitzungen enthält, die ein breites Spektrum an emotionalen Nuancen offenbaren. In Zusammenarbeit mit Professor Joachim Kruse, dem Leiter der Hochschulambulanz, sowie der wissenschaftlichen Mitarbeiterin Patricia Kulla, konnten wir aus tausenden Stunden an Aufnahmen eine qualitativ hochwertige Vorauswahl treffen. Solches Material ist äußerst selten, da echte emotionale Momente häufig weder gefilmt noch für Forschungszwecke zugänglich sind. 

Im nächsten Schritt analysierten Studierende kurze Videoclips von jeweils 0,5 Sekunden Länge und kodierten die sichtbaren Emotionen anhand vorgegebener Kategorien. Die Ergebnisse zeigen, dass komplexere Modelle, insbesondere neuronale Netze, bereits beeindruckende Fortschritte in der Emotionserkennung erzielen. Obwohl Menschen den Modellen derzeit noch überlegen sind, hat sich der Abstand deutlich verringert. Mit weiterer Forschung könnte es möglich sein, Systeme zu entwickeln, die in ihrer Leistung der menschlichen Wahrnehmung ebenbürtig sind. 

Du hast Psychologie studiert, aber arbeitest intensiv mit neuen Technologien und Maschinellem Lernen. Wie bist Du darauf gekommen? 

Hannes Diemerling: Während meines Psychologiestudiums habe ich schnell gemerkt, dass mich besonders komplexe Daten und deren Analyse faszinieren. Mein Interesse an Statistik wurde durch meinen Professor, Timo von Oertzen, geweckt. Er hat mich nicht nur in meinem Studium unterstützt, sondern auch meine Begeisterung für die Möglichkeiten der Datenanalyse gefördert. Mit ihm zusammen habe ich mich zunehmend mit der Methodischen Forschung in der Psychologie, und dem Maschinellen Lernen im Besonderen, beschäftigt. 

Besonders spannend fand ich die Techniken des Maschinellen Lernens, die es ermöglichen, Datentypen zu analysieren, die früher ausschließlich Menschen vorbehalten waren – wie zum Beispiel die Bilderkennung. Zu Beginn hatte diese Technologie für mich eine fast magische Faszination: Die Idee, dass Algorithmen überlagerte Muster in großen Datensätzen erkennen und menschliche Entscheidungsprozesse simulieren können, hat mich gefesselt. 

Maschinelles Lernen bietet nicht nur eine breite Palette an Anwendungsmöglichkeiten, sondern auch nahezu unbegrenztes Potenzial für zukünftige Forschung. Die Möglichkeit, einen Beitrag zur Weiterentwicklung dieser Technologien zu leisten, motiviert mich bis heute. Es treibt mich an, mich kontinuierlich weiterzubilden und neue Ansätze zu erforschen, um die Grenzen dessen, was Maschinelles Lernen leisten kann, weiter zu verschieben. 

Wie verbindest Du Deinen psychologischen Hintergrund mit Deinen Kenntnissen im Bereich des Maschinellen Lernens, insbesondere in der Emotionserkennung? 

Hannes Diemerling: Meine Forschung konzentriert sich auf die Verbindung von Psychologie und Maschinellem Lernen, besonders auf Methoden zur Emotionserkennung. Mit meinem psychologischen Hintergrund behandle ich emotionale Konzepte aus einer theoretischen Perspektive und integriere diese in die Entwicklung von maschinellen Lernmodellen. Oft werden Emotionen entweder aus psychologischer Sicht oder rein datengetrieben betrachtet, wobei der andere Aspekt vernachlässigt wird. Ich arbeite daher an einem Ansatz, der beide Perspektiven kombiniert.  

Maschinelle Lernmodelle können helfen, komplexe menschliche Prozesse wie Emotionen zu verstehen und zu untersuchen. Sie lassen sich so trainieren, dass sie menschliche Bewertungen und Reaktionen bei der Emotionserkennung nachahmen. Modelle wie große Sprachmodelle (LLMs) oder spezialisierte Netzwerke bieten neue Möglichkeiten, das menschliche Verhalten und Entscheidungsprozesse besser zu verstehen.  

Mein Ziel ist es, Modelle zu entwickeln, die nicht nur leistungsfähig sind, sondern auch die Feinheiten menschlicher Emotionen erfassen. Indem ich psychologische Theorien mit modernen maschinellen Lernverfahren verbinde, möchte ich die Mechanismen der Emotionserkennung besser verstehen und Anwendungen in Forschung und Gesundheitswesen fördern. So kann unser Verständnis von der menschlichen Psyche und der künstlichen Intelligenz vertieft werden. 

Du bist Teil des Doktorandenprogramms der International Max Planck Research School on the Life Course (LIFE), wie unterstützt Dich das Programm bei Deiner persönlichen und wissenschaftlichen Entwicklung? 

Hannes Diemerling: Das Doktorandenprogramm hilft mir sehr bei meiner persönlichen und wissenschaftlichen Entwicklung und hat mir viele Chancen eröffnet. So konnte ich zum Beispiel ein Semester in den USA verbringen und Professor Steve M. Boker an der University of Virginia treffen – eine Möglichkeit, die ohne LIFE nicht realisierbar gewesen wäre. 

Durch das Programm habe ich die Gelegenheit, verschiedene Themen kennenzulernen und internationale Wissenschaftler und Wissenschaftlerinnen zu treffen. Zudem sind die Ressourcen, das inspirierende Umfeld des Max-Planck-Instituts für Bildungsforschung sowie des Programms selbst von großem Wert. Die Unterstützung durch erfahrene Forschende sowie der der Austausch mit anderen Doktorand*innen schaffen eine motivierende Atmosphäre, in der ich mich kontinuierlich weiterentwickeln kann. 

Informationen zur IMPRS LIFE finden Sie hier.

Originalpublikation

Diemerling, H., Stresemann, L., Braun, T., & von Oertzen, T. (2024). Implementing machine learning techniques for continuous emotion prediction from uniformly segmented voice recordings. Frontiers in Psychology, 15, Article 1300996. https://doi.org/10.3389/fpsyg.2024.1300996

Weitere interessante Beiträge

Zur Redakteursansicht