Clara Schünemann steht inmitten von Ästen eines Baums und lächelt in die Kamera. Links von ihr steht der Schriftzug "Voller Tatendrang - Studentisches Engagement an der Uni Mannheim" und rechts ein Zitat von Schünemann: "Durch das Engagement ist mein Studium unglaublich reicher geworden."

Einfacher kochen dank Sprach­erkennung

An stressigen Tagen haben viele Menschen keine Zeit zu kochen. Stattdessen greifen sie auf Fast Food zurück, um ihren Hunger zu stillen. Ein Team aus dem Verbund­projekt Trans­forMA möchte Abhilfe schaffen – mithilfe des Kochassistenten Foodle.

Im Verbund­projekt Trans­forMA, das 2023 gestartet ist, arbeiten die Universität Mannheim und die Hochschule Mannheim in interdisziplinären Teams zusammen. Projektziel ist es, sich als Kompetenzzentrum für Fragen der Trans­formation zu positionieren und durch dialogischen Trans­fer von Wissen den Wandel in Mannheim und der Region aktiv zu lenken. Das Projekt umfasst fünf Handlungs­felder, die sich Themen wie Verantwortung und Nachhaltigkeit, Kooperationen mit Wirtschaft und Gesellschaft sowie Technologie widmen.

Eines der Projekte ist der Kochassistent Foodle, der YouTube-Kochvideos analysiert und automatisch eine Zutatenliste und Kochanleitung generiert. Außerdem kann Foodle Fragen zum Rezept beantworten – alles per Chatbot und Sprach­erkennung. Die Studierenden Thilo Dieing, Aakriti Istwal, Priyanka Roy, Sharan Shyamsundar, Hanh Thi- Bich Nguyen und Mariam Arustashvil des Mannheim Master of Data Science haben den Assistenten entwickelt, betreut von Professor Dr. Heiner Stuckenschmidt und Darshit Pandya vom Lehr­stuhl für Künstliche Intelligenz. FORUM hat Master­student Thilo Dieing zu seiner Arbeit an Foodle befragt.

FORUM: Seit März 2023 haben Sie an Foodle gearbeitet, nun ist der Sprach­assistent fertig. Was waren Ihre Aufgaben im Projekt?

Thilo Dieing: Alle Team­mitglieder basteln ein bisschen an allem. Meine zwei Schwerpunkte waren das Front End, also die nutzbare App, in der Sprach­erkennung und Chatbot gebündelt sind, und die Evaluierung der Sprach­erkennungs­modelle.

FORUM: Was war Ihr Highlight bei der Arbeit an Foodle?

Dieing: Ein Highlight war, als wir das allererste Mal eine Webversion von Foodle hatten, die wir unseren Projektleitern vorstellen konnten. Und natürlich das Projektende, als wir ein funktionierendes Modell fertig hatten. Das war so, als wäre das „Baby“, an dem man ein Jahr gearbeitet hat, auf die Welt gekommen.

FORUM: Gibt es Pläne, dass Foodle irgendwann öffentlich nutzbar sein wird?

Dieing: Momentan nicht, da Foodle sehr langsam ist, wenn man es auf einem normalen Rechner nutzen möchte. Man könnte überlegen, ob man Foodle als Demonstrator an einem bis zwei Tagen öffentlich ausstellt. Wir planen aber, den Datensatz aus den trans­kribierten YouTube-Videos, den wir manuell erstellt haben, zusammen mit dem Lehr­stuhl zu publizieren. Somit hätte das Projekt einen Mehrwert für die Forschungs­community.

FORUM: Was würden Sie Studierenden empfehlen, die sich in ähnlichen Projekten beteiligen möchten?

Dieing: Probiert es einfach! Die Teilnahme an solchen Projekten ist immer ein Sprung ins kalte Wasser, aber ich kann für das ganze Team sprechen, wenn ich sage: Wir haben viel dazugelernt und hätten nie gedacht, dass wir am Ende so ein Produkt bauen können.

Interview: Rheia Martiny / August 2024