Rainer Freudenthaler, Mannheimer Zentrum für Europäische Sozialforschung (MZES): automatisierte Methoden der Inhaltsanalyse (September 2022)

Rainer Freudentaler vor einem dunklen Hintergrund. Er trägt eine Brille, ein dunkelrotes Shirt und darüber einen karierten Blazer.

Dr. Rainer Freudenthaler ist Projektmitarbeiter im Mannheimer Zentrum für Europäische Sozialforschung. Nach einem Bachelorstudium der Medienwirtschaft an der Hochschule der Medien in Stuttgart und einem Masterstudium in der Medien- und Kommunikationswissenschaft promovierte er 2021 an der Universität Mannheim mit einer Dissertation zur öffentlichen Debatte zur deutschen Flüchtlingspolitik in Online-Medien.

Was ist Ihr aktuelles Forschungsthema?

Ich arbeite im Projekt „Impliziter und expliziter Rassismus in Nachrichtenmedien und sozialen Medien: Ausmaß und Wirkung“, das Teil des Forschungsverbunds „Diskriminierung und Rassismus“ (FoDiRa) ist. In diesem Projekt bauen wir auf einem früheren Forschungsprojekt auf, in dem automatisierte Methoden zur Messung expliziter Stigmatisierung und impliziter Stigmatisierung entwickelt wurden. Damit gemeint ist: Werden bestimmte Minderheitengruppen überdurchschnittlich mit Furcht oder unterdurchschnittlich mit Anerkennung assoziiert (explizit)? Und werden diese Gruppen in implizit negativ konnotierten Kontexten genannt (implizit)? Wir wollen die Methoden weiter verbessern und auf neue Daten anwenden – auf Berichterstattung in Mainstream- und Alternativmedien, und auf Social-Media-Daten von Influencern. Und wir wollen experimentell testen, welchen Effekt diese Darstellungen haben können.

Für alle, die noch nicht so tief in das Thema Data Science eingestiegen sind: Wie würden Sie einem Kind erklären, woran Sie arbeiten?

Wir bringen Computern bei, große Textmengen zu lesen. Wenn Menschen Texte lesen, hat das den Nachteil, dass sie nur verhältnismäßig kleine Textmengen lesen können. Also testen wir, ob unsere Computerprogramme genauso gut wie Menschen erkennen können, was uns interessiert – wenn das so ist, können wir größere Mengen an Texten analysieren.

Alle sprechen über Data Science – wie würden Sie die Bedeutung des Themas für sich selbst in drei Worten beschreiben?

Größere Datenmengen auswerten.

Welche Berührungspunkte mit Data Science hat Ihre Arbeit? Welche Methoden nutzen Sie bereits und welche wären zukünftig interessant für Sie?

Wir arbeiten momentan mit Latent Semantic Scaling und Methoden zur Messung von Word-Embedding-Bias. Beides sind Methoden, die darauf aufbauen, Wörter danach zu vergleichen, ob sie ähnlich verwendet werden, um zu erkennen, welche Wörter ähnliche Bedeutungen haben. Wir schauen momentan mit großem Interesse auf Deep-Learning-Methoden, die noch besser in der Lage zu sein scheinen, Bedeutung in Texten zu erkennen, z. B. NLI-BERT.

Wie hoch ist der Wert von Data Science für Ihre Arbeit? Wäre Ihre Forschung ohne Data Science überhaupt möglich?

Ich sehe bei uns im Feld momentan vor allem Vorteile in der Skalierung – in der Kommunikationswissenschaft bedeutet quantitative Inhaltsanalyse mit menschlichen Kodierer/innen immer, dass man sehr genau einschränken muss, welche Faktoren man untersucht. Wenn man ökonomisch nur eine Hand voll Zeitungen untersuchen kann, kann man reliabel nur eine geringe Anzahl an Variablen als erklärende Variablen ins Modell aufnehmen. Ich würde z. B. den Unterschied, den die politische Orientierung einer Zeitung ausmacht, messen, indem ich 2 linke mit 2 konservativen Zeitungen vergleiche. Das schränkt ein. Wenn ich automatisiert größere Datenmengen untersuchen kann, kann ich mehr Variablen kontrollieren: liegt es an der politischen Orientierung? Regional/Überregional? Kommerzielle vs. Genossenschaftliche Finanzierung? Und so weiter.

Welche Entwicklungsmöglichkeiten sehen Sie für das Thema Data Science in Bezug auf Ihr Fachgebiet?

Ich denke, das spannende wird 1. die Vergrößerung der Datenbasis, 2. Möglichkeiten zur Verknüpfung mit anderen (quantitativen und qualitativen) Methoden und 3. Möglichkeiten zum Teilen von Messinstrumenten und Daten sein.

Zurück