Rainer Freudenthaler, Mannheimer Zentrum für Europäische Sozialforschung (MZES): automatisierte Methoden der Inhaltsanalyse (September 2022)
Was ist Ihr aktuelles Forschungsthema?
Ich arbeite im Projekt „Impliziter und expliziter Rassismus in Nachrichtenmedien und sozialen Medien: Ausmaß und Wirkung“, das Teil des Forschungsverbunds „Diskriminierung und Rassismus“ (FoDiRa) ist. In diesem Projekt bauen wir auf einem früheren Forschungsprojekt auf, in dem automatisierte Methoden zur Messung expliziter Stigmatisierung und impliziter Stigmatisierung entwickelt wurden. Damit gemeint ist: Werden bestimmte Minderheitengruppen überdurchschnittlich mit Furcht oder unterdurchschnittlich mit Anerkennung assoziiert (explizit)? Und werden diese Gruppen in implizit negativ konnotierten Kontexten genannt (implizit)? Wir wollen die Methoden weiter verbessern und auf neue Daten anwenden – auf Berichterstattung in Mainstream- und Alternativmedien, und auf Social-Media-Daten von Influencern. Und wir wollen experimentell testen, welchen Effekt diese Darstellungen haben können.
Für alle, die noch nicht so tief in das Thema Data Science eingestiegen sind: Wie würden Sie einem Kind erklären, woran Sie arbeiten?
Wir bringen Computern bei, große Textmengen zu lesen. Wenn Menschen Texte lesen, hat das den Nachteil, dass sie nur verhältnismäßig kleine Textmengen lesen können. Also testen wir, ob unsere Computerprogramme genauso gut wie Menschen erkennen können, was uns interessiert – wenn das so ist, können wir größere Mengen an Texten analysieren.
Alle sprechen über Data Science – wie würden Sie die Bedeutung des Themas für sich selbst in drei Worten beschreiben?
Größere Datenmengen auswerten.
Welche Berührungspunkte mit Data Science hat Ihre Arbeit? Welche Methoden nutzen Sie bereits und welche wären zukünftig interessant für Sie?
Wir arbeiten momentan mit Latent Semantic Scaling und Methoden zur Messung von Word-Embedding-Bias. Beides sind Methoden, die darauf aufbauen, Wörter danach zu vergleichen, ob sie ähnlich verwendet werden, um zu erkennen, welche Wörter ähnliche Bedeutungen haben. Wir schauen momentan mit großem Interesse auf Deep-Learning-Methoden, die noch besser in der Lage zu sein scheinen, Bedeutung in Texten zu erkennen, z.B. NLI-BERT.
Wie hoch ist der Wert von Data Science für Ihre Arbeit? Wäre Ihre Forschung ohne Data Science überhaupt möglich?
Ich sehe bei uns im Feld momentan vor allem Vorteile in der Skalierung – in der Kommunikationswissenschaft bedeutet quantitative Inhaltsanalyse mit menschlichen Kodierer/
Welche Entwicklungsmöglichkeiten sehen Sie für das Thema Data Science in Bezug auf Ihr Fachgebiet?
Ich denke, das spannende wird 1. die Vergrößerung der Datenbasis, 2. Möglichkeiten zur Verknüpfung mit anderen (quantitativen und qualitativen) Methoden und 3. Möglichkeiten zum Teilen von Messinstrumenten und Daten sein.