September 2022: Data Science Insights von Rainer Freudenthaler

Dr. Rainer Freudenthaler ist Projektmitarbeiter im Mannheimer Zentrum für Europäische Sozialforschung. Nach einem Bachelor­studium der Medienwirtschaft an der Hochschule der Medien in Stuttgart und einem Master­studium in der Medien- und Kommunikations­wissenschaft promovierte er 2021 an der Universität Mannheim mit einer Dissertation zur öffentlichen Debatte zur deutschen Flüchtlingspolitik in Online-Medien.

 

Was ist Ihr aktuelles Forschungs­thema?                                             

Ich arbeite im Projekt „Impliziter und expliziter Rassismus in Nachrichtenmedien und sozialen Medien: Ausmaß und Wirkung“, das Teil des Forschungs­verbunds „Diskriminierung und Rassismus“ (FoDiRa) ist. In diesem Projekt bauen wir auf einem früheren Forschungs­projekt auf, in dem automatisierte Methoden zur Messung expliziter Stigmatisierung und impliziter Stigmatisierung entwickelt wurden. Damit gemeint ist: Werden bestimmte Minderheiten­gruppen über­durchschnittlich mit Furcht oder unter­durchschnittlich mit Anerkennung assoziiert (explizit)? Und werden diese Gruppen in implizit negativ konnotierten Kontexten genannt (implizit)? Wir wollen die Methoden weiter verbessern und auf neue Daten anwenden – auf Bericht­erstattung in Mainstream- und Alternativmedien, und auf Social-Media-Daten von Influencern. Und wir wollen experimentell testen, welchen Effekt diese Darstellungen haben können.

Für alle, die noch nicht so tief in das Thema Data Science eingestiegen sind: Wie würden Sie einem Kind erklären, woran Sie arbeiten?

Wir bringen Computern bei, große Textmengen zu lesen. Wenn Menschen Texte lesen, hat das den Nachteil, dass sie nur verhältnismäßig kleine Textmengen lesen können. Also testen wir, ob unsere Computer­programme genauso gut wie Menschen erkennen können, was uns interessiert – wenn das so ist, können wir größere Mengen an Texten analysieren.

Alle sprechen über Data Science – wie würden Sie die Bedeutung des Themas für sich selbst in drei Worten beschreiben?

Größere Datenmengen auswerten.

Welche Berührungs­punkte mit Data Science hat Ihre Arbeit? Welche Methoden nutzen Sie bereits und welche wären zukünftig interessant für Sie?

Wir arbeiten momentan mit Latent Semantic Scaling und Methoden zur Messung von Word-Embedding-Bias. Beides sind Methoden, die darauf aufbauen, Wörter danach zu vergleichen, ob sie ähnlich verwendet werden, um zu erkennen, welche Wörter ähnliche Bedeutungen haben. Wir schauen momentan mit großem Interesse auf Deep-Learning-Methoden, die noch besser in der Lage zu sein scheinen, Bedeutung in Texten zu erkennen, z.B. NLI-BERT.

Wie hoch ist der Wert von Data Science für Ihre Arbeit? Wäre Ihre Forschung ohne Data Science überhaupt möglich?

Ich sehe bei uns im Feld momentan vor allem Vorteile in der Skalierung – in der Kommunikations­wissenschaft bedeutet quantitative Inhaltsanalyse mit menschlichen Kodierer/innen immer, dass man sehr genau einschränken muss, welche Faktoren man untersucht. Wenn man ökonomisch nur eine Hand voll Zeitungen untersuchen kann, kann man reliabel nur eine geringe Anzahl an Variablen als erklärende Variablen ins Modell aufnehmen. Ich würde z.B. den Unterschied, den die politische Orientierung einer Zeitung ausmacht, messen, indem ich 2 linke mit 2 konservativen Zeitungen vergleiche. Das schränkt ein. Wenn ich automatisiert größere Datenmengen untersuchen kann, kann ich mehr Variablen kontrollieren: liegt es an der politischen Orientierung? Regional/Überregional? Kommerzielle vs. Genossenschaft­liche Finanzierung? Und so weiter.

Welche Entwicklungs­möglichkeiten sehen Sie für das Thema Data Science in Bezug auf Ihr Fach­gebiet?

Ich denke, das spannende wird 1. die Vergrößerung der Datenbasis, 2. Möglichkeiten zur Verknüpfung mit anderen (quantitativen und qualitativen) Methoden und 3. Möglichkeiten zum Teilen von Messinstrumenten und Daten sein.

Zurück