Ruben Bach, Mannheimer Zentrum für Europäische Sozialforschung (MZES): Neue Daten und Methoden für die sozial­wissenschaft­liche Forschung (Juni 2024)

Ruben Bach ist wissenschaft­licher Mitarbeiter in der Abteilung Daten und Methoden des Mannheimer Zentrums für Europäische Sozialforschung (MZES). Seine Forschung hat ihre Wurzeln in den computer­basierten Sozial­wissenschaften. Er befasst sich mit Fragen des Online-Nachrichtenkonsums, KI-gestützter Entscheidungs­findung und Qualitätsaspekten neuer und traditioneller Forschungs­daten in den Sozial­wissenschaften.

Was ist Ihr aktuelles Forschungs­thema?

Ein Projekt, das mir gefällt, kombiniert Forschungs­arbeiten aus zwei Bereichen, die seit einigen Jahren auf meiner Forschungs­agenda stehen. Ich kombiniere Wissen aus der Umfragemethodik, einem Bereich der angewandten Statistik, der sich mit Erhebungs­methoden und deren Optimierung befasst, mit statistischen Lerntechniken zur Analyse von Textdaten. So unter­suche ich beispielsweise, welche Umfrage- und Fragebogendesigns zu einer möglichst hohen Antwortqualität führen und gleichzeitig Daten in Formaten produzieren, die für eine automatisierte oder halbautomatisierte Analyse mit Algorithmen zur Verarbeitung natürlicher Sprache optimal sind.

Für alle, die noch nicht so tief in das Thema Data Science eingestiegen sind: Wie würden Sie einem Kind erklären, woran Sie arbeiten?

Ich unter­suche, wie wir Menschen Fragen so stellen sollten, dass ihre Antworten genau beschreiben, was sie denken. Gleichzeitig sollten die Antworten in Formaten gegeben werden, die es Computer­programmen leicht machen, sie zu verstehen. Es geht darum, den perfekten Fragebogen zu entwerfen, der sowohl von Menschen als auch von Computern leicht gelesen und verstanden werden kann.

Alle sprechen über Data Science – wie würden Sie die Bedeutung des Themas für sich selbst in drei Worten beschreiben?

Datenqualität ist alles 

Welche Berührungs­punkte mit Data Science hat Ihre Arbeit? Welche Methoden nutzen Sie bereits und welche wären zukünftig interessant für Sie?

Ich verwende alle Arten von maschinellen Lernalgorithmen für die angewandte Forschung in den Sozial­wissenschaften. Bisher habe ich mich auf trans­formator­basierte Sprach­modelle und verschiedene Algorithmen auf der Basis von Klassifikations- und Regressionsbäumen konzentriert. In Zukunft möchte ich mein Portfolio um Techniken für den Umgang mit audiovisuellen Daten erweitern.

Wie hoch ist der Wert von Data Science für Ihre Arbeit? Wäre Ihre Forschung ohne Data Science überhaupt möglich?

Das hängt von der Definition von Data Science ab. Meine Arbeit hat sich immer mit Daten und Datenanalysetechniken beschäftigt. Dieser Logik folgend, wäre meine Arbeit ohne Data Science nicht möglich.

Welche Entwicklungs­möglichkeiten sehen Sie für das Thema Data Science in Bezug auf Ihr Fach­gebiet?

Ich glaube, dass Sozial­wissenschaft­ler*innen und insbesondere Methodiker*innen wie ich mehr zur Forschung über Qualitätsaspekte der verwendeten Daten beitragen sollten. Qualitativ hochwertige Daten sind wichtig, um gute Entscheidungen zu treffen. Bislang konzentrieren wir uns oft zu sehr auf die Algorithmen und die Analysepipelines und zu wenig auf die Daten, die wir verwenden.

Zurück