Was ist Ihr aktuelles Forschungsthema?
Ein Projekt, das mir gefällt, kombiniert Forschungsarbeiten aus zwei Bereichen, die seit einigen Jahren auf meiner Forschungsagenda stehen. Ich kombiniere Wissen aus der Umfragemethodik, einem Bereich der angewandten Statistik, der sich mit Erhebungsmethoden und deren Optimierung befasst, mit statistischen Lerntechniken zur Analyse von Textdaten. So untersuche ich beispielsweise, welche Umfrage- und Fragebogendesigns zu einer möglichst hohen Antwortqualität führen und gleichzeitig Daten in Formaten produzieren, die für eine automatisierte oder halbautomatisierte Analyse mit Algorithmen zur Verarbeitung natürlicher Sprache optimal sind.
Für alle, die noch nicht so tief in das Thema Data Science eingestiegen sind: Wie würden Sie einem Kind erklären, woran Sie arbeiten?
Ich untersuche, wie wir Menschen Fragen so stellen sollten, dass ihre Antworten genau beschreiben, was sie denken. Gleichzeitig sollten die Antworten in Formaten gegeben werden, die es Computerprogrammen leicht machen, sie zu verstehen. Es geht darum, den perfekten Fragebogen zu entwerfen, der sowohl von Menschen als auch von Computern leicht gelesen und verstanden werden kann.
Alle sprechen über Data Science – wie würden Sie die Bedeutung des Themas für sich selbst in drei Worten beschreiben?
Datenqualität ist alles
Welche Berührungspunkte mit Data Science hat Ihre Arbeit? Welche Methoden nutzen Sie bereits und welche wären zukünftig interessant für Sie?
Ich verwende alle Arten von maschinellen Lernalgorithmen für die angewandte Forschung in den Sozialwissenschaften. Bisher habe ich mich auf transformatorbasierte Sprachmodelle und verschiedene Algorithmen auf der Basis von Klassifikations- und Regressionsbäumen konzentriert. In Zukunft möchte ich mein Portfolio um Techniken für den Umgang mit audiovisuellen Daten erweitern.
Wie hoch ist der Wert von Data Science für Ihre Arbeit? Wäre Ihre Forschung ohne Data Science überhaupt möglich?
Das hängt von der Definition von Data Science ab. Meine Arbeit hat sich immer mit Daten und Datenanalysetechniken beschäftigt. Dieser Logik folgend, wäre meine Arbeit ohne Data Science nicht möglich.
Welche Entwicklungsmöglichkeiten sehen Sie für das Thema Data Science in Bezug auf Ihr Fachgebiet?
Ich glaube, dass Sozialwissenschaftler*innen und insbesondere Methodiker*innen wie ich mehr zur Forschung über Qualitätsaspekte der verwendeten Daten beitragen sollten. Qualitativ hochwertige Daten sind wichtig, um gute Entscheidungen zu treffen. Bislang konzentrieren wir uns oft zu sehr auf die Algorithmen und die Analysepipelines und zu wenig auf die Daten, die wir verwenden.