Ein eingeschalteter Computer steht in einem Dschungel.

Schatzsuche im Datendschungel

Tagtäglich hinterlassen wir alle unzählige Datenspuren. Wir streamen Musik und Videos, bewerten Produkte und teilen Herzchen für die schönsten Fotos aus. Was in der Wissenschaft als Datafizierung bezeichnet wird, ist für jeden von uns Alltag. Für die Forschung sind diese Datenmengen ein nie dagewesener Schatz, allerdings ein noch ziemlich gut verborgener. Unstrukturierte Daten für die wissenschaft­liche Community nutzbar zu machen, ist das Ziel des Konsortiums BERD@NFDI (Business Economic Related Data@Nationale Forschungs­dateninfrastruktur). Warum das so wichtig ist, weiß BERD-Sprecher und Marketingprofessor der Uni Mannheim Prof. Dr. Florian Stahl.

„Alexa, wieviel Uhr ist es?“, frage ich um 6:24 Uhr verschlafen einen kleinen runden Lautsprecher, der auf dem Nachttisch steht. Bevor ich unter die Dusche hüpfe, starte ich meine Lieblingsplaylist auf Spotify und drehe die Lautstärke hoch. Beim Frühstück scrolle ich nebenbei durch Instagram, mein Blick ruht auf der Werbung, ich vergebe ein paar Likes für die hübschen Urlaubsfotos einer Kollegin. Noch bevor ich das Haus verlassen habe, habe ich bereits Unmengen an Informationen über meine Vorlieben und Gewohnheiten im Internet hinterlassen – meine ganz eigene, kleine Datenspur.

All unsere Datenspuren summiert ergeben einen wirren Datendschungel, der für Forschende wie Marketingprofessor Florian Stahl jedoch wertvolle Schätze birgt. „Die gewachsene Datenmenge ist eine große Chance für die Forschung in den Wirtschafts- und Sozial­wissenschaften. Damit diese ganzen Daten überhaupt von den Forschenden genutzt werden können, braucht es Projekte wie BERD“, erklärt er. BERD – das ist ein vorübergehender Zusammenschluss von sechs Institutionen, die seit Oktober 2021 unter der Leitung der Universität Mannheim mit Hochdruck daran arbeiten, eine digitale Plattform für alle Forschenden der Betriebs- und Volkswirtschafts­lehre sowie der Sozial­wissenschaften zu schaffen. Neben Forschenden der Universitäten Mannheim, Hamburg, Köln und München sind auch das Leibniz-Informations­zentrum Wirtschaft (ZBW) und die Universitäts­bibliothek Mannheim involviert. Das gemeinsame Ziel: Die unstrukturierten Daten für Wissenschaft­ler*innen nutzbar und zugänglich machen.

Welche Vorlieben und Gewohnheiten haben Menschen? Warum konsumieren sie bestimmte Produkte, warum verhalten sie sich in bestimmten Situationen auf eine bestimmte Art und Weise? „Früher haben wir das alles über Umfragen herauszufinden versucht, das war mit­unter sehr aufwendig. Doch die so gewonnen Daten konnten im Anschluss ohne Probleme ausgewertet und dargestellt werden “, erklärt Stahl. Nun habe man all diese Daten aus dem Netz: Von Webseiten, aus Apps, aus Internet of Things-Anwendungen, aus digitalen Geschäftsberichten, aus den sozialen Netzwerken und das in ganz unterschiedlichen Formaten: als Audio, Video, Bild- oder Textdateien. „Wichtige Fragestellungen können wir nun auf ganz neue Art erforschen, gerade für die Verhaltensforschung ist das eine tolle Chance“, freut sich der BERD-Sprecher.

Damit die Wissenschafts­community aber loslegen kann, müssen die Daten zum einen aufbereitet werden und zum anderen müssen geeignete KI-Methoden identifiziert werden, die den Forschenden die Datenverarbeitung erleichtern. Und hier kommt die BERD-Plattform ins Spiel: Als Infrastruktur bietet sie Forschenden die Möglichkeit, an die Daten zu gelangen, sie zu nutzen und einen Überblick über nachnutzbare KI-Algorithmen zu bekommen. „Wir verstehen uns als eine Art TÜV – wir zeigen, welche Datensätze für welche Forschungs­zwecke bereits verwendet wurden und welche KI-Anwendung dazu besonders geeignet war. Wir möchten der Community die nötigen Werkzeuge an die Hand geben, so dass sie Ideen bekommen, wie es sich mit dieser oftmals überfordernd großen Datenmenge gut arbeiten lässt“, erläutert Stahl. Ob das mit der neuen Plattform so funktioniert wie erdacht, testen derweil ausgewählte Forschende – ihr Feedback ist dem BERD-Team wichtig. Schon im November wird die digitale BERD-Plattform für die breite Öffentlichkeit zugänglich sein, verrät Stahl.

Text: Jule Leger/Dezember 2023