Carola Trips, Lehrstuhlinhaberin für Anglistische Linguistik/ Diachronie: Linguistische Datenverarbeitung (November 2022)
Was ist Ihr aktuelles Forschungsthema?
In der letztes Jahr eingeworbenen DFG-Forschungsgruppe “Structuring the Input in Language Processing, Acquisition and Change” (SILPAC, FOR 5157) untersuche ich mit meinem Team Sprachwandel aus der psycholinguistischen Perspektive, also wie Veränderungen im Sprachinput und während der Sprachverarbeitung Sprachwandel auslösen können.
Für alle, die noch nicht so tief in das Thema Data Science eingestiegen sind: Wie würden Sie einem Kind erklären, woran Sie arbeiten?
Was ich mache, könnte man als „Spracharchäologie“ beschreiben: ich nehme Textfunde für das Englische im Mittelalter und versuche, anhand dieser Texte herauszufinden, wie die Menschen damals gesprochen/
Alle sprechen über Data Science – wie würden Sie die Bedeutung des Themas für sich selbst in drei Worten beschreiben?
Korpuslinguistik, linguistische Annotation, maschinelle Sprachverarbeitung
Welche Berührungspunkte mit Data Science hat Ihre Arbeit? Welche Methoden nutzen Sie bereits und welche wären zukünftig interessant für Sie?
Ich arbeite primär mit linguistisch annotierten Korpora. Das Anreichern von bestehenden Korpora mit weiteren Informationen, die automatisch extrahiert werden können, wie z.B. die Lemmatisierung von Verben, ist oft notwendig, um eine Forschungsfrage bearbeiten zu können. Diese Annotationen sind Voraussetzung für die Verwendung quantitativer und statistischer Methoden. Da ich mich auch für Sprachkontakt in historischen Übersetzungen interessiere, wären für mich zukünftig Methoden und tools interessant, die Texte alignieren und vergleichbar machen (historische Parallelkorpora).
Wie hoch ist der Wert von Data Science für Ihre Arbeit? Wäre Ihre Forschung ohne Data Science überhaupt möglich?
In meiner Definition von Data Science liegt der Fokus auf der linguistischen Datenverarbeitung. Der Wert von Textannotation und Computerwerkzeugen ist in meiner Forschung sehr hoch, zumindest für quantitative Studien. Allerdings darf man auch die nicht-linguistischen, philologischen Eigenschaften von diesen Texten nicht aus den Augen verlieren. Die in meinen Projekten betriebene historische Linguistik ist stark von Data Science beeinflusst, kombiniert aber beide Ansätze auf fruchtbare Weise.
Welche Entwicklungsmöglichkeiten sehen Sie für das Thema Data Science in Bezug auf Ihr Fachgebiet?
Das Arbeiten mit annotierten Korpora ist für die historische Linguistik heutzutage essentiell und es existieren erfreulicherweise mittlerweile auch sehr gute linguistisch annotierte Korpora für ältere Sprachstufen (sprachübergreifend). Ein Problem ist allerdings, dass nach wie vor nur wenige Korpus-Ressourcen geteilt werden, oft aus dem Grund, dass diese in Forschungsprojekten entstehen und der Forschungscommunity nicht bekannt und/