Carola Trips, Lehrstuhlinhaberin für Anglistische Linguistik/Diachronie: Linguistische Datenverarbeitung (November 2022)

Carola Trips vor einem hellen Hintergrund. Sie trägt ein gestreiftes Kapuzenoberteil.

Prof. Dr. Carola Trips ist Inhaberin des Lehrstuhls für Anglistische Linguistik/Diachronie (Anglistik IV) an der Universität Mannheim und arbeitet im Bereich der Historischen Linguistik. Ihre Forschungsinteressen umfassen neben synchroner und diachroner Syntax und Morphologie(-theorien) Sprachkontakt, Sprachwandel, lexikalische Semantik sowie Korpuslinguistik. Carola Trips promovierte und habilitierte an der Universität Stuttgart, an der sie auch ihr Studium der Fächer Englisch und Deutsch auf Lehramt und Magister abschloss. Seit 2022 ist sie Wissenschaftliches Mitglied des MCDS.

Was ist Ihr aktuelles Forschungsthema?

In der letztes Jahr eingeworbenen DFG-Forschungsgruppe “Structuring the Input in Language Processing, Acquisition and Change” (SILPAC, FOR 5157) untersuche ich mit meinem Team Sprachwandel aus der psycholinguistischen Perspektive, also wie Veränderungen im Sprachinput und während der Sprachverarbeitung Sprachwandel auslösen können.

Für alle, die noch nicht so tief in das Thema Data Science eingestiegen sind: Wie würden Sie einem Kind erklären, woran Sie arbeiten?

Was ich mache, könnte man als „Spracharchäologie“ beschreiben: ich nehme Textfunde für das Englische im Mittelalter und versuche, anhand dieser Texte herauszufinden, wie die Menschen damals gesprochen/geschrieben und ihre Sprache erworben haben, und was sich in der Sprache verändert hat. Um möglichst viel in relativ kurzer Zeit herauszufinden, kann man Computerprogramme (sogenannte tools) entwickeln, die diese Texte automatisch untersuchen und analysieren.

Alle sprechen über Data Science – wie würden Sie die Bedeutung des Themas für sich selbst in drei Worten beschreiben?

Korpuslinguistik, linguistische Annotation, maschinelle Sprachverarbeitung

Welche Berührungspunkte mit Data Science hat Ihre Arbeit? Welche Methoden nutzen Sie bereits und welche wären zukünftig interessant für Sie?

Ich arbeite primär mit linguistisch annotierten Korpora. Das Anreichern von bestehenden Korpora mit weiteren Informationen, die automatisch extrahiert werden können, wie z. B. die Lemmatisierung von Verben, ist oft notwendig, um eine Forschungsfrage bearbeiten zu können. Diese Annotationen sind Voraussetzung für die Verwendung quantitativer und statistischer Methoden. Da ich mich auch für Sprachkontakt in historischen Übersetzungen interessiere, wären für mich zukünftig Methoden und tools interessant, die Texte alignieren und vergleichbar machen (historische Parallelkorpora).

Wie hoch ist der Wert von Data Science für Ihre Arbeit? Wäre Ihre Forschung ohne Data Science überhaupt möglich?

In meiner Definition von Data Science liegt der Fokus auf der linguistischen Datenverarbeitung. Der Wert von Textannotation und Computerwerkzeugen ist in meiner Forschung sehr hoch, zumindest für quantitative Studien. Allerdings darf man auch die nicht-linguistischen, philologischen Eigenschaften von diesen Texten nicht aus den Augen verlieren. Die in meinen Projekten betriebene historische Linguistik ist stark von Data Science beeinflusst, kombiniert aber beide Ansätze auf fruchtbare Weise.

Welche Entwicklungsmöglichkeiten sehen Sie für das Thema Data Science in Bezug auf Ihr Fachgebiet?

Das Arbeiten mit annotierten Korpora ist für die historische Linguistik heutzutage essentiell und es existieren erfreulicherweise mittlerweile auch sehr gute linguistisch annotierte Korpora für ältere Sprachstufen (sprachübergreifend). Ein Problem ist allerdings, dass nach wie vor nur wenige Korpus-Ressourcen geteilt werden, oft aus dem Grund, dass diese in Forschungsprojekten entstehen und der Forschungscommunity nicht bekannt und/oder nicht zugänglich sind. Das Forschungsmanagement in diesem Bereich sollte deutlich verbessert werden.

Zurück