Carola Trips, Lehr­stuhl­inhaberin für Anglistische Linguistik/Diachronie: Linguistische Datenverarbeitung (November 2022)

Prof. Dr. Carola Trips ist Inhaberin des Lehr­stuhls für Anglistische Linguistik/Diachronie (Anglistik IV) an der Universität Mannheim und arbeitet im Bereich der Historischen Linguistik. Ihre Forschungs­interessen umfassen neben synchroner und diachroner Syntax und Morphologie(-theorien) Sprachkontakt, Sprachwandel, lexikalische Semantik sowie Korpuslinguistik. Carola Trips promovierte und habilitierte an der Universität Stuttgart, an der sie auch ihr Studium der Fächer Englisch und Deutsch auf Lehr­amt und Magister abschloss. Seit 2022 ist sie Wissenschaft­liches Mitglied des MCDS.

Was ist Ihr aktuelles Forschungs­thema?          

In der letztes Jahr eingeworbenen DFG-Forschungs­gruppe “Structuring the Input in Language Processing, Acquisition and Change” (SILPAC, FOR 5157) untersuche ich mit meinem Team Sprachwandel aus der psycholinguistischen Perspektive, also wie Veränderungen im Sprachinput und während der Sprachverarbeitung Sprachwandel auslösen können. 

Für alle, die noch nicht so tief in das Thema Data Science eingestiegen sind: Wie würden Sie einem Kind erklären, woran Sie arbeiten?

Was ich mache,  könnte man als „Spracharchäologie“ beschreiben: ich nehme Textfunde für das Englische im Mittelalter und versuche, anhand dieser Texte herauszufinden, wie die Menschen damals gesprochen/geschrieben und ihre Sprache erworben haben, und was sich in der Sprache verändert hat. Um möglichst viel in relativ kurzer Zeit herauszufinden, kann man Computer­programme (sogenannte tools) entwickeln, die diese Texte automatisch untersuchen und analysieren.

Alle sprechen über Data Science – wie würden Sie die Bedeutung des Themas für sich selbst in drei Worten beschreiben?

Korpuslinguistik, linguistische Annotation, maschinelle Sprachverarbeitung

Welche Berührungs­punkte mit Data Science hat Ihre Arbeit? Welche Methoden nutzen Sie bereits und welche wären zukünftig interessant für Sie?

Ich arbeite primär mit linguistisch annotierten Korpora. Das Anreichern von bestehenden Korpora mit weiteren Informationen, die automatisch extrahiert werden können, wie z.B. die Lemmatisierung von Verben, ist oft notwendig, um eine Forschungs­frage bearbeiten zu können. Diese Annotationen sind Voraussetzung für die Verwendung quantitativer und statistischer Methoden. Da ich mich auch für Sprachkontakt in historischen Übersetzungen interessiere, wären für mich zukünftig Methoden und tools interessant, die Texte alignieren und vergleichbar machen (historische Parallelkorpora).

Wie hoch ist der Wert von Data Science für Ihre Arbeit? Wäre Ihre Forschung ohne Data Science überhaupt möglich?

In meiner Definition von Data Science liegt der Fokus auf der linguistischen Datenverarbeitung. Der Wert von Textannotation und Computer­werkzeugen ist in meiner Forschung sehr hoch, zumindest für quantitative Studien. Allerdings darf man auch die nicht-linguistischen, philologischen Eigenschaften von diesen Texten nicht aus den Augen verlieren. Die in meinen Projekten betriebene historische Linguistik ist stark von Data Science beeinflusst, kombiniert aber beide Ansätze auf fruchtbare Weise.

Welche Entwicklungs­möglichkeiten sehen Sie für das Thema Data Science in Bezug auf Ihr Fach­gebiet?

Das Arbeiten mit annotierten Korpora ist für die historische Linguistik heutzutage essentiell und es existieren erfreulicherweise mittlerweile auch sehr gute linguistisch annotierte Korpora für ältere Sprachstufen (sprach­übergreifend). Ein Problem ist allerdings, dass nach wie vor nur wenige Korpus-Ressourcen geteilt werden, oft aus dem Grund, dass diese in Forschungs­projekten entstehen und der Forschungs­community nicht bekannt und/oder nicht zugänglich sind. Das Forschungs­management in diesem Bereich sollte deutlich verbessert werden.

Zurück