Das Mannheimer Barockschloss und der Ehrenhof unter blauem Himmel.

Understanding Abilities and Failures of Language Models

Uhr

Michael Hahn, Universität des Saarlands

EO 159

CAS-Gastvortrag von Michael Hahn

Michael Hahn ist als Gastredner des CAS eingeladen. Seine Einladung erfolgte im Kontext des Projektes der aktuellen Kohorte mit dem Titel: „Knowledge acquisition, representation and application in human minds and machines“. Der Gastvortragvortrag trägt den Titel „Understanding Abilities and Failures of Language Models“.

Abstract:
The reasoning capabilities of LLMs have seen enormous progress, but it remains hard to predict when they fail, and how many reasoning tokens they need to solve different problems. I will present two lines of research aiming to make reasoning abilities more predictable via theoretical bounds on the abilities of the underlying architecture — the Trans­former. First, I will present our recent work aiming to predict on which algorithmic tasks trans­formers can generalize to longer inputs, and compare to LLM performance. Second, I will describe our recent work bounding the reasoning cost needed to solve various algorithmic problems with trans­formers. I will close by discussing problems for further research. 

Der Vortrag wird parallel auch auf Zoom übertragen, sodass auch eine digitale Teilnahme möglich ist. Die Zugangsdaten lauten wie folgt: https://uni-mannheim.zoom-x.de/j/68235694831. Sie werden nach dem Einwählen zunächst in den Warteraum geführt und dann zu Beginn des Vortrags zugeschaltet.

Zurück