Human-Centered Data Science
Wir sind eine von Prof. Lisa Beinborn gegründete
Forschungsgruppe. Wir arbeiten an Natural Language Processing (NLP) mit einem menschzentriertem Ansatz und sind dem Institut für Informatik und dem Campus-Institut Data Science der Georg-August Universität Göttingen angegliedert.
Team
![]() |
![]() |
![]() |
![]() |
|
Prof. Lisa Beinborn Gruppenleiterin |
Jonas Mayer Martins PhD Student |
Zhuojing Huang PhD Student |
Jana Hackethal Assistentin |
|
Aktuelles
- Lisa Beinborn wurde eingeladen, den Festvortrag beim Neujahrsempfang der Universität zu halten. Sie sprach über
"Sprache modellieren — Das Zusammenspiel von Informatik,
Linguistik und Psychologie".
- Lisa Beinborn wurde mit einemImpuls-Professur
Stipendium ausgezeichnet, um an polyvokalen Sprachmodellen zu arbeiten, die sprachübergreifende und
individuelle Unterschiede berücksichtigen können.
- Unsere Gruppe war sehr aktiv auf derEMNLP Konferenz 2024 in Miami:
- Wir haben die Frequenzverzerrung aktueller Sprachmodelle untersucht und stellen einen neuen Ansatz namens
Syntactic Smoothing vor, der sowohl die Frequenzverzerrung als
auch die Anisotropie des Repräsentationsraums reduziert.
- Unsere Gruppe hat beide Preise für herausragende Arbeiten bei der ConLL BabyLM Challenge gewonnen. Lisa
Beinborn arbeitete mit Forschern aus Cambridge zusammen, um die Fähigkeiten eines Sprachmodells zu
analysieren, das aus sprachähnlichen Eingaben lernt, die als
Phoneme dargestellt werden. Unsere Gastforscherin Miyu Oba arbeitete an Variationsmengen. Für das Pre-Training des Sprachmodells verwendete sie zusammen mit einer Gruppe von Wissenschaftlern
aus Groningen und Tokio-Nara systematisch verschiedene Mengen von Sätzen, die eine ähnliche Absicht ausdrücken.
- Jenia Kim präsentierte auf dem TSAR Workshop ihre Ideen für die adaptive Vereinfachung von kommunalen Texten.
- Miyu Oba zeigte, dass es Sprachmodellen immer noch schwer fällt grammatikalisches Wissen aus indirekten Hinweisen abzuleiten.
- Wir haben die Frequenzverzerrung aktueller Sprachmodelle untersucht und stellen einen neuen Ansatz namens
Syntactic Smoothing vor, der sowohl die Frequenzverzerrung als
auch die Anisotropie des Repräsentationsraums reduziert.
- Lisa Beinborn und Nora Hollenstein haben ein Buch über Kognitive Plausibilität in Natural Language
Processing geschrieben.
Forschung
Wir entwickeln computergestützte Modelle, die menschliche Variation, Unsicherheit und kognitive Komplexität berücksichtigen, und interessieren uns derzeit vor allem für die folgenden Themen:
- Multilingual NLP
- Kognitiv plausibles Representation Learning
- Interpretierbarkeit und Bias von Machine-Learning-Modellen
- Sprachtechnologie im Bildungskontext
- Modellierung von Eye-Tracking-Daten der Sprachverarbeitung
Lehre
Wir sind immer auf der Suche nach motivierten Studierenden, die mit uns arbeiten möchten.
Wenn Ihnen unsere Kurse gefallen und Sie tiefer einsteigen möchten, wenden Sie sich an claplab@uni-goettingen.de.
Werfen Sie einen Blick auf unsere Abschlussarbeitsthemen oder schlagen Sie Ihre eigene Idee vor, die auf einer aktuellen Arbeit oder einer Shared Task basiert.