Entwicklung und Anwendung von Methoden zur Analyse unstrukturierter Texte im Gesundheitswesen mit Fokus auf Named Entity Recognition (NER) und Large Language Models (LLMs), Training, Feinabstimmung und Evaluierung von LLMs zur Analyse der Datenqualität und Strukturierung der Texte, Entwicklung von Strategien zur Validierung und Qualitätsbewertung von extrahierten Textinformationen in klinischen und epidemiologischen Datenkontexten, Erstellung, Pflege und Automatisierung von Pipelines für Text Mining und NLP-Verfahren (z. B. mit Python, HuggingFace, spaCy, Transformers), Integration von NLP-Ergebnissen in bestehende Dateninfrastrukturen und Schnittstellen (FHIR, HL7), Aktive Mitwirkung bei der Publikation von wissenschaftlichen Ergebnissen in hochrangigen Fachzeitschriften