Natural Language Processing (NLP)

Die Abteilung Natural Language Processing (NLP) am Institut für Angewandte Informatik (InfAI) e.V. forscht unter der Leitung von Prof. Dr. Gerhard Heyer zu den Schwerpunkten Text Mining, Document Analysis, Textklassifikation und Active Learning. Des Weiteren arbeitet sie an Themen wie der nutzerzentrierten Entwicklung KI-basierter Systeme sowie der Evaluation großer Sprachmodelle. Es bestehen enge Kooperationen mit dem ScaDS.AI (Dresden/Leipzig), der Universität Leipzig sowie mit der Sächsischen Akademie der Wissenschaften (SAW) und weiteren Partnerinstitutionen.

Gerhard Heyer ist Professor emeritus für Automatische Sprachverarbeitung (ASV) am Institut für Informatik in der Fakultät für Mathematik und Informatik an der Universität Leipzig. Im Unterschied zur Computerlinguistik, die meist an philologischen Fakultäten angesiedelt ist, versteht sich die ASV als Teil der Angewandten Informatik. Der fachliche Schwerpunkt liegt dabei auf der automatischen Verarbeitung von geschriebener Sprache – unabhängig davon, um welche Einzelsprache und deren Kodierung es sich handelt – mit dem Ziel, so viel (linguistisches und nicht linguistisches) Wissen wie möglich aus Texten automatisch zu extrahieren. Ein besonderer Schwerpunkt liegt dabei auf der automatischen Extraktion von semantischen Relationen, deren Repräsentation und Nutzung im Information Retrieval und Wissensmanagement.

Ziele dieser Forschungsabteilung

  • Automatische Verarbeitung geschriebener Sprache (Nutzung des Wissensrohstoffs Text) – Extraktion von Wissen
  • Daten, Verfahren und Anwendungen zur automatischen semantischen Textanalyse

Projekte mit Beteiligung der Abt. Natural Language Processing (NLP)

  • CORAL: Fundierte Spachmodelle auf der Grundlage proprietärer Daten, 10/2024-09/2027
  • KI4JUSTiS: Forschungskooperation zum Einsatz von Künstlicher Intelligenz in der sächsischen Justiz, 02/2024 – 01/2027
  • GenKIES: Generative KI-Modelle zur Unterstützung des Requirements Engineerings für elektronische Systeme, 07/2024 –  06/2026
  • SARDINE: Smart Regional Development Infrastructure (Arbeitspaket4), 03/2020 – 12/2022
  • KIRESys: KI-basiertes Reference Design-Processing für die automatisierte Entwicklung von Embedded Systems, 01/2021 – 12/2023
  • MFRR: Media Freedom Rapid Response, 03/2020-02/2021 und 05/2021-05/2022
  • PGuard: Risikoanalyse und Kontrolle des Datenverkehrs von Smartphone-Apps für einen effektiven Selbstdatenschutz, 01/2016 – 06/2018
  • Wortschatz Leipzig / Leipzig Corpora Collection: Korpusbasierte digitale Wörterbücher und Textkorpora für Deutsch und über 200 weitere Sprachen, 1994 – heute

Abteilungsleiter

Prof. Dr. Gerhard Heyer
Telefon: +49 341 97322 31
E-Mail: heyer@infai.org

Institut für Angewandte Informatik (InfAI) e. V.
An-Institut der Universität Leipzig
Goerdelerring 9 ⎥ 04109 Leipzig