Kontextspezifische Spracherkennung im Operationssaal (MA/SA)

Offene Position für Masterarbeit

Beschreibung:

Für die kontextsensitive Integration von Robotersystemen in den Operationssaal müssen diese in der Lage sein, die aktuelle Situation zu beurteilen. Anhand der vielen verschiedenen Geräusche und Töne ist es möglich, den Fortschritt der Operation und die Befehle der Operateure zu erkennen. Zu diesem Zweck soll ein auf künstlicher Intelligenz basiertes Spracherkennungsmodul entwickelt werden, das die Tonspur der Chirurgen analysiert und Informationen über den aktuellen Stand der Operation ausgibt.

Aufgaben:

  • Literaturrecherche zur Spracherkennung insbesondere der Erkennung von Schlüsselwörtern (Keyword spotting)
  • Aufnahme von Audiodaten während Live-Operationen in der Chirurgie
  • Aufbereitung und Annotation der Audiodaten
  • Entwicklung und Implementierung eines ausgewählten Spracherkennungsmoduls zur Detektion von Befehlen im Operationssaal
  • Evaluation des Modells in Kooperation mit Chirurgen

Anforderungen:

  • Fortgeschrittene Kenntnisse im Bereich Machine Learning und Computer Vision
  • Umfassende Kenntnisse in Python oder Matlab 
  • Interesse an der Medizin
  • Eigeninitiative und Motivation

Bitte kontaktieren Sie uns, wenn Sie an weiteren Details zu den Arbeitspaketen interessiert sind.

Lars Wagner, M.Sc.
Email: lars.wagner@tum.de

Jonas Fuchtmann, M.Sc.
Email: jonas.fuchtmann@tum.de

Datum: 10.09.2022