Automatisierte Strukturierung von medizinischen Dokumenten

Thesis Type Master
Thesis Status
Currently running
Student Jan Schlenker
Start
Thesis Supervisor
External Supervisor
Univ.-Prof. Dr. Bernhard Holzner, Priv.-Doz. Dr. Gerhard Rumpold
Contact
Research Field

In den zurzeit aktuellen Klinik-Informations-Systemen (KIS) werden klinischen Daten zum Teil in unstrukturierten Dokumenten erfasst. Diktierte Arztbriefe, die als PDF oder Word-Dokument vorliegen, enthalten unstrukturierte Informationen wie Diagnose, Anamnese, Medikation, Laborwerte und das weitere Behandlungsprocedere. Diese unstrukturierten klinischen Daten können für wissenschaftliche Auswertungen nur mit erheblichem Einsatz von Humanressourcen nutzbar gemacht werden, d.h. manuell strukturiert werden.

Ziel dieser Arbeit ist es, Algorithmen zu entwickeln, die diese unstrukturierten Informationen voll- oder semiautomatisiert aus den Arztbriefen extrahieren und in eine für wissenschaftliche Auswertungen brauchbare, strukturierte Datenstruktur (Datenbank) übertragen. Dabei sollen aktuelle Techniken aus der Textanalyse wie z.B. maschinelles Lernen zum Einsatz kommen, die ggf. mit regelbasierten Algorithmen kombiniert werden. Schlussendlich soll ein Prototyp entwickelt werden, der es ermöglicht, die automatisch extrahierten Informationen für reale Dokumente vorzuschlagen, manuell zu überprüfen und nach Überarbeitung in die Datenstruktur zu übernehmen.