Detailseite
Projekt Druckansicht

Erzeugung und Beantwortung ontologischer Anfragen über semistrukturieren medizinischen Daten

Fachliche Zuordnung Theoretische Informatik
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2015 bis 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 284232554
 
Immer mehr Information über Individuen (z.B. Personen, Ereignisse, biologische Objekte) sind elektronisch in strukturierter oder semi-strukturierter Form verfügbar. Die manuelle Auswahl von Individuen, welche bestimmte Kriterien erfüllen, aus derartigen Daten ist eine komplexe, fehleranfällige und zeitaufwändige Aufgabe. Daher müssen Werkzeuge entwickelt werden, die es erlauben, Fragen nach solchen Individuen automatisch oder halb-automatisch anhand der verfügbaren Daten zu beantworten. Während einfache Fragen leicht durch Suche nach natürlich-sprachlichen Schlüsselwörtern beantwortet werden können, würden komplexere Fragen, die Typinformation und relationale Information mit einbeziehen, die Präzision der erhaltenen Antworten erhöhen und damit den Aufwand für die manuelle Nachbearbeitung verringern. Ein Beispiel dafür ist die Suche nach Patienten, die nicht-triviale Kombinationen gewisser Kriterien (wie Zulässigkeitskriterien für klinische Studien) erfüllen, anhand von elektronischen Patientenakten. In anderes Beispiel, das wir ebenfalls als Use Case in diesem Projekt betrachten wollen, sind Fragen, die Studenten im Prüfungsamt zu Studien- und Prüfungsregularien stellen. In beiden Fällen sind die Fragen in natürlicher Sprache formuliert.Im GoAsq Projekt wollen wir zwei verschiedene Ansätze zur Beantwortung natürlich-sprachlicher Fragen über strukturierten und semi-strukturierten Daten untersuchen sowie miteinander vergleichen und kombinieren. Der erste Ansatz verwendet die Expertise der französischen Projektpartner bei der text-basierten Fragebeantwortung, um natürlich-sprachliche Fragen direkt mit Hilfe von Sprachverarbeitungs- und Information-Retrieval-Techniken zu beantworten. Der andere Ansatz versucht, die natürlich-sprachliche Frage in eine formale Datenbankanfrage zu übersetzen, welche dann bezüglich einer domänenspezifischen Ontologie mit Hilfe von Datenbanktechniken beantwortet wird. Die automatische Übersetzung der Frage ist nötig, da es für die fragenden Personen (Mediziner, Studenten) sehr schwer ist, formale Anfragen zu formulieren. Die Ontologie kann die semantische Lücke zwischen den Personen, die die Daten erzeugen (z.B. dem Hausarzt, der die Patientenakte führt), und den Personen, die die Frage stellen (z.B. dem Forscher, der die Zulässigkeitskriterien formuliert) schließen. GoAsq kann dazu auf neue Ergebnisse zur ontologie-basierten Anfragebeantwortung (ontology-based query answering, OBQA) zurückgreifen. In Arbeitspaket 1 werden wir dazu die beiden Use Cases (Zulässigkeitskriterien, Studienregularien) genauer untersuchen. AP 2 entwickelt und analysiert Erweiterungen existierender OBQA-Formalismen, die für die Uses Cases erforderlich sind. AP 3 entwickelt Techniken zur Extraktion formaler Anfragen aus textuellen Fragen. AP 4 evaluiert den so erhaltenen Ansatz, vergleicht ihn mit dem text-basierten Ansatz zur Fragebeantwortung und entwickelt einen hybriden Ansatz, der die Vorteile beider Ansätze kombiniert.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Frankreich
Kooperationspartnerinnen Professorin Dr. Brigitte Grau; Dr. Yue Ma
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung