Detailseite
Erzeugung und Beantwortung ontologischer Anfragen über semistrukturieren medizinischen Daten
Antragsteller
Professor Dr.-Ing. Franz Baader
Fachliche Zuordnung
Theoretische Informatik
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2015 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 284232554
Immer mehr Information über Individuen (z.B. Personen, Ereignisse, biologische Objekte) sind elektronisch in strukturierter oder semi-strukturierter Form verfügbar. Die manuelle Auswahl von Individuen, welche bestimmte Kriterien erfüllen, aus derartigen Daten ist eine komplexe, fehleranfällige und zeitaufwändige Aufgabe. Daher müssen Werkzeuge entwickelt werden, die es erlauben, Fragen nach solchen Individuen automatisch oder halb-automatisch anhand der verfügbaren Daten zu beantworten. Während einfache Fragen leicht durch Suche nach natürlich-sprachlichen Schlüsselwörtern beantwortet werden können, würden komplexere Fragen, die Typinformation und relationale Information mit einbeziehen, die Präzision der erhaltenen Antworten erhöhen und damit den Aufwand für die manuelle Nachbearbeitung verringern. Ein Beispiel dafür ist die Suche nach Patienten, die nicht-triviale Kombinationen gewisser Kriterien (wie Zulässigkeitskriterien für klinische Studien) erfüllen, anhand von elektronischen Patientenakten. In anderes Beispiel, das wir ebenfalls als Use Case in diesem Projekt betrachten wollen, sind Fragen, die Studenten im Prüfungsamt zu Studien- und Prüfungsregularien stellen. In beiden Fällen sind die Fragen in natürlicher Sprache formuliert.Im GoAsq Projekt wollen wir zwei verschiedene Ansätze zur Beantwortung natürlich-sprachlicher Fragen über strukturierten und semi-strukturierten Daten untersuchen sowie miteinander vergleichen und kombinieren. Der erste Ansatz verwendet die Expertise der französischen Projektpartner bei der text-basierten Fragebeantwortung, um natürlich-sprachliche Fragen direkt mit Hilfe von Sprachverarbeitungs- und Information-Retrieval-Techniken zu beantworten. Der andere Ansatz versucht, die natürlich-sprachliche Frage in eine formale Datenbankanfrage zu übersetzen, welche dann bezüglich einer domänenspezifischen Ontologie mit Hilfe von Datenbanktechniken beantwortet wird. Die automatische Übersetzung der Frage ist nötig, da es für die fragenden Personen (Mediziner, Studenten) sehr schwer ist, formale Anfragen zu formulieren. Die Ontologie kann die semantische Lücke zwischen den Personen, die die Daten erzeugen (z.B. dem Hausarzt, der die Patientenakte führt), und den Personen, die die Frage stellen (z.B. dem Forscher, der die Zulässigkeitskriterien formuliert) schließen. GoAsq kann dazu auf neue Ergebnisse zur ontologie-basierten Anfragebeantwortung (ontology-based query answering, OBQA) zurückgreifen. In Arbeitspaket 1 werden wir dazu die beiden Use Cases (Zulässigkeitskriterien, Studienregularien) genauer untersuchen. AP 2 entwickelt und analysiert Erweiterungen existierender OBQA-Formalismen, die für die Uses Cases erforderlich sind. AP 3 entwickelt Techniken zur Extraktion formaler Anfragen aus textuellen Fragen. AP 4 evaluiert den so erhaltenen Ansatz, vergleicht ihn mit dem text-basierten Ansatz zur Fragebeantwortung und entwickelt einen hybriden Ansatz, der die Vorteile beider Ansätze kombiniert.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
Frankreich
Partnerorganisation
Agence Nationale de la Recherche / The French National Research Agency
Kooperationspartnerinnen
Professorin Dr. Brigitte Grau; Dr. Yue Ma