Project Details
Concept-based morphosemantically normalized cross-language information retrieval on medical documents
Applicant
Professor Dr. Rüdiger Klar (†)
Subject Area
Epidemiology and Medical Biometry/Statistics
Term
from 2003 to 2007
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5404263
Da auch in der Medizin mittlerweile der weitaus überwiegende Teil textueller Information elektronisch verfügbar ist, kommt der Entwicklung leistungsfähiger Recherchewerkzeuge eine vorrangige Bedeutung zu. Bewertet man die Nützlichkeit gängiger Textretrievalsysteme aus dem Blickwinkel der deutschen medizinischen Fachsprache, dann mangelt es ihnen einerseits an morphologischer Funktionalität (Behandlung der Flexion, Derivation und Komposition), lexikalisch-semantischer Funktionalität (inhaltliche Relationierung von Fachterminologie) und - vor dem Hintergrund der zunehmend bedeutsamer werdenden Dokumentensuche im World Wide Web - der Fähigkeit zu einer einzelsprachenübergreifenden Analyse großer Dokumentenbestände. Das Anliegen dieses Antrags ist die Entwicklung und Evaluierung eines Retrievalsystems für medizinische Dokumente, mit dem diese Funktionalitätslücken behoben werden. Sein methodischer Kein ist ein um stammformartige Morpheme der medizinischen Fach- und Laiensprache gruppierter Thesaurus, die mittels einfacher semantischer Relationen (zunächst nur Synonymie und Ähnlichkeit) vernetzt werden. Darauf baut ein Verfahren zur Segmentierung von Textwörtern in entsprechende Morpheme und zu morphemorientiertem Retrieval auf. Neben intralingualer Synonymie und Ähnlichkeit soll der Thesaurus auch entsprechende interlinguale semantische Relationen (für das Deutsche und Englische und, aufgrund der Besonderheiten der medizinischen Fachsprache, auch Griechische und Lateinische) unterstützen. Es sind umfangreiche, differenzierte Retrievaltests geplant, um das morphosemantisch normalisierte Textretrieval empirisch zu evaluieren.
DFG Programme
Research Grants
Participating Person
Professor Dr. Udo Hahn