Detailseite
Projekt Druckansicht

Mehrsprachige wissensverbesserte Informationsextraktion für die Pharmakovigilanz

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung seit 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 442445488
 
Wissen kann heutzutage digital in vielen verschiedenen Formen und Quellen veröffentlicht werden, wie z.B. Enzyklopädien, wissenschaftliche Veröffentlichungen, aber auch strukturierte Wissensquellen wie Ontologien oder Wissensdatenbanken. Daneben enthalten auch Nachrichtenartikel, Blogs oder Social Media relevante Informationen. All dies wird täglich in einer Vielzahl von Sprachen veröffentlicht. In MEDLINE werden beispielsweise jedes Jahr fast eine Million neue Artikel aufgenommen.Das vorliegende Projekt zielt darauf ab, Methoden der Künstlichen Intelligenz (KI) zu entwickeln, die diese verschiedenen Arten von Textquellen automatisch verarbeiten und Informationen extrahieren, um bestehende Wissensbasen zu befüllen.Dieses Projekt zeigt dies im Bereich der Pharmakovigilanz, die darauf abzielt, das Wissen über unerwünschte Arzneimittelwirkungen auf dem neuesten Stand zu halten. Zu den maßgeblichen Quellen in diesem Bereich gehören wissenschaftliche Zeitschriften und Packungsbeilagen, während elementare Beobachtungen in Patientenakten und Social Media berichtet werden.Aktuelle Mainstream-Informationsextraktionsmethoden verwenden eine selbstüberwachte Extraktion von Wortdarstellungen aus großen Textkorpora und neigen dazu vorhandenes Wissen in der Zieldomäne zu vernachlässigen. Im Gegensatz dazu zielt das vorliegende Projekt darauf ab, vorhandenes Wissen in die Prozesse zur Erfassung und Extraktion von Informationen zu integrieren, um die Extraktion neuer Informationen und Kenntnisse zu verbessern. Darüber hinaus wird es die Vorteile der Existenz ähnlicher Informationen, die in mehreren Sprachen veröffentlicht werden, nutzen, um das Wissen zu bündeln. Diese sprachübergreifende Dimension kommt durch die vorgeschlagene trilaterale Zusammenarbeit deutlich zum Tragen. Um unsere Zusammenarbeit und unser gegenseitiges Wissen zu stärken, haben wir Praktika für Nachwuchsforscher in jedem der beiden anderen Partnerteams unter der gemeinsamen Leitung der Partner sowie im Plenum geplant, um ihnen eine gemeinsame internationale Präsenz zu ermöglichen.Das Konsortium besteht aus drei international anerkannten Teams, die auf die Verarbeitung natürlicher Sprache spezialisiert sind. NAIST (JP) hat die de-facto NLP-Tools für Japanisch entwickelt. Das DFKI (DE) verfügt über einen starken Hintergrund in den Bereichen Korpusgenerierung, allgemeine Informationsextraktion und biomedizinische Textverarbeitung. LIMSI (FR) verfügt über eine langjährige Erfahrung in der Korpusannotation, der hybriden Informationsextraktion und der Fragebeantwortung sowie über einen starken Hintergrund in der biomedizinischen Sprachverarbeitung, einschließlich der Pharmakovigilanz aus Patientenforen.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Frankreich, Japan
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung