Project Details
Projekt Print View

DIAsDEM: "Datenintegration von Altlasten und semistrukturierten Dokumenten durch Einsatz von Mining Verfahren"

Subject Area Theoretical Computer Science
Term from 1999 to 2006
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5171574
 
Der größte Anteil von Informationen einer Organisation liegt intextueller Form vor. Für die Gewinnung sinnvoller Einsichten aus diesen Texten ist es notwendig, deren Inhalte sowohl miteinander als auch mit Datenbankdaten zu verknüpfen und einen einheitlichen Anfragemodus über den Gesamtdatenbestand zu schaffen. DIAsDEMplus wird eine Methodik konzipieren und ein Werkzeug prototypisch realisieren, das Schemata über Textarchive ableitet, sie mit strukturierten Datensammlungen in einem Hyper-Archiv integriert und eine datenbankorientierte Anfragesprache zur Informationsgewinnung bereitstellt. Basierend auf den Ergebnissen des Vorgängerprojekts DIAsDEM, das flache XML Dokumenttypdefinitionen für unstrukturierte Texte ableitet, wird die DIAsDEMplus Workbench Data Mining-Verfahren einsetzen, um ein vollständiges Schema über Textarchive abzuleiten. Die so strukturierten Textbestände werden mit Datensammlungen in einem Hyper-Archiv zusammengeführt, das alle Komponenten derAnwendungsobjekte (z.B. Projekte, Personen, Unternehmen) integriert. Die Objektintegration und die Anfragebearbeitung werden von der wahrscheinlichkeitsbedingten Gültigkeit der einzelnen Schemata beeinflußt. Die DIAsDEMplus Workbench wird zur Sicherstellung qualitativ hochwertiger Anfrageergebnisse Integrationsregeln und Modelle zur Berechnung der Treffsicherheit umfassen. Für die Validierung der Methoden des Projekts DIAsDEMplus ist das Anwendungsszenario "Veröffentlichte Wirtschaftsinformationen" vorgesehen. Es sieht die Ableitung von Schemata und die Integrationvon Handelsregistereinträgen, Ad Hoc-Mitteilungen und/oder weiteren Berichten von bzw. über Unternehmen vor, um die Informationsbasis für kaufmännische Transaktionen zu optimieren.
DFG Programme Research Grants
 
 

Additional Information

Textvergrößerung und Kontrastanpassung