Computerlinguistische Methoden für die Rechtsterminologie: Modellierung und Verarbeitung von Definitionen in Urteilsbegründungen
Final Report Abstract
In der Gesamtrückschau hat das Projekt CORTE sowohl in theoretischer als auch in technisch -praktischer Hinsicht erfolgreich einen innovativen Ansatz verfolgt. Dabei wurde an vielen Stellen Neuland beschritten. Im linguistisch-theoretischen Bereich liegt der Hauptbeitrag darin, dass das Phänomen Definition überhaupt erstmals außerhalb technischer und didaktischer Texte auf einer großen Korpusgrundlage empirisch untersucht wurde. Die so gewonnenen Einsichten dürften - auch wenn dieser Fragestellung im Projekt nicht explizit nachgegangen wurde - zu einem beträchtlichen Teil auf kontextualisierte Definitionen in Texten verschiedenster Genres übertragbar sein. Besonders relevant sind sie jedoch naturgemäß für die direkt untersuchte Domäne. Hinsichtlich der Rolle von Definitionen in Rechtstexten konnten die bisherigen, stark deduktivwissenschaftstheoretisch geprägten rechtstheoretischen Überlegungen um eine komplementäre, datenbasierte Ebene ergänzt werden. Die Funktion richterlicher Definitionen in der juristischen Argumentation wurde so in einer bisher in der Auslegungslehre nicht vorhandenen empirischen Breite und Differenziertheit beschrieben. Besondere praktische Relevanz erhalten die Ergebnisse dadurch, dass die erarbeiteten Kategorisierungen - anders als in rechtstheoretischen Grundlagenwerken üblich - direkt durch eine Vielzahl von Belegstellen auf konkrete richterliche Argumentationen in realen Fällen bezogen sind. Im praktisch-technischen Bereich liegen die Innovativität des Ansatzes und die Besonderheit der Ergebnisse des CORTE-Projektes weniger in den verwendeten Methoden als in der untersuchten Aufgabenstellung und Anwendungsdomäne. Sowohl die Extraktion von Definitionen als eigenständige Aufgabe (also nicht als Subtask etwa in einem QA-System) als auch die Anwendung von Verfahren des textbasierten Informationszugriffs auf Rechtstexte sind Forschungsbereiche, die sich gegenwärtig erst formieren (so wird in diesem Jahr erstmals ein internationaler Workshop zum Thema Definitionsextraktion veranstaltet und 2006 wurde zum ersten Mal ein TREC-Track zum juristischen IR abgehalten). Für die Arbeiten in CORTE bedeutete dies, dass nicht - wie zum Beispiel für klassische QA- und lE-Systeme - auf shared taks mit bestehenden Entwicklungs- und Referenzkorpora (und damit Erfahrungen bei deren Erstellung) sowie etablierten Evaluierungsschemata aufgebaut werden konnte. Die Datenaufbereitung und linguistische Vorverarbeitung stellte deshalb im Projekt eine (zumindest hinsichtlich des Arbeitsaufwands) besonders umfangreiche Teilaufgabe dar. Auch der manuelle Aufwand für die wissensbasierte Erstellung, Verbesserung und Pflege von Suchmustern erwies sich als sehr groß (und wohl zu hoch für praktische Zwecke, insbesondere, da sich dieser Prozess sinnvollerweise auf eine permanente parallele Datenanalyse durch Experten stützen sollte). Anderseits zeigen aber die Ergebnisse aus AP 3 und 4, dass durch die Hinzunahme flacher, statistisch basierter Verfahren an geeigneten Stellen die Aussicht besteht, ein mit begrenztem Expertenaufwand erstelltes wissensbasiertes Definitionsextraktions- System halbautomatisch bis zur praktischen Einsatzfähigkeit zu verbessern und zu erweitern. Aufgrund der ausgeprägt domänenspezifischen Funktion von Definitionen in Rechtstexten und ihrer komplexen Interaktion mit juristischem Hintergrundwissen im Auslegungsvorgang erfordert die Entwicklung eines solchen Systems in jedem Fall ein hohes Maß an interdisziplinärer Kooperation. Dieses wird die Grenzen der im Rahmen eines computerlinguistischen Projekts wie CORTE gegebenen Möglichkeiten noch überschreiten müssen, weil der nur von juristischen Praktikern zu beurteilende (und daher in CORTE weitestgehend ausgeblendete) Aspekt der benutzer- und aufgabenorientierten Usability neben der Ergebnisqualität einen weiteren Schlüsselfaktor für die Einsatzfähigkeit eines solchen Systems darstellt.
Publications
-
Computational Linguistic Support for Legal Ontology Construction, In: Proceedings of the Tenth International Conference on Artificial Intelligence and Law, 2005 (ICAIL 05), p. 242-243, New York: ACM Press, 2005
Walter, S. and Pinkal, M.
-
Automatic Extraction of Definitions from German Court Decisions, In: Proceedings of the ACL-2006 Workshop on Information Extraction Beyond The Document, Sydney, Australia, 20-28
Walter, S. and Pinkal, M.
-
Computerlinguistische Methoden für die Rechtsterminologie, In: Schweighofer et al. (Hrsg.): e-Staat und e-Wirtschaft aus rechtlicher Sicht. Tagungsband des 9. Intemationalen Rechtsinformatik Symposions IRIS 2006, Stuttgart (Boorberg) 2006, 303-309
Walter, S.
-
Linguistic Description and Automatic Extraction of Definitions from German Court Decisions, In: Proceedings of the Sixth International Language Resources and Evaluation (LREC'08)
Walter, S.
-
Definitions in Court Decisions - Automatic Extraction and Ontology Acquisition, In: Breuker et al. (eds.): Law, Ontologies and the Semantic Web. lOS Press, Amsterdam, 2009
Walter, S. and Pinkal, M.