Detailseite
Deutsches Textarchiv (DTA) - Aufbau eines Aktiven Archivs deutscher Texte und Entwicklung entsprechender Werkzeuge
Antragsteller
Professor Dr. Wolfgang Klein
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2007 bis 2017
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 37149321
Ziel des DTA ist es, einen disziplinübergreifenden Kernbestand an Texten deutscher Sprache von Beginn des Barock bis zur Gegenwart zu digitalisieren und so aufzubereiten, dass er über das Internet in vielfältiger Weise nutzbar ist. Für die Zeit von 1900–2000 liegt ein solcher Bestand bereits in der gleichfalls von der DFG geförderten Corpusdatenbank des „Digitalen Wörterbuchs der Deutschen Sprache des 20. Jahrhunderts“ (DWDS) an der BBAW vor. Sie ist lemmatisiert, getaggt und derzeit mit einem Wörterbuch verlinkt, so dass Sprünge vom Wörterbuch ins Corpus und umgekehrt möglich sind. Die Corpusdatenbank wird bereits jetzt intensiv genutzt (derzeit – August 2009 – etwa 25.000 registrierte Nutzer und etwa 150.000 Aufrufe täglich). Sie wird zum einen schrittweise an die Gegenwart herangeführt; dies geschieht mit akademieinternen Mitteln und über Kooperationsprojekte. Zum anderen soll das seit Juli 2007 von der DFG geförderte Projekt DTA das Textcorpus schrittweise in die Zeit vor 1900 erweitern. In der ersten Projektphase (2007–2010) werden dazu ca. 650–700 Werke aus der Zeit von 1780–1900 als Bild- und Volltext-digitalisate bereitgestellt. In der nun beantragten Fortsetzung des DTA soll das Corpus um ca. 650 Texte aus der Zeit von ca. 1650 bis 1780 erweitert werden. Der Kernbestand soll in Kooperation mit anderen Wissenschaftlern und Forschungs-stätten ständig ausgebaut werden, und zwar nach Umfang wie nach Tiefe der Aufbereitung. Dieser weitere Ausbau ist projekt- und disziplinspezifisch.
DFG-Verfahren
Sachbeihilfen
Beteiligte Personen
Professor Dr. Manfred Bierwisch (†); Professor Dr. Martin Grötschel