Effekte testbasierter Rechenschaftslegung auf die datenbasierte Schul- und Unterrichts-entwicklung - Eine ländervergleichende Studie
Final Report Abstract
Diese Studie ging der Frage nach, inwiefern sich unterschiedliche Vergleichsarbeitskonzeptionen auf die Rezeption und Nutzung von Rückmeldedaten in Gymnasien auf Lehrer-, Fachkonferenz- und Schulebene auswirken. Hierzu wurden Lehrkräfte in Thüringen und Baden-Württemberg, zwei Bundesländern mit unterschiedlichen Testkonzeptionen und Rückmeldeformaten, befragt. Thüringen beteiligt sich an VERA 8, führt jedoch in Klasse 6 eigene Kompetenztests durch. Die Tests sind in weitere Schulentwicklungsstrateglen (z.B. Projekt Eigenverantwortliche Schule) eingebettet, es findet eine zentrale Auswertung statt und in verschiedenen Berichtswellen werden Vergleichsdaten auf Klassen- und Schulebene sowie um sozioökonomische Variablen korrigierte Werte auf Landesebene zur Verfügung gestellt. Baden-Württemberg beteiligt sich dagegen nicht an VERA 8 und führt selbst entwickelte Vergleichsarbeiten durch. Den Lehrkräften werden bereits bei der Dateneingabe landesweite Verglelchsdaten aus einer Pilotierungsstudie zur Verfügung gestellt. Allerdings vrerden keine "bereinigten" Vergleichswerte unter Berücksichtigung von Eingangsvoraussetzungen der Schülerinnen und Schüler (Sprachstand, Wiederholer, sozioökonomischer Hintergrund, etc.) zur Verfügung gestellt Ein weiterer Unterschied ist die Durchführung der baden-württembergischen Vergleichsarbeiten zu Beginn der Jahrgangsstufen 7 und 9. In Thüringen werden die Tests im VERA-Rhythmus jeweils gegen Ende der Klassen 6 und 8 durchgeführt. Die Ergebnisse in aller Kürze zusammengefasst: • Eine überwriegende Mehrheit der befragten Lehrkräfte in beiden Bundeslandern liest die rund um Vergleichsarbeiten zur Verfügung gestellten Dokumente. Die Aufgabenkennwerte sowie die landesweiten Vergleichswerte werden von Thüringer Lehrkräften jedoch breiter rezipiert als in Baden-Württemberg. • Durchführung und Auswertung der Vergleichsarbeiten bereiten in beiden Bundesländern in der Regel keine Probleme. • Die curriculare Validität der Tests wird von den Gymnasiallehrkräften in Thüringen höher eingeschätzt. In weiteren vergleichenden Analysen der Testaufgaben sollen mögliche Erklärungen für diese Differenz herausgearbeitet vrerden. • Hinsichtlich der Bewertung des Innovationspotenzials der Testaufgaben, des förderdiagnostischen Nutzens sowie der Relevanz der Daten für die Unterrichtsreflexion gibt es keine Länderunterschiede. Die Befunde der Vorstudie müssen damit relativiert vrerden. Die eher detaillierte Rückmeldestrategie mit fairen Landesvergleichswerten in Thüringen führt zu keiner höheren Nutzung der Testdaten für die Begründung von Fördermaßnahmen oder die Weiterentwicklung des eigenen Unterrichts. • An Thüringer Gymnasien sind die Vergleichsarbeiten eher Gegenstand von Diskussionen in Gesamtlehrerkonferenzen. Ebenso wird der allgemeine Beitrag der Tests für die Schulentwicklung höher eingeschätzt als in Baden-Württemberg. Die Vermutung liegt nahe, dass dieser Effekt vor allem mit der konsistenten Implementationsstrategie in Thüringen und der Verknüpfung mit anderen Vorhaben zur Stärkung der Schulautonomie zusammenhängt. • Die Lehrkräfte berichten vor allem dann eher von einer Diskussion der Rückmeldedaten auf Fachkonferenz- und Schulebene, wenn sie gleichzeitig ihren eigenen Unterricht als eher individualisiert beschreiben, mehr kollegiale Kooperation an ihrer Schule wahrnehmen und das Innovationsklima an der Schule positiver bewerten. Dies stützt die Vermutung, dass testdatenbasierte Schulentwicklung lediglich unter günstigen Voraussetzungen stattfinden kann und die in Deutschland implementierten Vergleichsarbeiten kaum geeignet sind, an allen Schulen einen Paradigmenwechsel von einer Input- zu einer Outputsteuerung einzuleiten.
Publications
- (2010). Accountability policies and teachers' acceptance and usage of school performance feedback - a comparative study. School Effectiveness & School Improvement. 21(2), 145-165
Maier, Uwe
- (2010). Effekte von testbasiertem Rechenschaftsdruck auf Schülerieistungen: Ein Literaturüberblick zu quasi-experimentellen Ländervergleichsstudien. Journal of Educational Research Online, 2(2), 125-152
Maier, Uwe
- (2011). Formative Leistungsdiagnostik in der Sekundarstufe I - Befunde einer quantitativen Lehrerbefragung zu Nutzung und Korrelaten verschiedener Typen formativer Diagnosemethoden in Gymnasien. Empirische Pädagogik, 25(1), 25-46
Maier, Uwe
- (2011). Verbesserung der Diagnosekompetenz von Lehrkräften durch externe, standardbasierte Testsysteme? - Lektionen aus anderen Ländem. Schulpädagogik heute, 2(3)
Maier, Uwe & Schymala, Martin