Goethe-Institut Inhalt zurück weiter

Gemeinsamer europäischer Referenzrahmen für Sprachen:
Lernen, lehren, beurteilen
Kapitel 9   Beurteilen und Bewerten

9.2.3 Typen von Beurteilung und Bewertung

Die Skalen der Gemeinsamen Referenzniveaus sollen die Beschreibung von Kompetenzniveaus erleichtern, die in bestehenden Qualifikationssystemen erreicht werden - und somit einen Vergleich zwischen verschiedenen Systemen erleichtern. Die Literatur über Messverfahren kennt fünf klassische Verfahren, getrennte Beurteilungen zu verbinden: (1) Gleichung, (2) Kalibrierung, (3) statistische Prüfung, (4) Benchmarking (= Vergleich von Standards verschiedener Systeme anhand ausgewählter Beispiele) (5) gemeinsame Standardfindung durch Konsens.

Die ersten drei Verfahren sind traditionell: (1) Man produziert alternative Versionen des gleichen Tests (Gleichsetzung), (2) man bezieht die Resultate aus verschiedenen Tests auf eine gemeinsame Skala (Kalibrieren oder Eichung) und (3) man bereinigt rechnerisch den unterschiedlichen Schwierigkeitsgrad oder die unterschiedliche Strenge der Prüfenden (statistische Prüfung).

Die beiden letzteren Verfahren beinhalten, (4) dass man Beispiele von Arbeiten in Bezug auf standardisierte Definitionen und Beispiele vergleicht (Benchmarking) oder (5) dass man in Diskussionen ein gemeinsames Verständnis aufbaut (gemeinsame Standardfindung). Es ist eins der Ziele des Referenzrahmens, diesen Prozess des Aufbaus eines gemeinsamen Verständnisses zu unterstützen. Aus diesem Grund sind die für diesen Zweck bereitgestellten Skalen und Deskriptoren in einem methodologisch strengen Verfahren entwickelt und standardisiert worden. In den Erziehungswissenschaften wird dieser Ansatz immer häufiger als 'standard-orientierte Beurteilung' bezeichnet. Man ist sich darüber einig, dass die Entwicklung eines standard-orientierten Ansatzes zeitaufwändig ist, weil die am Verfahren Beteiligten nur durch einen Prozess der Veranschaulichung und des Austauschs von Meinungen ein Gefühl dafür erwerben, was bestimmte Standards bedeuten.

Es gibt gute Gründe dafür, dass dieser Ansatz potenziell die beste Methode ist, Bezüge herzustellen, weil er die Entwicklung und die Validierung einer gemeinsamen Interpretation des Konstrukts beinhaltet. Der Hauptgrund für die Schwierigkeit, Beurteilungen sprachlicher Leistungen aufeinander zu beziehen, liegt - trotz aller statistischer Zaubereien der traditionellen Methoden - darin, dass Prüfungen üblicherweise völlig verschiedene Dinge erfassen, selbst wenn sie anstreben, die gleichen Bereiche abzudecken. Das ist zum Teil zurückzuführen auf (a) eine mangelnde Konzeptbildung und mangelnde Operationalisierung des Konstrukts, und teilweise auf (b) mit der Testmethode verbundene Effekte.

Der Referenzrahmen bietet einen fundierten Lösungsversuch für dieses vorrangige und grundlegende Problem des Lernens moderner Sprachen in einem europäischen Kontext. In den Kapiteln 4 bis 7 wird ein Beschreibungssystem dargestellt, das auf praxisorientierte Weise Sprachverwendung, Kompetenzen und die Prozesse des Lehrens und Lernens begrifflich zu klären versucht. Dies wird allen Partnern helfen, das kommunikative Sprachkönnen zu operationalisieren, das wir fördern möchten.

Die Skalen der Deskriptoren bilden ein Begriffsraster, das man benutzen kann, um:

  1. nationale und institutionelle Systeme vermittels des Referenzrahmens aufeinander zu beziehen;
  2. die Ziele bestimmter Prüfungen und Kursmodule vermittels der skalierten Referenzniveaus abzubilden.

Anhang A gibt den Leserinnen und Lesern einen Überblick über die bei der Entwicklung von Deskriptoren benutzten Methoden und zeigt, wie sie auf die Skalen des Referenzrahmens bezogen sind.

Die Handreichungen für Prüfende (User Guide for Examiners), die von ALTE erstellt wurden (Dokument CC-Lang (96) 10 rev) enthalten ausführliche Anweisungen und Hilfen, wie Konstrukte in Tests operationalisiert und wie unnötige Verzerrungen durch Effekte der Testmethoden vermieden werden können.

 
Goethe-Institut Inhalt zurück weiter