Goethe-Institut Inhalt zurück

Gemeinsamer europäischer Referenzrahmen für Sprachen:
Lernen, lehren, beurteilen
Kapitel 9   Beurteilen und Bewerten

9.4 Praktikable Beurteilung und ein Metasystem

Die Skalen an verschiedenen Stellen in den Kapiteln 4 und 5 sind Beispiele für ein System von vereinfachten Kategorien, die sich auf das umfassendere Beschreibungsmodell beziehen, das im Text des vierten Kapitels dargestellt wird. Es ist nicht beabsichtigt, dass jeder bei einem Beurteilungsansatz bzw. Bewertungsverfahren für die Praxis alle Skalen auf allen Niveaus verwenden soll. Bewertende finden es schwierig, mit einer großen Anzahl von Kategorien zurechtzukommen, und außerdem ist vielleicht nicht das ganze Spektrum der aufgeführten Niveaus im betreffenden Kontext relevant. Das System soll vielmehr als ein Mittel zum Herstellen von Bezügen dienen.

Ganz gleich, welches Verfahren man benutzt: Jedes praktische Beurteilungssystem muss die Anzahl möglicher Kategorien auf eine praktikable Menge reduzieren. Es ist allgemein bekannt, dass mehr als 4 oder 5 Kategorien bereits zu kognitiver Überlastung führen und dass, psychologisch gesehen, 7 Kategorien eine Obergrenze bilden. Man muss also eine Auswahl treffen. Wenn bei der Beurteilung mündlicher Leistung Interaktionsstrategien als wesentlicher Aspekt der Kommunikation angesehen werden, und wenn man sie auch als bedeutsam für die Beurteilung der mündlichen Leistung ansieht, dann enthalten die Beispielskalen 14 qualitative Kategorien, die für die Beurteilung von mündlicher Leistung relevant sind:

Sprecherwechsel
Kooperation
Um Klärung bitten
Flüssigkeit
Flexibilität
Kohärenz
Themenentwicklung
Genauigkeit
Soziolinguistische Kompetenz
Spektrum sprachlicher Mittel allgemein
Wortschatzspektrum
Grammatische Korrektheit
Wortschatzbeherrschung
Beherrschung der Aussprache und Intonation


Es ist offensichtlich, dass Deskriptoren für viele dieser Merkmale in eine allgemeine Checkliste aufgenommen werden könnten; 14 Kategorien sind aber doch bei weitem zu viele für eine Beurteilung von Sprachproduktion. Deshalb würde in jedem praktischen Ansatz eine solche Liste von Kategorien nur in einer Auswahl benutzt werden, wobei Merkmale zusammengefasst, umbenannt und auf eine kleinere Gruppe von Beurteilungskriterien reduziert werden, die den Bedürfnissen der betroffenen Lernenden und die den Anforderungen der betreffenden Testaufgabe sowie dem Stil des jeweiligen didaktischen Konzepts, in deren Rahmen die Beurteilung stattfindet, entsprechen. Die sich ergebenden Kriterien können als gleich bedeutsam gewichtet werden; bestimmte, für eine Aufgabe entscheidende Faktoren, können aber auch stärker gewichtet werden.

Die folgenden vier Beispiele zeigen Wege auf, wie dies praktiziert wird: Die ersten drei sind Beispiele dafür, wie Kategorien in bestehenden Bewertungssystemen als Testkriterien benutzt werden. Das vierte Beispiel zeigt, wie Deskriptoren in den Skalen des Referenzrahmens zusammengelegt und umformuliert wurden, um ein Beurteilungsraster für einen ganz bestimmten Zweck und für einen ganz bestimmten Anlass zur Verfügung zu stellen.

Beispiel 1:

Cambridge Certificate in Advanced English (CAE), Paper 5: Bewertungsskriterien 1991
Testkriterien Beispielskalen Weitere Kategorien
Flüssigkeit Flüssigkeit  
Genauigkeit und Spektrum Spektrum der sprachlichen Mittel
Wortschatzspektrum
Grammatische Korrektheit
Wortschatzbeherrschung
 
Aussprache Beherrschung des Phonemsystems  
Aufgabenerfüllung Kohärenz
soziolinguistische Angemessenheit
Erfolgreiche Bewältigung der AufgabeUnterstützung durch Gesprächspartner
Interaktive Kommunikation Sprecherwechsel
Kooperation
Themenentwicklung
Umfang und Mühelosigkeit des Gesprächsbeitrags

Bemerkung zu Weitere Kategorien:

In den Beispielskalen finden sich im Abschnitt Kommunikative Aktivitäten Aussagen zur erfolgreichen Bewältigung von Aufgaben in Bezug auf die betreffende Aktivität. Umfang und Mühelosigkeit des Gesprächsbeitrags wird in diesen Skalen unter Flüssigkeit subsumiert. Ein Versuch, Kriteriendefinitionen für notwendige Unterstützung durch Gesprächspartner zu schreiben und auf empirischer Grundlage zu kalibrieren, um sie in die Sammlung von Skalen zu integrieren, war erfolglos.

Beispiel 2:

International Certificate Conference (ICC):
Certificate in English for Business Purposes, Test 2: Business Conversation (1987)
Testkriterien Beispielskalen Weitere Kategorien
Skala 1 (unbenannt) soziolinguistische Angemessenheit
grammatische Korrektheit
Wortschatzbeherrschung
Erfolgreiche Bewältigung der Aufgabe
Skala 2 (Der Gebrauch von Diskursmitteln, um eine Konversation in Gang zu bringen und aufrechtzuerhalten) Sprecherwechsel
Kooperation
soziolinguistische Angemessenheit
 

Beispiel 3:

Eurocentres - Die Beurteilung einer Interaktion innerhalb einer kleinen Gruppe (RADIO) (1987)
Testkriterien Beispielskalen Weitere Kategorien
Spektrum Spektrum der sprachlichen Mittel
Wortschatzspektrum
 
Genauigkeit grammatische Korrektheit
Wortschatzbeherrschung
soziolinguistische Angemessenheit
 
Art der Produktion Flüssigkeit
Beherrschung der Aussprache und Intonation
 
Interaktion Sprecherwechsel
Kooperation
 

Beispiel 4:

Kontext: Die Beispieldeskriptoren wurden in einem Schweizer Projekt, das in Anhang A erläutert wird, skaliert. Bei Abschluss des Forschungsprojekts wurden die Lehrenden, die daran teilgenommen hatten, zu einer Konferenz eingeladen, um die Ergebnisse zu präsentieren und in der Schweiz eine Erprobungsphase mit dem Europäischen Sprachenportfolio in Gang zu setzen. Bei der Konferenz gab es zwei Diskussions-themen: (a) Die Notwendigkeit, Checklisten für die kontinuierliche Beurteilung und für die Selbstbeurteilung auf einen allgemeinen Referenzrahmen zu beziehen und (b) die Art und Weise, wie die in dem Projekt skalierten Deskriptoren für verschiedene Bewertungszwecke benutzt werden können. Als Teil dieser Diskussion wurden Videoaufzeichnungen von einigen Lernenden auf dem Bewertungsraster bewertet, der als Tabelle 3 in Kapitel 3 abgebildet ist. Es enthält eine Auswahl von kombinierten und bearbeiteten Beispieldeskriptoren.

Im Rahmen eines Projekts des Schweizerischen Nationalfonds zur Förderung der wissenschaftlichen Forschung: Bewertung der mündlichen Leistungen in Videoaufzeichnungen (1996).
Testkriterien Beispielskalen Weitere Kategorien
Spektrum Spektrum der sprachlichen Mittel
Wortschatzspektrum
 
Korrektheit grammatische Korrektheit
Wortschatzbeherrschung
 
Flüssigkeit Flüssigkeit  
Interaktion Interaktion (allgemein)
Sprecherwechsel
Kooperation
 
Kohärenz Kohärenz  

Verschiedene Institutionen mit verschiedenen Lernenden vereinfachen, selektieren und kombinieren für verschiedene Arten der Beurteilung in verschiedenen Kontexten Merkmale auf verschiedene Art und Weise. Die Liste von 14 Kategorien ist daher keineswegs zu lang; sie ist wahrscheinlich nicht in der Lage, alle Varianten zu zuzulassen, die man möglicherweise wählt, und müsste noch erweitert werden, damit sie wirklich umfassend ist

Die Benutzer des Referenzrahmens sollten bedenken und, soweit sinnvoll, angeben,
  • auf welche Art und Weise in ihrem System theoretische Kategorien vereinfacht und operationalisiert werden;
  • in welchem Umfang die Hauptfaktoren, die in ihrem System als Beurteilungskriterien benutzt werden, auf das Kategoriensystem in Kapitel 5 und die aufgeführten Beispielskalen bezogen werden können, vorausgesetzt, sie werden unter Berücksichtigung spezifischer Verwendungszusammenhänge weiter ausgearbeitet und an lokale Verhältnisse angepasst.

 
Goethe-Institut Inhalt zurück