Bildungsstandards als universelles Instrument: Grenzen, Konflikte und Herausforderungen am Beispiel VERA in Deutschland

Vorweg: Dieser Artikel muss noch überarbeitet werden. Inhaltsverzeichnis soll mit Ankern versehen werden, ebenso die Fußnoten (die bisherigen importierten Anker funktionieren noch nicht).

Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Arts (B.A.) im Fach Erziehungswissenschaften

Eingereicht am 15.09.2011. Erster Gutachter: Prof. Dr. Marcelo Caruso; 2. Gutachter: Prof. Dr. Jürgen Henze

Humboldt-Universität zu Berlin; Philosophische Fakultät IV; Institut für Erziehungswissenschaften

Inhalt

I. Einleitung

  1. Aufbau der Arbeit
  2. Zentrale Fragestellungen der Arbeit

 

II. Bildungsstandards als „universelle“ und globale Idee

  1. Der Begriff „Bildung“, der Begriff „Standard“
  2. (Ideen-)Geschichte und Hintergrund
  3. Ökonomische Komponenten
  4. Kritik

 

III. (Jüngere) Geschichte der Bildungsstandards in Deutschland

  1.  Die deutsche Debatte seit PISA – Eckpfeiler
  2. IQB: Entstehung, Struktur und Aufgaben

 

IV. Zielsetzung und Durchführung in Deutschland am Beispiel Bildungsstandards und der VERA-Evaluation im Fach Mathematik

  1. Entwicklung des Konzepts
  2. Aufgabenentwicklung und Leitideen
  3. Reaktionen auf VERA
  4. Umsetzung der Evaluationsergebnisse

 

V. Grenzen und Probleme

  1. Kulturanthropologische Bedenken zur Legitimität von Standardisierung im Spannungsfeld von Heterogenität
  2. Komplikationen aufgrund des deutschen Föderalismus‘
  3. Probleme bei der Durchführung von Tests sowie ihrer Interpretation
  4. Spannungsfeld: Systemvielfalt, Segregation und Standardisierung
  5. Welcher Bildungsbegriff ?

 

VI. Diskussion und Ausblick

Literaturverzeichnis

(Die Arbeit als PDF: Roenicke_BA_PDF_Online)


I.                   Einleitung

Qualitätsentwicklung im Bildungswesen – nach dieser Zielsetzung wurde nicht nur ein eigenes Institut benannt [1] – seit der PISA Studie 2000[2] dominierte kaum eine andere Debatte derart die bildungspolitische Arena in Deutschland. PISA war ein traumatischer Schock für die deutsche Gesellschaft. In der öffentlichen Debatte wurden Rufe nach einem anderen Schulsystem laut, nach mehr Disziplin, nach besseren Lehrern und nach der Entwicklung einer allgemeinen Strategie zur Verbesserung der Qualität deutscher Schulen. Die Ständige Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (KMK) verabschiedete bereits 2003 und 2004 Vorgaben zur Entwicklung von Bildungsstandards[3] und entschied sich für einen Weg der Qualitätsentwicklung, der aus vier Komponenten besteht:

  1. Die Formulierung von Bildungsstandards
  2. Die Einrichtung eines umfassenden Bildungsmonitorings
  3. Die Schaffung eines eigenen Instituts, welches die Formulierung von Bildungsstandards einerseits, sowie die Verknüpfung von Bildungsstandards und der Durchführung des dazu notwendigen Bildungsmonitorings andererseits koordiniert: das IQB
  4. Die Einrichtung eines Zentrums für internationale Vergleichsstudien (ZIB)

In der folgenden Arbeit wird der Schwerpunkt auf dem ersten Punkt in dieser Strategie, den Bildungsstandards, liegen. Wobei festgehalten werden muss, dass in  ihrer Konzeption die Bildungsstandards nicht als isoliert von den anderen Maßnahmen betrachtet werden können, sondern vielmehr ein sie alle verbindendes Element sind. Diese Wechselwirkung soll durch das Schaubild in Abbildung 1 erläutert werden. Die KMK hat Bildungsstandards als Zielvorgabe geschaffen, welche durch ein ständig ablaufendes Bildungsmonitoring – beides geplant, koordiniert und durchgeführt in erster Linie durch das IQB – in einer Feedbackschleife zwischen Politik, Wissenschaft und Schulen stehen.

 

Die zwei Funktionen, die durch Bildungsstandards erfüllt werden sollen, sind laut KMK:

1. die Überprüfung der Leistung in Ländervergleichen und länderübergreifenden Vergleichsarbeiten und

2. das Setzen von notwendigen Impulsen zur Schul- und Unterrichtsentwicklung auf der Basis von empirischen Befunden.

Die vorliegende Arbeit sucht eine differenzierte Betrachtung der Bildungsstandards a) als international verankertes Konzept mit universellem Anspruch und b) allgemeinpädagogisch zu betrachtendes Konstrukt. Diese beiden Perspektiven werden eine übergeordnete Rolle über die dritte Dimension, die der empirischen Erziehungswissenschaft, spielen.

I.1. Aufbau der Arbeit

Die vorliegende Arbeit betrachtet ausgehend von der Geschichte a) der Idee und b) der Verbreitung des Konzepts „Bildungsstandards“ als eines globalen und weltweit angewandten  Konzepts und somit Gegenstandes der Vergleichenden Erziehungswissenschaft die damit verbundenen Chancen, Risiken und Herausforderungen. Der Vergleich wird dabei immer wieder ausgehend von einer Analyse der Entwicklungen in Deutschland seit 2003 – mit den vorangegangenen geschichtlichen Voraussetzungen – vor allem mit den beiden historisch und kulturell in Bezug auf die Entwicklung ihrer Bildungs-Politik sehr verschiedenen Länder England und Schweden gesucht. Die Auswahl der beiden Vergleichsländer beruht auf der Einschätzung, dass diese einerseits kulturell ähnliche Länder sind, europäisch und westlich geprägt, andererseits zugleich zwei Extrempunkte in der Herangehensweise und der Geschichte ihrer Bildungspolitik darstellen, die bei beiden deutlich anders verlief, als in Deutschland. Sie dienen daher beide gleichermaßen gut a) als Kontrastfolie zur deutschen Entwicklung und b) zugleich als Beispiele, die mit ihrer recht langen Geschichte auf dem Gebiet der Bildungsstandards, mögliche Entwicklungen illustrieren können, die auch in Deutschland bevorstehen könnten und die in eine hiesige Debatte über das Instrument Bildungsstandards mit einbezogen werden sollten.

Zu Beginn wird eine Auseinandersetzung mit der Begrifflichkeit „Bildungsstandard“ vorgenommen, was eine allgemeinpädagogische Betrachtung des Begriffs Bildung unerlässlich macht. Darauf folgt eine Betrachtung des Konzepts Bildungsstandards als eine international verbreitete Idee, eine Einführung in ihre Geschichte, sowie eine Auseinandersetzung mit ausgewählten Beispielen aus dem OECD-Spektrum, da diese Länder allesamt an PISA teilnehmen, was eine Vergleichbarkeit erleichtert und zudem genügend Datenmaterial verspricht.

Um eine dezidierte Betrachtung in der konkreten Umsetzung vornehmen zu können, wird anschließend ein Fokus auf die empirisch-pädagogische Praxis im Rahmen der Lernstandserhebungen VERA (VERgleichsArbeiten) des Fachs Mathematik gelegt. Die VERA-Testungen stehen in direkter Verknüpfung mit den Bildungsstandards, wie dies bereits in Abbildung 1 veranschaulicht wurde. Sie sind das Instrument zur Überprüfung der Lernstände, sie sind auf Basis der Standards entworfen und haben als Hauptziel die Schulentwicklung, damit die Schulen den Standards in naher Zukunft entsprechen. Die Festlegung auf die Mathematik wurde getroffen, da in der Mathematik als relativ klar bestimmbares Themenfeld weniger komplexe Problemstellungen in der Messung von Leistung, gerade bei einem Output-orientiertem Vorgehen wie bei den Bildungsstandards, auftreten sollten. Ob diese Annahme haltbar ist, wird im Verlauf der Untersuchung des Gegenstandes Mathematik-Leistungsmessung noch zu zeigen oder zu widerlegen sein.

Am Ende soll mit einer Betrachtung der Probleme vor Ort wieder der Bogen zurück geschlagen werden: Welche Grenzen haben die als universelles Instrument angelegten Bildungsstandards? Wie zukunftsfähig sind sie? Welches Konzept von Bildung ist in ihnen enthalten – und welches nicht?

In der abschließenden Diskussion wird ein Ausblick auf die Chancen und Herausforderungen versucht, die in der Zukunft des in Deutschland noch recht jungen Instruments Bildungsstandards liegen.

I.2. Zentrale Fragestellungen der Arbeit

Den Sammelband „Qualität durch Standards?“[4] führen die Autoren Eger, Gastager und Hofmann mit der Forderung ein, es sei eine Aufgabe der Erziehungswissenschaft neben der Formulierung der von der Bildungspolitik vorgeschriebenen Standards auch über deren Begründbarkeit und Sinnhaftigkeit nachzudenken und gegebenenfalls in einen kritischen Diskurs mit der Bildungspolitik einzutreten. Die zentralen Fragen, die dieser Arbeit zugrunde liegen, lauten daher:

  • Wie können Output-Kriterien bildungstheoretisch legitimiert werden?
  • Welche unerwünschten Nebenwirkungen können auftreten?
  • Welche Kriterien müssen in der Praxis einer Curricula-Konzeption anhand von Bildungsstandards in der a) Lehre, b)Evaluation und c) Qualitätsentwicklung erfüllt sein, um das Konzept Bildungsstandards zum Erfolg zu führen?

II.               Bildungsstandards als „universelle“ und globale Idee

II.1. Der Begriff „Bildung“, der Begriff „Standard“

Noch bevor der ideengeschichtliche Hintergrund von Bildungsstandards als universelles Konzept in Augenschein genommen werden soll, hier ein Blick auf die Bedeutung der beiden Begriffe, aus denen sich „Bildungs-Standard“ zusammensetzt: Bildung und Standard.

Unter Bildung versteht Kerschensteiner vor allem einen Prozess, der beim Individuum ansetzt, wenn er feststellt: „Die Individualität nun, dieser unauflösliche Verband mannigfaltiger Funktionen in seiner Eigen- und Einzigartigkeit, ist Gegenstand jenes Verfahrens, das wir als Bildungsverfahren bezeichnen.“ Kerschensteiner betont die Individualität als Material des Prozesses Bildung. Hinzu kommt die Rolle der Kultur, die ein Subjekt umgibt, und so gelangt Kerschensteiner zu seiner kurzen Definition von Bildung, die lautet: „Bildung ist ein durch die Kulturgüter geweckter, individuell organisierter Wertsinn von individuell möglicher Weite und Tiefe.“ Und weiter: „Es ist das wertende Gesamtorgan mit dem wir der Umwelt gegenübertreten und sie verstehen können.“[5]

Einer der meistzitierten Denker des Begriffs Bildung war Wilhelm von Humboldt. Dieser denkt Bildung als eine Tätigkeit zwischen dem Menschen und seiner Umwelt:

„Im Mittelpunkt aller besonderen Arten der Thätigkeit nemlich steht der Mensch, der ohne alle, auf irgend etwas Einzelnes gerichtete Absicht, nur die Kräfte seiner Natur stärken und erhöhen, seinem Wesen Werth und Dauer verschaffen will. Da jedoch die blosse Kraft einen Gegenstand braucht, an dem sie sich üben, und die blosse Form, der reine Gedanke, einen Stoff, in dem sie, sich darin ausprägend, fortdauern könne, so bedarf auch der Mensch einer Welt ausser sich. Daher entspringt sein Streben, den Kreis seiner Erkenntnis und seiner Wirksamkeit zu erweitern […]. Rein und in seiner Endabsicht betrachtet, ist sein Denken immer nur ein Versuch seines Geistes, vor sich selbst verständlich, sein Handeln ein Versuch seines Willens, in sich frei und unabhängig zu werden, seine ganze äussre Geschäftigkeit überhaupt aber nur ein Streben, nicht in sich müssig zu bleiben. Bloss weil beides, sein Denken und sein Handeln nicht anders, als nur vermöge eines Dritten, nur vermöge des Vorstellens und des Bearbeitens von etwas möglich ist, dessen eigentlich unterscheidendes Merkmal es ist, Nicht-Mensch, d. i. Welt zu seyn, sucht er, soviel Welt, als möglich zu ergreifen, und so eng, als er nur kann, mit sich zu verbinden.“[6] Bildung ist hierbei weniger ein Zustand, als vielmehr ein Prozess, in den ein Mensch eintritt, um seine a) Erkenntnis und b) Wirksamkeit zu erweitern.

Moderne Theoretiker bestimmen Bildung als Prozess in einem Zwiespalt zwischen den Anforderungen einer Gesellschaft an das Individuum, ausgehend von der Fragestellung: Was braucht die Gesellschaft (materiale Bildung) und den Anforderungen eines Individuums an die Gesellschaft (formale Bildung), ausgehend von der Frage: Was braucht das Individuum[7]. Benner sieht demnach in beiden Extremen keine Berücksichtigung der beiden grundlegenden Prinzipien Anerkennung der Bildsamkeit[8] und Nicht-Hierarchizität der gesellschaftlichen Praxen[9]. Deswegen führten beide Wege zu Verkürzungen von Problemen. Demgegenüber stellt er eine nicht-affirmative Bildungstheorie, die, wie er sagt „als eine Wechselwirkung von Mensch und Welt gedacht und konzipiert wird, in der der Mensch sich in Auseinandersetzung mit der Welt selbst bestimmt.“[10]

Im Brockhaus von 1960 steht: „Bildung: Der Vorgang geistiger Formung, auch die innere Gestalt, zu der der Mensch gelangen kann, wenn er seine Anlagen an den geistigen Gehalten seiner Lebenswelt entwickelt. Gebildet ist nicht, wer nur Kenntnisse besitzt und Praktiken beherrscht, sondern der durch sein Wissen und Können teilhat am geistigen Leben; wer das Wertvolle erfasst, wer Sinn hat für Würde des Menschen, wer Takt, Anstand, Ehrfurcht, Verständnis, Aufgeschlossenheit, Geschmack und Urteil erworben hat. Gebildet ist in einem Lebenskreis, wer den wertvollen Inhalt des dort überlieferten oder zugänglichen Geistes in eine persönlich verfügbare Form verwandelt hat.“ Genau wie Kerschensteiner, der die Individualität von Bildung betont, sieht Gunter Dueck in Bezugnahme auf die Definition im Brockhaus von 1960 in Bildung vor allem eine persönliche Angelegenheit. Dem entgegengesetzt bewertet Dueck die Generierung von Wissen und das Abfragen desselben in Tests, wie es in Schulen praktiziert wird: „Das Wissen der Schulen, nämlich das, was in Tests abgefragt wird, ist ein uniformes Wissen, das für alle Menschen gleich ist.“ Seine Kritik geht noch weiter: „Es geht nur um den Zwang zur Einheitlichkeit.“ Er habe in einer Podiumsdiskussion den Bildungsbegriff aus dem 1960er Brockhaus zitiert und dadurch Widerspruch einer Landeskultusministerin geerntet: „Bildung sei, sagte sie, Erziehung zur Berufsfähigkeit.“ Damit ist Dueck nicht einverstanden. Anschließend an Humboldt kritisiert er: „Es gibt überall einen Trend zur Systematisierung unserer Köpfe. Im Wesentlichen wird die linke Hirnhälfte mit Standards befüllt. Bildung im ganzheitlichen Sinn? Ade!“.[11] Dueck zieht in seiner Kritik der Landeskultusministerin die indirekte Konsequenz, dass Bildung und Standards beinahe Widersprüche zueinander darstellen. Was aber sind Standards?

Ebenfalls im Brockhaus wird Standard im Allgemeinen als Richtschnur, Maßstab und Norm definiert, als „die im allgemeinen Qualitäts- und Leistungsniveau erreichte Höhe.“[12] Der Brockhaus verweist dabei auf das Synonym das Normal, das im Messwesen anstelle von ‚Standard‘ verwendet wird und definiert ist mit: „zur Darstellung (Realisierung) einer bestimmten Einheit im Messwesen verwendeter Körper oder Apparat, für den bestimmte Bedingungen festgelegt wurden; ein nach internationaler Übereinkunft geschaffenes Normal, wird auch als Urmaß und Prototyp bezeichnet.“[13] Angewandt auf die Bildungsstandards oder auch auf PISA bedeutet dies, dass es vor allem um eine Übereinkunft geht, die den Raum der direkten Lehr-Lern-Kommunikation verlässt und über diesen hinaus wirkt, sowie mehrere dieser Räume miteinander verknüpft und in Beziehung zueinander stellt.

Das freie Online-Wörterbuch Wiktionary nennt als erste Bedeutung: „etwas Geläufiges, Etabliertes, weithin Verbreitetes“[14]. Im technischen Bereich bekommt Standard zusätzlich die Notwendigkeit von Kompatibilität zugeschrieben[15]. Das Wörterbuch der Deutschen Sprache sieht in Standard seit der ersten Hälfte des 20. Jahrhunderts „häufig Bestimmungswort in Komposita im Sinne von ‘Grund-, Normal-’, vgl. Standardausführung, -modell, -typ. standardisieren‘ […] nach einem vorgeschriebenen Muster vereinheitlichen, normen’“.[16] Das Normale und die Vereinheitlichung spielen also für Standards eine wichtige Rolle.

Standard tritt sehr häufig in Zusammenhang mit dem Begriff der Norm oder dem Attribut normal auf. Dabei geht es aber im Wesentlichen nicht um eine Norm im philosophisch-ethischem Sinn, also um keine wertende Beurteilung menschlicher mit ethischen Maßstäben, sondern um eine allgemein anerkannte Regel und Richtschnur für eine wertende Beurteilung[17] – im Falle von Bildungsstandards Beurteilung anhand von Ergebnissen in Leistungsmessungen. Bei solchen Beurteilungen zählt nicht zufällig vor allem der Vergleich von Durchschnitten – denn Standard, Normalität und Durchschnitt sind drei Begriffe, die gerade in der empirischen Erfassung von wie auch immer gearteten Realitäten eine wichtige Rolle spielen. Wobei sich die Begriffe Standard und Durchschnitt im erziehungswissenschaftlichen Fachdiskurs sehr häufig finden lassen[18]. Wohingegen „Normalität“ ein Begriff ist, der weniger offen diskutiert wird. Nach einer Theorie von Jürgen Link neigt die moderne westliche Gesellschaft jedoch zu einem immer stärker werdenden Streben nach Normalität, was Link „Normalismus“ nennt. In seiner Auseinandersetzung mit dem „Normalen“ und der Normalität stellt er die Behauptung auf: „Spezialdiskurse und ihre Praktiken produzieren spezielle, sektorielle Normalitäten (z.B. medizinische, psychologische, soziologische) – die Interdiskurse integrieren diese verschiedenen Normalitäten zu allgemein kulturellen Vorstellungen von Normalität, zu einer Art Querschnittskategorie des Normalen.“[19] Links zentrale These lautet: Auch wenn der Begriff Normalität in den Wissenschaften weitestgehend unbehandelt blieb, ausgeblendet und als für die wissenschaftliche Praxis nahezu untauglich angesehen wird, so blieb (sonst macht das Wort „erhalten“ keinen Sinn) er eben doch als ein unterschwelliger Mechanismus, dem Normalismus, erhalten und wirkt in allen gesellschaftlichen Praxen – auch in der Wissenschaft. Vielleicht kann Link gar so verstanden werden: Wenngleich in der wissenschaftlichen Sprache der Begriff Normalität gemieden wird, so spielen (s.o.) Durchschnitt und Standard eine wichtige Rolle. In seiner Betrachtung der Diskursgeschichte des Normalismus nimmt Link daher den Durchschnitt ins Visier[20] und beobachtet anhand der Rezeption der Ideen Gauß‘ „wie der Diskurs unter Kants Feder, einmal auf das Gleis des Normalen gesetzt, sozusagen automatisch zur Statistik, zum Durchschnitt als normalistischer Norm, zu einer Skala mit zwei symmetrisch zum Durchschnitt liegenden Devianzbereichen und mit zwei Extremen fährt[21] (Hervorhebungen durch den Autor).[22]

Eine weitere Auseinandersetzung zur Frage nach der Rolle von Normalität im Bereich der empirischen Bildungsforschung, die mit Standards arbeitet um Qualität zu sichern, wird in Kapitel V.1. stattfinden.

II.2. (Ideen-)Geschichte und Hintergrund

Die Bildung zu standardisieren, also für alle gleich zu machen – kompatibel eben – ist eine Idee, die bereits in den 1970er Jahren in den USA aufkam.[23] Dort wurde mit den sogenannten minimum-competency-tests (MCTs) begonnen, mit relativ einfachen Tests in mehreren Bundesstaaten zu analysieren, ob die Schüler ein Mindestmaß an Bildung erreichten. Die USA haben demnach eine über 30-jährige Erfahrung im Umgang mit Bildungsstandards, wie Daniel Koretz bemerkt. Deutschland hinkt so betrachtet deutlich hinterher. Um die späte „empirische Wendung“ hierzulande nachvollziehen zu können, muss ein Blick in die Geschichte und Entwicklung der deutschen Pädagogik geworfen werden.

In seiner vergleichenden Analyse der Einführung standardisierter Messungen in der ersten Hälfte des 20. Jahrhunderts betrachtet Florian Waldow die Länder Schweden und Deutschland.[24] Wie in vielen anderen Schulsystemen, auch habe sich in Deutschland wie in Schweden durch das Wegbrechen der ständischen sozialen Positionierung eine Notwendigkeit ergeben, die soziale Stellung stärker mit einem Bildungserfolg zu verknüpfen – eine Entwicklung, die in der Entstehung des Bürgertums ihren Anfang genommen hatte. Neben dem Adel entwickelte es sich zu Beginn des 18. Jahrhunderts und allmählich etablierte sich ein Bildungsbürgertum neben dem Wirtschaftsbürgertum und den politischen Mächten Adel und Klerus. Eine soziale Durchlässigkeit zwischen den Ständen hatte es bis dahin nicht gegeben. Das Bröckeln der festen Standesschranken, wie es im 18. Jahrhundert seinen Lauf nahm, machte es langfristig notwendig, neue Mechanismen der Selektion zu finden. Zu Beginn des 20. Jahrhunderts erlebten die höheren Schulen europaweit einen großen Zuwachs und die Frage, wie die Schülerschaft dieser Schulen ausgewählt werden sollte, wenn nicht qua Herkunft, musste beantwortet werden. Wie Waldow anführt, schienen standardisierte Messverfahren von Begabung und Leistung eine mögliche Antwort. Man suchte also eine „wissenschaftliche“ Lösung für das Problem.[25] So kam es ihm zufolge auch, dass die Jahre zwischen 1910 und 1920 in beiden Ländern, Deutschland wie Schweden, davon gekennzeichnet waren, mit der Verwissenschaftlichung der Pädagogik befasst zu sein – sie wurde eine eigene wissenschaftliche Disziplin. In Uppsala/ Schweden richtete man 1910 die ersten Pädagogik-Lehrstühle ein. In Deutschland waren bereits um 1900 Forschungseinrichtungen der experimentellen Pädagogik und empirisch arbeitender pädagogischer Psychologie an den Universitäten angesiedelt.[26] Während man in Schweden das pädagogische Wissen vor allem als Steuerungswissen verstand und psychologisch-empirisch basiert versuchte, daraus bildungspolitisches Handeln ableiten zu können – was letztendlich zur endgültigen Einführung standardisierter Leistungsmessungen bereits um 1940 herum führte[27] – verstand sich die deutsche Pädagogik vor allem als eine der Philosophie untergeordnete Geisteswissenschaft, die sich auf ein ganzheitliches Bildungsverständnis festlegte, womit sich standardisierte Tests in vielfacher Hinsicht nicht vertrugen. Diese grundlegend andere Haltung in der deutschen wissenschaftlichen Disziplin Pädagogik hielt bis in die 1990er Jahre hinein an. Waldow beschreibt diese Sicht: „Diesem Individualität betonenden Ideal der Bildung entsprach ein Gesellschaftsmodell, dass die Gesellschaft nicht als aus gleichen Individuen zusammengesetzt verstand, sondern sie als ein organisches Gemeinwesen begriff, zu dem jeder auf seine eigene Weise beiträgt, vergleichbar einem Symphonieorchester.“[28] Einerseits werden das Individuum und Diversität betont; andererseits diente es seit jeher als Abwehrbegründung gegen eine soziale Öffnung der Gesellschaft qua Bildungsgerechtigkeit. Bestimmte Reformbewegungen konnten mit dieser Argumentation lange abgeschmettert werden; der späte Durchbruch standardisierter Tests, die späte Teilnahme Deutschlands an der PISA-Studie – all das lässt sich damit erklären. Doch das Wissen sowie das Vorbild anderer Länder waren theoretisch vorhanden und auch deutsche Wissenschaftler versuchten  standardisierte Schulleistungstests salonfähig zu machen. Doch sie scheiterten lange Zeit mit diesem Anliegen.

Bereits vor 40 Jahren, 1970, wies Karl-Heinz Ingenkamp auf all die Probleme hin, die heute mit den Bildungsstandards gelöst werden sollen und schlug als Strategie zur Behebung dieser Misere „kriteriumsorientierte Schulleistungstests“ vor.[29] Die prinzipielle Idee zur Nutzung von Schulleistungstests als Ausgangspunkt für eine Qualitätsentwicklung ist also nicht unbedingt, wie Klieme dies nennt, ein „anglo-amerikanisches Steuerungselement“[30] – den Ansatz gab es bereits Ende der 60er Jahre auch in Deutschland. Doch weiter verfolgt wurde er hier nicht.

Standards im Bildungswesen sind weit verbreitet. Im Rahmen einer sogenannten „test-based accountability“ – also testbasierter Rechenschaftslegung, werden sie vorangetrieben und erfahren weltweite Beachtung und Umsetzung. Dabei mögen die genauen Details der Umsetzung kulturellen Verschiedenheiten unterliegen, wie auch Baumert, Gogolin und Scheinpflug einräumen. Sie alle sind sich aber in ihrer Grundlegung sehr ähnlich: Sie gehen alle von einer prinzipiellen Messbarkeit der Fähigkeiten und Fertigkeiten von Schülern aus.[31] Auf Basis dieser Annahme werden standardisierte Leistungstests eingeführt, die zumeist in einem regelmäßigen Intervall durchgeführt werden, wobei es vor allem darum geht, dass Schulen – und somit Lehrer – Verlässlichkeit beweisen müssen. Baumert et al. merken an, dass es sich hierbei um eine Output-orientierte Methode handelt.[32]

Output-Orientierung ist ein zentrales Element von Qualitätssicherung im Allgemeinen – nicht nur im Bildungswesen. In Ihrem Zeitschriftenaufsatz im International Journal of Educational Development beschreibt Colette Chabbott, wie sich bereits Anfang des 19. Jahrhunderts weltweit Organisationen zu entwickeln begannen, deren Ziel und Anliegen es war – und bis heute ist, weltweit für Fortschritt und Entwicklung einzutreten.[33] Teil der Agenda dieser größtenteils Nichtregierungs-Organisationen war bereits seit den 50er Jahren neben dem Fokus auf der wirtschaftlichen Entwicklung immer auch eine Entwicklung der Bildung und Erziehung, die gleichzeitig als notwendige Basis für eine nachhaltige wirtschaftliche Entwicklung angesehen wurde. Chabbott stellt die wesentlichen Themen der Entwicklungsdiskurse nach Dekaden geordnet tabellarisch dar (siehe Abbildung 2). Hier lässt sich beobachten, dass der Diskurs über Effektivität und Effizienz der Bildung seinen Anfang erst im Laufe der 80er Jahre nahm. Über diese ökonomischen Komponenten des Nachdenkens über universelle Methoden zur wirtschaftlichen Entwicklung qua Bildung soll im folgenden Abschnitt weiter eingegangen werden.

Die internationalen Organisationen für Entwicklung und die Menschen, die für sie arbeiten, spielen eine wichtige Rolle dabei, Bildungs-Normen und -Standards zu entwerfen und durchzusetzen. Chabbott verweist darauf, dass neben den oft genannten nationalstaatlichen Interessen – diese können an einem Ausbau an weltweiter Macht und Dominanz, also politischer aber auch rein wirtschaftlicher Art sein – vor allem ganz simple organisationsinterne Zwänge, wie Ressourcen-Knappheit, eine Rolle bei der Entwicklung von strikt standardisierten Verfahren gespielt haben.[34]

Über diese ökonomischen Komponenten des Nachdenkens über universelle Methoden zur wirtschaftlichen Entwicklung qua Bildung soll im folgenden Abschnitt weiter eingegangen werden.

II.3. Ökonomische Komponenten

Auch wenn das Bildungssystem eigentlich als ein von ökonomischen Einflussfaktoren unabhängiger Raum, eine der Wirtschaftlichkeit nicht untergeordnete gesellschaftliche Praxis gedacht werden sollte, wie dies Benner fordert[35], so wird in der Realität die Wirtschaftlichkeit von Lehren (oder Lehrern) und Schule gerade in der bildungspolitischen Praxis ständig mit untersucht. In der Idee der Setzung von Standards und deren regelmäßige Kontrolle durch Evaluation drückt sich eine Erwartung von Effizienz aus. Hinzu kommt die Entwicklung von Konkurrenz zwischen den Schulen, wie dies beispielsweise in England unter Margaret Thatcher eingeführt wurde, wo die externe Evaluation auf der Basis von expliziten Standards kombiniert mit der Möglichkeit von Sanktionen gegen „schlechte“ Schulen und einer Öffentlichmachung der Ergebnisse in sogenannten „league tables“ die Schüler und Eltern zu Kunden und die sich anbietenden Schulen zu einem Markt gemacht haben[36]. In den englischen Schulen entstanden so „Quasi-Markets“, deren Ziel es war, mit weniger finanziellen und personellen Ressourcen bessere Leistungen zu erreichen. Stichworte waren die traditionell ökonomischen Begriffe AccountabilityTransparency and rational choice.[37] Hans-Georg Kotthoff, der in einer Studie im Rahmen der international und interkulturell vergleichenden Erziehungswissenschaft die beiden Länder Schweden und England sowie deren Schul-Evaluationen miteinander verglichen hat, sieht zwei verschiedene idealtypische Erwartungshaltungen an Evaluationen, die diese zu erfüllen haben: Erstens Kontrolle und zweitens Förderung.[38] Zudem drückten sich die verschiedenen – oft durch kulturelle und länderspezifische Traditionen geprägte, also kontextgebundene – Herangehensweisen an die Umsetzung einer Qualitätsentwicklung an Schulen durch zwei mögliche verschiedene Setzungen von Standards aus: Die einen sind explizite Standards, welche sich durch systematisch definierte Regeln dessen auszeichnen, was als Qualität angesehen wird und die in klar geregelten Prozeduren durchgesetzt werden, zudem von Einrichtungen, die ausdrücklich dazu geschaffen und dafür verantwortlich sind, Qualitätsevaluation durchzuführen (in England ist dies Ofsted – Office for Standards in Education-and Children’s Services and Skills; in Schweden Skolverket; in Deutschland das Institut zur Qualitätsentwicklung im Bildungswesen, das IQB). Das andere sind implizite Standards, die sich voll allem durch interne Evaluationen ergeben, also schulintern oder maximal lokal begrenzt sind und durch die direkt am Bildungsprozess beteiligten Personen geschaffen werden, also Lehrern, Schülern und Eltern. Sie entstehen durch eigene Reflexion, Fortbildungsmaßnahmen, Erwartungshaltungen und gemeinsame Aushandlungsprozesse – nicht aber durch eine externe Institution, die Vorgaben erarbeitet und unabhängig von den Einflüssen der Evaluierten selbst agiert.[39] In England, Schweden und Deutschland, aber auch in allen anderen Ländern, die angelehnt an die Überlegungen der OECD und der Weltbank zur Qualitätsentwicklung der Bildungssysteme Bildungsmonitoring und Standardisierung einführ(t)en, gibt es demnach explizite Standards. Sie dienen vor allem der Kontrolle der Effizienz und Effektivität.

Dass zudem auch ökonomische Zwänge eine Rolle spielen, wird von der englischen Ofsted selbst auf deren eigenen Internetseite erklärt: „The aim of all this work is to promote improvement and value for money in the services we inspect and regulate, so that children and young people, parents and carers, adult learners and employers benefit.”[40] Es geht also nicht nur um die beste Qualität und Zufriedenheit von Schülern, Lehrern und Eltern sondern auch um Geld. Zudem hat die Evaluation von Schulen nicht zuletzt immer auch eine Rechtfertigungsfunktion. In den meisten Ländern der OECD wird ein nicht unerheblicher Anteil staatlicher Gelder – und damit handelt sich um Mittel, die aus Steuereinnahmen gewonnen werden – in die Bildungssysteme investiert. Daraus ergibt sich eine Notwendigkeit, staatlich zu rechtfertigen und zu begründen, dass die Gelder so und nicht anders investiert werden sollten, dass sie der Gesellschaft als Ganzer zugutekommen. Die OECD erstellt Rankings, in denen ausgemacht wird, wie viel Prozent der Bruttoinlandsprodukte die Länder in ihre Bildung investieren (siehe Abbildung 3; S. 17).[41]

Zu erwarten wäre, da sich ein Staat immer für seine Ausgaben rechtfertigen und darstellen muss, dass diese zum Erhalt und zur Förderung der Gesellschaft dienen, dass in Ländern mit hohem Anteil der Bildungsausgaben am BIP die Kontrolle der Ergebnisse des Bildungssystems eine größere Rolle spielt.[42] So könnte auch erklärt werden, warum ausgerechnet die USA, die mit 7,6 Prozent des BIP hinter Island an zweiter Stelle der Tabelle stehen (vgl. Abbildung 3), eine der längsten Traditionen der Schulevaluation mitbringen. Im Vergleich dazu geben die Länder Kanada, Südkorea und auch Schweden nach OECD-Angaben hierbei vor allem überdurchschnittlich viel Geld für die Gehälter ihrer Lehrer aus.[43]

In diesem Zusammenhang steht auch die zunehmende Konzentration weg von der Input-Steuerung (curricular) hin zur Output-Steuerung (Leistungsmessung). Besonders durch den starken Einfluss der internationalen Leistungsmessungen wie PISA und TIMSS, die intensive Debatten politischer und gesellschaftlicher Natur nach sich zogen, wurde die Output-Orientierung gestärkt. Diese Entwicklung, eine Unterordnung der Inputsteuerung unter die Output-Evaluation, ist in vielen Ländern der OECD, auch in den von Kotthoff intensiv untersuchten Ländern Schweden und England, zu beobachten.

Zuletzt bleibt festzuhalten, dass die Bildungsstandards, wie sie in Deutschland nun am IQB in Zusammenarbeit mit der Universität Kassel konzipiert werden, sich in ihrer Herangehensweise stark an derer orientieren, die der Aufgabenentwicklung von PISA zugrunde liegen. Was nicht verwundert, arbeiten schließlich Bildungsforscher, die von Anfang an für Deutschland die PISA-Auswertungen übernahmen, heute am IQB oder waren an dessen Aufbau mitbeteiligt. Es kann also von einer Art „Strahlkraft“ der OECD-Herangehensweise an Bildung und Bildungsmonitoring ausgegangen werden. Diese allerdings ist in erster Linie eine ökonomische Institution, wie es schon der Name deutlich macht – Organisation für wirtschaftliche Zusammenarbeit und Entwicklung. Svein Sjøberg von der University of Oslo stellt die Objektivität und Wertfreiheit der PISA-Studie daher in Frage: Sie sei eingebettet in die politischen Ziele und ökonomischen Prioritäten der OECD.[44]

II.4. Kritik

Bildungsstandards erfahren teils vorsichtige, das Konzept nicht in Gänze infrage stellende; teils komplett ablehnende Kritik. Bernd Zymek warnt zwar vor einer „abschüssigen Bahn vom Modell zur Ideologie“, dennoch erkennt er die positiven Möglichkeiten und Chancen an.[45] Er weist darauf hin, dass die guten Absichten und die gewollten Folgen, die durch eine Einführung standardisierter Leistungsmessungen – die immer auch im Rahmen einer Gesamtsteuerungsstrategie für das Bildungs- und Schulwesen als Ganzem gesehen werden müssen – erreicht werden sollen (bessere Leistungen auf der Basis von Konkurrenz, welches es ermöglicht ohne höhere Ausgaben im Bildungswesen einen Effizienz-Schub zu schaffen) nicht die ungewollten Folgen kaschieren dürften.[46] Im Wesentlichen nennt Zymek zwei ungewollte, negative Folgen:

  1. Die soziale Selektion würde verschärft. Dies sei bereits in England zu beobachten, wo durch die Transparenz über die (Miss-)Erfolge bei Leistungstests vor allem jene Schulen in sozial schwächeren Gegenden geschlossen werden mussten. Hinzu kommt, dass die Verantwortung zu den Eltern geschoben würde: Diese müssen sich informieren, vergleichen und anhand von Ergebnissen aus Tests entscheiden, welche Schule sie auswählen sollen. Einerseits benötigen sie dazu die nötige Motivation, andererseits die entsprechende Kenntnis und Fähigkeit – beide sind sozial codiert, sie sind kulturelles Kapital, um mit Bourdieu zu sprechen.
  2. Ebenfalls in England habe sich gezeigt, dass der Unterricht in den Schulen, wie er von den Lehrern gehalten wird – also den eigentlichen Professionellen, mit didaktischer Ausbildung und fachlicher Kompetenz – durch ein Learning to the test abgelöst wird, welches sich vor allem durch außerschulische Lern-Angebote in enormen Maße verbreitet habe. Der Unterricht als Raum des Lernens wird so unterhöhlt – die Lehrer fühlen sich zunehmend entmündigt.

Auf der anderen Seite steht eine generelle Kritik an der Ökonomisierung der Bildung, wie sie in vielen Beiträgen des Jahrbuchs für Pädagogik 2010, das unter dem Titel „Der vermessene Mensch“[47] erschienen ist, herausklingt und wie sie bereits im vorherigen Kapitel anklang. Als dritte Kritik-Linie lässt sich jene ausmachen, die von einem ganzheitlichen Bildungsideal ausgehend vor allem die kulturellen Besonderheiten als Widerspruch zu einer universellen Strategie ansieht, wie sie im Kapitel  V.1. dieser Arbeit aufgegriffen werden.

III. (Jüngere) Geschichte der Bildungsstandards in Deutschland

III.1. Die deutsche Debatte seit PISA – Eckpfeiler

Wie bereits einleitend angedeutet, ist die Einführung von Bildungsstandards in Deutschland auch und vor allem eine Reaktion auf das schlechte Abschneiden deutscher SchülerInnen in der internationalen Vergleichsstudie PISA – die Leistungsniveaus waren schlichtweg unbefriedigend. Ein weiteres Problemfeld, das PISA an die Oberfläche brachte, war das der starken Leistungsstreuung. Eine dritte Baustelle besteht, auch das zeigte PISA, in den starken sozialen Disparitäten.[48] „Die große Herausforderung der gegenwärtigen Arbeiten zur Entwicklung, Operationalisierung und Implementation von Bildungsstandards,“ so Eckhard Klieme, „besteht darin, Standards in diesem Sinne als Instrumente zur Reflexion und möglicherweise zur Veränderung didaktischer Kulturen zu nutzen.“[49]

Der Schock über den starken Einfluss von sozialem Hintergrund der Jugendlichen auf deren Schulleistungen, war begründet: Kein anderes Land, das an PISA teilnahm, hatte eine derart große Abhängigkeit des Leistungsergebnisses vom sozioökonomischen Niveau des Berufs der Eltern, wie Deutschland. Die Statistiken des Lesetests von PISA 2000 zeigen deutliche Probleme auf.

So hatte Deutschland:

  • bei den Mittelwerten von allen Teilnehmerstaaten die größte Standardabweichung in der Gesamtskala Lesen (111 Punkte, dem folgen Neuseeland mit 108 und Belgien mit 107 Punkten; wobei auf 100 Punkte normiert wurde um einen Vergleichs-Ausgangspunkt zu schaffen; die niedrigsten Werte hatten Japan mit 86, Spanien mit 85 und Korea mit 70 Punkten)[50];
  • bei der Gruppe der leistungsschwächsten Schüler im Vergleich mit den anderen Ländern wesentlich schlechtere Werte in der Lesekompetenz, wohingegen die Spitzengruppe der deutschen Schüler vergleichbare Leistungen wie die durchschnittliche Spitzengruppe der OECD erreichte[51];
  • der Rückstand von Kindern aus Einwandererfamilien zu jenen, die nicht aus migrantischen Familien kommen ist der zweithöchste, nur in Belgien sind die Unterschiede noch größer[52] – die Zusammenhänge zwischen Migrationshintergrund der Schüler und der Zugehörigkeit zur Risikogruppe sind in Abbildung4 verdeutlicht.

Für das Fach Mathematik ist außerdem sehr auffällig, dass in Deutschland der Anteil der Risikogruppe, das heißt der Anteil an Schülern, deren mathematische Kompetenz bei der Erhebung der PISA-Daten nicht über das Grundschulniveau hinausreichte, mit beinahe 25 % so hoch wie in keinem anderen Land war.[53] Hingegen liegen deutsche Schüler im Anteil der Spitzengruppe, jene Schüler, die Kompetenzstufe V erreichten, weit hinter Japan, der Schweiz und anderen Ländern.[54] In der Mathematik, das zeigte PISA 2000, hat Deutschland besondere Schwächen.

PISA 2000 und auch die darauffolgenden PISA-Studien haben gezeigt, dass in Deutschland, mehr als in anderen OECD-Staaten, der sozioökonomische Status der Eltern, das Bildungsniveau der Eltern, sowie die ethische Herkunft der Familie eine entscheidende Rolle für die Lern- und Leistungsergebnisse der Schüler spielen. Einen Einfluss haben diese Faktoren fast immer, doch andere Länder weisen nicht derart große Scheren zwischen den HISEI-Quartilen der Schüler auf, wie Deutschland. Nimmt man an, dass gemäß Abbildung 5[55] der Lernerfolg der Schüler von vielen, sich gegenseitig beeinflussenden und in Wechselwirkung miteinander stehenden Faktoren abhängen, wie Klassenkontext, Expertise der Lehrer, Medien-Umwelt, Unterrichtsprozesse – die auf jeweilige individuelle Voraussetzungen treffen – dann scheinen die Länder, die bei den PISA Studien besonders gute Ergebnisse erzielten, kombiniert mit einer geringeren sozialökonomisch beeinflussten Disparität in den Leistungsergebnissen, etwa Finnland, Kanada und Schweden, es zu schaffen, an diesen staatlich beeinflussbaren Stellschrauben (Lehrerexpertise, Unterrichtsprozesse etc.) sowie durch eine Beeinflussung des elterlichen Unterstützungsverhaltens mittels Feedback über die Leistungen ihrer Kinder die Unterschiede im „mitgebrachten“ sozialen und kulturellen Kapital[56] besser auszugleichen. Sie eröffnen Chancen für eine größere soziale Variation an Kindern. In den USA läuft ein auf dieses Ziel ausgerichtetes Programm unter dem Namen „No Child left behind[57]. Dieses Programm, das sich laut Koretz in einer Art evolutionärem Prozess über die vergangenen 30 Jahre entwickelt hat, beinhaltet sogenannte „uniform performance goals[58] – also gleiche Leistungsziele, die für alle gelten – die sich in den USA inzwischen zu performance standards entwickelt haben.

Neben einer Debatte über die Mängel des deutschen Schulsystems, die durch die PISA-Ergebnisse losgelöst wurden, entstand eine kritische Betrachtung der PISA-Studie selbst, der Herangehensweise der OECD, der Entwicklung der Aufgaben, der empirischen Arbeit und der Interpretationsmechanismen.[59] Im Bereich Mathematik hält Antoine Bodin von der französischen Université de Franche-Comté fest, dass es viele (französische) Mathematik-Lehrer sehr verwirrt habe, dass die dort gestellten Aufgaben sehr fern der Art und Weise gelegen hätten, wie diese Mathematik vermittelten. Auch Mathematiker hätten sich irritiert über die Art der Fragestellung und der Aufgabenkonstruktion geäußert.[60]

Darüber hinaus ergab sich, ebenfalls in der Auseinandersetzung mit den Methoden und Ergebnissen des Mathematikteils von PISA, eine Debatte über den Begriff der „Testfähigkeit“, der für diese Arbeit von Relevanz ist: So stellt Wolfram Meyerhöfer von der Freien Universität zu Berlin die unterschiedliche Testfähigkeit von internen, also von Lehrern gemachten, Leistungsbewertungen und externen, standardisierten Leistungsbeurteilungen zur Debatte.[61] Nach Meyerhöfer seien alle Tests mit Unschärfen behaftet – ob nun Klassenarbeiten, mündliche Prüfungen oder die Beurteilung von Hausaufgabenleistungen durch Lehrpersonal. Doch Schüler oder Eltern könnten die Ergebnisse dieser Tests diskutieren, dazu Feedback geben und in einen interaktiven Prozess eintreten, bei dem sich durch Feedback auch die Unterrichtsmethoden, in manchen Fällen gar die Benotung, ändere. Dem entgegen gesetzt hätten standardisierte Testverfahren stets den Anspruch, frei von solcherlei Unschärfen zu sein.[62] Zudem stellt der Autor eine prinzipielle Konfliktträchtigkeit zwischen standardisierten Tests und der Autonomie von Individuen fest: „Sie [die Testfähigkeit] reproduziert […] die Autonomiezerstörung, indem sie den Schüler auf Fähigkeiten hin trainiert, die außerhalb von mathematischen Fähigkeiten liegen. Die autonomiezerstörende Grundstruktur von Tests ist nicht hintergehbar.“[63] Anhand einer Auswahl konkreter Aufgaben aus TIMSS und PISA zeigt Meyerhöfer detailliert auf, dass gerade in der Mathematik dieses Problem nicht handhabbar ist.

III.2. Das IQB: Entstehung, Struktur und Aufgaben

In der Auseinandersetzung von Politik und Wissenschaft zu der zentralen Frage, wie das Bildungssystem verbessert bzw. wie dessen Qualität maßgeblich erhöht werden kann, steht als Angelpunkt das Institut zur Qualitätsentwicklung im Bildungswesen, kurz IQB. Es wurde 2004 gegründet und ist einerseits der Kultusministerkonferenz zugeordnet, deren Generalsekretär sowie die Amtschefkommission „Qualitätssicherung in Schulen“ es gründeten, andererseits ist es an das Institut für Erziehungswissenschaft der Humboldt-Universität zu Berlin angegliedert. Finanziert wird es durch alle 16 Bundesländer nach dem sogenannten Königsberger Schlüssel. Seine bisherigen Leitungen waren: Olaf Köller, der erster Direktor war(2004 bis 2009); Hans Anand Pant (Leiter von 2010 bis heute) und Petra Stanat (ebenfalls 2010 bis heute Leiterin). Sowohl Olaf Köller als auch Petra Stanat waren zuvor Mitarbeiter am Max-Planck-Institut für Bildungsforschung (MPIB). Dieses war direkt mit der Auswertung der PISA-Studie 2000 befasst, was unter Jürgen Baumert geschah, der in dieser Zeit sowohl das MPIB (von 1996 bis 2010), als auch das deutsche PISA-Konsortium leitete.

Zu den Hauptaufgaben des IQB gehören:

  • Generierung von großen Aufgabensammlungen zur Operationalisierung der Bildungsstandards
  • Formulierung von Kompetenzmodellen. Hier wird konkret für einzelne Fächer beschrieben, welche Kompetenzen die Schüler und Schülerinnen zu einem definierten Zeitpunkt erreicht haben sollen.
  • Formulierung von Vergleichsaufgaben. Diese Aufgaben sind geeignet, das Erreichen bestimmter Kompetenzen durch die Schüler und Schülerinnen zu erfassen.
  • Erarbeitung von computergestützten Test-, Auswertungs- und Rückmeldesystemen.
  • Pädagogisch-psychologische Diagnostik
  • Lehr-/Lernforschung im Schnittbereich zwischen Fachdidaktiken, Erziehungswissenschaft und Psychologie

In der Praxis arbeiten am IQB knapp 60 feste Mitarbeiter und Doktoranden, daneben noch einige Hilfskräfte. Nachdem das IQB 2004 gegründet wurde und bereits in den Jahren 2006/2007 Normierungsstudien zur Vorbereitung der Bildungsstandards wie von der KMK beschlossen durchgeführt wurde, begann ebenfalls hier die Konzeption der Aufgaben für die VERA-Testungen.

 IV. Zielsetzung und Durchführung in Deutschland am Beispiel Bildungsstandards und der VERA-Evaluation im Fach Mathematik

IV.1. Entwicklung des Konzepts

Das Institut zur Qualitätsentwicklung im BildungswesenIQB, erläutert den Zweck der VERA-Lernstandserhebungen wie folgt: „VERA dient vor allem der Unterrichtsentwicklung, besonders mit Blick auf die nationalen Bildungsstandards. Diese formulieren erwartete Leistungen der Schülerinnen und Schüler zum Schulabschluss bzw. Schulübergang. Durch die Ergebnisse der Vera-Durchgänge, die 1 bzw. 2 Jahre vor der Abschlussklasse durchgeführt werden, erhalten die Lehrkräfte Erkenntnisse über die Stärken und Schwächen ihrer Klassen auch im Bezug auf die Bildungsstandards. Entsprechend dieser Ergebnisse kann der Unterricht durch die Lehrkräfte beibehalten, angepasst oder in bestimmten Domänen ausgebaut werden.“

Bereits in PISA 2000 wurde bei der Erhebung der Daten der Schülerleistungen in der mathematischen Grundbildung ein Konzept angewandt, welches sich Mathematical Literacy nennt. Mathematical Literacy ist ein internationales Rahmenkonzept, das von der OECD entworfen wurde.[64] Klieme, Neubrandt und Lüdtke bezeichnen es als „Werkzeug zur Modellierung von realen Problemen“. Ihnen zufolge untersucht es, „inwieweit mathematisches Wissen funktional, flexibel und mit Einsicht zur Bearbeitung vielfältiger Kontextbezogener Probleme eingesetzt werden kann.“ [65]

Innerhalb dieses Rahmenkonzepts kommen folgende Kompetenzerwartungen zum Ausdruck:

  • die Fähigkeit, mathematisch zu denken
  • die Fähigkeit, mathematisch zu argumentieren
  • die Fähigkeit zur mathematischen Modellierung
  • die Fähigkeit, Probleme zu stellen und zu lösen
  • die Fähigkeit, mathematische Darstellungen zu nutzen
  • die Fähigkeit, mit den symbolischen, formalen und technischen Elementen der Mathematik umzugehen
  • die Fähigkeit, zu kommunizieren
  • die Fähigkeit, Hilfsmittel einzusetzen und zu gebrauchen.[66]

Schaut man sich die Konzipierung der Grundfähigkeiten, die durch die Bildungsstandards als sogenannte „allgemeine mathematische Kompetenzen“ festgeschrieben werden, an, ist eine große Ähnlichkeit nicht zu übersehen, diese lauten:

  • Mathematisch argumentieren
  • Probleme mathematisch lösen
  • Mathematisch modellieren
  • Mathematische Darstellungen verwenden
  • Mit Mathematik symbolisch/ formal/ technisch umgehen
  • Mathematisch kommunizieren.[67]

Diese sechs allgemeinen Kompetenzen werden im vom IQB und der Universität Kassel konzipierten „Kompetenzmodell der Bildungsstandards für das Fach Mathematik in der Sekundarstufe I“[68] als die prozessbezogene von drei notwendigen Dimensionen aufgeführt. Die Autoren betonen, dass es „typisch für mathematisches Arbeiten“ sei, „dass mehrere Kompetenzen im Verbund benötigt werden und sich die verschiedenen Kompetenzen partiell durchdringen.“[69] Daneben gibt es noch eine Anspruchsdimension, die genauer festlegt, welche Anforderungsbereiche es gibt und die Inhaltsdimension, diese drückt sich durch mathematische Leitideen aus.[70] In ihrem Zusammenspiel ergeben diese drei Dimensionen das Gesamtkonzept der deutschen Bildungsstandards, die sich schematisch wie in Abbildung 7, S. 28, darstellen lassen. Dabei sollen vor allem drei Grunderfahrungen vermittelt werden: 1. Mathematik als Werkzeug: Die Phänomene, die einen Menschen umgeben, sollen in einer spezifischen, mathematischen Weise wahrgenommen und verstanden werden. 2. Mathematik als geistige Schöpfung und Welt eigener Art: Dabei geht es darum, dass Schüler die Mathematik quasi als eigene „Sprache“ erlernen. 3. Mathematik als Hilfsmittel zum Erwerb fachbezogener und fächerübergreifender Fähigkeiten: Hierbei geht es vor allem darum, die Probleme, die einerseits im Fach Mathematik, andererseits auch in anderen Fächern auftreten (Physik, Biologie, Chemie, Musik oder Wirtschaft) mittels mathematischer Vorgehensweisen zu lösen.[71]

Die Anforderungsbereiche für die Mathematik sind dabei den jeweiligen Kompetenzbereichen untergeordnet (vgl. Tabelle 1). Sie stellen laut den Entwicklern des Konzepts die „unterschiedlichen kognitiven Anspruchsniveaus“ dar. Anforderungsbereich I ist dabei jeweils eine Art „Einstiegsniveau“, wobei die Autoren betonen, dass es auch ein Niveau „unter“ Anspruchsniveau I gäbe, dabei käme dann aber die Kompetenz noch gar nicht zum Tragen.

In wie weit es sich bei Anspruchsniveau I um eine Art Mindeststandard handelt, wird nicht weiter erläutert. Aber  die Aufteilung in ausgerechnet drei verschiedene Niveaus vermittelt eine Abstufung in „unteres Niveau“, „mittleres Niveau“ und „hohes Niveau“. Somit liegt eine Assoziierung der Anforderungsbereiche mit den drei verschiedenen Formen von Standards – nämlich a) Mindeststandard; b) Regelstandard und c) Maximalstandard – wie dies auch analog zu den PISA-Kompetenzstufen I, II, und III von einigen Wissenschaftlern interpretiert wird, nahe.[72]

Die Tabelle in Abbildung 8, S. 29, zeigt recht deutlich, dass in der Konzeption von Bildungsstandards für die Mathematik einerseits die verschiedenen Dimensionen der Mathematik als Welt eigener Art, als Anwendungsmittel zum Erfassen der einen Menschen umgebenden Welt, als Kommunikationsgegenstand und als bloßes Mittel zur Bewältigung von Problemen anderer Bereiche eingearbeitet werden; andererseits wird bereits nach verschiedenen kognitiven Niveaus sortiert, die es zu bewältigen gibt. Von purer Formelanwendung bis hin zur selbstständigen Konstruktion eigener Modelle zur Bearbeitung einer unbekannten Problemstellung gibt es eine große Bandbreite an Anforderungen.

Abbildung 8: Die Kompetenzbereiche und ihre drei gestuften Anforderungsbereiche im Überblick;

Quelle: Kompetenzstufenmodell zu den Bildungsstandards im Fach Mathematik für den Mittleren Schulabschluss

 

IV.2. Aufgabenentwicklung und Leitideen

Im Jahr 2005 wurde das Institut zur Qualitätsentwicklung im Bildungswesen, das IQB, gegründet. Seitdem ist es für die Entwicklung der Testaufgaben zur Überprüfung der entwickelten Bildungsstandards verantwortlich. Davor lag die Zuständigkeit zur Entwicklung von Items, zum Beispiel für die Ende 2005 und im Rahmen der PISA Studie 2006 durchgeführte Normierungsstudie für die Bildungsstandards[73], beim Deutschen PISA-Konsortium. Dieses entwickelte mehr als 1.000 Items, die in den genannten Studien getestet und womit die Bildungsstandards normiert wurden. Daraufhin wurden Nachnormierungen für die noch fehlenden Klassenstufen 8 und 10 durchgeführt (denn an PISA nehmen immer nur Neuntklässler teil). Diese Nachnormierungen liefen unter der Federführung des IQB.[74] Am Ende dieser Studien lagen dem IQB (und der Universität Kassel, die zusammen mit dem IQB für die Aufgabenentwicklung zuständig ist) über 500 repräsentativ abgefragte Items vor.

Die Entwicklung der Aufgaben ist ein hochkomplexer Prozess. […]

Neben den oben beschriebenen Kompetenzbereichen und Anforderungsbereichen spielen vor allem die sogenannten Leitideen bei der Erstellung der Aufgaben eine wichtige Rolle: Die späteren Items werden nach Leitideen geordnet, dabei ist es wichtig, dass jedes Item einer Haupt-Leitidee zugeordnet werden kann, auch wenn es vielleicht mehrere streift.

„Die mathematischen Leitideen versuchen, die Phänomene zu erfassen und zu strukturieren, die man sieht, wenn man die Welt mit einer „mathematischen Brille“ betrachtet.“[76] Mit diesem Satz wird die Ausführung der Leitideen eingeleitet. Leitideen sind also eine Art „phänomenologischer Cluster“, welche der Mathematik ihre einzigarte Beschaffenheit verleihen. Die fünf Leitideen sind:

  1. „Zahl“
  2. „Messen“
  3. „Raum und Form“
  4. „funktionaler Zusammenhang“
  5. „Daten und Zufall“

Wie bereits in weiter vorne ausgeführt, fügen die Leitideen in einer Art dreidimensionalem Raum aus Kompetenzen (Prozess; mathematisches Arbeiten an sich) und Anforderungsbereiche (Anspruch; kognitive Stufung) die dritte Dimension hinzu: den Inhalt. Zur Leitidee „Zahl“ gehören unter anderem die Arithmetik und Kombinatorik; zur Leitidee „Messen“ die Geometrie und die Größenlehre; „Raum und Form“ bildet die analysierende Geometrie ab; „funktionaler Zusammenhang“ behandelt das Gebiet der Algebra und „Daten und Zufall“ widmet sich der Stochastik. Es wird erkennbar, dass die Leitideen sich an der klassischen Struktur des curricularen Mathematik-Unterrichts anlehnen, jedoch einerseits neue und umfassendere Begriffe finden, andererseits zudem noch Verbindungen einbezogen sind – gar erwünscht: „Bei der Einordnung der einzelnen Items in die Leitideen haben wir uns in jedem Fall für eine primäre Leitidee entschieden. In manchen Items spielen aber zwei oder gar drei Items eine Rolle […].“[77] Die Leitideen dienen somit nicht nur der Strukturierung der Bildungsstandards in ein dreidimensionales Modell, und nicht nur als „phänomenologische Cluster“; sie strukturieren darüber hinaus die Items in der Testkonstruktion. So ist dies bis heute auch bei VERA der Fall. Es wird deutlich, dass die Testkonstruktion, die Prozesse zwischen den verschiedenen koordinierenden Ebenen, die theoretischen Grundgedanken und der Bildungsbegriff bei VERA Mathematik sehr komplex angelegt sind.

IV.3. Reaktionen auf VERA

Die Gewerkschaft für Erziehung und Wissenschaft in Berlin hat jüngst (im März 2011) einen offenen Brief an den Bildungssenator Prof. Zöllner geschrieben, in dem es heißt, „[…] dass in Ihrer Verwaltung noch immer  nicht gesehen wird, dass bessere Testergebnisse von Schülern in sozialen Brennpunkten keine Frage von mehr Druck oder mehr Wettbewerb sind. Der Sachverhalt sieht anders aus: Nicht die Schüler lernen zu wenig, sondern der Test erfasst nicht, dass sie trotz ihrer oft sehr schlechten Lernvoraussetzungen sehr viel lernen. Deshalb sind auch zentrale Dateien für Aufgabenstellungen keine hilfreiche Unterstützungsform. Sie behindern nur eine kindgerechte Pädagogik in den Schulen.“[78] In Berlin werden, wie in manchen anderen Bundesländern auch, die Ergebnisse der VERA-Tests veröffentlicht und in Rankings verarbeitet, was zu einigen Problemen in der pädagogischen Praxis der Lehrkräfte vor Ort führt. Dies stellt ein massives Problem für viele Lehrer und Schulen dar.[79]

Doch es sind nicht nur die Lehrkräfte oder die GEW, die an VERA Kritik äußern, auch aus fachdidaktischer Richtung kommt Kritik. Prof. Christoph Selter von der Mathematischen Fakultät der TU Dortmund, hat sich die Aufgabenstellungen in VERA Mathematik für die Klasse 3 genauer angesehen und stellt fest:

Viele Aufgaben seien,

– nicht aus dem Kernbereich des Unterrichts: Die Aufgaben seien nach Selter darauf ausgerichtet, nicht die im Unterricht erlernten arithmetischen Fähigkeiten zu testen, sondern vielmehr darauf, die Fähigkeit Neues und Unbekanntes zu erfassen.[80]

– nicht in der Lage, das Denken der Kinder authentisch einzufangen: teilrichtige Aufgaben müssten demnach generell als falsch bewertet werden, selbst wenn die Kinder damit nur einen anderen Gedankengang zum Ausdruck gebracht hätten.[81]

– nicht verständlich gestellt: gewöhnungsbedürftige Formulierungen und eine zu „erwachsene“ Sprache seien oft hinderlich, im Sinne eines sich in die Kinder hineinversetzenden Menschen, die Aufgabenstellung wirklich klar zu machen.[82]

Selter hat 2004 beobachtet, wie einige Schulen und deren Kollegien in Nordrhein-Westfalen auf die VERA-Testung reagierten. Er beschreibt eine ambivalente Haltung: „VERA weist sicherlich eine Reihe von begrüßenswerten Elementen auf; das Projekt soll die Lehrpersonen bei der Weiterentwicklung des Unterrichts unterstützen. VERA wird jedoch nach meinen Eindrücken häufig als zusätzliche Pflicht erlebt, die Zeit absorbiert, die nicht wenige der ohnehin schon am Rande der Belastbarkeit arbeitenden Lehrerinnen und Lehrer aus eigener Sicht lieber effektiver einsetzen würden, da sie den Ertrag von VERA als nicht angemessen erachten. An den Schulen, zu denen ich Kontakt habe, dauerte das Auswählen, Ausdrucken, Kopieren, Heften, Auswerten, Studieren der Korrekturanweisungen, Eingeben und Hochladen der Resultate allein für Mathematik mehr als 20 Zeitstunden, also eine halbe Arbeitswoche.“[83] Neben den pädagogischen Vorbehalten, die von Seiten der GEW in Berlin vorgebracht wurden, beschreibt Selter hier ganz praktische, arbeitsalltägliche Belastungen, die durch die Durchführung der Tests an Schulen entstehen.

Auch am IQB selbst gibt es vereinzelt Kritik an der Konstruktion der Aufgaben. So gibt es zum Beispiel einen generellen Streit darüber, ob Mathematik-Aufgaben besonders textlastig sein dürften, oder nicht. […]

IV.4. Umsetzung der Evaluationsergebnisse

Der entscheidende Faktor in der Diskussion um den Erfolg oder Misserfolg der Durchführung solcher Lernstandserhebungen wie VERA ist: Wie werden die Ergebnisse benutzt? Wie wird anhand ihrer, eine Rückkopplung zu den ursprünglich gestellten Bildungsstandards gewährleistet und die Qualität der Lehr-Lern-Situation in den Einzelschulen, sowie ihre Weiterentwicklung tatsächlich positiv beeinflusst?

In der momentanen Praxis wird mit den Ergebnissen der VERA-Untersuchung länderspezifisch unterschiedlich umgegangen (Vgl. Kapitel V. 4.).[85] In der ursprünglichen Konzipierung von VERA sollen die Ergebnisse allein bei den untersuchten Schulen verbleiben, demnach nicht öffentlich gemacht werden, und schon gar nicht für politische Debatten benutzt oder in Wahlkämpfen verwendet werden. Doch die Praxis ist leider längst eine andere. In manchen Bundesländern, so zum Beispiel in Berlin, findet eine mediale und politische Debatte über die Ergebnisse statt. Schulen oder ganze Bezirke/ Kommunen werden als besonders herausragend oder als besonders schlecht klassifiziert; Schulen veröffentlichen aufgrund von äußerem Druck selbst ihre Ergebnisse und  wollen damit mögliche Konkurrenzschulen zwingen, dieses auch zu tun. Dies ist nicht die ursprüngliche Idee, denn dieser zufolge dienen die Lernstandserhebungen einer internen Evaluation und Weiterentwicklung. Im Bundesland Hessen verbleiben die Testergebnisse daher tatsächlich einzig bei den Schulen. Allenfalls die Schulinspektionen bekommen Zugang zu ihnen, um in ihrem allgemeinen und umfassenden Evaluations-Bestreben einen Eindruck über die Leistungen der Schüler zu erhalten. Auch in Nordrhein-Westfalen ist eine zentrale Veröffentlichung der Ergebnisse nicht geplant, dennoch haben die einzelnen Schulen die Möglichkeit, die Ergebnisse öffentlich zu machen.

Das Problem an einer medial ausgebreiteten Debatte über Schulergebnisse ist, dass Druck entsteht und die Einzelschule, die sich in einem internen, selbstgestalteten Prozess der Weiterentwicklung befindet, unter enormen Zugzwang gerät und zum Spielball politischer Kalküle wird. Der offene Brief der GEW Berlin an Bildungssenator Zöller zählt die Befürchtungen der Lehrkräfte auf: „der Rankingplatz wird Bildungsziel und nicht die Entwicklung der Kinder,

– eine Schwerpunktsetzung im Unterricht zugunsten der in den standardisierten Tests benannten (abgefragten) Kompetenzen,

– das Schönen der Bilanz durch Manipulation der Ergebnisse und die Entwicklung eines Misstrauensklimas sowohl in der Einzelschule als auch im Gesamtsystem Schule,

– eine sich offen oder unterschwellig entwickelnde negative Einstellung gegenüber Kindern, die die Testanforderungen nicht erfüllen (können),

– ein Konkurrenzkampf der Schulen um Kinder mit guten äußeren Bildungsvoraussetzungen,

– die Förderung einer sozialen Entmischung der Schülerschaft.“[86]

Julia Schneewind und Harm Kuper entwickeln in ihrer Auseinandersetzung mit der Frage, wie die Rückmeldung an Schulleitung und Lehrerschaft zu einer echten Veränderung führen könnte, ein Schema, das die Wechselwirkung zwischen Informationen über die Leistungen, individuellen Bedingungen der Schule oder Lehrerschaft und externen Bedingungen gesteuert durch das Mittel der Evaluation beschreibt (Abbildung 9). Im Idealfall, so die beiden Autoren, führt die Evaluation und die damit geschaffene Rückmeldung, direkt zu einer Veränderung. Dieser Idealfall allerdings ist von einigen Bedingungen abhängig: „Ergebnisrückmeldungen, die im Anschluss an Lernstandserhebungen an Schulen gegeben werden, stellen ein eigenständiges methodisches Problem dar.

 

Rückmeldungen müssen einerseits komplexe Informationen über die Leistungen von Schülern und Schülergruppen transportieren, die Anlass für die Reflexion der Praxis und Möglichkeiten der Schlussfolgerung über die Effektivität der Praxis bieten. Andererseits sind Verständlichkeit und Handhabbarkeit der Information zu gewährleisten, um die praktische Verwendung zu ermöglichen.“[87] Wie aber genau Verständlichkeit und Handhabbarkeit generiert werden können, wird nicht erklärt, es liegt aber nahe, dass dies ein komplizierterer Prozess ist, der von ebenso vielen Faktoren abhängt, wie das in Abbildung 9 gezeigte Abhängigkeitsdiagramm.

Im Brief der GEW Berlin an den Senat wird am Schluss gefordert, statt VERA „die Entwicklung und Förderung von Verfahren“ voranzutreiben, „die den individuellen Lernzuwachs der Schüler in angemessener Weise zur Kenntnis nehmen und die einen praktischen Gebrauchswert für die Verbesserung von Bildungsqualität beinhalten.“[88] Die GEW bemängelt damit den praktischen Gebrauchswert von VERA. Die Schulen, Lehrer und Schüler würden zwar getestet, doch eine gezielte Qualitätsentwicklung auf Basis dieser Testungen fände nicht statt und damit würden sie letztlich doch alleine gelassen.[89] Auch hier wird mehr Handhabbarkeit eingefordert.

Hans Anand Pant, Leiter des IQB, sieht dieses Problem auch, im Interview mit der Wochenzeitung Zeit sagt er: „Viele Kultusministerien haben zu wenig darüber nachgedacht, was sie Schulen mit schlechten Ergebnissen an Unterstützung anbieten. Da braucht es Experten für die Fachinhalte, die in den Schulen konkret zeigen, wie ein Lehrer besser Mathematik unterrichtet, wie er das Sprachvermögen fördert oder die Lesekompetenz von Migrantenschülern verbessert. Einige Bundesländer fangen damit jetzt an.“[90] Auch Pant spricht sich gegen Rankings und die Nutzung von VERA als reines Kontroll-Instrument aus.[91] […], schätzt er die teilweise unkontrollierte Nutzung der Testergebnisse zum Zweck der Kontrolle des Rankings und – schlimmstenfalls – um Sanktionen zu verhängen, als gefährlich und kontraproduktiv ein. Dennoch weist er darauf hin, dass in der Debatte gerne die Kritik in den Mittelpunkt gestellt würde. „Viele Schulen gehen mit dem Test völlig unaufgeregt um. Es gibt Bundesländer wie etwa Rheinland-Pfalz, aus denen hören wir so gut wie überhaupt keine Kritik.“

V. Grenzen und Probleme

V.1. Kulturanthropologische Bedenken zur Legitimität von Standardisierung im Spannungsfeld von Heterogenität

Viele AutorInnen haben klar hervorgehoben, dass gerade das Bildungssystem und die konkrete Ausgestaltung von Unterricht stark kulturellen Einflüssen unterliegen. So schreibt Richard Tabulawa: „There can be no justification for an universal and homogenising pedagogy if indeed teaching and learning are contextual activities. A universalised pedagogy necessarily marginalises pedagogies based on alternative epistemologies.“[92] Indem Tabulawa die kontextuelle Dimension jeglichen Lernens und Lehrens betont, stellt er unmittelbar infrage, ob und wie universalistische Konzepte von Bildung in einer von vielen Epistemologien geprägten Welt funktionieren können und sollen, ohne den Wert des Eigenen, kulturell und traditionell Gewachsenen, kurz: den Wert von Vielfalt und Heterogenität zu marginalisieren.

Eine ausführliche Diskussion der Standardisierungsidee anhand des Begriffs Kultur nimmt Regina Klein vor.[93] Diese in Wechselwirkung mit dem Subjekt stehende Dimension von Bildung ist für Klein zentral, sie sieht in ihr ein gefährdetes Gut, dass durch Normalisierung und Standardisierung gleichsam ausgehebelt werden soll und durch die Konstruktion von sogenannten „interkulturellen Kompetenzmodellen“[94] ersetzt. Weiter sieht Klein das Subjekt als durch die Standardisierung in seiner Individualität gefährdet an, wenn sie schreibt: „Der Boden, in den Bildungsstandards eingerammt werden, ist der Boden eines bildsamen Subjekts, dessen lebenslanger Sozialisations-, Identitäts- und Bildungsprozess kompetenztheoretisch auf verengte, nämlich domänenspezifische Leistungsdispositionen reduziert wird.“[95]

Einen Schritt weiter geht Elisabeth von Stechow, die eine “Erziehung zur Normalität” ausmacht und in Festschreibungen eines Standards nicht nur den Versuch sieht, Qualitätsverbesserungen zu erreichen, sondern auch Macht auszuüben. So schreibt Stechow: „Das Individuum, das über die Fähigkeit zur Selbstkontrolle verfügt, folgt der unausgesprochenen gesellschaftlichen Empfehlung, im Bereich des Normalen zu verbleiben“[96] – was sie explizit als Machttechnologie ansieht. Normal definiert sich bei ihr als Standardmaß, das man nur im statistisch gemessenen Vergleich feststellen kann. Normalität sei demnach im Sinne einer Orientierungskarte denkbar. Stechow stellt auch den unmittelbaren Zusammenhang dieser Konstruktion von Normalität und ihrer impliziten Aufforderung der Anpassung und der Notwendigkeit von empirischer Überprüfung durch Tests her, wenn sie untermauert: „Normalität ist ohne Verdatung nicht vorstellbar.“ – Umgekehrt bedeutet dies für sie auch: Die zunehmende Verdatung dient einer Konstruktion von Normalität. Sie bezeichnet daher die „normalistische Statistik als gesellschaftliche Regulierungstechnik.“ Und ergänzt: „Statistiken bringen, indem sie gesellschaftliche Normalisierungen darstellen, neue hervor.“[97]

Heterogenität, Individualität und freie Wechselwirkung zwischen Schüler und Welt stellen in einer normalistischen und empirischen Welt keine messbaren Werte dar, sie bekommen in ihr keinen Raum. Gunter Dueck weist darauf hin, dass es in den meisten gesellschaftlichen Systemen nicht um eine persönliche Entwicklung geht, um persönliche Fähigkeiten oder Chancen von Individuen, sondern vielmehr um ein fast schon mechanisches Funktionieren: „offiziell sollen Sie zuallererst funktionieren“[98].

Dueck weist auf das wesentliche Merkmal im Denken und Handeln hin: Der Durchschnitt als Orientierungsmarker: „Der Durchschnitt ist eine wesentliche Größe des Denkens und Handelns des Systeme.“[99]. Das Exzellente ist das Fehlerfreie – Raum für Fehler gibt es nach Dueck nicht. „Das Exzellente ist für den richtigen Menschen das, was den Prüfungen standhält.“[100] Es geht nicht um eine persönliche Entwicklung im Sinne von Bildung, um die Ausgestaltung einer Beziehung zu einer widerständigen Welt, sondern um standardisierte Resultate – den Prüfungen standhalten, mehr braucht es in Duecks Augen für eine Exzellenz der Gegenwart nicht. Dem schließt sich auch Wolfram Meyerhöfer an, der an der Konzeption und Durchführung von Bildungsstandards mit der Koppelung an Leistungsvergleiche, wie sie heute mit VERA durchgeführt werden, gerade für das Fach Mathematik kritisiert: „Es geht in der Testsituation nicht darum, dass ein mathematisches Problem erschlossen wird, dass ein Gedanke entfaltet wird oder eine Argumentation brillant entwickelt wird. Es geht darum, das Kreuz an der von den Testern gewünschten (an der „richtigen“) Stelle zu setzen, die von den Testern gewünschte Zahl hinzuschreiben oder einen Gedanken so weit zu entfalten, dass der Kodierer einen Punkt dafür vergibt. Gelegentlich, so fügt er abschließend in zynischem Ton hinzu, „laufen Erschließung und Gewünschtes zusammen, d.h. gelegentlich testet eine Aufgabe mathematische Bildung bzw. Leistung.“[101]

V.2. Komplikationen aufgrund des deutschen Föderalismus‘

Das Institut zur Qualitätsentwicklung im Bildungswesen ist für die Entwicklung von Bildungsstandards für die gesamte Bundesrepublik zuständig. Deutschland aber ist ein föderales Land – dies gilt vor allem für die Bildungspolitik – und schon die Schulstruktur in den Bundesländern ist nicht einheitlich. Die konkrete Ausgestaltung der Umsetzung von Bildungsstandards, sei es zum Beispiel, diese direkt in curriculare Realität umzuwandeln, wie dies bereits in Baden-Württemberg geschehen ist, kann stark variieren.[102]

Die 16 Bundesländer haben die Hoheit über die genaue Ausgestaltung ihrer Schulstruktur und gehen dabei sehr verschiedene Wege. Einige lassen das sogenannte dreigliedrige Schulsystem[103] bestehen, andere bauen gerade dies massiv um und legen etwa Haupt- und Realschulen zu Stadtteilschulen zusammen. In Berlin und Brandenburg beträgt die Regelschulzeit in den Grundschulen sechs, in den anderen Bundesländern vier Jahre. Je nach Regierungskoalition in den Ländern unterscheidet sich die Bildungspolitik massiv. Einzig die von der KMK beschlossenen Standards scheinen Konsens zu sein. Doch auch hier gibt es massive Verständnisunterschiede darüber, welche Konkreten Auswirkungen die Standards zum Beispiel auf die Lehr- und Bildungspläne haben. In Baden-Württemberg orientieren sich die neuen Bildungspläne sehr eng an den Leitideen, Kompetenzen und Anforderungsbereichen des IQB-Konzepts. Andernorts bestehen nach wie vor die alten Lehrpläne fort. So gesehen sind Bildungsstandards einerseits der „kleinste gemeinsame Nenner“ der in der KMK vertretenen Kultusministerien. Andererseits ergibt sich die Schwierigkeit, dass nicht einmal sie vollständige Berücksichtigung in den Schulen vor Ort finden. Diese Tatsache ist einerseits der föderalen Struktur – die sich in kaum einem Politikgebiet so massiv auswirkt, wie in der Bildungspolitik – geschuldet , andererseits ist die Konzipierung und Umsetzung der Idee Bildungsstandards in Deutschland vergleichsweise jung. In einer dauernden Feedback-Schleife zwischen Ländern, KMK, IQB und letztendlich auch den Einzelschulen findet so etwas wie ein dynamischer Entwicklungsprozess statt.[104] Wahrscheinlich wird sich erst in 20 bis 30 Jahren sagen lassen, ob Deutschland trotz seiner komplexen föderalen Bildungsstruktur mittels Standards mehr Einheitlichkeit erlangen konnte. Bemerkenswert ist jedenfalls, wie die Bildungsstandards gerade über jenes Problem stolpern, zu dessen Lösung sie unter anderem angetreten sind: Die Vergleichbarkeit der Leistungen zwischen den Bundesländern.

Ein weiteres Problemfeld: Die Länder sind vor Ort maßgeblich für die Ausgestaltung der VERA-Erhebungen zuständig. Sie sind es auch, die vermitteln sollen und müssen, wie der Test genau konzipiert ist, welchem Zweck er dient und wie er vor Ort durchgeführt werden soll. Es liegt also vor allem in den Händen der Verantwortlichen der einzelnen Bundesländer, ob die Lehrkräfte, die Eltern und Schüler Vertrauen in den „guten Zweck“ von VERA haben können, oder ob sich Misstrauen und Missverständnisse entwickeln. Dies ist in gewisser Weise ein Kontrollverlust aus der Perspektive des IQB und der Universität Kassel, die viel Mühe und Zeit, sowie viele intensive Gedanken in die Konstruktion der Aufgaben gesteckt haben. Was am Ende vom Ansatz übrig bleibt, liegt, trotz der eingeführten Personalschulungen von denen […]  im Interview berichtet, nicht in ihren Händen.[105]

IQB-Leiter Pant drückt es im Interview mit der ‚Zeit‘ ebenfalls sehr deutlich aus: „Aber wenn man sich in den Qualitätsagenturen in den Bundesländern umhört, stellt man überrascht fest, dass mancherorts die methodischen Grundlagen der Vera-Studie noch nicht immer zutreffend dargestellt werden. Leider ist das nicht ganz untypisch: Seit einigen Jahren werden im großen Maßstab Schüler getestet und Schulen evaluiert. Gleichzeitig aber wurde versäumt, deutlich zu machen, was die Lernstandserhebungen sollen und wie Lehrer mit den Ergebnissen umgehen sollen. Da ist die Kommunikation noch stark verbesserungsbedürftig.“[106] Eine Kommunikation, die durch das föderale Durcheinander nicht einfacher wird.

V.3. Probleme bei der Durchführung von Tests sowie ihrer Interpretation

Doch nicht nur institutionelle Strukturen erschweren VERA den Weg zum Erfolg. Auch die Testdurchführung selbst birgt empirische Schwierigkeiten, die nicht kontrollierbaren Nebeneffekte sind nicht gering. Von Seiten der durchführenden Institutionen wird in der Regel das Möglichste getan, um unkontrollierbare Nebeneffekte, die durch die Unberechenbarkeit des „Faktor Mensch“ hervorgerufen werden können, möglichst zu minimieren. Das Verfahren der Durchführung der Tests in der Normierungsstudie 2006/2007 (siehe Kapitel IV.3.) war selbst standardisiert und höchst formalisiert. Die Testleiter, die vor Ort eigens eingesetzt wurden, waren alle speziell geschult.[107] Mittlerweile hat sich selbst diese Situation geändert: VERA-Testungen werden nicht mehr von Instituts-Seite durch eigene Testleitungen durchgeführt, sondern durch die Lehrkräfte vor Ort Der „Faktor Mensch“ kommt nun also auch wieder von der testdurchführenden Seite ins Spiel. Die Interaktion zwischen Schüler und Lehrer ist auch zu beachten. Ihre Wirkungsmacht wird in der Erfahrung, die Testleiter Sven Peukert 2007 bei der Normierungsstudie vor Ort machte, sichtbar: Die Schüler waren während des Tests wesentlich konzentrierter und erfolgreicher, als sie es sonst waren. Diese Einschätzung beruht auf den Aussagen der jeweiligen Lehrer, die ihre Schüler manchmal kaum wiedererkannten. Im Umkehrschluss deutet dies auf eine mögliche besonders destruktiv wirkende Schüler-Lehrer-Beziehung hin, die durch die Standardisierung des Testverfahrens plötzlich gebrochen werden konnte.

So erklärt auch das IQB auf seiner Internetseite: „Es muss bedacht werden, dass das konkrete Testergebnis einer einzelnen Schülerin bzw. eines einzelnen Schülers nicht überbewertet werden sollte: Zum einen sind die Testsituation und die Art der Testaufgaben für die meisten Schülerinnen und Schüler noch nicht völlig vertraut, zum anderen kann ein Test immer nur im Sinne einer Momentaufnahme bestimmte Teilaspekte prüfen.“[108] Der Aspekt der Momentaufnahme impliziert sehr viele mögliche Folgeprobleme in der Be- und Auswertung und aufgrund dessen rät auch das IQB dazu, die Ergebnisse nicht zu überbewerten.

Wie Sjøberg bemerkt, würden Resultate, gerade bei internationalen oder auch nationalen Vergleichstests bei denen große Zahlen unterschiedlicher SchülerInnen von unterschiedlichen Schulformen teilnehmen, so betrachtet werden, als ob alle Teilnehmer in allen Ländern oder Bundesländern, unabhängig von der Schulform, in gleichem Maße ernsthaft an die Testbögen herangehen. Sonst seien sie nicht vergleichbar.[109] Dem hält Sjøberg entgegen, dass in vielen modernen Gesellschaften eine bestimmte Klientel an Schülern nicht ihr Bestes geben will, da sie z.B. die PISA Items zu lang, unleserlich, unrealistisch oder langweilig finden oder weil sie wissen, dass negative Resultate absolut keine Auswirkungen auf sie haben.[110] Er nutzt das Konzept „perceived task value“ bzw. „task value beliefs“, um dieses Problem zu verdeutlichen: „The task value belief focuses on the question, „Why do I want to do this task?. The task value belief concerns beliefs about the importance of succeeding (or even trying to succeed) on a given task“.[111] Demnach hängt die Motivation und Ernsthaftigkeit, mit der Schüler eine Aufgabe bearbeiten, von vielen unterschiedlichen Faktoren ab, nämlich neben den oben genannten auch von einer allgemeinen Motivation zum Lernen und der persönlichen Einstellung zu Schule, Staat, Leistung(sdruck) und den Erwartungen der Eltern.[112]

Die verschiedenen Ausgangssituationen der Schüler führten in einer Normierungsstudie zur Umsetzung der Bildungsstandards in der Mathematik, Sekundarstufe I, zu folgenden möglichen Problemen:

–          Einige – je nach Schulform auch mehrere – Schüler waren nicht motiviert, an einem Test teilzunehmen, dessen Ergebnis für ihre Schulnoten keine Rolle spielten.

–          Einige Schüler konnten sich nach kurzer Zeit nicht mehr konzentrieren und störten somit andere Schüler.

–          Manche Schüler taten nur so, als füllten sie etwas aus, gaben aber leere Blätter ab.

–          Den Schülern der Hauptschule war es nach eigenen Angaben ungeheuer unangenehm, sich mit Gymnasiasten vergleichen lassen zu sollen; sie sahen darin keinen „Sinn“, da es für sie nur logisch war, dass die Schüler des Gymnasiums viel besser sein würden, als sie als Schüler der Hauptschule.

–          Manche Hauptschüler drückten ihre Unmotivation aus, indem sie sinngemäß sagten: Sollen doch die Gymnasiasten die Tests machen, die können das doch eh alles besser.

–          An allen Schulformen traten Schüler auf, die sich mit der Beantwortung der Tests auf eine besonders satirisch-kreative Weise, teilweise diametral den erwartbaren Ergebnissen entgegen laufend, befassten. Sie taten dies einerseits aus Protest oder andererseits als Spiel und Selbstbehauptung für spätere Prahlerei mit anderen Schülern.[113]

Diese Erfahrungen, die sowohl in der Theorie begründbar sind, als auch vor Ort bestätigt wurden, zeigen: Die Ergebnisse und Antworten in den Tests geben nicht zwangsweise wieder, was ein Schüler wirklich kann. Die Einflussfaktoren, die auf die Motivation, den Test überhaupt ernsthaft zu bearbeiten, einwirken, können kaum realistisch eingeschätzt werden.

Zu dieser grundsätzlichen und kaum beherrschbaren Problematik, die eher psychometrischer Natur ist, kommt eine ganz praktische: Auch auf der Auswertungsseite sitzt ein Mensch. Die Kodierer sind ebenso wenig, wie die Schüler, die standardisierte Test bearbeiten, frei von bestimmten psychischen Konstitutionen, angefangen bei der eigenen Konzentrationsfähigkeit bis hin zu der teilweise recht schwierigen Aufgabe, uneindeutige Ergebnisse mit der binären Kodierung „richtig“ oder „falsch“ zu erfassen. Ein Kodierer sei meistens ein schlecht bezahlter Student – behauptet Wolfram Meyerhöfer in seiner Betrachtung der Testfähigkeit von Mathematik-Aufgaben in TIMSS und PISA.[114] In der Tat liegt hier eines der wesentlichen Probleme standardisierter Leistungstest, beziehungsweise eine ihrer für Fehler anfälligen Stellen. Die Auswertung der Tests ist eine Aufgabe, die viel Zeit und Ressourcen beansprucht. Es sind in der Regel nicht die Aufgabenentwickler selbst, die anhand von Code-Büchern in einem anstrengendem Prozess die Antworten auf dem, teilweise schlecht lesbaren, Fragebogen in richtig oder falsch einsortieren, sondern in der Tat studentische Hilfskräfte[115]. Die Codierung ist binär, es gibt nur Null oder Eins zu verteilen, richtig oder falsch; keine Teilpunkte.

V.4. Spannungsfeld: Systemvielfalt, Segregation und Standardisierung

Wie bereits weiter oben beschrieben, besteht in Deutschland eine sehr große föderale Vielfalt an unterschiedlichen Ausgestaltungen des Bildungssystems. Nicht nur, dass keine einheitliche Bewertungsgrundlage für weitergehende, die tertiäre Bildungswege vorhanden ist. Im Moment, und auch im Zusammenhang mit den nach PISA lautgewordenen Rufen nach Veränderungen in der Struktur des Bildungssystems, gehen viele Bundesländer eigene und sehr individuelle Wege, diese umzubauen. Betrachtet man jeden dieser Wege als ein Experiment mit offenem Ausgang, so ergeben sich allein daraus schon größere Probleme für eine Konstruktion von Bildungsstandards, die in zwei Richtungen wirken:

  1. Wie schwierig ist es für die Bundesländer und ihre Kultusministerien, unvoreingenommen und frei neue Methoden in a) der Lehrerausbildung und -Expertise, b) Unterrichtsgestaltung und c) Segregationspraxis oder neu: gemeinschaftlichen Lernens zu wagen, da gerade am Anfang stehende und neu beginnende Projekte oft fehleranfälliger sind, als die alten Methoden und traditionellen Herangehensweisen an Schulen. Wenn ein Bundesland neue Wege zu gehen wagt, wie dies beispielsweise in Berlin der Fall ist, und gleichzeitig in Lernstandserhebungen wie VERA schlecht abschneidet, kann dies hinderlich für die Weiterentwicklung des Weges sein. Gerade Berlin hat gezeigt, dass Medien und einige Wissenschaftler auf der Basis von VERA nach nur drei Jahren des Probierens eines anderen Weges schnell zur Stelle waren, diesen Weg in seiner Gesamtheit als grundfalsch zu verdammen.

 

  1. Ist es für das Anliegen eines einheitlichen Standards schwierig, diese jeweils sehr speziellen Situationen angemessen zu berücksichtigen, will man aussagekräftige Fakten zur tatsächlichen Entwicklung der Qualität in deutschen Schulen haben. Standards und ihre Rückkopplung an Bildungsmonitoring (vgl. Kap I.1.) brauchen um wirklich gut interpretierbar zu sein auch eine gewisse Stabilität der äußeren Umstände in den Einzelschulen vor Ort, die mehrere Kohorten übergreifen sollte, um valide und reliabel zu sein.

V.5. Welcher Bildungsbegriff ?

Welchen Begriff von Bildung hat eine Gesellschaft, die per Standards diese jene verbessern will? Im politischen, gesellschaftlichen und medialen Diskurs werden die Begriffe „Bildung“ und „Kompetenzen“ semantisch kaum mehr voneinander getrennt – sie sind zu synonymen avanciert. Bildungsstandards erfassen Kompetenzen und das bleibt nicht ohne Folgen. Regina Klein und Susanne Dungs setzen die Orientierung der Bildungspolitik am Konzept der Kompetenz in direkten Zusammenhang mit der Konzeption von Bildungsstandardisierung und weisen mit Bourdieu nach, dass beide eine Ideologie verkörpern, die – so könnte vermutet werden – vor allem der Rechtfertigung sozial Privilegierter dient. Im Umkehrschluss kommt Bourdieu, und dem schließen sich Klein und Dungs an, zu der Erkenntnis, dass Inkompetenz als Kehrseite, die mit Dummheit und Unfähigkeit verknüpft sind, mit Bildungsstandards nicht nur durch eine optimierende Strategie verbessert werden soll, sondern vielmehr auch als Soziodizee, als Rechtfertigung von Klassenunterschieden in der Gesellschaft wirken können.[116]

Zu Beginn der Arbeit wurde anhand der Erläuterung und Geschichte der beiden Begriffe Bildung und Standard die Frage aufgeworfen: „Beißen“ sich Bildung und Standard nicht? Der Bildungsbegriff Humboldts erscheint manchen Menschen heute nicht mehr angemessen. Stattdessen sprechen die an Bildungspolitik maßgeblich beteiligten Personen und Institutionen lieber von „Kompetenzen“. Dies erscheint im Gesamtzusammenhang auch der bessere Begriff, denn Bildung – an dieser Minimaldefinition sollte festgehalten werden – ist mehr als nur einzelne Fähigkeiten, Kompetenzen oder der Erwerb von Fachwissen. Bildung umfasst die Wechselwirkung zwischen einem Individuum mit seiner (Um-)Welt und den sich daraus ergebenden Veränderungen im kognitiven, aber auch emotionalen geistigen Zustand der Menschen. In diesem Sinne ist sie nicht standardisierbar.

VI. Diskussion und Ausblick

Können Bildungsstandards bildungstheoretisch legitimiert werden? Welche Bedingungen müssen dafür erfüllt sein? Und welche Kritik muss aus den Erziehungswissenschaften an bildungspolitische Akteure formuliert werden?

Die OECD hat mit PISA vorgelegt: Durch die Konzeption der Aufgaben, die in der Mathematik auf dem Gedanken der „Mathematical Literacy“ beruht, wurden implizit Standards mitgeliefert. In Deutschland wurden die offiziellen Bildungsstandards nach diesem Modell entworfen. Die Weltbank hat mit ihrem Programm „Education for all“ vorgesehen, dass Standards, offizielle nationale Lernziele durch eine gezielte Regierungspolitik geschaffen werden müssten. In ihrem Rahmenkonzept[117], das als universell anwendbar, für alle Länder der Welt, angesehen wird, spielen Standards eine wichtige Rolle. Die beiden Beispiele England und Schweden, die in ihrer Geschichte sowie Gegenwart zwar beide eine lange Tradition bei der Nutzung des Instruments haben wurde deutlich: Die nationalen und kulturellen Kontexte beeinflussen die Bildung und Bildungspolitik so stark, dass ein für alle gültiges Konzept, so formuliert es auch Tabulawa[118] (Vgl. Kapitel V.1.), nicht funktionieren kann. Neben den verschiedenen negativen Folgen, wie sie gerade für England aufgezeigt werden konnten, spielen die Akteure vor Ort, die Organisationskultur und die Berücksichtigung der kulturellen und sozialen Gegebenheiten eine entscheidende Rolle. Besonders deutlich wurde diese Tatsache an der Situation in Deutschland: Die Verschiedenheiten und Bedürfnisse der 16 Bundesländer, die ja alle zu einer Gesellschaft, einer Nation gehören, stellen schon erhebliche Probleme bei der Konzeption von Standards sowie ihrer Überprüfung durch Bildungsmonitoring dar.

Die vorliegende Arbeit hat gezeigt, dass Bildungsstandards zwar gesellschaftlich und politisch eine breite Anerkennung erfahren, man aber vor einer übereilten und vor allem rein politischen oder ökonomischen Orientierung bei der Nutzung des Instruments warnen muss. Bildung und Standard sind zwei Begriffe, die qua definitionem nicht ohne Schwierigkeiten zusammen gehen. Sie sind einander im Widerspruch. Bildung gedacht mit Humboldt, Kerschensteiner, Dueck und Benner ist nicht standardisierbar. Lediglich Kompetenzen lassen sich messen, vergleichen. In der Mathematik kann gemessen werden, ob ein Schüler es in einer sehr speziellen Test-Situation, mit all seinen bildungs-habituellen Voraussetzungen und in der jeweiligen Lehrer-Schüler-Beziehung verhaftet (denn bei VERA führen die Lehrer die Tests durch) schafft, die erforderten Rechenergebnisse zu liefern. Ein Kreuz an der richtigen Stelle, die richtige Zahl hingeschrieben, allenfalls der richtige Rechenweg geschildert – das sind die einzigen drei Ergebnis-Möglichkeiten, die in einem standardisiertem Test abfragbar sind. Es ist hoch formalisiert.

Dueck richtet sich gegen eine Feststellung von rein formalen Mathematik-Leistungen anhand von Rechenergebnissen. Er fordert stattdessen mündliche Prüfungen, da nur bei solchen feststellbar sei, wie gut ein Schüler in mathematischem Denken sei. Dueck ist im Präsidium der Deutschen Mathematiker-Vereinigung. „Nicht ausrechnen, sondern denken, auch in der Schule!“ lautet seine Devise.  Als er daraufhin von Kollegen gefragt wurde, wie dies konkret umzusetzen sei, sagte er: „Ich will, dass die Ministerien anordnen, dass alle Mathematikprüfungen im Gymnasium mündlich sind, alle Vierteljahr eine halbe Stunde, sonst nichts.“[119] Ist diese Forderung utopisch, weltfremd und angesichts der Rechtfertigungsfunktion von Evaluationen und der Qualitäts-entwickelnden Aufgabe von Bildungsstandards von der Hand zu weisen?

Die verschiedenen Aspekte, die in der vorliegenden Arbeit über die schwierige Beziehung von Bildung und Standardisierung, von Heterogenität und Normierung, von kulturellen und traditionellen Kontexten und universellen Konzepten analysiert wurden, zeigen: Das Setzen von Standards und ihre Überprüfung in ebenso standardisierten Tests bleibt nicht ohne Folgen auf a) ein lernendes Subjekt, b) die Institution Schule und die in ihr lehrenden Professionen sowie c) die Bildungskultur einer gesamten Gesellschaft. Der Diskurs begann, wie gezeigt wurde, sich bereits in den 80er Jahren in Richtung Ökonomisierung der Bildung zu wenden; PISA, TIMSS und nun VERA sind allesamt Instrumente, die der empirischen Bildungsforschung einerseits wichtige Einblicke in die Fakten vor Ort, in den Schulen und über die Lernstände der Schüler geben und die, das zeigte eine Analyse der Ergebnisse von PISA 2000, die eine starke soziale Schieflage in den Bildungschancen in Deutschland ans Tageslicht brachten, eine Gesellschaft auch hinsichtlich ihrer Versäumnisse wachrütteln kann. Wie im Abschnitt über die Geschichte der Bildungsstandards in Deutschland gezeigt wurde, könnte ein Zusammenhang zwischen der philosophisch-geistigen Orientierung der hiesigen Pädagogik, die mit einer Ablehnung von standardisierten Tests einhergeht, und einer Weigerung der sozialen Öffnung bestehen.[120] In Zeiten, in denen sich Bildung für alle öffnet, ungeachtet der Herkunft, müssen Zugänge zu höherer Bildung geregelt werden – standardisierte Tests liegen daher auf der Hand. Wer sich dem verweigert, der lässt jene Mechanismen weiter wirken, in denen oft unbewusst die Herkunft der Schüler einen größeren Einfluss auf ihren Bildungsweg haben, als ihre tatsächlichen Leistungen. PISA hat den Deutschen vor Augen gehalten, dass ein Akademiker-Kind mit deutlich weniger Kompetenzpunkten eine Gymnasialempfehlung durch seine Lehrer erhalten wird, als ein Kind aus schlechteren sozio-ökonomischen Verhältnissen. Es besteht eine Legitimationspflicht. Oder die Wege müssen für alle geöffnet werden, die Selektion neu überdacht. Eine Legitimation qua Bildungsstandards allerdings kann nur greifen, wenn diese selbst in sich bildungstheoretisch legitimierbar sind.

Nun hat es nicht nur eine Debatte über die Verbesserungswürdigkeit des deutschen Bildungssystems gegeben, sondern langsam beginnt sich auch eine Diskussion darüber zu entfalten, in wie weit die geschaffenen Instrumente, die angetreten sind, die Qualität der Bildung zu verbessern, geeignet dafür sind. Tests und Standards, das konnte mit Dueck, Klein und anderen verdeutlicht werden, verengen den ursprünglichen Bildungsbegriff. Mit Humboldt gesprochen, wird die Wechselwirkung des Subjekts mit der Welt und der Kultur nicht mehr als das zentrale Element wahrgenommen, sondern hinter messbare, klassifizierbare und – mit Dueck gesprochen – „richtige“ Ergebnisse von Lernstandserhebungen nahezu von der Oberfläche des medialen, politischen und leider auch wissenschaftlichen Diskurses verdrängt. Dieser Eindimensionalität des Bildungsbegriffs kann, auch das zeigen Dueck und Klein, entgegen gewirkt werden. Das impliziert nicht notwendiger Weise, dass Kompetenz-Standards (eine Umbenennung des Instruments weg vom eigentlich falschen Begriff der „Bildung“ hin zu dem, was wirklich gemessen wird: Kompetenz könnte ein erster wichtiger Schritt für die folgende Auseinandersetzung mit dem Thema sein) völlig abgeschafft werden sollen. Aber sie müssen um eine grundlegendere, allgemeinpädagogische Evaluierung erweitert werden. Das Ohr der an politischen Entscheidungen beteiligten, der KMK und der Bundesbildungsministerin, gehört aktuell in erster Linie den Empirikern. Diejenigen, die allgemeinpädagogisch, philosophisch und anthropologisch die Weiterentwicklung der Gesellschaft betrachten und denken[121] werden dieser Sicht untergeordnet, was der Nicht-Hierarchizität der gesellschaftlichen Praxen nach Benner grundlegend widerspricht. Pädagogik, Bildung und Erziehung müssen nach ihm mit der Politik und der Wirtschaft auf Augenhöhe stehen. Weder darf sich die Politik bloß aufgrund ihrer eigenen Interessen (Sparen, internationaler Wettbewerb, Rechenschaftslegung etc…), noch darf sich die Wirtschaft als „ranghöher“ in der Reihe der gesellschaftlichen Praxen in die Bildung einmischen. Eine materiale Bildung ist abzulehnen – ebenso wie eine formale. Natürlich muss das Individuum durch die Schule auf das Leben in der Gesellschaft vorbereitet werden. Doch eine Unterordnung muss dabei vermieden werden. Benner nennt dazu die zwei zentralen Wege, die auch in der Konzeption von Bildungsstandards, gegangen werden müssen:

  1. Die Anerkennung der Bildsamkeit der Schüler
  2. Die Nicht-Hierarchizität der gesellschaftlichen Praxen

Konkret bedeutet dies, dass wie oben beschrieben die Pädagogik Freiräume benötigt, in denen sie keinen Druck von Politik und Wirtschaft erfährt, ein bestimmtes „Produkt liefern“ zu müssen. Noch ist Deutschland nur in manchen Bundesländern auf einem solchen Pfad: Überall dort, wo begonnen wird, die Schulen in Rankings zu stellen; überall dort, wo die Ergebnisse von VERA (oder anderer Leistungs-Tests) dazu instrumentalisiert werden, politische Grabenkämpfe zu führen. In England ist man längst weiter: Schulen, die nicht effizient und effektiv genug sind, werden sanktioniert – eine eindeutige Unterordnung der Bildung unter Politik und Wirtschaft.

Die Anerkennung der Bildsamkeit der Individuen ist nur möglich, indem vor Ort, in den Lehr-Lern-Situationen, die entsprechenden Voraussetzungen geschaffen werden: In Schulen, in den Kollegien. In der direkten Interaktion zwischen den gemeinten Individuen mit ihrer Umwelt. Das schließt eine Evaluierung nicht aus. Aber es wird notwendig, sie durch eine neue Herangehensweise an das Lernen und Lehren zu ergänzen. Gibt man jenen einen Raum, ihre Stimme zu erheben, die Bildung als das von Humboldt konzipierte Wachsen des Menschen in der subjektiv gestalteten Auseinandersetzung mit der Welt sehen, eröffnen sich neue Bedeutungsräume, kreative und mit großem Potential für Transformation ausgestattete Entwicklungsprozesse und beinahe utopische Bildungsräume. Diesen zugrunde liegt nach Klein ein „prozessualer und hybrider Kulturbegriff“[122]. Es funktioniert nicht nach einem universalistischen Plan, der unabhängig von Kontingenzen für alle Gesellschaften, Kommunen, Lehr-Lern-Orte und Subjekte zu gelten hat. Einen solchen Entwurf findet man bislang am ehesten (und das paradoxer Weise, für jene Fundamentalkritiker der testbasierten Schul-Entwicklung) in Ländern wie Finnland verwirklicht: Dort werden seit einer Regierungsreform des Jahres 1968 bis zur neunten Klasse alle Schüler gemeinsam mit für alle geltenden Lernzielen unterrichtet.[123] In einem komplizierten Netz aus Lehrern, Psychologen, Sportangeboten und Gesundheitsangeboten sind Schulen in Finnland viel mehr als bei uns Orte des Lebens. Indem die Schulen dort all diese Angebote an alle Schüler machen, und das müssen sie nach staatlicher Vorschrift, wird ihre Herkunft weniger bedeutsam; finnische Schule soll so inklusiv wie möglich sein; sie soll alle mitnehmen. Der oberste Grundsatz dabei ist: „Du sollst deine Schüler nicht beschämen.“ Auch in Finnland gibt es ein National Core Curriculum, das zentrale Lernziele formuliert. Im Unterricht selbst aber bestimmen die Schüler selbst ihr Lerntempo, ihren Stoff und ihren Rhythmus – freier Unterricht ist die Regel; offene Klassen sind Standard.[124] Standards und die Anerkennung freier Bildsamkeit müssen kein Widerspruch sein. Es kommt auf die Interaktion vor Ort an.

In diesem Sinne können Bildungs- oder Kompetenzstandards durchaus bildungstheoretisch und erziehungswissenschaftlich legitimiert werden. Es ist möglich, dass sie die beiden oben genannten Bedingungen erfüllen. Dazu ist es unerlässlich, dass der pädagogischen Praxis ihre Gleichwertigkeit zugestanden wird: Die Schulentwicklung darf nicht von Oben und als politisches Machtinstrument betrieben werden – sie muss die Akteure vor Ort und die kontextabhängige Kultur berücksichtigen. Zudem kann die freie und unbestimmte Bildsamkeit der Schüler geachtet werden, indem man die durchgeführten Tests nicht als Kontroll- und Druckmittel benutzt, sondern als Standortbestimmungs-Instrument mit der freien Möglichkeit verbunden, als Schüler den weiteren Bildungsweg selbst und frei zu bestimmen.


Literaturverzeichnis

Brockhaus Enzyklopaedie in vierundzwanzig Baenden (1986-c1996). 19., voellig neu bearbeitete Aufl. Mannheim: F.A. Brockhaus. Online verfügbar unter http://www.worldcat.org/oclc/233679909.

Brockhaus-Enzyklopädie. In 24 Bänden (1991). 19. völlig neu bearbeitete Auflage. Wiesbaden [u.a.]: Brockhaus (Fünfzehnter Band). Online verfügbar unter http://www.worldcat.org/oclc/634982857.

Dokumentation zum Symposion „Lernen aus Evaluationsergebnissen – Verbesserungen planen und implementieren“. im Rahmen der didacta – die Bildungsmesse 20. und 21.02.2008, Stuttgart (2008). Stuttgart, 21.02.2008. Stuttgart. Online verfügbar unter http://www.vds- bildungsmedien.de/veranstaltungen/symposien-zur-didacta/symposien-2008- dokumentation/dokumentation-symposion-2008-evaluation.pdf.

Baumert, Jürgen (2001): Pisa 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich. Rev. Nachdr. der Erstausg. Opladen: Leske + Budrich.

Baumert, Jürgen; Gogolin, Ingrid; Scheunpflug, Annette (2011): „Transforming education“. Large- scale reform projects and their effects – German an international experience. In: Ingrid Gogolin, Jürgen Baumert und Annette Scheunpflug (Hg.): Transforming education. Large- scale reform projects in education systems and their effects = Umbau des Bildungswesens : bildungspolitische Großreformprojekte und ihre Effekte. Wiesbaden: VS Verl. für Sozialwiss (Sonderheft, 13), S. 1–8.

Benner, Dietrich (2001): Allgemeine Pädagogik. Eine systematisch-problemgeschichtliche Einführung in die Grundstruktur pädagogischen Denkens und Handelns. 4., völlig neu bearb. Weinheim: Juventa. Online verfügbar unter http://www.worldcat.org/oclc/47702738.

Beschlüsse der Kultusministerkonferenz (04.12.2003): Bildungsstandards im Fach Mathematik für den Mittleren Schulabschluss, vom 1. Online verfügbar unter http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2003/2003_12_04- Bildungsstandards-Mathe-Mittleren-SA.pdf, zuletzt geprüft am 07.08.2011.

Beschlüsse der Kultusministerkonferenz (15.10.2004): Bildungsstandards im Fach Mathematik für den Hauptschulabschluss, vom 1. Online verfügbar unter http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2004/2004_10_15- Bildungsstandards-Mathe-Haupt.pdf, zuletzt geprüft am 07.08.2011.

Beschlüsse der Kultusministerkonferenz (15.10.2004): Bildungsstandards im Fach Mathematik für den Primarbereich, vom 1. Online verfügbar unter http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2004/2004_10_15- Bildungsstandards-Mathe-Primar.pdf, zuletzt geprüft am 07.08.

Blum, Werner (Hg.) (2006): Bildungsstandards Mathematik: konkret. Sekundarstufe I: Aufgabenbeispiele, Unterrichtsanregungen, Fortbildungsideen. 1. Aufl. Berlin: Cornelsen Verlag Scriptor.

Bodin, Antoine (2007): What does PISA Really Assess? What Does It Not? A French View. In: Stefan Hopmann, Gertrude Brinek und Martin Retzl (Hg.): PISA zufolge PISA. Hält PISA, was es verspricht? = PISA according to PISA : does PISA keep what it promises? Wien: Lit, S. 21–43.

Bohl, Thorsten (Hg.) (2009): Lernen aus Evaluationsergebnissen. Verbesserungen planen und implementieren. Bad Heilbrunn: Klinkhardt. Online verfügbar unter http://www.worldcat.org/oclc/416445679.

Chabbot, Colette (1998): Constructing Educational Consensus: International Development Professionals and the World Conference on Education for All. In: Int. J. Educational Development Vol. 18, (3), S. 207–218.

Holm, Daniela: Normierung und Illustrierung der Bildungsstandards für das Fach Mathematik (Hauptschulabschluss / Mittlerer Schulabschluss). Unter Mitarbeit von Christiane Penk und Alexander Roppelt. Hg. v. Institut zur Qualitätsentwicklung im Bildungswesen. Online verfügbar unter http://www.iqb.hu-berlin.de/arbbereiche/projekte/projekte?pg=p_8, zuletzt geprüft am 30.08.2011.

Deutscher Bildungsrat (Hg.) (1970): Begabung und Lernen. Unter Mitarbeit von Heinrich Roth. Deutscher Bildungsrat. 5. Aufl. Stuttgart: Ernst Klett Verlag (Gutachten und Studien der Bildungskommission, 4).Dueck, Gunter (2003): Supramanie. Vom Pflichtmenschen zum Score-Man. 1. Aufl. Berlin: Springer-Verlag GmbH & Co. KG. Online verfügbar unter http://www.worldcat.org/oclc/53431093.

Dust, Martin (Hg.) (2010): ˜“Derœ vermessene Mensch“. Ein kritischer Blick auf Messbarkeit, Normierung und Standardisierung. Frankfurt am Main ˜[u.a.]œ: Lang. Online verfügbar unter http://www.worldcat.org/oclc/707923265.

DWDS-Projekt, Berlin-Brandenburgische Akademie der Wissenschaften (2011): Standard. Online verfügbar unter http://www.dwds.de/?kompakt=1&qu=Standard, zuletzt aktualisiert am 06.06.2011, zuletzt geprüft am 10.08.2011.

Eder, Ferdinand; Gastager, Angela; Hofmann, Franz (Hg.) (2006): Qualität durch Standards? Beiträge zum Schwerpunktthema der 67. Tagung der AEPF. Deutsche Gesellschaft für Erziehungswissenschaft; Tagung der AEPF. Münster ;, München [u.a.]: Waxmann.

Farrell, Joseph; Saloner, Garth (1985): Standardization, Compatibility, and Innovation. In: The RAND Journal of Economics 16 (1), S. 70–83. Online verfügbar unter http://www.jstor.org/stable/2555589.

Gogolin, Ingrid; Baumert, Jürgen; Scheunpflug, Annette (Hg.) (2011): Transforming education. Large-scale reform projects in education systems and their effects = Umbau des Bildungswesens : bildungspolitische Großreformprojekte und ihre Effekte. Wiesbaden: VS Verl. für Sozialwiss (Sonderheft, 13).

Hammermeister, Juliane (2010): Die Sache mit den Schlüsselkompetenzen. Kritische Anmerkungen zum OECD-Kompetenzmodell. In: Martin Dust (Hg.): ˜“Derœ vermessene Mensch“. Ein kritischer Blick auf Messbarkeit, Normierung und Standardisierung. Frankfurt am Main ˜ [u.a.]œ: Lang, S. 87–95.

Hanhimäki, Eija (2011): Moral Professionalism in Interaction. Educators‘ Relational Moral Voices in Urban Schools. Münster, Westf: Waxmann. Online verfügbar unter http://www.worldcat.org/oclc/723396128.

Herbrechter, Dörthe; Schwankl, Claudia (2009): Kultursteuerung im Kontext von Schule und Organisation. In: Ute Lange (Hg.): Steuerungsprobleme im Bildungssystem. Festschrift für Klaus Harney. 1. Aufl. Wiesbaden: VS, Verl. für Sozialwiss, S. 101–116.

Herzberg, Heidrun (2004): Lernhabitus und Milieu als zentrale Dimensionen bei der Untersuchung lebenslanger Lernprozesse. In: REPORT 27, 2004 (1), S. 38–44, zuletzt geprüft am http://www.die-bonn.de/doks/herzberg0401.pdf.Hopmann, Stefan; Brinek, Gertrude; Retzl, Martin (Hg.) (2007): PISA zufolge PISA. Hält PISA, was es verspricht? = PISA according to PISA : does PISA keep what it promises? Wien: Lit. Online verfügbar unter http://www.worldcat.org/oclc/289108407.

Humboldt, Wilhelm von (1960): Schriften zur Anthropologie und Geschichte. 5 Bände. Hg. v. Andreas Flitner und Klaus Giel. Stuttgart: Cotta (Werke in fünf Bänden, I).

Ingenkamp, Karl-Heinz (1970): Möglichkeiten und Grenzen des Lehrerurteils und der Schultests. In: Deutscher Bildungsrat (Hg.): Begabung und Lernen. Unter Mitarbeit von Heinrich Roth. 5. Aufl. Stuttgart: Ernst Klett Verlag (Gutachten und Studien der Bildungskommission, 4), S. 407–431.

Institut zur Qualitätsentwicklung im Bildungswesen: VERA – Häufig gestellte Fragen. Hg. v. Institut zur Qualitätsentwicklung im Bildungswesen. Online verfügbar unter http://www.iqb.hu-berlin.de/vera/faq, zuletzt geprüft am 07.09.2011.

Institut zur Qualitätsentwicklung im Bildungswesen: Kompetenzstufenmodell zu den Bildungsstandards im Fach Mathematik für den Mittleren Schulabschluss. Online verfügbar unter http://www.iqb.hu-berlin.de/bista/dateien/Mathe_MSA.pdf, zuletzt geprüft am 23.08.2011.

Katrin Rönicke (29.08.2011): Mathematik Sekundarstufe I – die Arbeit am Institut zur Qualitätsentwicklung im Bildungswesen – VERA. […]. Institut zur Qualitätsentwicklung im Bildungswesen, Berlin.

Katrin Rönicke (30.08.2011): Normierungsstudie 2007 Mathematik Sekundarstufe I – Testleitung vor Ort. Interview mit Sven Peukert. Berlin.

Kerschensteiner, Georg (2010): Theorie der Bildung. Nachdr. der Orig.-Ausg., Leipzig und Berlin, 1931. Hamburg: Severus-Verl.

Klein, Regina (2009): Fest-Stellungen: zur Entsorgung von Reflexivität durch Kultur- und Bildungsstandards. In: Regina Klein und Susanne Dungs (Hg.): Standardisierung der Bildung auf dem Prüfstand. Zur Wechselwirkung zwischen Subjekt- und Kulturbildung. 1. Aufl. Wiesbaden: VS Verlag für Sozialwissenschaften, S. 29–54.Klein, Regina; Dungs, Susanne (2009): Einleitende Bemerkungen zur Standardisierung der Ressource Mensch. In: Regina Klein und Susanne Dungs (Hg.): Standardisierung der Bildung auf dem Prüfstand. Zur Wechselwirkung zwischen Subjekt- und Kulturbildung. 1. Aufl. Wiesbaden: VS Verlag für Sozialwissenschaften, S. 7–23.

Klein, Regina; Dungs, Susanne (Hg.) (2009): Standardisierung der Bildung auf dem Prüfstand. Zur Wechselwirkung zwischen Subjekt- und Kulturbildung. 1. Aufl. Wiesbaden: VS Verlag für Sozialwissenschaften. Online verfügbar unter http://www.worldcat.org/oclc/611191049.

Klieme, Eckhard (2006): Bildungsstandards als Instrument zur Harmonisierung von Leistungsbewertungen und zur Weiterentwicklung didaktischer Kulturen. In: Ferdinand Eder, Angela Gastager und Franz Hofmann (Hg.): Qualität durch Standards? Beiträge zum Schwerpunktthema der 67. Tagung der AEPF. Münster ;, München [u.a.]: Waxmann.

Ständige Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (07.08.2011): Überblick. Bundesweit geltende Bildungsstandards. Bonn. Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland, Graurheindorfer Str. 157. Online verfügbar unter http://www.kmk.org/bildung- schule/qualitaetssicherung-in-schulen/bildungsstandards/ueberblick.html, zuletzt geprüft am 07.09.2011.

Köller, Olaf (2009): Soziale Disparitäten in PISA-I und PISA-E. Vorlesung Einführung in der international. Institut zur Qualitätsentwicklung im Bildungswesen. Berlin. Online verfügbar unter http://www.iqb.hu-berlin.de/lehre/dateien/120109.pdf, zuletzt geprüft am 23.08.2011.

Koretz, Daniel (2011): Lessons from test-based education reform in die U.S. In: Ingrid Gogolin, Jürgen Baumert und Annette Scheunpflug (Hg.): Transforming education. Large-scale reform projects in education systems and their effects = Umbau des Bildungswesens : bildungspolitische Großreformprojekte und ihre Effekte. Wiesbaden: VS Verl. für Sozialwiss (Sonderheft, 13), S. 9–24.

Kotthoff, Hans-Georg (2003): Bessere Schulen durch Evaluation? Internationale Erfahrungen. Münster [u.a.]: Waxmann. Online verfügbar unter http://www.worldcat.org/oclc/249176809.

Bildungsstandards für Mathematik. Gymnasium – Klassen 6, 8, 10 Kursstufe. Online verfügbar unter http://www.bildung-staerkt- menschen.de/service/downloads/Bildungsstandards/Gym/Gym_M_bs.pdf, zuletzt geprüft am 23.08.2011.Bildungsstandards für Mathematik. Realschule Klassen 6,8,10. Online verfügbar unter http://www.bildung-staerkt- menschen.de/service/downloads/Bildungsstandards/Rs/Rs_M_bs.pdf.

Lange, Ute (Hg.) (2009): Steuerungsprobleme im Bildungssystem. Festschrift für Klaus Harney. 1. Aufl. Wiesbaden: VS, Verl. für Sozialwiss. Online verfügbar unter http://www.worldcat.org/oclc/466130954.

Link, Jürgen (2006): Versuch über den Normalismus. Wie Normalität produziert wird. 3., erg., überarbeitete und neu gestaltete Aufl. Göttingen: Vandenhoeck & Ruprecht.

Max-Planck-Institut für Bildungsforschung: Internationales und nationales Rahmenkonzept für die Erfassung von mathematischer Grundbildung in PISA. Online verfügbar unter http://www.mpib- berlin.mpg.de/Pisa/KurzFrameworkMaths.pdf, zuletzt geprüft am 23.08.2011.

Meyerhöfer, Wolfram (2007): Testfähigkeit – Was ist das? In: Stefan Hopmann, Gertrude Brinek und Martin Retzl (Hg.): PISA zufolge PISA. Hält PISA, was es verspricht? = PISA according to PISA : does PISA keep what it promises? Wien: Lit, S. 57–92.

OECD (2008): Bildung auf einen Blick 2008: OECD-Indikatoren. Zusammenfassung in Deutsch. Paris, France. Online verfügbar unter http://www.oecd.org/dataoecd/16/8/41261663.pdf.

Ofsted, Office for Standards in Education England. Online verfügbar unter http://www.ofsted.gov.uk/about-us.

Peters, Susan J. (2004): INCLUSIVE EDUCATION: AN EFA STRATEGY FOR ALL CHILDREN. Hg. v. WORLD BANK. Online verfügbar unter http://siteresources.worldbank.org/EDUCATION/Resources/278200- 1099079877269/547664-1099079993288/InclusiveEdu_efa_strategy_for_children.pdf, zuletzt geprüft am 14.09.2011.

Schneewind, Julia; Kuper, Harm (2009): Rückmeldeformate und Verwendungsmöglichkeiten der Ergebnisse aus zentralen Lernstandserhebungen. In: Thorsten Bohl (Hg.): Lernen aus Evaluationsergebnissen. Verbesserungen planen und implementieren. Bad Heilbrunn: Klinkhardt, S. 113–129.Schulte, Jürgen (2011): Offener Brief zu VERA 3/2011 an Senator Prof. Dr. Zöllner. Initiative „Grundschulen im sozialen Brennpunkt“. Hg. v. Ahornstr 5. 10787 Berlin GEW-Berlin. GEW Berlin. Berlin. Online verfügbar unter http://www.gew- berlin.de/documents_public/Vera3_OB.pdf, zuletzt geprüft am 07.09.2011.

Selter, Christoph (2005): VERA Mathematik 2004: VERbesserungsbedürftige Aufgaben! In: Grundschule aktuell (89), S. 17–20.

Sjøberg, Svein (2007): PISA and „Real Life Challenges“: Mission Impossible? In: Stefan Hopmann, Gertrude Brinek und Martin Retzl (Hg.): PISA zufolge PISA. Hält PISA, was es verspricht? = PISA according to PISA : does PISA keep what it promises? Wien: Lit, S. 203–224.

Spiewak, Martin (2011): „So war der Test nicht gemeint“. Die Vergleichsarbeiten (Vera) an Grundschulen sind in die Kritik geraten. Ein Gespräch mit Hans Anand Pant, der sie entwickelt hat. In: Die Zeit 2011, 26.05.2011 (22). Online verfügbar unter http://www.zeit.de/2011/22/C-Interview-Pant, zuletzt geprüft am 07.09.2011.

Stechow, Elisabeth von (2004): Erziehung zur Normalität. Eine Geschichte der Ordnung und Normalisierung der Kindheit. 1. Aufl. Wiesbaden: VS Verl. für Sozialwiss.

Stubenrecht, Werner Scholze (1999): Brockhaus-Enzyklopädie. 19., völlig neu bearb. Mannheim: Brockhaus.

Tabulawa, Richard (2003): International Aid Agencies, Learner-Centred Pedagogy and Political Democratisation: A Critique. In: Comparative Education Vol. 39 (1), S. 7.26. Online verfügbar unter http://www.jstor.org/stable/3099628.

Tenorth, Heinz-Elmar (2009): Bildungsarmut als Herausforderung moderner Allgemeinbildung. In: Ute Lange (Hg.): Steuerungsprobleme im Bildungssystem. Festschrift für Klaus Harney. 1. Aufl. Wiesbaden: VS, Verl. für Sozialwiss, S. 155–173.

Waldow, Florian (2010): Die internationale Konjunktur standardisierter Messungen von Schülerleistung in der ersten Hälfte des 20. Jahrhunderts und ihr Niederschlag in Deutschland und Schweden. In: Martin Dust (Hg.): ˜“Derœ vermessene Mensch“. Ein kritischer Blick auf Messbarkeit, Normierung und Standardisierung. Frankfurt am Main ˜ [u.a.]œ: Lang, S. 75–95.

 


[1] Das Institut zur Qualitätsentwicklung im Bildungswesen (IQB)

[2] PISA steht für Programme for International Student Assessment

[3] Für das Fach Mathematik geteilt in drei verschiedene Beschlüsse: {Beschlüsse der Kultusministerkonferenz 4.12.2003 #16}{Beschlüsse der Kultusministerkonferenz 15.10.2004 #15}{Beschlüsse der Kultusministerkonferenz 15.10.2004 #14}

[4] {Eder 2006 #13}: S. 7 f.

[5] {Kerschensteiner 2010 #20: 18–19}

[6] {Humboldt 1960 #26} S. 235

[7] „Bildungstheorien lassen sich danach unterscheiden, ob sie das konstitutive Prinzip individueller Bildsamkeit und das regulative Prinzip eines nicht-hierarchischen Verhältnissen der Einzelpraxen ausdifferenzierter Humanität berücksichtigen oder nicht.“ Konkret bedeutet dies nach Benner: „Sofern die gesellschaftlichen Aufgaben pädagogischen Handelns unter weitgehender Ausklammerung der individuellen Zweckbestimmung der pädagogischen Praxis Praxis betrachtet werden, nimmt die Bildungstheorie die Gestalt einer materialen Bildung an. Treten dagegen individuelle Zwecke unter Vernachlässigung der gesellschaftlichen Aufgaben in den Vordergrund, sprechen wir nicht von materialer, sondern von formaler Bildung.“ {Benner 2001 #21: S. 150}

[8] Bildsamkeit ist nach Benner: „eine Verhältnisbestimmung der pädagogischen Interaktion selbst und bezieht sich auf die Möglichkeit der Mitwirkung der Zu-Erziehenden an der pädagogischen Interaktion.“ Und: „Jemandem seine Bildsamkeit absprechen, hieße ihm sein Recht zur Mitwirkung an der menschlichen Gesamtpraxis, seine Menschlichkeit aberkennen.“ {Benner 2001 #21: S. 79/80}

[9] Dazu Benner: „Die Idee eines nicht-hierarchischen Ordnungszusammenhangs der menschlichen Gesamtpraxis distanziert sich von jeder Praxisordnung, welche Arbeit, Pädagogik, Ethik, Politik, Kunst und Religion in ein hierarchisches Verhältnis zueinander setzt und einer dieser Praxisformen oder einer Gruppe von ihnen den Primat gegenüber den anderen zuerkennt.“ (Ebd.: S. 124)

[10] Ebd.: S. 155/156

[11]  {Dueck 2003 #18: S. 66}

[12] {Brockhaus Enzyklopaedie in vierundzwanzig Baenden 1986-c1996 #30}: Bd. 21 S. 79

[13] {Brockhaus-Enzyklopädie 1991 #31}: Bd. 15, S. 693

[14] {Wiktionary: Standard; 2011-08-10 #32}

[15] Ebd.

[16] {DWDS-Projekt 2011-06-06 #33}

[17] Vgl. „Norm“ in {Brockhaus-Enzyklopädie 1991 #31}: Bd. 15, S. 693

[18] Etwa in Auswertungen von Vergleichsstudien wie TIMSS, PISA oder VERA – wo Durchschnitte eine zentrale Rolle zur Vergleichbarkeit spielen. Dies liegt mit Sicherheit an der zentralen Rolle, die das arithmetische Mittel für empirische Forschung im Allgemeinen spielt, so wird es auch als geeignete Schätzung für den sogenannten Erwartungswert angesehen – zumindest in einem gewissen Rahmen (es dürfen keine „Ausreißer“ in der Stichprobe vorliegen etc..). Gerade in der medialen Debatte und in der gesellschaftlichen Diskussion, die zumeist auf einem populärwissenschaftlichem Niveau geführt wird, steht zumeist die Betrachtung der Mittelwerte von Studien im Vergleich zu anderen Mittelwerten im Vordergrund – ohne die mit Sicherheit auch durchgeführten Analysen neben diesen Werten, wie eine Betrachtung der Quartile, eine Differenzierung nach bestimmten Merkmalen oder einer genaueren Analyse der Standardabweichung, der Varianz etc. näher zu diskutieren.

[19] {Link 2006 #34}: S. 20

[20] {Link 2006 #34}: S. 218 ff

[21] Ebd.: S. 185

[22] Für eine weitere kritische Betrachtung des Durchschnitts vgl. auch Kapitel V.1. und die Einwände von Gunter Dueck.

[23] {Koretz 2011 #24}: S. 10 ff

[24] Vgl.: Waldow 2010 #62

[25] Ebd.: S. 76 ff

[26] {Waldow 2010 #62}: S. 79/80

[27] Ebd.: S. 77/78

[28] Ebd.: S. 81

[29] {Ingenkamp 1970 #37}

[30] {Klieme 2006 #36}: S. 56

[31] Vgl. {Baumert 2011 #25}: S. 2 ff.

[32] Ebd.

[33] {Chabbot 1998 #52}: S. 208 ff

[34] “These organizations and the professionals that work in them play an important role in producing and enforcing global educational norms and standards. Many studying the rise of these norms and standards tend to emphasize shifts in political power, conflict, dominance, and interests among the nationstates that fund international organizations (Carnoy, 1974; Arnove, 1980; Spaulding, 1981; Berman, 1992; Samoff, 1995). This study, in contrast, looks at international development organizations as organizations, per se, and argues that organizational variables, such as resource dependence, rather than nation-state interests and dominance alone, explain much of the standardization we see in international educational conventions and declarations.” {Chabbot 1998 #52}

[35] Vgl.: {Benner 2001 #21}

[36] Vgl. {Kotthoff 2003 #39}: S. 338 ff.; ebenso: {Zymek 2009 #63}: S. 82 ff

[37] {Zymek 2009 #63}: s. 82 ff

[38] Ebd.: S. 342 ff.

[39] Vgl. {Kotthoff 2003 #39}: S. 338 ff

[40] {Ofsted  #40}

[41] {OECD 2008 #41}

[42] Es stellt sich in der Tat die Frage, ob eine intensive Evaluationskultur und die Ausgaben für das Bildungswesen in einem positiven Korrelationszusammenhang stehen – denn theoretisch wäre rein ökonomisch gesehen denkbar, dass eine Gesellschaft, die viel Geld in ihr Bildungswesen investiert, an dieses auch höhere Erwartungen hat, als eine Gesellschaft, die – wie in Deutschland der Fall – eher weniger investiert. Im Rahmen dieser Arbeit ist es nicht möglich, eine Korrelation dahingehend zu untersuchen – doch der Zusammenhang zwischen der Intensität von Schul-Evaluationen und den Ausgaben für das Bildungssystem könnte Ausgangspunkt für weitere international vergleichende Studien sein.

[43] {OECD 2008 #41}: S. 5

[44] {Sjoberg 2007 #50}: S. 203

[45] {Zymek 2009 #63}: S. 96

[46] Ebd.: S. 83/84

[47] {Dust 2010 #10}; Vgl. u.a.: {Weiß 2010 #64}, {Hammermeister 2010 #65}

[48] Vgl. {Klieme 2006 #36}: S. 55

[49] Ebd.

[50] {Baumert 2001 #38}: S. 107

[51] Ebd.: S. 116

[52] {Baumert 2001 #38}: S. 118 184, 394

[53] Ebd: S. 172

[54] Ebd.

[55] {Köller 2009 #45}

[56] Zum Einfluss des sozialen und kulturellen Kapitals auf die Ergebnisse bei PISA 2000, v.a. im Lesetest, vgl. Monika Jungbauer-Gans: {Jungbauer-Gans 2004 #46} S. 388 ff. Sie hält darin in einem Vergleich der drei PISA-Teilnehmer Deutschland, Frankreich und Schweiz fest: „dass die Leistungsergebnisse am besten durch das kulturelle Kapital und die sozioökonomische Herkunft erklärt werden[…] Das soziale Kapital bestimmt die Leistungsdifferenzen in relativ geringem Umfang und der stärkste Effekt (familiäre Unterstützung bei den Hausaufgaben) widerspricht zudem der Hypothese.“ (ebd. S. 393)

[57] Vgl.: {Koretz 2011 #24}: S. 11 ff

[58] Ebd.: S. 12

[59] Siehe hierzu: {Hopmann et. Al. 2007 #47} „PISA zufolge PISA“ ist ein Sammelband, in dem sich 18 ForscherInnen aus sieben Ländern der Frage angenommen haben, ob PISA hält, was es verspricht – mit, wie die Herausgeber in ihrem Vorwort vorwegnehmen, der ernüchternden Festellung, dass PISA eben nicht halte, was es verspreche.

[60] {Bodin 2007 #48}: S. 31

[61] {Meyerhöfer 2007 #49}: S. 58 ff

[62] Ebd.: S. 58

[63] Ebd.: S. 68

[64] Die kompletten Ausführungen zum Rahmenkonzept der OECD für die Erfassung der Mathematikleistungen im internationalen Vergleich finden sich im Internet beim {Max-Planck-Institut für Bildungsforschung  #42}

[65] {Baumert 2001 #38}: S. 139

[66] {Max-Planck-Institut für Bildungsforschung  #42}: S. 3

[67] {Institut zur Qualitätsentwicklung im Bildungswesen 29.10.2008 #44}

[68] Vgl. auch: {Blum 2006 #66}: S. 36 ff

[69] Ebd.: S. 4

[70] {Institut zur Qualitätsentwicklung im Bildungswesen 29.10.2008 #44}: S. 3

[71] {Institut zur Qualitätsentwicklung im Bildungswesen 29.10.2008 #44}: S. 3/4 – an dieser Stelle merken die Autorinnen des IQB und der Universität Kassel an, ihrer Meinung nach legitimiere dieser bildungstheoretische Hintergrund, den sie als sehr breit empfinden, die Verwendung des Wortes Bildungsstandards. In der oben bereits angerissenen Diskussion kann Bildung jedoch streng genommen nicht „geteilt“ werden. Zudem wurde herausgearbeitet, dass es eine Widersprüchlichkeit zwischen den beiden Begriffen „Bildung“ und „Standard“ gibt. Schlussendlich führen die Autoren an dieser Stelle auch keine weiteren Belege an, oder vertiefen die Diskussion weiter, wieso ihrer Meinung nach a) dieser Ansatz bildungstheoretisch besonders breit sei oder b) unter Beachtung der verschiedenen Interpretationen des Begriffs „Bildung“ die drei zu vermittelnden Grunderfahrungen der Mathematik diesen als Grundlage für die Erstellung des Kompetenzmodells legitimieren. Zudem gehen sie damit einer breiten bereits geführten Diskussion aus dem Wege, die in Kompetenzen und Bildung zwei völlig unterschiedliche Konstrukte sehen. Es bleibt daher der Eindruck, dass einerseits mit der expliziten Erwähnung dieses Satzes eine Tatsache konstatiert werden soll, die nicht belegt wird, was andererseits darauf deuten lässt, dass man der Debatte im Großen eher aus dem Weg gehen möchte.

[72] Z.B. {Tenorth 2009 #67}: S. 159

[73] Vgl. Interview […]: Siehe Anhang Seite 70 ff.; vgl.: {Institut zur Qualitätsentwicklung im Bildungswesen 29.10.2008 #44}: S. 18

[74] Vgl. Interview vom 30.08.2011 mit Herrn Sven Peukert, ehemaliger Mitarbeiter am Institut zur Qualitätsentwicklung im Bildungswesen. Siehe Anhang, S. 68

[75] Vgl. Interview […] vom 29.08.2011: Siehe Anhang Seite 70 ff.;

[76] {Institut zur Qualitätsentwicklung im Bildungswesen 29.10.2008 #44}: S. 11

[77] {Institut zur Qualitätsentwicklung im Bildungswesen 29.10.2008 #44}: S. 12

[78] {Schulte 2011 #70}: S. 1

[79] Vgl. {Zymek 2009 #63} und Kapitel II.3. dieser Arbeit

[80] {Selter 2005 #71}: S. 1/2

[81] Ebd.: S. 3

[82] Ebd.: S. 4

[83] Ebd.: S. 5

[84] Vgl. Interview […] vom 29.08.2011: Siehe Anhang Seite 70 ff.

[85] Ebd.

[86] {Schulte 2011 #70}

[87] {Dokumentation zum Symposion Lernen 2008 #58}: S. 18

[88] {Schulte 2011 #70}: S. 2

[89] Ebd.: S. 1

[90] {Spiewak 26.05.2011 #72}: S. 2

[91] Ebd.: S. 1

[92] (Tabulawa, 2003)

[93] {Klein 2009 #54}: S. 30 ff

[94] Ebd.: S. 32

[95] Ebd.: S. 38/39

[96] {Stechow 2004 #35}: S. 26/27

[97] Stechow 2004 #35}: S. 26

[98] {Dueck 2003 #18: “39”}

[99] {Dueck 2003 #18: 59}

[100] {Dueck 2003 #18: 65}

[101] {Meyerhöfer 2007 #49}: S. 88/89

[102] Vgl.: Bildungspläne des Kultusministerium Baden-Württemberg: Dort werden sukzessive die alten Bildungspläne vom neuen Konzept Bildungsstandards abgelöst. Diese orientieren sich in ihrer Konzeption und Begrifflichkeit direkt an den Bildungsstandards des IQB. In der Mathematik finden sich dort die bereits vorgestellten Kompetenzerwartungen, die anhand von Leitideen formuliert werden. {Landesbildungsserver Baden-Württemberg: Bildungsstandards für Mathematik – Realschule Klassen 6, 8, 10;   #43}{Landesbildungsserver Baden-Württemberg: Bildungsstandards für Mathematik – Gymnasium Klassen 6, 8, 10. Kursstufe  #55}

[103] Es ist meist nicht wirklich dreigliedrig, da Sonderschulen verschiedener Art nebenbei bestehen.

[104]  In diesem Zusammenhang interessant sind die Betrachtungen von Dörthe Herbrechter und Claudia Schwankl, die Schule als eine Organisation betrachten und in ihr eine ganz eigene Organisationskultur wahrnehmen. (Vgl. Herbrechter 2009 #68}: S. 102 ff). Soll nun mittels Bildungspolitik schlussendlich auch eine Einzelschule „gesteuert“ werden, muss ihnen zufolge stets auch die Kultur und das ihr zugrunde liegende sozial konstruierte Sinnsystem mitbedacht werden. Einen Schritt weiter gedacht, findet sich so eine Organisationskultur letztlich auf allen Ebenen des Prozesses der Setzung und Überprüfung von Bildungsstandards. Auch sie beinhalten ein sozial und in diesem Fall zusätzlich politisch konstruiertes Sinnsystem. Die Dynamik und die „Quasi-Evolution“, die Herbrechter und Schwankl beschreiben, wenn sie Schulentwicklung als einen der externen Steuerung nur bedingt unterworfenen Prozess beschreiben, kann und sollte man auch auf die Prozesse zwischen den oben genannten Instanzen anwenden.

[105] Vgl. Interview […] vom 29.08.2011: Siehe Anhang Seite 70 ff.

[106] {Spiewak 26.05.2011 #72}

[107] Vgl. Interview vom 30.08.2011 mit Herrn Sven Peukert, ehemaliger Mitarbeiter am Institut zur Qualitätsentwicklung im Bildungswesen. Siehe Anhang, S. 68 ff.

[108] {Institut zur Qualitätsentwicklung im Bildungswesen  #69}

[109] {Sjøberg 2007 #50}: S. 203

[110] Ebd.

[111] Ebd.: S. 223

[112] Vgl. {Herzberg 2004 #51}:  Heidrun Herzberg entwirft in ihrer Arbeit, „Lernhabitus und Milieu als zentrale Dimensionen bei der Untersuchung lebenslanger Lernprozesse“, angelehnt an den Habitusbegriff bei Bourdieu ein Konzept namens Lernhabitus, den sie folgendermaßen definiert: „Er ist Produkt inkorporierter sozialer Strukturen, zugleich aber auch das Erzeugungsprinzip biografischer Lern- und Bildungsprozesse. Mit folgenden Kategorien lässt sich der biografische Lernhabitus bei der empirischen Analyse erfassen: Bildungsaspirationen, biografische Lern- und Verarbeitungsstrategien, Deutungshoheit, Wertorientierungen, biografische Reflexivität.“ Sie beschreibt damit den direkten Einfluss von sozialer Strukturen von Schülern auf die individuellen Lernprozesse, die diese entwickeln.

[113] Vgl. Interview vom 30.08.2011 mit Herrn Sven Peukert, ehemaliger Mitarbeiter am Institut zur Qualitätsentwicklung im Bildungswesen. Siehe Anhang, S. 68

[114] {Meyerhöfer 2007 #49}: S. 84

[115] Vgl. Interview […] Anhang Seite 70 ff.

[116] {Klein 2009 #53}: S. 11

[117] {Peters 2004 #73}; Vgl. Anhang Tabelle 2.

[118] {Tabulawa 2003 #75}: S. 22

[119] {Dueck 2003 #18: 66}

[120] Vgl. {Waldow 2010 #62}

[121] Vgl. Gunter Dueck: Topothesie

[122] {Klein 2009 #54}: S. 51

[123] {Hanhimäki 2011 #74}: S. 41 ff

[124] Ebd.

 

Flattr this!

6 Gedanken zu „Bildungsstandards als universelles Instrument: Grenzen, Konflikte und Herausforderungen am Beispiel VERA in Deutschland“

  1. Habe es mir noch nicht ganz durchgelesen, deshalb erst einmal kein Kommentar zum Inhalt, aber als Diplomstudent mal eine Frage: Das reicht vom Umfang her für eine Bachelorarbeit? Wie viele Seiten waren das denn als du die Arbeit abgegeben hast?

    1. Hallo,
      habe gerade noch das PDF hochgeladen. Es waren insgesamt 77 Seiten; ohne Anhang und Literaturverzeichnis waren es 52 – mehr als 50 sollen es am EWi-Institut bei Bachelorarbeiten nicht sein.

  2. Notiz an mich: Muss mir mal die Zeit nehmen, die Arbeit zu lesen. Habe die letzten vier Jahre bei der Evaluation der Bildungsstandards (Naturwissenschaften) mitgearbeitet und zu dem Thema promoviert …

    PS: 52 Seiten sind mehr als genug. Meine MA-Arbeit hatte 65 und meine Diss 120 :)

  3. Tipp: Zuerst das Fazit lesen ;) – dann kann man sich ja überlegen, ob man wissen will, wie es zustande kam.

    mich würde deine Diss zudem interessieren. hast du am IQB gearbeitet?

  4. > mich würde deine Diss zudem interessieren

    Die Diss wird’s in Kürze auch frei im Netz zu lesen geben (muss noch letzte Änderungen in LaTeX einarbeiten).

    > hast du am IQB gearbeitet?

    Ja, bin mit der Hälfte meiner jetzigen Stelle auch immer noch dort.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.