156
Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der Volksschule Österreichischer Expertenbericht Herausgegeben von Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner PIRLS & TIMSS 2011

PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der VolksschuleÖsterreichischer ExpertenberichtHerausgegeben von Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner

PIRLS &TIMSS 2011

Page 2: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 3: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.)

PIRLS & TIMSS 2011Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der VolksschuleÖsterreichischer Expertenbericht

Leykam

Page 4: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Bundesministerium für Bildung und FrauenMinoritenplatz 5 1014 Wien

Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens Alpenstraße 1215020 Salzburg

www.bifie.at

PIRLS & TIMSS 2011. Die Kompetenzen in Lesen, Mathematik und Naturwissen-schaft am Ende der Volksschule. Österreichischer Expertenbericht. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.). Graz: Leykam 2015. ISBN 978-3-7011-8002-8Einbandgestaltung und Layout: Die Fliegenden Fische, Salzburg & Andreas Kamenik, BIFIE I Zentrales Management & Services Satz: Sandra Hechenberger, BIFIE I Zentrales Management & Services Druck: Steiermärkische Landesdruckerei GmbH, 8020 GrazVertrieb an den Buchhandel: Leykam Buchverlagsgesellschaft m. b. H. Nfg. & Co. KG www.leykamverlag.at

Kein Teil des Werks darf in irgendeiner Form (durch Fotografie, Mikrofilm oder ein anderes Verfahren) ohne schriftliche Genehmigung des Verlags reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.

Page 5: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Vorwort

Die internationalen Studien PIRLS und TIMSS beleuchten systemische Zusammenhänge des Kompetenzerwerbs durch den Vergleich mit anderen Ländern. Die Möglichkeit des System-vergleichs bietet dabei einen wichtigen Interpretationsrahmen für die Ergebnisse einzelner Länder und Bildungssysteme. PIRLS und TIMSS geben somit dem österreichischen Schul-system regelmäßig Rückmeldung darüber, wie gut es gelingt, bis zum Ende der Volksschule wesentliche Grundkompetenzen in Lesen sowie Mathematik und Naturwissenschaft zu ver-mitteln und damit einen wesentlichen Baustein für erfolgreiche Bildungskarrieren zu legen. Im Zentrum steht, Orientierungswissen für die Bildungsplanung, -steuerung, die Aus- und Fortbildung der Lehrerinnen und Lehrer sowie für die Qualitätsentwicklung zu gewinnen. Die Ergebnisse aus PIRLS und TIMSS dienen nicht der Steuerung von Einzelschulen – so wie das in Österreich die flächendeckenden Standardüberprüfungen mit Rückmeldungen für Schulen und Lehrer/innen intendieren. Sehr wohl können aber einzelne Erkenntnisse aus PIRLS und TIMSS auch für die konkrete pädagogische Arbeit am Schulstandort von Nutzen sein.

Der vorliegende Band geht verschiedenen Fragestellungen im Zusammenhang mit der Lese-, Mathematik- und Naturwissenschaftskompetenz von Kindern im Volksschulalter nach. Die Basis für die Analysen bilden vorrangig die Daten aus PIRLS und TIMSS 2011, aber auch Daten aus früheren Erhebungen dieser Studien sowie der OECD-Studie PISA. Abschnitt I widmet sich den Kompetenzen selbst – im internationalen Vergleich sowie im Längsschnitt, mit einem fokussierten Blick auf besonders leistungsstarke und besonders leistungsschwache Kinder, durch die Analyse der Schwierigkeit der einzelnen verwendeten Leseaufgaben für österreichische Kinder, aus der Perspektive der Geschlechtergerechtigkeit sowie durch eine spezifische methodische Fragestellung im Zusammenhang mit fehlenden Antworten im Test. Abschnitt II lenkt die Aufmerksamkeit auf außerschulische Rahmenbedingungen des Kom-petenzerwerbs – der Einfluss des Migrationshintergrunds auf die Schülerleistungen sowie verschiedene Faktoren familiärer Bedingungen und Unterstützung stehen hier im Mittel-punkt. Abschnitt III greift Themen des Unterrichts auf und zeigt, welche Rolle Hausauf-gaben sowie Methoden der inneren Differenzierung im Unterricht der Volksschule spielen.

Dieser Band ist vor allem das Ergebnis der Arbeit der Autorinnen und Autoren. Das Team der internationalen Studien am BIFIE unter der Leitung von Birgit Suchań und Christina Wallner- Paschon zeichnet nicht nur für die Durchführung von PIRLS und TIMSS in Österreich verantwortlich, sondern hat durch konzeptionelle, strukturelle und organisato-rische Arbeiten über verschiedene Autorengruppen hinaus wesentlich zum Entstehen dieses Buchs beigetragen. Für ihren Beitrag zur Qualitätssicherung gilt unser Dank den externen Reviewern Johann Bacher, Ferdinand Eder und Josef Thonhauser. Layout, Satz und Lektorat oblag dem Medienmanagement des BIFIE unter der Leitung von Hannes Kaschnig. Ganz besonderer Dank gebührt den Schülerinnen und Schülern, ohne deren Bereitschaft und Engagement die Durchführung von PIRLS und TIMSS 2011 nicht möglich gewesen wäre.

Salzburg, im Oktober 2015

Claudia SchreinerDirektorin des BIFIE

Page 6: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 7: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Inhalt

3 Vorwort 7 Einführung

13 I. Kompetenzen in Lesen, Mathematik & Naturwissenschaft

15 1.1 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 27 1.2 Analysen auf Itemebene in Lesen 39 1.3 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 55 1.4 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment

65 II. Familiäre und vorschulische Unterstützung

67 2.1 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 85 2.2 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 100 2.3 Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf schulische Kompetenzen

111 III. Unterricht in Lesen, Mathematik & Naturwissenschaft an Österreichs Volksschulen

113 3.1 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 127 3.2 Innere Differenzierung im Mathematikunterricht

143 Anhang

145 Anhangstabellen 151 Autorenverzeichnis

Page 8: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 9: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Einführung 7

EinführungBirgit Suchań & Christina Wallner-Paschon

Die Studien PIRLS (Progress in International Reading Lite-racy Study) und TIMSS (Trends in International Mathema-tics and Science Study) erfassen in regelmäßigen Abständen Schlüsselkompetenzen von Schülerinnen und Schülern der vierten Schulstufe1: PIRLS misst seit 2001 alle fünf Jahre die Lesekompetenz; TIMSS erhebt seit 1995 im Abstand von vier Jahren die Kenntnisse der Schüler/innen in Mathe-matik und Naturwissenschaft. Durch diesen unterschied-lichen Erhebungsrhythmus fielen PIRLS und TIMSS im Jahr 2011 erstmals zusammen. Die Teilnehmerländer hat-ten so die Möglichkeit, alle drei Kompetenzbereiche ge-meinsam bei denselben Schülerinnen und Schülern zu er-heben – eine Gelegenheit, die sich erst wieder in 20 Jahren bieten wird. Initiator dieser beiden Studien ist die unabhän-gige Forschergemeinschaft IEA (International Association for the Evaluation of Educational Achievement), die 1958 gegründet wurde. Seit über 50 Jahren hat die IEA zahlreiche groß angelegte Vergleichsstudien im Bereich der Bildung durchgeführt, um den politischen Entscheidungsträgern internationale Bildungsindikatoren bereitzustellen. Damit können Stärken und Schwächen im Bildungssystem im in-ternationalen Vergleich identifiziert werden.

Ziele von PIRLS und TIMSS

Internationale Studien wie PIRLS und TIMSS messen die Qualität von Bildungssystemen zu bestimmten Zeitpunkten der schulischen Ausbildung in Form ihres Ertrags (Outputs) und vergleichen diesen über alle Teilnehmerländer hinweg. Darüber hinaus wird eine Reihe an Hintergrundinformati-onen erhoben, die Hinweise auf mögliche Bedingungsfak-toren guter und schwacher Schulleistungen liefern. Daraus können faktenbasierte Maßnahmen für eine Qualitätsver-besserung im Bildungssystem abgeleitet werden.

Folgende Indikatoren können mit PIRLS und TIMSS ge-wonnen werden:

�� Basisindikatoren: Die Leistungsdaten aus PIRLS und TIMSS liefern Informationen über den Ist-Stand der Kompetenzen in Lesen, Mathematik und Naturwissen-schaft am Ende der vierten Schulstufe.�� Kontextindikatoren: Mithilfe von Fragebögen für Schü-

ler/innen, Eltern, Lehrkräfte, Schulleiter/innen sowie hinsichtlich des Lehrplans werden Kontextindikatoren erhoben, von denen angenommen wird, dass sie mit dem Lernen von Lesen, Mathematik und Naturwissen-schaft in Zusammenhang stehen. Sie können wichtige Erklärungsbeiträge für unterschiedliche Schülerleistun-gen liefern.�� Trendindikatoren: Die regelmäßige Durchführung von

PIRLS und TIMSS ermöglicht es, die Leistungen der Schüler/innen im Zeitverlauf zu beobachten und zu analysieren.

Teilnehmerländer und Organisation von PIRLS & TIMSS 2011

Teilnehmerländer

Abbildung 1.1 zeigt alle Teilnehmerländer von PIRLS & TIMSS 2011auf der 4. Schulstufe. An PIRLS haben sich ins-gesamt 45 Länder und acht Regionen2 beteiligt; an TIMSS 50 Länder und sieben Regionen. Insgesamt 37 Länder und sechs Regionen haben die Gelegenheit des Zusammenfalls beider Studien genützt und die Kinder sowohl in Lesen als auch in Mathematik und Naturwissenschaft getestet.

Österreich beteiligte sich 2011 zum zweiten Mal an der internationalen Lesestudie PIRLS und zum dritten Mal an der internationalen Studie TIMSS zur Erfassung der Mathematik- und Naturwissenschaftskompetenz von Schülerin-nen und Schülern auf der vierten Schulstufe. Dieses Kapitel bietet einen Überblick über wesentliche Aspekte bei der Durchführung von PIRLS und TIMSS. Neben einer Beschreibung der Ziele und der für die Studien verantwortlichen internationalen und nationalen Institutionen wird auf die Stichprobe, das Testdesign sowie auf wesentliche Aspekte bei der Interpretation der Ergebnisse eingegangen.

1 TIMSS bietet die Möglichkeit, auch die Schüler/innen der 8. Schulstufe zu testen. Österreich hat sowohl 2007 als auch 2011 nur an der Erhebung auf der 4. Schulstufe teilgenommen.

2 Bei den Regionen handelt es sich um Regionen/Teile eines Landes, die sich unabhängig von einer landesweiten Teilnahme an PIRLS und/oder TIMSS beteiligen, um eigene Vergleichsdaten zu erhalten. International werden diese als Benchmarking Participants bezeichnet. Sie werden in der Ergebnisdar-stellung des vorliegenden Berichts nicht berücksichtigt.

Page 10: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

8 Einführung

Abbildung 1.1: Teilnehmerländer 4. Schulstufe (PIRLS & TIMSS 2011)

Deutschland DEU*

AlbertaCAN (AB)

Australien AUS

AserbaidschanAZE

nur TIMSSnur PIRLS PIRLS & TIMSS

Marokko MAR

Hongkong HKG

Litauen LTU*

Katar QAT

Kroatien HRV

Neuseeland NZL

Regionen (Benchmarking Participants)

Teilnehmende Länder PIRLS & TIMSS 2011

AndalusienESP (AN)*MaltaMLT (mt)*

Abu DhabiARE (AD)

Dubai ARE (DU)

Florida USA (FL) North CarolinaUSA (NC)

Finnland FIN*

England GBR (E)*

Malta MLT*

Niederlande NLD*

Spanien ESP*

Rumänien ROU*

Portugal PRT*

Taiwan TWN

Saudi-Arabien SAU

TschechischeRepublik CZE*

Slowenien SVN*

Slowakische Republik SVK*

Russland RUS

Polen POL*

Oman OMN

Schweden SWE*

Singapur SGP

Vereinigte Staatenvon Amerika USA

Vereinigte Arabische Emirate ARE

Ungarn HUN*

Österreich AUT*

Norwegen NOR

Dänemark DNK*

Bulgarien BGR*

Israel ISR

Belgien (fr)BEL (fr)*

Kolumbien COL

Indonesien IDN

Frankreich FRA*

Kanada CAN

Trinidad und Tobago TTO

Belgien (fl)BEL (fl)*

Chile CHL

Serbien SRB

Türkei TUR

Tunesien TUN

Kasachstan KAZ

Armenien ARM

Bahrain BHR

Japan JPN

Korea KOR

Kuwait KWT

Jemen YEM

Thailand THA

Nordirland GBR (N)*

Italien ITA*

Irland IRL*

Iran IRN

Georgien GEO

Quebec CAN (QC)

Ontario CAN (ON)

* Teilnehmerland ist Mitglied der Europäischen Unionausgewählte Vergleichsländer sind fett hervorgehoben

Page 11: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Einführung 9

Die internationale Organisation

Die IEA trägt als Initiatorin der beiden Studien die über-geordnete Projektverantwortung. Grundlegende Entschei-dungen, die neben PIRLS und TIMSS auch alle anderen IEA-Studien betreffen, werden in der jährlich stattfinden-den General Assembly (Generalversammlung) getroffen. Verantwortlich für die internationale Organisation und Koordination für PIRLS und TIMSS ist das International Study Center (ISC) am Boston College in den USA. Das ICS arbeitet dabei eng mit einem Konsortium zusammen, dem folgende Institutionen angehören:

�� IEA-Sekretariat (Amsterdam): Überprüfung der Über-setzungen aller Testinstrumente der teilnehmenden Län- der, Ausbildung der internationalen Qualitätsbeobach-ter/innen;�� IEA-Datenverarbeitungs- und Forschungszentrum

(Hamburg): Verarbeitung und Prüfung der bei PIRLS und TIMSS erhobenen Daten;�� Statistics Canada (Ottawa, Ontario): Stichprobenzie-

hung, Gewichtung;�� Educational Testing Service (Princeton, New Jersey):

Unterstützung in messtheoretischen Belangen.

Für die Entwicklung und Begutachtung der Testaufga-ben sowie der Hintergrundfragebögen gibt es jeweils eine Expertengruppe. 2011 bestand jede dieser Gruppen aus acht bis zwölf Expertinnen und Experten aus verschiedenen Teilnehmerländern. Somit wird eine breite wissenschaft-liche Expertise bei der Erstellung der Erhebungsinstrumente sichergestellt.

Für die nationale Umsetzung der Studien gibt es in jedem Land ein nationales Projektzentrum. Der National Research Coordinator (NRC) ist dabei für die Durchführung der Stu-die unter Einhaltung sämtlicher internationalen Richtlinien im eigenen Land verantwortlich.

Die nationale Organisation

In Österreich gehört die Durchführung internationaler Assessments zu den gesetzlichen Kernaufgaben des BI-FIE (Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens) unter der Leitung von Dr.in Claudia Schreiner (Direktorin). Umge-setzt werden diese im Department Bildungsstandards & Internationale Assessments in Salzburg unter der Leitung von Mag.a Simone Breit (Departmentleiterin). Aufgabe des BIFIE ist die wissenschaftliche Planung und praktische Umsetzung der Studien. In Zusammenarbeit mit dem ISC wurde am BIFIE das Untersuchungsdesign an die natio-

nalen Gegebenheiten angepasst, die Aufgaben und Frage - bögen wurden mitentwickelt, übersetzt und an österreich-ische Besonderheiten adaptiert. Darüber hinaus hat das BIFIE die Erhebungen an den Schulen durchgeführt, erfasst die Daten elek tronisch und analysiert sie für den Ergebnis-bericht.

Population und Stichprobe

Die Definition der Stichprobe erfolgt bei PIRLS und TIMSS über die Schulstufe: Zur Grundgesamtheit zählen alle Schüler/innen jener Schulstufe, die dem 4. Schuljahr entspricht3. Das Durchschnittsalter muss zum Testzeit-punkt mindestens bei 9,5 Jahren liegen. In Österreich sowie in den meisten Teilnehmerländern finden die Tests somit am Ende der 4. Schulstufe (4. Klasse Volksschule) statt.

Die Ziehung der Stichprobe erfolgte in zwei Schritten. Zunächst wurden in jedem Land aus allen Schulen mit Schülerinnen und Schülern der 4. Schulstufe die Test-schulen zufällig ausgewählt. Um dabei eine standardisierte Vorgehensweise zu gewährleisten, wurde dieser Schritt für alle Länder von Statistics Canada durchgeführt. Im zwei-ten Schritt wurde am jeweiligen nationalen Zentrum an diesen Schulen mindestens eine Klasse der 4. Schulstufe – ebenfalls zufällig – ausgewählt. Den Ländern stand es frei, jeweils mehr als eine Klasse pro Schule für die Stichprobe zu ziehen. Alle Schüler/innen der somit festgelegten Klassen waren Teil der PIRLS- und TIMSS-Stichprobe.

Sowohl auf Schul- als auch auf Schülerebene war es nach international definierten Kriterien möglich, Viertklässler/innen vom Test auszuschließen – die Ausschlüsse durften in Summe allerdings nicht mehr als 5 % der Population ausmachen. In Österreich wurden auf Schulebene Sonder-schulen sowie Schulen mit weniger als drei Schülerinnen und Schülern der 4. Schulstufe im Vorfeld (vor dem ersten Schritt der Stichprobenziehung) ausgeschlossen. Auf Schü-lerebene wurden (nach der Ziehung der Klassenstichprobe) folgende Schüler/innen ausgeschlossen:

�� Schüler/innen mit einer anhaltenden körperlichen Be-einträchtigung (0,2 % aller ausgewählten Schüler/innen in Österreich), �� Schüler/innen mit einer anhaltenden geistigen Beein-

trächtigung (2,6 %) und �� Schüler/innen mit einer anderen Muttersprache, wenn

gleichzeitig die Testsprache noch nicht ausreichend be-herrscht wird (0,7 %).

3 Das erste Schuljahr wird dabei über den ISCED-Level 1 definiert. ISCED ist eine internationale Standardklassifikation der Bildung, die von der UNESCO entwickelt wurde (Details dazu unter: http://www.uis.unesco.org/Library/Documents/2011-international-standard-classification-education-isced-2012-en.pdf ). ISCED-Level 1 ist jener Zeitpunkt in der Schullaufbahn, zu dem das systematische Lernen von Lesen, Schreiben und Mathematik sowie der Erwerb eines Basiswissens in anderen Bereichen beginnen.

Page 12: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

10 Einführung

Die Entscheidung darüber hat in Österreich die Klassen-lehrerin/der Klassenlehrer in Absprache mit der für die Testdurchführung zuständigen Person getroffen und betraf 3,5 % aller ausgewählten Schüler/innen. Weitere 25 Kin-der (0,5 %) hatten die Schule zwischen der Erstellung der Schülerlisten und dem Testzeitpunkt verlassen.

Die österreichische Stichprobe für PIRLS & TIMSS 2011 besteht aus 158 Schulen, 276 Klassen und 4670 bzw. 4668 Schülerinnen und Schülern. Mit einer Teilnahmequote von 100 % sowohl auf Schul- als auch auf Klassenebene und 97,8 % (PIRLS) bzw. 97,7 % (TIMSS) auf Schülerebene konnte Österreich die international geforderten Teilnahme-quoten (85 % auf Schul- und Schülerebene, 95 % auf Klas-senebene) deutlich übertreffen.

Ablauf der Tests und Testinstrumente

Der PIRLS-Test

PIRLS misst die Leseleistung der Viertklässler/innen diffe-renziert für unterschiedliche (1) Leseabsichten und (2) Ver-stehensprozesse, die beim Lösen der Aufgabenstellung erfor-derlich sind. Darüber hinaus werden (3) das Leseverhalten und die Einstellungen zum Lesen erfasst.

Mithilfe von literarischen Texten und Informationstexten werden beim PIRLS-Test zwei unterschiedliche Leseabsich-ten generiert: Lesen, um literarische Erfahrung zu machen, und andererseits Lesen, um Informationen zu gewinnen. Die Lesekompetenzen der Schüler/innen können nach diesen beiden Subskalen getrennt analysiert werden.

Die Verstehensprozesse (kognitive Prozesse, die beim Lösen einer Aufgabe notwendig sind) werden durch unterschied-liche Aufgabentypen zu den Texten hervorgerufen. Es gibt (1) Aufgaben, bei denen die Schüler/innen explizit angege-bene Informationen „Erkennen und Wiedergeben“ müssen, (2) Aufgaben, die ein Ziehen von einfachen Schlussfolge-rungen verlangen, (3) Aufgaben, bei denen ein Interpretie-ren sowie Verknüpfen von Gedanken und Informationen notwendig sind, um zur richtigen Lösung zu kommen und (4) Aufgaben, bei denen Inhalt, Sprache und einzelne Text-elemente untersucht und bewertet werden müssen. Für eine Analyse der Lesekompetenz hinsichtlich der Verstehen-sprozesse werden jeweils zwei der eben genannten Anfor-derungen zu Subskalen zusammengefasst: Wiedergeben und Schlussfolgern sowie Interpretieren und Bewerten.

Der dritte Aspekt – das Leseverhalten und die Einstellungen zum Lesen – wird mit den Hintergrundfragen im Schüler-fragebogen erhoben.

Die Messung der Lesekompetenz erfolgt mit einem Papier- und-Bleistift-Test. Insgesamt gibt es zehn Texte (fünf Infor-

mationstexte und fünf literarische Texte) mit daran anschlie-ßenden Aufgaben. Die Texte wurden zu 13 verschiedenen Testheften kombiniert, wobei jedes Testheft aus 2 Texten besteht. Für die Bearbeitung des Testshefts hatten die Schü-ler/innen insgesamt 80 Minuten Zeit. Im Anschluss daran beantworteten sie den Schülerfragebogen. Dieser umfasst neben demographischen Informationen auch Fragen zum familiären Hintergrund, zu den Lesegewohnheiten außer-halb der Schule und zum Lesen in der Schule. Auch die Eltern sowie die Lehrkräfte der beteiligten Schüler/innen wurden gebeten, einen Fragebogen zu beantworten. Auf Schulebene wurden von den Schulleiterinnen und Schul-leitern Informationen zu Schulressourcen, Schulklima etc. erhoben. Der Fragebogen zum Lehrplan in den Teilnehmer-ländern ergänzt die Informationen auf Schul- und Klassen-ebene und fokussiert auf die national festgelegten Rahmen-bedingungen des Leseunterrichts an den Schulen.

Der TIMSS-Test

Um ein möglichst detailliertes Bild von den Kompetenzen der Schüler/innen zu erhalten, werden die Domänen Ma-thematik und Naturwissenschaft in jeweils drei inhaltliche und drei kognitive Bereiche (Subskalen) unterteilt. Die kog-nitiven Bereiche sind für beide Domänen ident und erfassen (1) das Wissen über mathematische bzw. naturwissenschaft-liche Fakten, Konzepte und Prozesse, (2) das Anwenden ihres Wissens in unterschiedlichen Situationen und (3) das Begründen von Schlussfolgerungen und Lösungen bzw. von Experimenten. Bei den Inhaltsbereichen in Mathematik wird unterschieden zwischen (1) Zahlen, (2) geometrische Formen und Maße sowie (3) Darstellen von Daten. In Natur-wissenschaft werden die Themen (1) Biologie, (2) Physik und (3) Erdkunde abgedeckt.

Auch bei TIMSS wird ein Papier-und-Bleistift-Test einge-setzt, um die Kompetenzen der Schüler/innen zu erfassen. Insgesamt gab es 14 verschiedene Testheftformen. Jedes Testheft bestand aus insgesamt zwei Aufgabenblöcken im Bereich Mathematik und zwei Aufgabenblöcken im Be-reich Naturwissenschaft. Für die Bearbeitung aller Aufga-ben in einem Testheft hatten die Schüler/innen insgesamt 72 Minuten Zeit. Darüber hinaus wurden wie bei PIRLS Fragebögen auf folgenden Ebenen eingesetzt: Schüler/in-nen, Eltern, Lehrkräfte, Schulleitung sowie ein Lehrplan-fragebogen.

Zur Interpretation der Ergebnisse

Die vorliegende Publikation fokussiert auf die österreichi-schen Ergebnisse. Da bei PIRLS & TIMSS, wie bei Lar-ge-Scale-Assessments üblich, nicht alle Schüler/innen der 4. Schulstufe eines Landes getestet wurden, sondern eine Stichprobe, muss bei der Interpretation der Daten Folgen-des beachtet werden:

Page 13: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Einführung 11

�� Die aus den Daten resultierenden statistischen Kenn-zahlen (z. B. Mittelwerte) sind Punktschätzungen der tatsächlichen Populationswerte. Sie sind aufgrund der Testung einer Stichprobe mit einem gewissen statisti-schen Messfehler – dem Standardfehler (SE) – behaftet. Dieser wird unter anderem dafür verwendet, einen Werte bereich (Konfidenzintervall) zu berechnen, inner-halb dessen sich der tatsächliche Populationsmittelwert mit einer bestimmten Wahrscheinlichkeit befindet. Für die vorliegende Publikation wurde diese Wahrschein-lichkeit mit 95 %, (d. h. p < .05) festgelegt4. Das heißt, die Werte der Population liegen mit 95-prozentiger Wahrscheinlichkeit innerhalb der berichteten Konfi-denzintervalle.

�� Der Standardfehler (statistischer Messfehler) spielt auch bei statistischen Tests eine Rolle, etwa wenn man die Er-gebnisse zweier Gruppen miteinander vergleicht (z. B. Mädchen und Buben). Alle Signifikanzprüfungen in dieser Publikation erfolgen, falls nicht explizit anders vermerkt, zweiseitig auf dem 5 %-Niveau.

�� Da es sich bei PIRLS & TIMSS um sehr große, präzise Stichproben handelt, können teilweise auch sehr kleine Unterschiede (etwa zwischen Mädchen und Buben) statistisch nachgewiesen werden. Diese existieren mit großer Wahrscheinlichkeit in der betreffenden Populati-on, sind aber manchmal so klein, dass sie in praktischer Hinsicht nicht relevant sind. Einige Ergebnisdarstellun-gen beinhalten deshalb Angaben zur Effektstärke eines Unterschieds.5 Damit wird zusätzlich zur statistischen Signifikanz auch die Größenordnung von gefundenen Unterschieden quantifiziert. Eine grobe Faustregel für die Einschätzung der Größenordnung sind die Richt-werte nach Cohen (1988), nach denen Effektstärken ab 0.2 als kleine, ab 0.5 als mittlere und ab 0.8 als große Unterschiede eingestuft werden. Demnach kann ab einer Effektstärke von 0.2 (d. h., der Unterschied macht 20 % der Standardabweichung aus) zusätzlich zu einer statistischen Signifikanz auch von einer praktischen Relevanz ausgegangen werden.

4 Das Konfidenzintervall errechnet sich damit aus dem Wert der Punktschätzung (z. B. Mittelwert) ±1,96 x SE.5 Das hier verwendete Effektstärkemaß für Mittelwertunterschiede (Cohens d) wird nach folgender Formel berechnet:

Darüber hinaus wird darauf hingewiesen, dass es sich bei den angegebenen Kennwerten (Mittelwerte, Standardfeh-ler, Prozentangaben etc.) um gerundete Werte handelt. Die Werte (inkl. jener in Tabellen und Abbildungen) werden zuerst – unter Berücksichtigung entsprechender Nachkom-mastellen – berechnet und dann kaufmännisch gerundet. Es kann daher vorkommen, dass beispielsweise die Summe von gerundeten Prozentangaben nicht exakt 100 ergibt oder Summen und Differenzen von Werten geringfügig inkon-sistent erscheinen.

Folgende Berichte zu PIRLS & TIMSS 2011 wurden be-reits publiziert:

B. Suchań & C. Schreiner (2012). PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissen-schaft in der Grundschule. Technischer Bericht. Verfügbar un-ter: https://www.bifie.at/buch/1740

B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schrei-ner (2012). PIRLS & TIMSS 2011. Schülerleistungen in Le-sen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick. Graz: Leykam.

B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schrei-ner (2012). PIRLS & TIMSS 2011. Schülerleistungen in Le-sen, Mathematik und Naturwissenschaft in der Grundschule. Die ersten Ergebnisse. Graz: Leykam.

Martin, M. O. & Mullis, I. V. S. (Eds.). (2013). TIMSS and PIRLS 2011: Relationships Among Reading, Mathematics, and Science Achievement at the Fourth Grade – Implications for Early Learning. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.

Mullis, I. V. S., Martin, M. O., Foy, P. & Drucker, K. T. (2012). The PIRLS 2011 International Results in Reading. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.

Literatur

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum

Page 14: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 15: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

I. Kompetenzen in Lesen, Mathematik &

Naturwissenschaft

Page 16: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 17: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 15

1.1 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft

BirgitSuchań

Mittelwerte und Streuungen in den drei Kompetenzbereichen

Wie gut können Österreichs Viertklässler/innen im Ver-gleich zu jenen aus den teilnehmenden EU-Ländern sinnerfassend lesen? Wie hoch sind ihre mathematischen Fähigkeiten im EU-Vergleich und sind ihre Kenntnisse bei naturwissenschaftlichen Themen besser als jene der Kinder anderer Länder? Um diese Fragen zu beantworten, wird zu-nächst ein Überblick über das durchschnittliche Leistungs-niveau gegeben. Die Abbildungen 1.1.1 bis 1.1.3 zeigen für die teilnehmenden EU-Länder den Mittelwert und das dazugehörige 95 %ige Konfidenzintervall (in Orange) sowie die Streuung der Leistung in Form von Perzentilen (5., 25., 75. und 95.). Die Länder sind dabei absteigend nach dem Durchschnittswert gereiht. Hellblau hinterlegt sind jene Länder, in denen sich der Mittelwert nicht signifikant vom Österreich-Schnitt unterscheidet. Um zu überprüfen, ob die Unterschiede, die – auch wenn sie sehr gering sind – aufgrund der großen und präzisen Stichproben statistisch nachgewiesen werden können, auch in praktischer Hinsicht relevant sind, wurde für alle Ländervergleiche mit Öster-reich die Effektstärke2 berechnet. Die Effektstärken sind in Form von Sternsymbolen in den Abbildungen 1.1.1 bis 1.1.3 eingetragen. Die exakten Werte zu diesen Abbildun-gen befinden sich in den Anhangstabellen A.1 bis A.3.

Lesen

Im Durchschnitt erreichen die 23 teilnehmenden EU- Länder bei PIRLS einen Mittelwert von 534 Punkten (s. Ab-bildung 1.1.1). Finnland liegt an der Spitze. Die finnischen

Schüler/innen übertreffen mit 568 Punkten die Leseleistung eines jeden anderen EU-Teilnehmerlands. Nordirland folgt mit einem Mittelwert von 558 Punkten und ist ebenfalls signifikant besser als alle dahinter gereihten Länder. Danach folgen zwei nordeuropäische Länder und England, wo die Kinder eine etwa gleich hohe Lesekompetenz aufweisen: Dänemark (554), Irland (552) und England (552).

Die Kinder in Österreich erzielen 529 Punkte auf der Lese-Gesamtskala. Mit diesem Wert liegen sie knapp, aber dennoch statistisch signifikant unter dem EU-Mittel und 39 Punkte hinter Finnland. Neben Finnland übertreffen weitere 11 EU-Länder (darunter auch Deutschland) den Österreich-Schnitt. In sieben dieser 11 Länder ist diese höhere Lesekompetenz nicht nur statistisch gegeben, son-dern auch von praktischer Relevanz. So beträgt die Effekt-stärke für den Vergleich von Finnland und Österreich 0.61, was als mittlerer Effekt eingestuft werden kann. Die Effekt-stärken für Nordirland bis zur Tschechischen Republik be- tragen zwischen 0.42 und 0.27. Von Schweden bis Ungarn sind die Differenzen hinsichtlich der Lesekompetenz prak-tisch nicht relevant. Vergleichbare Lesekompetenzen mit Österreich haben die Schüler/innen der Slowakischen Republik (535), Bulgariens (532), Sloweniens (530), Litauens (528) sowie Polens (526) – gemeinsam mit Öster-reich befinden sie sich in der unteren Hälfte der Länder-reihung. Fünf Länder liegen deutlich hinter Österreich, wobei die Schüler/innen aus Malta mit 477 Punkten die niedrigste Lesekompetenz unter den hier dargestellten Ländern aufweisen. Mit Ausnahme von Frankreich sind die Effektstärken dieser Länder ebenfalls so hoch ausgeprägt, dass man auch von einer praktischen Bedeutsamkeit der

Dieser Abschnitt gibt einen Überblick über das Abschneiden der österreichischen Schüler/innen bei PIRLS & TIMSS 2011 im europäischen Vergleich. Dabei werden wesentliche Ergebnisse aus dem ersten nationalen Ergebnisbericht (Suchań, Wallner-Paschon, Bergmüller & Schreiner, 2012) zusammenfassend dargestellt und durch österreichspezifische Analysen ergänzt. Zunächst erfolgt eine Darstellung der Mittelwerte und Streuungen in den drei Kompetenzbereichen Lesen, Mathematik und Naturwissenschaft. Neben dem aktuellen Abschneiden der Schüler/innen wird darüber hinaus die Leistungsentwicklung seit dem Jahr 2001 (PIRLS) bzw. seit 1995 (TIMSS) analysiert. Weiters widmet sich dieser Abschnitt einer Charakterisierung der leistungsstarken und -schwachen Schüler/innen nach den Merkmalen Geschlecht, Migrationshintergrund und Bildung der Eltern sowie einer zusammenfassenden Darstellung der Geschlechterdifferenzen in allen Leistungsbereichen. Mit Ausnahme der Trendanalysen beschränken sich die Ländervergleiche in diesem Abschnitt auf die jeweils teilnehmenden EU-Länder1.

1 Es sei an dieser Stelle darauf hingewiesen, dass die europäischen Teilnehmerländer von PIRLS 2011 und jene von TIMSS 2011 nicht völlig ident sind. Die Darstellungen und Analysen von PIRLS beruhen auf 23 teilnehmenden EU-Ländern; jene von TIMSS auf 21. Insgesamt beteiligten sich 20 Mit-gliedsstaaten der EU sowohl an PIRLS als auch an TIMSS.

2 Details zur Berechnung der Effektstärke finden sich im Einführungskapitel.

Page 18: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

16 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft

Leistungsunterschiede sprechen kann. Sie reichen bei diesen Vergleichen von 0.63 in Malta bis hin zu 0.24 in Spanien.

Die gesamte Balkenlänge in Abbildung 1.1.1 zeigt den Abstand zwischen den Schülerinnen und Schülern mit den höchsten bzw. mit den niedrigsten Leseleistungen – exklu-sive der obersten bzw. der untersten 5 % der Schüler/innen. Zwischen den Leserinnen und Lesern in Österreich mit den höchsten Mittelwerten und jenen mit den geringsten Leis-tungen liegen 209 Punkte: Die erfolgreichsten Kinder (exkl. der besten 5 %) erreichen bis zu 626 Punkte (95. Perzentil); umgekehrt liegen die Werte der leseschwächeren Kinder bei 418 Punkten (5. Perzentil). Im Ländervergleich ist dieser Abstand relativ gering ausgeprägt. Nur in den Niederlan-den und in der Tschechischen Republik (beides Länder mit einem signifikant höheren Mittelwert als in Österreich) sind die Schülerleistungen noch homogener. Die Differenz zwischen dem 5. und dem 95. Perzentil beträgt in diesen Ländern 178 bzw. 205 Punkte. In Finnland liegen so wie in Österreich 209 Punkte zwischen den besten und den schwächsten Schülerinnen und Schülern – allerdings auf einem deutlich höheren Leistungsniveau. Im Vergleich dazu sind Rumänien und Malta nicht nur jene Länder mit den niedrigsten Mittelwerten, hier zeigen sich auch die größten Leistungsstreuungen, die jene von Österreich und Finnland um etwa 100 Punkte übertreffen (298 bzw. 317 Punkte Dif-ferenz zwischen 5. und 95. Perzentil).

Mathematik

In Mathematik beträgt der Mittelwert der 21 beteiligten EU-Länder 519 Punkte. Die höchste Mathematikkompe-tenz unter den in Abbildung 1.1.2 dargestellten Ländern haben die Schüler/innen aus Nordirland. Sie liegen mit ei-nem Mittelwert von 562 Punkten deutlich über dem EU-Schnitt und übertreffen alle anderen EU-Teilnehmerländer signifikant. Der flämischsprachige Teil Belgiens, Finnland sowie England folgen; sie unterscheiden sich im Leistungs-niveau mit Durchschnittswerten von 549, 545 und 542 Punkten kaum voneinander.

Ähnlich wie in Lesen befindet sich Österreich auch hin-sichtlich der Mathematikkompetenz in der unteren Hälfte der 21 teilnehmenden EU-Länder und signifikant unter dem EU-Durchschnittswert. Mit 508 Punkten liegen die heimischen Schüler/innen 54 Punkte hinter den Kindern aus Nordirland – dem bestgereihten EU-Teilnehmerland. In insgesamt 10 EU-Ländern ist die durchschnittliche Mathematikkompetenz deutlich höher als in Österreich. In all diesen Ländern ist die Leistungsdifferenz zu Öster -reich nicht nur statistisch signifikant, sondern auch von praktischer Bedeutung (Effektstärken zwischen 0.72 in Nordirland und 0.27 in Irland). In sechs weiteren Ländern zeigen sich keine signifikanten Leistungsunterschiede zu Österreich (Ungarn, Slowenien, Tschechische Republik, Italien, Slowakische Republik und Schweden). Die Schüler/innen aus Malta, Spanien, Rumänien und Polen schneiden

AU

T

300

400

500

600

700

FIN

**

DN

K*

IRL* N

LD*

CZE

*

SW

E

ITA

DE

U

PR

T

HU

N

SV

K

SV

N LTU

PO

L

FRA

ES

P*

MLT

**

BE

L (fr

)*

Lese

kom

pete

nz

hoch

nied

rig Perzentile (%)Mittelwert

5. 25. 75. 95.

Konfidenzintervall (+/–1.96 SE)

}

GB

R (N

)*

GB

R (E

)*

RO

U*B

GR

Lesekompetenz: Mittelwerte und Streuung (EU-Länder)

sig. besser als AUT sig. schlechter als AUTkein sig. Unterschied zu

AUT

EU-Mittel

Teilnehmerländer absteigend nach dem Mittelwert auf der Lese-Gesamtskala gereiht

* ... Effektstärke > 0.2** ... Effektstärke > 0.5

Abbildung 1.1.1: Lesekompetenz im EU-Vergleich (PIRLS 2011)

Page 19: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 17

hingegen signifikant schlechter ab und mit Ausnahme von Malta weisen die Effektstärken (0.40 bis 0.30) auch hier auf praktisch bedeutsame Unterschiede hin. Der Leistungsab-stand zwischen dem erst- und dem letztgereihten EU-Land (Nordirland und Polen) beträgt 81 Punkte.

Bezieht man in diese Analyse neben dem Leistungsniveau auch die Streuung der Schülerwerte innerhalb der Länder mit ein, so fällt auf, dass die Mathematikkompetenzen in Nordirland im europäischen Vergleich zwar sehr hoch aus-geprägt, allerdings auch sehr heterogen sind: Während die Höchstleistungen (exklusive der besten 5 %) bei 693 Punk-ten liegen, erreichen die leistungsschwächsten Kinder (ex-klusive der schwächsten 5 %) 411 Punkte. Ähnlich sieht es in England aus: ein relativ hoher Mittelwert bei einer Bandbreite von 292 Punkten zwischen dem 5. und dem 95. Perzentil. Österreich fällt nicht nur in Lesen, sondern auch in Mathematik mit relativ homogenen Leistungen auf: 204 Punkte liegen zwischen den besten (606 Punkte) und schwächsten Kindern (401 Punkte). Lediglich in den Niederlanden und im flämischsprachigen Teil Belgiens ist diese Differenz geringer (174 bzw. 195 Punkte). Dass die Viertklässler/innen aus Nordirland deutlich besser sind als die österreichischen, lässt sich neben der Mittelwertdifferenz auch daran erkennen, dass das 75. Perzentil für Nordirland (622) höher ist als das 95. für Österreich (606). Das bedeu-tet, dass jener Leistungswert, den in Österreich nur mehr jedes 20. Kind erreicht bzw. überschreitet (ab 606 Punkte aufwärts), in Nordirland von zumindest jedem 4. Kind er-zielt wird.

Naturwissenschaft

Im Kompetenzbereich Naturwissenschaft (s. Abbildung 1.1.3) schneiden – wie bereits in Lesen – die finnischen Schüler/innen (570) deutlich besser als die Kinder aller anderen EU-Teilnehmerländer ab. Sie liegen damit auch über dem Durchschnittswert der 21 beteiligten EU-Länder von 521 Punkten. Unmittelbar hinter Finnland folgt eine Gruppe von zehn Ländern (von der Tschechischen Repub-lik bis einschließlich Italien), deren Mittelwerte alle auf sehr ähnlichem Niveau sind. Zu diesen Ländern zählen auch Österreich (532) und Deutschland (528). Weitere zehn Länder schneiden deutlich schlechter als diese Gruppe ab, wobei wiederum Malta das letztgereihte Land ist (446). Die österreichischen Schüler/innen erreichen im Schnitt um 39 Punkte weniger als die finnischen; dieser Unterschied ist mit einer Effektstärke von 0.56 auch in praktischer Hin-sicht bedeutsam. Anders als in Lesen und Mathematik ist der österreichische Mittelwert in Naturwissenschaft signifi-kant über dem EU-Schnitt.

Die Naturwissenschaftsleistungen der österreichischen Kin-der sind nicht so homogen wie in Mathematik: 231 Punkte liegen zwischen dem 5. und dem 95. Perzentil, wobei die Schwächsten bis zu 408 und die Besten über 640 Punkte erreichen. Vor allem im unteren Leistungsbereich streuen die Werte in Naturwissenschaft stärker als in Mathematik. Deutlich einheitlicher sind die Kompetenzen der Schüler/innen in den Niederlanden (bei gleichem Leistungsniveau wie in Österreich beträgt der Abstand 174 Punkte), im

Mat

hem

atik

kom

pete

nz

hoch

nied

rig

300

400

500

600

700

AU

TFIN

**

DN

K*

IRL*

NLD

**

DE

U*

PR

T*

HU

N

LTU

*

PO

L*

MLT

BE

L (fl

)**

Perzentile (%)Mittelwert

5. 25. 75. 95.

Konfidenzintervall (+/–1.96 SE)

}

GB

R (N

)**

GB

R (E

)*

SV

N

CZE

SW

E

ITA

SV

K

RO

U*

ES

P*

Mathematikkompetenz: Mittelwerte und Streuung (EU-Länder)

sig. besser als AUT sig. schlechter als AUTkein sig. Unterschied zu AUT

EU-Mittel

Teilnehmerländer absteigend nach dem Mittelwert auf der Mathematik-Gesamtskala gereiht

* ... Effektstärke > 0.2** ... Effektstärke > 0.5

Abbildung 1.1.2: Mathematikkompetenz im EU-Vergleich (TIMSS 2011)

Page 20: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

18 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft

flämischsprachigen Teil Belgiens (189 Punkte; allerdings auf einem signifikant niedrigeren Leistungsniveau als in Österreich) und im führenden Land Finnland (217 Punkte Differenz zwischen 5. und 95. Perzentil).

Erklärung der Leistungsvarianz auf Individual-, Schul- und Klassenebene

Die oben dargestellten Leistungsunterschiede innerhalb der Länder können durch individuelle Voraussetzungen der Schüler/innen, aber auch durch Einflüsse auf Klassen- bzw. Schulebene entstehen. Mithilfe eines Mehrebenenmodells wurde für Österreich der Anteil dieser drei Ebenen (Schüler/ innen, Klasse und Schule) an der gesamten Leistungsvarianz in Lesen, Mathematik und Naturwissenschaft analysiert. Tabelle 1.1.1 zeigt, dass der Großteil der Leistungsvarianz in Lesen (87 %) auf individuelle Merkmale der Kinder zurückzuführen ist. Weitere 5 % lassen sich durch Unterschiede zwischen den Klassen jeweils innerhalb einer Schule und 8 % durch Unter-schiede zwischen den Schulen erklären.

In Mathematik ist der Anteil, der durch individuelle Un-terschiede zwischen den Schülerinnen und Schülern erklärt wird, mit 83 % etwas geringer. Die restliche Varianz ver-teilt sich zu 7 % auf Klassenebene und zu 11 % auf Schul - ebene. Ein ähnliches Bild zeigt sich in Naturwissenschaft.

84 % der Leistungsunterschiede zwischen den Schülerin-nen und Schülern werden durch individuelle Merkmale er-klärt, weitere 6 % kommen durch die Klassenzugehörigkeit hinzu und 10 % durch die Schulzugehörigkeit.

In allen drei Bereichen lässt sich somit der Großteil der Leis-tungsvarianz in Österreich durch individuelle Merkmale der Viertklässler/innen erklären. Der Anteil der Klassen-und Schulebene ist vergleichsweise geringer ausgeprägt. Dies ist allerdings kein österreichspezifisches Ergebnis. In jenen EU-Ländern, in denen eine derartige Analyse der Varianzkomponenten möglich ist (weil zumindest zwei Klassen pro Schule getestet wurden)3, liegt der Anteil auf Individualebene bei einem Großteil dieser Länder ebenfalls bei 80 % bzw. darüber. Im führenden EU-Land Finnland können beispielsweise zwischen 89 % (Naturwissenschaft und Mathematik) bzw. 90 % (Lesen) der Varianz auf indivi-duelle Schülermerkmale zurückgeführt werden.4 Dieser Be-fund, dass der Großteil der Leistungsunterschiede in einem Land durch individuelle Voraussetzungen der Schüler/in-nen erklärt werden kann, deckt sich auch mit einem Be-fund von Marzano (2000; zitiert nach Lipowski, 2006) aus einer Metaanalyse: Diese zeigt, dass 80 % der Unterschiede mit den individuellen Merkmalen der Lernenden erklärt werden können; auf die Klassenzugehörigkeit ent fallen 13 % und auf die Schulzugehörigkeit 7 % der Varianz.

* ... Effektstärke > 0.2** ... Effektstärke > 0.5

Nat

urw

isse

nsch

afts

kom

pete

nz

hoch

nied

rigNaturwissenschaftskompetenz: Mittelwerte und Streuung (EU-Länder)

300

400

500

600

700

AU

T

FIN

**

DN

K

IRL*SW

E

ITA

DE

U

PR

T

HU

N SV

K

SV

N LTU

*

ES

P*

RO

U*

BE

L (fl

)*

GB

R (N

)*

GB

R (E

)

PO

L*

MLT

**

CZE N

LD

EU-Mittel

sig. schlechter als AUTkein sig. Unterschied

zu AUT

Perzentile (%)Mittelwert

5. 25. 75. 95.

Konfidenzintervall (+/–1.96 SE)

}

Teilnehmerländer absteigend nach dem Mittelwert auf der Naturwissenschafts-Gesamtskala gereiht

Abbildung 1.1.3: Naturwissenschaftskompetenz im EU-Vergleich (TIMSS 2011)

3 In Lesen ist dies für 12 der teilnehmenden EU-Länder möglich und in Mathematik und Naturwissenschaft für 10 Länder.4 Ein derartiger Vergleich der Varianzanteile mit Deutschland ist nicht möglich, da in Deutschland pro Schule nur eine Klasse getestet wurde und somit

keine Varianz auf Klassenebene berechnet werden kann.

Page 21: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 19

Es gibt unter den EU-Ländern bei PIRLS & TIMSS 2011 allerdings auch welche, in denen der Schüleranteil gerin-ger ausfällt. So weicht beispielsweise Bulgarien in Lesen am stärksten von diesen Zahlen ab: Mit 63 % ist die Varianz-erklärung auf Schülerebene unter den EU-Vergleichsländern am geringsten; 30 % entfallen hingegen auf die Schul-ebene und 7 % auf die Klassenebene. In Mathematik und Naturwissenschaft ist der Anteil auf Schülerebene mit 69 bzw. 67  % in Ungarn vergleichsweise gering (jeweils ein Viertel der Leistungsschwankungen kann in Ungarn auf Schulebene und rund 7 % auf Klassenebene erklärt werden). Ein derartiger Ländervergleich im Hinblick auf die Varianz-komponenten sollte allerdings mit Vorsicht interpretiert werden, da in den Ländern die Einheit Schule bzw. Klasse unterschiedlich definiert wird und somit möglicherweise nicht vergleichbar ist (siehe dazu OECD, 2009, S. 221 f.).

Leistungsvarianz in Österreich (Lesen, Mathematik und Naturwissenschaft)

auf Schüler-, Klassen- und Schulebene

Kompetenzbereich

Ebene LesenMathe-matik

Natur-wissenschaft

Schüler 87,0 % 82,5 % 84,2 %

Klasse 5,2 % 6,8 % 5,9 %

Schule 7,8 % 10,7 % 9,9 %

Tabelle 1.1.1: Verteilung der Leistungsvarianz auf Individual-, Klassen- und Schulebene in Österreich

(PIRLS und TIMSS 2011)

Leistungstrend in den drei Kompetenzbereichen

Nachdem 2011 PIRLS bereits zum dritten Mal stattgefun-den hat und TIMSS zum fünften Mal, ist es möglich, die Veränderung der Schülerleistungen über die Jahre hinweg zu analysieren. Abbildung 1.1.4 zeigt für Österreich und drei weitere Länder die Kompetenzen der Viertklässler/ innen im Zeitverlauf – sowohl für alle Kinder gemeinsam (graue Linie) als auch getrennt nach Geschlecht (rote Linie für Mädchen, blaue Linie für Buben). Neben Deutschland als gleichsprachigem Nachbarland Österreichs wurden auch Slowenien und Singapur für diese Darstellung ausgewählt: In Slowenien haben sich unter den EU-Ländern die Leis-tungen der Schüler/innen in allen drei Kompetenzbereichen deutlich verbessert. Singapur wurde gewählt, um zu zeigen, wie sich die Leistungen in einem Land entwickeln, das in allen drei Bereichen zu den führenden Nationen zählt. Für PIRLS umfasst die Abbildung alle drei Erhebungsjahre seit

Beginn der Studie (da sich mit Ausnahme von Österreich die dargestellten Länder seit 2001 an PIRLS beteiligen); für TIMSS sind nur die Zeitpunkte mit österreichischer Beteiligung eingetragen. Signifikante Leistungsänderungen im Vergleich zur jeweils vorangegangenen Erhebung sind sowohl für den Ländermittelwert (in Schwarz) sowie für Mädchen (in Rot) und Buben (in Blau) mit einem Stern-symbol gekennzeichnet.5 Die exakten Werte zu Abbildung 1.1.4 befinden sich in Anhangstabelle A.4.

Lesen

In Österreich ist die Lesekompetenz von 2006 (538 Punkte) auf 2011 (529 Punkte) um neun Punkte zurückgegangen. Dieser Unterschied ist zwar gering, aber dennoch statistisch signifikant. Getrennt nach den Geschlechtern zeigt sich so-wohl für die Mädchen als auch für die Buben eine geringe, aber signifikante Abnahme von 10 bzw. 8 Punkten.

In Deutschland hat sich die Leistung von 2001 auf 2006 zunächst von 539 auf 548 Punkte verbessert (p < .05). Von 2006 auf 2011 ist sie allerdings wie in Österreich gering, aber dennoch signifikant zurückgegangen (–7 Punkte). Für die Geschlechter zeigt sich nur eine statistisch bedeutsame Verbesserung der Buben von 2001 auf 2006 (11 Punkte).

Das Leistungsniveau in Slowenien war zu Beginn von PIRLS mit 502 Punkten vergleichsweise gering. Bis zum Jahr 2006 hat sich der Mittelwert der Kinder allerdings um 20 Punkte gesteigert (p < .01) und bei der aktuellen Erhebung erfolgte nochmals eine kleine, aber statistisch bedeutsame Verbes-serung von neun Punkten. Dieser Leistungstrend lässt sich auch getrennt für beide Geschlechter feststellen: Die Buben haben sich um 22 bzw. 11 Punkte signifikant verbessert und die Mädchen um 19 bzw. 7 Punkte.

In Singapur hat sich die Lesekompetenz der Schüler/innen besonders stark von 2001 auf 2006 verbessert – der Leis-tungszuwachs beträgt 30 Punkte (p < .01). Von 2006 auf 2011 gab es nochmals eine kleine, aber statistisch bedeut-same Verbesserung von 9 Punkten. Mit diesem stetigen Kompetenzzuwachs ist das Leistungsniveau in der aktuellen Erhebung deutlich höher als in Österreich, Deutschland und Slowenien. Betrachtet man die Leistungsverände-rung getrennt nach Geschlecht, zeigt sich sowohl bei den Mädchen als auch bei den Buben von 2001 auf 2006 eine deutliche Verbesserung von 27 bzw. 34 Punkten (p < .01). Der Leistungszuwachs in den letzten 5 Jahren um jeweils 9 Punkte ist allerdings statistisch nicht signifikant.

Mathematik

Hinsichtlich der Mathematikkompetenz fällt das außer-ordentlich hohe Leistungsniveau der Kinder aus Singapur

5 Die Berechnungen der Leistungsveränderungen von einem Erhebungsjahr zum nächsten wurden in Anlehnung an die Vorgehensweise im internationalen Bericht nicht bonferronikorrigiert.

Page 22: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

20 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft

seit Beginn von TIMSS im Jahr 1995 auf. Sie erreichten damals im Schnitt 590 Punkte; das Österreich-Mittel lag 60 Punkte darunter. Während in Singapur die Mathema-tikkompetenz bis 2011 auf hohem Leistungsniveau kons-tant blieb, hat sich die Leistung der österreichischen Kinder

von 1995 auf 2007 um 25 Punkte verringert (p < .01). Die Veränderung von 2007 auf 2011 ist – wie in Deutschland und Singapur – nicht signifikant. Somit trennen die Kinder aus Österreich und Singapur aktuell 97 Leistungspunkte. Analysiert man die Kompetenzentwicklung der Mädchen

Abbildung 1.1.4: Leistungstrend in Lesen, Mathematik und Naturwissenschaft (PIRLS 2001, 2006 und 2011; TIMSS 1995, 2007 und 2011)

Leistungstrend in LesenAUT DEU SVN SGP

Leistungstrend in MathematikAUT DEU SVN SGP

Leistungstrend in NaturwissenschaftAUT DEU SVN SGP

Lese

kom

pete

nz

hoch

niedrig

Mat

hem

atik

kom

pete

nz

hoch

niedrig

Nat

urw

isse

nsch

afts

kom

pete

nz

hoch

niedrig

2001 2006* 2011*2001 2006* 2011*

1995 2007* 2011 1995 2007 2011

625

600

575

550

525

500

475

450

625

600

575

550

525

500

475

4501995 2007 20111995 2007* 2011*

600

575

550

525

500

475

4501995 2007 2011

600

550

525

500

475

450

600

575

550

525

500

475

450

600

550

525

500

475

4501995 2007 20111995 2007* 2011 1995 2007* 2011

600

575

550

525

500

475

625

600

575

550

525

500

475

450

600

550

525

500

475

450

600

575

550

525

500

475

45019951995 2007* 2011

600

575

550

525

500

475

625

600

575

550

525

500

475

450

600

575

550

525

500

475

450

600

550

525

500

475

4501995

LandesmittelwertMittelwert MädchenMittelwert Buben

... Landesmittelwert hat sich im Vergleich zur letzen Erhebung signifikant verbessert/verschlechtert

... Mittelwert Mädchen hat sich im Vergleich zur letzten Erhebung signifikant verbessert/verschlechtert

... Mittelwert Buben hat sich im Vergleich zur letzten Erhebung signfikant verbessert/verschlechtert

575

600

550

525

500

4752001 2006 2011*

**

*

***

**

575

600

550

525

500

4752001 2006* 2011*

*

**

* * *

*

*

***

**

**

*

Page 23: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 21

und Buben getrennt voneinander, so zeigt sich lediglich in Österreich von 1995 auf 2007 für beide Geschlechter ein deut - licher Leistungsrückgang von 27 bzw. 24 Punkten (p < .01).

Die mathematischen Fähigkeiten der slowenischen Schüler/ innen waren bei TIMSS 1995 vergleichsweise gering (462) und haben sich bis 2007 um 40 Punkte deutlich verbessert (p < .01). Bis 2011 sind ihre Leistungen nochmals um 11 Punkte (p < .01) gestiegen. Dieser Aufwärtstrend über alle Erhebungszeitpunkte hinweg lässt sich auch getrennt für Mädchen und Buben feststellen.

Naturwissenschaft

In Naturwissenschaft zeigt sich für alle Länder ein ähn-licher Leistungstrend wie in Mathematik. In Österreich ist die Naturwissenschaftskompetenz der Schüler/innen von 1995 auf 2007 zurückgegangen (–13 Punkte; p < .01). Der Mittelwert der Buben ist von 545 auf 532 Punkte gesunken (p < .05) und jener der Mädchen um 11 Punkte (p < .05). Von 2007 bis 2011 gab es, wie auch in Deutschland, Singa-pur und Slowenien, keine bedeutsame Veränderung (auch bei den Geschlechtern nicht). Die Viertklässler/innen in Slowenien konnten ihre naturwissenschaftlichen Fähigkeiten von 1995 auf 2007 deutlich verbessern (+54 Punkte; p < .01); von 2007 auf 2011 blieb das Niveau an nähernd gleich (dieses Bild spiegelt sich ebenfalls für die beiden Ge-schlechter getrennt betrachtet wider). Auch in Singapur gab es von 1995 auf 2007 einen deutlichen Leistungssprung. Der Durchschnittswert in Naturwissenschaft hat sich um 63 Punkte verbessert (p < .01); keine bedeutsame Verän-derung gab es hingegen von 2007 auf 2011. Das gleiche Muster zeigt sich ebenfalls, wenn man die Mittelwerte der Mädchen getrennt von jenen der Buben analysiert: Sowohl die Buben als auch die Mädchen haben sich von 1995 auf 2007 signifikant um 61 bzw. 66 Punkte verbessert; von 2007 auf 2011 blieben die Leistungen annähernd gleich.

Leistungsstarke und leistungsschwache Schüler/innen

Auch wenn bei den Ergebnisdarstellungen von internati-onalen Studien stets mit einem Vergleich der Mittelwerte begonnen wird, sollte nicht außer Acht gelassen werden, dass die Mittelwerte in erster Linie dazu geeignet sind, einen ersten Überblick über das Leistungsniveau der Länder zu geben. Ein und derselbe Leistungswert kann dabei allerdings durch völlig unterschiedliche Konstellationen entstehen: Ein bestimmter Mittelwert kann beispielsweise dadurch zustande kommen, dass es in einem Land viele Schüler/in-nen auf einem mittleren Leistungsniveau gibt, gleichzeitig jedoch wenige gute und wenige schwache Schüler/innen. Umgekehrt kann in einem anderen Land derselbe Mittel-

wert dadurch entstehen, dass es viele schwache und gleich-zeitig viele leistungsstarke Kinder gibt. Aus dem Mittelwert können also weder Aussagen über die Verteilung der Leis-tungen gemacht werden noch ist es möglich, die erbrachten Leistungen inhaltlich zu charakterisieren. Dazu gibt es bei PIRLS & TIMSS die sogenannten Kompetenzstufen. Diese bilden einen wesentlichen und pädagogisch wichtigen Teil bei den Ergebnisanalysen. In jedem Testbereich (Lesen, Mathematik und Naturwissenschaft) wurde die Leistungs-skala an bestimmten Punkten unterteilt, um dadurch fünf Stufen zu bilden (für eine Beschreibung dieser Methode und eine inhaltliche Beschreibung der Kompetenzstufen siehe Suchań & Wallner-Paschon, 2012, S. 69 ff.). Schüler/innen auf Stufe 1 (400–474 Punkte) bzw. unter Stufe 1 (< 400 Punkte) können aufgrund ihrer geringen Kompetenzen als leistungsschwache Schüler/innen bezeichnet werden. Sie besitzen maximal Basiskompetenzen und können nur die einfachsten Aufgaben von PIRLS bzw. TIMSS lösen – wie beispielsweise in Mathematik das Addieren von zwei ganzen Zahlen oder in Lesen das Heraussuchen von leicht auffindbaren Informationen in einem Text. Stufe 2 ver-langt von den Schülerinnen und Schülern, ihr Basiswissen in ein fachen Situationen anzuwenden; auf Stufe 3 müssen sie ihre erworbenen Fähigkeiten in mehreren unterschied-lichen Kontexten einsetzen. Kinder auf der höchsten Kom-petenzstufe 4 (≥ 625 Punkte) können hingegen komplexe Auf gaben (mit mehreren Zwischenschritten) in einer Reihe von unterschiedlichen Situationen erfolgreich bearbeiten; sie werden als leistungsstark bezeichnet.

Überschneidungen zwischen den Kompetenzbereichen hinsichtlich leistungsstarker und leistungsschwacher Schüler/innen

Im Erstbericht zu PIRLS und TIMSS 2011 (Suchań, Wall-ner-Paschon, Bergmüller & Schreiner, 2012) findet sich für jeden Kompetenzbereich getrennt eine Darstellung, wie sich die Schüler/innen der Teilnehmerländer auf die Kompetenzstufen verteilen. Abbildung 1.1.5 zeigt er-gänzend dazu, wie viele Schüler/innen in allen drei Leistungsbereichen, in zwei der drei Leistungsbereiche bzw. in einem Bereich zur leistungsstarken/leistungsschwachen Gruppe zählen. Dargestellt sind jene EU-Länder, die sich sowohl bei PIRLS als auch bei TIMSS mit der 4. Schulstufe beteiligt haben; insgesamt trifft dies auf 17 Länder zu.6 Auf der linken Seite der Abbildung finden sich die Überschnei-dungen der leistungsschwachen Schüler/innen; rechts jene der leistungsstarken. Die Teilnehmerländer sind dabei ab-steigend nach dem Anteil jener Kinder sortiert, die sowohl in Lesen als auch in Mathematik und Naturwissenschaft maximal Basiskompetenzen besitzen (Kompetenzstufe 1 bzw. unter 1). Diese Schüler/innen sollten besonders geför-dert werden; sie weisen bereits in der Volksschule in jenen Bereichen Defizite auf, die eine wesentliche Grundlage für die Entwicklung einer fundierten Allgemeinbildung sind.

6 Von den 20 EU-Ländern, die sich sowohl an PIRLS als auch an TIMSS 2011 beteiligt haben, haben 17 für beide Studien dieselben Schüler/innen getestet.

Page 24: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

22 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft

Der Anteil jener Viertklässler/innen, die besonderen För-derbedarf haben, da sie in allen drei Bereichen zu den Leistungsschwachen zählen, schwankt zwischen 3 % in Finnland und 27 % in Malta. In Österreich betrifft dies jedes 10. Kind; weitere 12 % erreichen in zwei von drei Bereichen maximal Kompetenzstufe 1 und 16 % zählen entweder in Lesen oder in Mathematik oder in Naturwis-senschaft zur leistungsschwachen Gruppe. Insgesamt hat somit etwa jedes 3. Kind in Österreich (38 %) in zumin-dest einer von drei grundlegenden Kompetenzen in der 4. Schulstufe Mängel. In Polen, Spanien, Rumänien und Malta trifft dies auf jeweils (knapp) über die Hälfte der Schüler/innen zu.

Den höchsten Anteil an Kindern, die in Lesen, Mathema-tik und Naturwissenschaft zu den Leistungsstarken zählen, gibt es erwartungsgemäß in Finnland: 5 % schaffen es hier in allen drei Domänen in die höchste Stufe. Mit weiteren 9 % in zwei Domänen und 18 % in einer erzielt insge-samt knapp ein Drittel der finnischen Viertklässler/innen in zumindest einem Bereich herausragende Leistungen. In Österreich ist dieser Anteil mit 12 % nicht einmal halb so groß; wobei nur 1 % sowohl in Lesen als auch in Mathe-matik und Naturwissenschaft leistungsstark ist, 3 % in zwei dieser Kompetenzen und 9 % in einem Kompetenzbereich.

Charakteristika leistungsstarker und leistungs-schwacher Schüler/innen in Österreich

Analysiert man die Leistungsstarken und -schwachen in Lesen, Mathematik und Naturwissenschaft getrennt von-einander, so zählen in Österreich 20 % der bei PIRLS ge- testeten Kinder (in Lesen) zur leistungsschwachen Gruppe; bei TIMSS-Mathematik sind es 30 % und in Naturwis-senschaft 21 %. Dem stehen 5 % leistungsstarke Schüler/innen in Lesen, 2 % in Mathematik und 8 % in Naturwis-senschaft gegenüber. In weiterer Folge werden diese Grup-pen nun für Österreich nach den Merkmalen Geschlecht, Migrationshintergrund und Schulbildung der Eltern ge-nauer charakterisiert. Abbildung 1.1.6 zeigt, getrennt für Lesen, Mathematik und Naturwissenschaft, zu welchen An-teilen die leistungsstarke bzw. -schwache Gruppe aus Mäd-chen und Buben, aus Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund besteht und welche Bildungs-abschlüsse ihre Eltern besitzen. Zum Vergleich ist für jedes Merkmal auch die Verteilung in der gesamten Population dargestellt.

In Lesen sind entsprechend dem Leistungsunterschied beim Mittelwert (s. Abbildung 1.1.4) die Mädchen in der leistungsstarken und die Buben in der leistungsschwachen Gruppe – im Vergleich zur Population – tendenziell über-

Abbildung 1.1.5: Überschneidungen zwischen leistungsstarken und leistungsschwachen Schülerinnen und Schülern in Lesen, Mathematik und Naturwissenschaft (PIRLS & TIMSS 2011)

1020 0 2010leistungsschwach leistungsstark

Überschneidungen zwischen leistungsschwachen und -starken Schülerinnen und Schülern

3030405060 0% %

MLT

ROU

ESP

POL

SVN

HUN

SKV

LTU

AUT

IRL

ITA

SWE

PRT

DEU

CZE

GBR (N)

FIN

20

16

20

18

13

13

15

13

16

13

17

17

14

13

14

12

20

14

16

16

12

10

11

10

12

12

13

12

11

10

11

9

5

27

23

17

17

13

12

11

11

10

9

9

9

8

8

8

7

3

6

10

6

8

8

12

10

9

9

14

11

12

11

10

11

20

18

6

3

5

4

4

3

5

4

4

5

3

4

9

9

15

5

3

3

4

Spitze in 3 Bereichen

Spitze in 2 Bereichen

Spitze in 1 Bereich

Leistungsschwach in 3 Bereichen

Leistungsschwach in 2 Bereichen

Leistungsschwach in 1 Bereich

Teilnehmerländer absteigend nach dem Anteil der leistungsschwachen Schüler/innen in allen drei Bereichen (Lesen, Mathematik und Naturwissenschaft) sortiert

Page 25: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 23

repräsentiert. In Mathematik und Naturwissenschaft ist die-ses Bild umgekehrt: Mit einem Verhältnis von etwa 2/3 zu 1/3 gibt es bei den Leistungsstarken deutlich mehr Buben als Mädchen. Unter den leistungsschwachen Schülerinnen und Schülern ist der Unterschied (mehr Mädchen als Bu-ben) nicht so deutlich ausgeprägt.

Hinsichtlich des Merkmals Migrationshintergrund zeigt sich, dass leistungsschwache Schüler/innen im Vergleich zu allen getesteten Kindern wesentlich häufiger aus Fami-lien mit Migrationshintergrund stammen. Dies gilt sowohl für Lesen als auch für Mathematik und Naturwissenschaft. Während in der Population 19 % der Kinder Migrations-hintergrund haben (Migrantinnen und Migranten der ers-ten bzw. zweiten Generation), sind es bei den Leistungs-schwachen je nach Domäne zwischen 31 % (Mathematik) und 43 % (Naturwissenschaft). Dennoch darf die Tatsache nicht unerwähnt bleiben, dass jeweils mehr als die Hälfte der Kinder in der leistungsschwachen Gruppe keinen Migrationshintergrund hat. Die leistungsstarken Gruppen

bestehen hingegen zu über 90 % aus einheimischen Kin-dern; das heißt, dass die Migrantinnen und Migranten in der höchsten Kompetenzstufe unterrepräsentiert sind.

Darüber hinaus lassen sich leistungsschwache Kinder da-durch charakterisieren, dass ihre Eltern häufiger geringere Bildungsabschlüsse aufweisen. In der Population hat etwa 1/4 der Kinder zumindest einen Elternteil mit einem Uni-versitätsabschluss oder einem Abschluss an einer Fachhoch-schule bzw. Pädagogischen Akademie/Sozialakademie. Sieht man sich die Verteilung der Abschlüsse bei jenen Kindern auf Kompetenzstufe 1 und darunter an, so haben nur 10–12 % von ihnen zumindest einen Elternteil mit Universitäts- oder Fachhochschulabschluss. Weitere 12–15 % stammen aus Familien, in denen die höchste absolvierte Ausbildung einem Pflichtschulabschluss entspricht. Die Mehrheit der leistungsschwachen Schüler/innen (etwa 60 %) hat Eltern mit einem Abschluss an einer berufs bildenden mittle-ren Schule oder mit einem Lehrabschluss. Ein anderes Bild zeigt sich in allen drei Kompetenzbereichen bei den

Anteile leistungsstarker und leistungsschwacher Schüler/innen in Österreich in Lesen nach ...

Anteile leistungsstarker und leistungsschwacher Schüler/innen in Österreich in Mathematik (M) und Naturwissenschaft (N) nach ...

Population

leistungsstark

leistungsschwach

Population

leistungsstark

leistungsschwach

Population

leistungsstark M

leistungsschwachM

NW

NW

Population

leistungsstark M

leistungsschwachM

NW

NW

... Geschlecht ... Migrationshintergrund ... Bildung der Eltern

... Geschlecht ... Migrationshintergrund ... Bildung der Eltern

Mädchen

Buben

max. Pflichtschule

BMS/Lehre

MaturaUni/PädAkPH/Soz/AK/FH

ohne Migrationshintergrund

Migrationshintergrund 2. Generation: Schüler/in in Österreich, beide Eltern im Ausland geborenMigrationshintergrund 1. Generation: Schüler/in und beide Eltern im Ausland geboren

100806040200 % % %100806040200 % 100806040200

100806040200 % % %100806040200 % 100806040200

Angaben in Prozent; Werte unter 4 % sind nicht eingetragen

5149

4753

5743

580 14

94

1064 26

580 14

94

96

869 23

1157 32

26225 47

512623

101414 61

26215 47

572220

4630 24

121712 60

101615 59

5149

6931

6535

4852

4753

Abbildung 1.1.6: Charakteristika der leistungsstarken und leistungsschwachen Schüler/innen (PIRLS & TIMSS 2011)

Page 26: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

24 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft

Viertkläss lerinnen und Viertklässlern auf der höchsten Leistungsstufe   4: etwa 50 % der Kinder (doppelt so viele wie in der Population) haben zumindest einen Elternteil mit Universitätsabschluss (oder mit einem vergleichbaren Abschluss). Die Anteile in der Kategorie Matura unterschei-den sich nur gering von jenen in der Population und jene mit einem Lehrabschluss bzw. einer berufsbildenden mittle-re Schule sind mit 20–30 % geringer als in der Population (47 %).

Geschlechterdifferenzen bei den Leistungs-skalen von PIRLS & TIMSS 2011

In Ergänzung zum Erstbericht folgt zum Abschluss die-ses Beitrags eine zusammenfassende Darstellung der Ge-schlechterdifferenzen sowohl im Hinblick auf die Gesamt- als auch auf die Subskalen von PIRLS & TIMSS 2011 (eine detaillierte Beschreibung der Subskalen findet sich in Grafendorfer, Wallner-Paschon, Suchań & Widauer, 2012). Im Erstbericht wurden lediglich die Mittelwerte aller Teil-nehmerländer bei den Subskalen berichtet – die Geschlech-terdifferenzen wurden in diesem Zusammenhang bislang nicht berücksichtigt. Weiterführende Analysen zu den an-deren beiden Faktoren, die im Hinblick auf die Chancen-gerechtigkeit von Bedeutung sind (Migrationshintergrund und Bildung der Eltern), finden sich in eigenen Beiträgen dieser Publikation (siehe Kapitel 2.1 sowie 2.2), weshalb dieser Beitrag – im Gegensatz zu den Geschlechterdifferen-zen – nicht gesondert darauf eingeht.

Abbildung 1.1.7 zeigt die Unterschiede zwischen Mädchen und Buben für alle Lesebereiche sowohl für Österreich als auch im Schnitt für die teilnehmenden EU-Länder. Neben der Punktdifferenz und der Signifikanz (Sternsymbol neben dem entsprechenden Balken) ist rechts daneben auch die Effektstärke eingetragen.

In Lesen übertreffen die österreichischen Mädchen die Buben um 8 Punkte; im EU-Schnitt sind es 12 Punkte (siehe Abbildung 1.1.7). In beiden Fällen ist die Differenz statistisch signifikant, aber inhaltlich kaum von Bedeutung (Effektstärke < 0.2). In den EU-Ländern gibt es – durch-schnittlich betrachtet – bei allen vier Lese-Subskalen signi-fikante Geschlechterdifferenzen. Allerdings zeigen sich nur beim Interpretieren, Verknüpfen und Bewerten von Inhalten bedeutende Effektstärken über 0.2 (in der Abbildung nur als Interpretieren bezeichnet). Es handelt sich dabei um den komplexeren der beiden Verstehensprozesse, die zur Lösung der Aufgaben von den Schülerinnen und Schülern verlangt werden. Im EU-Schnitt übertreffen die Mädchen die Buben dabei um 13 Punkte. In Österreich erbringen die Mädchen und Buben beim Lesen von Informationstexten und bei der kognitiven Skala Wiedergeben und einfaches Schluss folgern (in der Abbildung nur als Wiedergeben bezeichnet) ver-gleichbare Leistungen. Beim Lesen von literarischen Texten sowie beim komplexeren Verstehensprozess Interpretieren, Verknüpfen und Bewerten übertreffen die Mädchen die Buben um 13 bzw. 10 Punkte. Beide Unterschiede sind zwar signifikant, die Effektstärke liegt allerdings nur beim Interpretieren über 0.2.

In Mathematik (s. Abbildung 1.1.8) schwanken die Ge-schlechterdifferenzen in Österreich zwischen 5 und 16 Punkten zugunsten der Buben. Inhaltlich von Bedeutung ist allerdings nur die Differenz beim anspruchsvollsten der drei kognitiven Bereiche – beim Begründen. Wenn es also darum geht, in Mathematik Fragestellungen zu lösen, die sich auf unbekannte Situationen sowie komplexe Kontexte und Probleme beziehen, übertreffen die Buben der 4. Klasse ihre Alterskolleginnen um 16 Punkte. Im EU-Schnitt sind die Unterschiede zwischen Mädchen und Buben auf den meisten Skalen etwas geringer als in Österreich; sie sind zwar statistisch signifikant, inhaltlich allerdings kaum von Bedeutung (Effektstärke < 0.2).

Im Kompetenzbereich Naturwissenschaft (s. Abbildung 1.1.8) sind die Geschlechterdifferenzen in Österreich auf

Leseintentionen

GesamtskalaLesen

Information

Literarisch

Wiedergeben

InterpretierenVerstehensprozesse

–10–20 0 2010Mädchen besser Buben besser

Effektstärke

–0.12–0.17

Geschlechterdifferenzen in Lesen

812

–0.19–0.23

1013

–0.02–0.11

512

–0.07–0.16–0.16–0.18

18

1317

EU-Schnitt

AUT

Differenz ist signifikant (p < .05)

Abbildung 1.1.7: Geschlechterdifferenzen in Lesen (PIRLS 2011)

Page 27: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 25

einigen Skalen deutlich höher als in Mathematik und Lesen. Bei den Aufgaben zu den Themen Physik und Erdkunde liegen die Buben im Schnitt um 18 bzw. 24 Punkte vor den Mädchen. Beide Unterschiede sind sowohl statistisch als auch praktisch bedeutsam. Aufgaben aus dem Inhalts-bereich Biologie werden in Österreich und im EU-Schnitt von beiden Geschlechtern jeweils gleich gut gelöst. Die Differenzen der kognitiven Subskalen schwanken in Öster-reich zwischen 12 und 15 Punkten (im EU-Schnitt sind sie mit 1–7 Punkten geringer); von inhaltlicher Relevanz sind diese allerdings wie in Mathematik nur beim komplexesten Bereich Begründen, bei dem die Schüler/innen beispiels-weise Ergebnisse aus Experimenten mit naturwissenschaft-lichen Konzepten in Verbindung bringen müssen.

Zusammenfassung

Die Lese- und Mathematikkompetenzen der österreichi-schen Schüler/innen liegen unter dem Durchschnittswert der jeweils teilnehmenden EU-Länder. In Naturwissen-schaft schneiden sie besser ab; das Österreich-Mittel liegt deutlich über dem EU-Schnitt und nur die finnischen Kinder erreichen einen signifikant höheren Mittelwert. Vor allem in Lesen und in Mathematik fällt Österreich durch eine vergleichsweise geringe Streuung der Leistung auf. Diese lässt sich hauptsächlich auf individuelle Schülermerk-male zurückführen und ist nur zu einem geringen Anteil durch die Zugehörigkeit zu einer bestimmten Klasse oder Schule erklärbar.

Inhaltsbereiche

GesamtskalaNaturwissenschaft

Biologie

Physik

Erdkunde

Wissen

AnwendenKognitive Bereiche

–10–20 0 2010Mädchen besser Buben besser

Effektstärke

Begründen

0.180.08

0.04–0.020.260.150.270.13

0.17

0.02

0.080.21

0.090.17

Inhaltsbereiche

GesamtskalaMathematik

Zahlen

Geom. Formen

Darstellen

Wissen

AnwendenKognitive Bereiche

–10–20 0 2010Mädchen besser Buben besser

Effektstärke

Begründen

0.150.09

0.150.110.130.050.130.03

0.18

0.08

0.090.23

0.090.09

Geschlechterdifferenzen in Mathematik

Geschlechterdifferenzen in Naturwissenschaft

96

94

103

167

127

56

98

126

1811

2411

151

126

127

31

EU-Schnitt

AUT

Differenz ist signifikant (p < .05)

EU-Schnitt

AUT

Differenz ist signifikant (p < .05)

Abbildung 1.1.8: Geschlechterdifferenzen in Mathematik & Naturwissenschaft (TIMSS 2011)

Page 28: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

26 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft

Ein Vergleich der Leistung über die Zeit hinweg zeigt für Lesen einen geringen, aber dennoch statistisch signifikan-ten Leistungsrückgang von 9 Punkten. In Mathematik und Naturwissenschaft ist die Leistung nach einer deutlichen Abnahme von 1995 auf 2007 annähernd gleich geblieben.

Insgesamt 38 % der Viertklässler/innen in Österreich zäh - len in zumindest einem Kompetenzbereich zu den Leis-tungsschwachen; in Finnland sind es mit 17 % etwa halb so viele. Jedes 10. Kind in Österreich hat hingegen sowohl in Lesen als auch in Mathematik und Naturwissenschaft bereits am Ende der Volksschule Defizite. Diese leistungs-schwachen Schüler/innen stammen häufiger aus Familien mit Migrationshintergrund und ihre Eltern haben zum Großteil maximal eine berufsbildende mittlere Schule oder eine Lehre absolviert. Im Vergleich dazu sind über 90 %

der leistungsstarken Kinder Einheimische und etwa 50 % haben Eltern mit einem Universitätsabschluss bzw. einem Abschluss an einer Fachhochschule oder an einer Pädagogi-schen Akademie/Sozialakademie.

Die Leistungsunterschiede zwischen Mädchen und Buben in Österreich sind insgesamt gering. In Lesen liegen sie bei allen Subskalen jeweils etwas unter dem EU-Durchschnitt; in Mathematik und Naturwissenschaft zeigen sich hinge-gen für Österreich größere Differenzen im Vergleich zum Mittelwert aller teilnehmenden EU-Länder. Inhaltlich bedeutsam sind die Differenzen bei der anspruchsvollen Lesesubskala Interpretieren zugunsten der Mädchen; beim kognitiven Bereich Begründen in Mathematik und Natur-wissenschaft sowie bei Aufgaben aus den Bereichen Physik und Erdkunde zugunsten der Buben.

Literatur

Grafendorfer, A., Wallner-Paschon, C., Suchań, B. & Widauer, K. (2012). Was messen PIRLS & TIMSS? In: B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S. 12–48). Graz: Leykam.

Lipowsky, F. (2006). Auf den Lehrer kommt es an. Zeitschrift für Pädagogik, 51, 47–70.

OECD (2009). PISA Data Analyses Manual. SPSS, Second Edition. Paris: OECD.

Suchań, B. & Wallner-Paschon, C. (2012). Datenaufbereitung für die Ergebnisanalysen. In: B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S. 68–79). Graz: Leykam.

Suchań, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam.

Page 29: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Analysen auf Itemebene in Lesen 27

1.2 Analysen auf Itemebene in Lesen Karl Blüml & Sandra Filzmoser

Fragestellung

Lesekompetenz ist ein elementarer Bestandteil unserer Kultur. Sie bildet nicht nur das Fundament für das Lernen in allen Schulfächern, sondern ist auch für das Leben außer­halb der Schule unverzichtbar. Bei PIRLS wird Lesekompe­tenz definiert als „die Fähigkeit, jene geschriebenen Sprach-formen zu verstehen und zu nutzen, die von der Gesellschaft verlangt werden und/oder für die jeweilige Person nützlich und wertvoll sind. Junge Leser/innen können die Bedeutung von verschiedensten Texten erfassen. Sie lesen, um zu lernen, um an der Gemeinschaft der Lesenden in der Schule sowie im täglichen Leben teilzunehmen und zum Vergnügen“ (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009, S. 11; deut­sche Übersetzung v. BIFIE). Lesen ist damit die Fähigkeit, Texte in allen Medien dekodieren, verstehen, verarbeiten und zum Lernen nutzen zu können (Renner, 2013, S. 5).

Man kann das Verstehen von Texten anhand einiger Ver­stehensprozesse überprüfen, die in ihrer Gesamtheit den kompetenten Umgang mit Texten beschreiben sollen. PIRLS überprüft die folgenden vier Verstehensprozesse an­hand entsprechender Aufgabenstellungen (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009, S. 13 f.):

�� Erkennen und Wiedergeben explizit angegebener Infor­mationen;�� Ziehen einfacher Schlussfolgerungen;�� Interpretieren sowie Verknüpfen von Gedanken und

Informationen;�� Untersuchen und Bewerten von Inhalt, Sprache und

einzelnen Textelementen.

Neben diesen vier Verstehensprozessen werden bei PIRLS zwei Leseabsichten untersucht: das „Lesen, um literarische Erfahrungen zu machen“ und das „Lesen, um Informati­onen zu gewinnen“ (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009). Erstere wird anhand von literarischen Texten erhoben, zweitere anhand von Sachtexten. Die lite­rarischen Texte sind durchwegs narrativer Art (keine Lyrik, kein dramatischer Text), die Informationstexte sind eben­

falls zum überwiegenden Teil stark narrativer Art. Von den zehn eingesetzten Texten sind fünf literarische Texte und fünf Sachtexte. Jede der Leseaufgaben kann somit einem Verstehensprozess und einer Textart (und in diesem Verständ­nis einer angenommenen Leseabsicht) zugeordnet werden.

Um festzustellen, wie gut es den österreichischen Schüler­innen und Schülern gelingt, diese unterschiedlichen Ver­stehensprozesse und Textarten zu meistern, werden im Folgenden einzelne Testaufgaben analysiert. Dabei handelt es sich im Allgemeinen um veröffentlichte1, in Ausnahme­fällen auch unveröffentlichte Aufgaben. Die unveröffent­lichten Aufgaben müssen unter Verschluss gehalten werden, da sie in zukünftigen Erhebungen von PIRLS wieder ein­gesetzt werden. Diese können daher hier nur in sehr all­gemeiner und verschlüsselter Form beschrieben werden, sodass kein Rückschluss auf die konkrete Aufgabe möglich ist. Um dennoch die Textart (Leseabsicht) herauslesen zu können, werden die Texte „INFO“ und „LIT“ inklusive einer durchlaufenden Ziffer genannt.

Neben einer Zuordnung der Aufgaben zu den Verstehens­prozessen und Leseabsichten (Textarten) können diese auch nach ihrem Aufgabenformat eingeteilt werden. Bei Auf ­ gaben mit geschlossenem Antwortformat müssen die Kinder das jeweils richtige Kästchen ankreuzen (Multiple Choice). Bei Fragen mit offenem Antwortformat müssen sie selbst­ständig Antworten formulieren.

In diesem Beitrag wird untersucht, welche Merkmale Auf­gaben aufweisen, die den österreichischen Kindern auf­fällig leicht bzw. schwer fallen. Die Lösungshäufigkeiten der österreichischen Schüler/innen werden dabei mit jenen alle r PIRLS­Länder im Durchschnitt sowie mit den Werten der Schüler/innen Deutschlands und Englands verglichen. Deutschland wurde wegen des ähnlichen Schulsystems und der gleichen Sprache als Vergleichsland gewählt. England wurde gewählt, weil es immer wiederkehrende Vermutun­gen gibt, dass die Schüler/innen in angelsächsischen Län­dern vertrauter mit dem Multiple­Choice­Aufgabenformat sind und deshalb bessere Ergebnisse erzielen.

Bei PIRLS wird eine Vielzahl an Leseaufgaben (Items) eingesetzt. In Itemanalysen werden diese nach ihrer Schwierigkeit eingestuft. Schwierige Aufgaben zeichnen sich durch eine geringe Lösungshäufigkeit aus, leichte durch eine hohe. Im vorliegenden Beitrag wird untersucht, welche Aufgaben den österreichischen Kindern auffällig leicht bzw. schwer fallen. Die Lösungshäufigkeiten der österreichischen Schüler/innen werden dabei mit jenen aller PIRLS-Länder im Durch-schnitt sowie mit den Werten der Schüler/innen Deutschlands und Englands verglichen. Anschließend wird der Frage nachgegangen, welche spezifischen Merkmale die in Österreich auffälligen Aufgaben aufweisen. Daraus sollen didaktische Rückschlüsse auf den Unterricht gezogen werden.

1 Alle veröffentlichten PIRLS­Testaufgaben und ­Texte können auf https://www.bifie.at/node/1947 nachgelesen werden.

Page 30: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

28 Analysen auf Itemebene in Lesen

Insbesondere soll untersucht werden, ob die österreich i­schen Schüler/innen Stärken oder Schwächen in Bezug auf bestimmte Verstehensprozesse, bestimmte Textarten, be­stimmte Antwortformate oder auch in Bezug auf wesent­liche Textmerkmale (z. B. Lesbarkeit, Integration von Ta­bellen, Grafiken) aufweisen.

Methode

Bei PIRLS 2011 wurden den Schülerinnen und Schülern 142 Testaufgaben (Items) zu 10 Texten auf 13 Testhefte aufgeteilt vorgelegt (s. Wallner­Paschon & Widauer, 2012, S. 52 ff.). Die Grundlage der vorliegenden Analyse bilden die Lösungshäufigkeiten dieser 142 Items. Die Lösungs-häufigkeit entspricht dem Schüleranteil, der das jeweilige Item richtig beantwortet hat. Beispielsweise bedeutet eine Lösungshäufigkeit von 57 %, dass 57 % der Schüler/innen die Frage richtig gelöst haben.

Über die Schüler/innen aller Teilnehmerländer hinweg wird für jedes Item die durchschnittliche Lösungshäufig­keit berechnet. Auf Basis dieser Lösungshäufigkeit werden die Items unterschiedlichen Kompetenzstufen (I–IV) zu­geordnet. Die Itemschwierigkeit ist hoch, wenn nur wenige Testteilnehmer/innen eine richtige Lösung gefunden haben und niedrig, wenn das Item von vielen beantwortet werden konnte. Items der Stufe I gelten somit als sehr leicht und jene auf Stufe IV als sehr schwer zu lösen. (Grundsätzlich setzt sich die Itemschwierigkeit zusammen aus Textschwierigkeit und Aufgabenschwierigkeit. Es kann ein einfacher Text durch schwer zu lösende Aufgaben schwierig werden und umgekehrt.)

In Abbildung 1.2.1 sind vier Items aus dem Text „Flieg, Adler, flieg!“2 dargestellt und anhand der angeführten Para­meter erläutert. Im linken Balken ist die Itemschwierigkeit abgebildet. Rechts daneben sind die Lösungshäufigkeiten im PIRLS­Schnitt, darunter für Österreich gesamt bzw. für die Buben und Mädchen separat und in der dritten Zeile für Deutschland und England angegeben. Die Testitems sind in der dritten Spalte abgebildet, so wie sie in den Testheften abgedruckt werden, woraus sich die Nummerierung ergibt. In Blau sind Musterlösungen eingetragen. Welchem Verste­hensprozess die Items zugeordnet werden, ist in der rechten Spalte abzulesen.

Die ausgewählten Items aus dem Text „Flieg, Adler, flieg!“ sind in Abbildung 1.2.1 so dargestellt, dass die Anforderung an die Leseleistung von unten nach oben zunimmt. In man­chen Fällen ist eine Frage mit einer reinen Suchleistung zu lösen, ohne die Bedeutung des Worts überhaupt zu verste­hen. So zum Beispiel im ersten Item der Abbildung 1.2.1.

Der erste Satz der Geschichte lautet: „Eines Tages machte sich ein Bauer auf die Suche nach einem verloren gegan­genen Kalb.“ Hier ist der Schwierigkeitsgrad eher niedrig, die Schüler/innen müssen die Bedeutung von „Kalb“ nicht kennen, sie müssen lediglich erkennen, dass „suchen gehen“ bedeutungsmäßig ident ist mit „machte sich auf die Suche“. Der direkte Verstehensprozess ist einfach, sprachlich ge sehen gibt es jedoch die Voraussetzung, dass die semantische Iden­tität eines Funktionsverbgefüges und eines Verbs erkannt wird. Das Item wird dem Verstehensprozess Erkennen und Wiedergeben explizit angegebener Informationen zugeordnet.

Beim folgenden Verstehensprozess, Ziehen einfacher Schluss-folgerungen, ist die Anforderung an die Testkandidatinnen und ­kandidaten erkennbar höher. Sie müssen bei Item 3 den Schluss ziehen, dass man das In­beide­Hände­Nehmen als Zeichen für vorsichtige Behandlung sehen kann bzw. muss.

Der Verstehensprozess Untersuchen und Bewerten von Inhalt, Sprache und einzelnen Textelementen stellt die komplexesten Anforderungen zur Lösungsfindung. Bei Item 10 muss Spra­che bewertet werden. Man muss zunächst beurteilen, welche Wörter für die Schönheit des Himmels stehen können und sie sodann als Beleg aufschreiben. Das erfordert Weltwissen.

Bei Item 12 muss zunächst eine charakteristische Eigen­schaft eines Menschen gefunden werden (klug, gescheit, schlau) und dann muss man diese Interpretation mit einem Zitat aus dem Text belegen. Eine anspruchsvolle Aufgabe, die dem Verstehensprozess Interpretieren sowie Verknüpfen von Gedanken und Informationen zugeordnet wird. Überdies muss die Antwort selbstständig formuliert werden, was eine weitere Schwierigkeit darstellt.

Obwohl die Verstehensprozesse in ihrer Komplexität auf­bauend sind, werden jeweils zugehörige Items in allen Schwierigkeitsstufen entworfen.

In Abbildung 1.2.2 wird deutlich, wie schwer die einzel­nen Items den österreichischen Schülerinnen und Schü­lern gefallen sind. Es zeigt sich, dass die österreichischen Kinder nahezu nur bei den schwierigeren Items unter die durchschnittliche Lösungshäufigkeit von PIRLS gefallen sind. Das kann vorsichtig so interpretiert werden, dass den österreichischen Kindern nicht immer alle Items gleich leicht oder gleich schwer gefallen sind wie den Kindern der PIRLS­Länder insgesamt.

Von den insgesamt 142 Items trifft auf 58 zu, dass der Unterschied in der Lösungshäufigkeit zwischen Österreich und dem PIRLS­Schnitt bzw. den beiden Vergleichs ländern (Deutschland und England) über 10 Prozentpunkte be­

2 Der Text „Flieg, Adler, flieg!“ ist ein literarischer Text, der bei PIRLS 2011 zum Einsatz kam und nun für die Öffentlichkeit freigegeben wurde. Dieser Text, inklusive aller Testitems, findet sich unter folgendem Link auf den Seiten 12–21: https://www.bifie.at/system/files/dl/PIRLS_freigegebene_Items_mit_Beispiell%C3%B6sungen_20130115.pdf

Page 31: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Analysen auf Itemebene in Lesen 29

Abbildung 1.2.1: Testitems aus dem Text „Flieg, Adler, flieg!“ (PIRLS 2011)

IV

Item-schwierigkeit

Lösungs-häufigkeit Item

Verstehens-prozess

III

II

I

PIRLSAT/B/MDE/EN

Angaben der Lösungshäufigkeit in Prozent für ... ... PIRLS gesamt... Österreich gesamt/Österreich Buben/Österreich Mädchen... Deutschland/England

8796/96/96

95/91

6379/77/81

83/73

5156/55/58

57/73

4059/56/63

36/61

hoch

Inte

rpre

tiere

n so

wie

Ver

knüp

fen

von

Ged

anke

n un

d In

form

atio

nen

Unt

ersu

chen

und

Bew

erte

n v

on In

halt,

Spr

ache

und

ein

zeln

en T

exte

lem

ente

n

Zieh

en e

infa

cher

S

chlu

ssfo

lger

unge

nE

rken

nen

und

Wie

derg

eben

exp

lizit

ange

gebe

ner

Info

rmat

ione

n

nied

rig

1. Was wollte der Bauer am Anfang der Geschichte suchen gehen?

ein Kalb

Hirten

felsige Abhänge

ein Adlerjunges

3. ?etlednaheb githcisrov egnujreldA sad reuaB red ssad ,nam tkrem naroW

Er nahm das Adlerjunge in beide Hände.

Er brachte das Adlerjunge zu seiner Familie.

Er setzte das Adlerjunge zurück in sein Nest.

Er suchte am Flussufer nach dem Adlerjungen.

A

B

C

D

A

B

C

D

1. Was wollte der Bauer am Anfang der Geschichte suchen gehen?

ein Kalb

Hirten

felsige Abhänge

ein Adlerjunges

3. ?etlednaheb githcisrov egnujreldA sad reuaB red ssad ,nam tkrem naroW

Er nahm das Adlerjunge in beide Hände.

Er brachte das Adlerjunge zu seiner Familie.

Er setzte das Adlerjunge zurück in sein Nest.

Er suchte am Flussufer nach dem Adlerjungen.

A

B

C

D

A

B

C

D

10. Suche Wörter, die beschreiben, wie schön der Himmel in der Morgendämmerung aussah und schreibe sie ab.

!

12. Du hast durch das, was der Freund des Bauern getan hat, erfahren, was für ein Mensch er war. Beschreibe zuerst, was der Freund für ein Mensch war. Nenne dann zur Begründung ein Beispiel, was er getan hat.

!

Die Wolkenfetzen am Himmel waren zuerst rosa,

dann begannen sie, golden zu glänzen.

Er war schlau. Er wusste, dass er den Adler zum

Berg bringen musste, damit er fliegen würde.

10. Suche Wörter, die beschreiben, wie schön der Himmel in der Morgendämmerung aussah und schreibe sie ab.

!

12. Du hast durch das, was der Freund des Bauern getan hat, erfahren, was für ein Mensch er war. Beschreibe zuerst, was der Freund für ein Mensch war. Nenne dann zur Begründung ein Beispiel, was er getan hat.

!

Die Wolkenfetzen am Himmel waren zuerst rosa,

dann begannen sie, golden zu glänzen.

Er war schlau. Er wusste, dass er den Adler zum

Berg bringen musste, damit er fliegen würde.

Page 32: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

30 Analysen auf Itemebene in Lesen

trägt. Bei diesen schneidet Österreich bei 54 Items besser und bei 4 Items schlechter ab als der PIRLS­Schnitt. Diese Items werden auf den folgenden Seiten bezüglich Aufga­benformat (geschlossene Fragestellung, zumeist Multiple Choice, gegenüber offener Fragestellung, die eine verbali­sierte Antwort verlangt), Textart (literarisch oder informa­torisch) analysiert und die Textschwierigkeit anhand von Lesbarkeits indizes untersucht.3

Ergebnisse

Überblick über alle Items

Im Gesamtergebnis haben die österreichischen Kinder 529 Punkte in Lesen erreicht. Der PIRLS­Schnitt liegt bei 512 Punkten, Deutschland hat einen Durchschnitt von 541 Punkten und England einen von 552 Punkten erreicht. Im PIRLS­Ergebnisbericht (vgl. Suchań, Wallner­Paschon, Berg­müller & Schreiner, 2012) wird dies ausführlich dargestellt. Die Einzelitemanalysen sollen Aufschluss darüber geben, wo­rauf die Punktunterschiede zurückführbar sein können.In weiterer Folge wird gezeigt werden, dass die öster­

reichischen Schüler/innen bei manchen Items eine bis zu 28 Prozentpunkte höhere Lösungshäufigkeit erreichen als im PIRLS­Schnitt. Bei anderen Items erreichen sie eine bis zu 15 Prozentpunkte geringere Lösungshäufigkeit.

Im Hinblick auf die Leistung der Kinder bei den Text arten (literarischer Text gegenüber Informations­/Sachtext) gibt die Abbildung 1.2.3 Aufschluss. Allgemein betrachtet ist Österreich bei den Informationstexten unter den Werten von Deutschland und England, aber über dem PIRLS­Schnitt. Bei den literarischen Texten ist Österreich sehr nahe an diesen beiden Vergleichsländern und deutlich über dem PIRLS­Schnitt. In der Einzelanalyse wollen wir unter­suchen, ob es dafür verallgemeinerbare Gründe gibt.

Eine Analyse der Leistung getrennt für Mädchen und Buben zeigt, dass grundsätzlich die Mädchen besser abschneiden als die Buben (im Allgemeinen eher bei literarischen Texten), dass aber die Unterschiede in der Performanz in Österreich erkennbar geringer sind als in den Vergleichsländern (vgl. Abb. 1.2.4). Daraus kann der vorsichtige Schluss gezogen werden, dass die PIRLS­Texte und ­Items keine besonderen geschlechtsspezifischen Bevorzugungen und Benachteili­gungen enthalten.4

3 Dabei ist zu beachten, dass geringfügige Unterschiede in der Lösungshäufigkeit statistisch gesehen keine Aussagekraft haben. Wir führen daher nur jene Items an, deren Lösungshäufigkeit sich bei den österreichischen Schülerinnen und Schülern signifikant vom PIRLS­Schnitt unterscheidet. Der kritische Differenzwert wird von uns bei 10 Prozentpunkten gesetzt. Die durchschnittliche Differenz zwischen der Lösungshäufigkeit von PIRLS und Österreich liegt bei 7,6 Prozentpunkten. Für allfällige didaktische Aussagen erscheint es uns jedoch erforderlich, den Wert bei mindestens 10 Prozentpunkten anzusetzen.

4 Es war erklärtes Ziel von PIRLS, sowohl Texte wie auch Aufgabenprofile so zu gestalten, dass es keine geschlechtsspezifischen Bevorzugungen oder Be­nachteiligungen gibt.

70

50

80

90

100

60

40

20

30

0

10

%

%

Pro

zent

ric

htig

e A

ntw

orte

nle

icht

schw

ierig

ÖsterreichPIRLS-SchnittWerte aufsteigend nach der Lösungshäufigkeit im PIRLS-Schnitt gereiht

Item leichtschwierig

Itemschwierigkeit für Österreich

315

26

40

16

sehr leicht (LH > 80 %)leicht (LH 60−80 %)mittel (LH 40−60 %)schwierig (LH 20−40 %)sehr schwierig (LH < 20 %)

LH = Lösungshäufigkeit

Abbildung. 1.2.2: Testitems nach Lösungshäufigkeit gereiht (PIRLS 2011)

Page 33: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Analysen auf Itemebene in Lesen 31

Zu dem Befund aus Abbildung 1.2.4 kommt noch eine wichtige Überlegung hinzu: Zu jedem der zehn Texte gibt es im Schnitt 14 Items von unterschiedlicher Art und Schwierigkeit. Die Frage ist nun, wie sich Items mit über­durchschnittlich hohen Lösungshäufigkeiten auf die Texte verteilen.

Zum Text LIT1 gibt es 13 Items, 10 davon haben die ös­terreichischen Schüler/innen signifikant häufiger bewältigt als die Schüler/innen aller PIRLS­Länder im Durchschnitt. Darunter befinden sich auch jene Items mit den höchsten Anforderungen im Hinblick auf die Schwierigkeitsstufe. Bei drei weiteren Items liegen die Kinder aus Österreich zwischen 6 und 9 Prozentpunkte über dem internationalen Schnitt (darunter findet sich allerdings kein Testitem aus einer höheren Schwierigkeitsstufe als III). Kurz gesagt, bei den einfacheren Items schneiden die österreichischen Schü­ler/innen erkennbar besser ab (10 von 13 besser).

Zum Text INFO1 gibt es 12 Items, drei davon haben die österreichischen Schüler/innen häufiger richtig gelöst als die Schüler/innen aller PIRLS­Länder im Durchschnitt; diese liegen jedoch alle auf Schwierigkeitsstufe II und keine da­rüber.

Es zeigt sich, die österreichischen Schüler/innen lösen die eher einfachen Items erkennbar besser, nicht aber die schwie­rigeren. Das Muster zeichnet sich auch bei den übrigen Texten und Items ab.

70

50

80

60

40%

%

Pro

zent

ric

htig

e A

ntw

orte

nle

icht

schw

ierig

Österreich

PIRLS-Schnitt

England

Deutschland

Informationstext Literarischer Text

Texte aufsteigend nach Lösungshäufigkeit im PIRLS-Schnitt geordnet

Text

INFO

1

INFO

2

Wan

dern

Zahn

INFO

3

LIT1

LIT2

Adl

er

Folgende Texte sind freigegeben:

Kuc

hen

Wandern = „Wandern macht Spaß!“

Zahn = „Das Rätsel des riesigen Zahns“

Adler = „Flieg, Adler, flieg!“Kuchen = „Der Feindkuchen“

LIT3

70

50

80

60

40%

%

Pro

zent

ric

htig

e A

ntw

orte

nle

icht

schw

ierig

INFO

1

INFO

2

Wan

dern

Zahn

INFO

3

LIT1

LIT2

Adl

er

Kuc

hen

LIT3

INFO

1

INFO

2

Wan

dern

Zahn

INFO

3

LIT1

LIT2

Adl

er

Kuc

hen

LIT3

INFO

1

INFO

2

Wan

dern

Zahn

INFO

3

LIT1

LIT2

Adl

er

Kuc

hen

LIT3

Folgende Texte sind freigegeben:Wandern = „Wandern macht Spaß!“

Zahn = „Das Rätsel des riesigen Zahns“Adler = „Flieg, Adler, flieg!“

Kuchen = „Der Feindkuchen“

Österreich EnglandDeutschland

Texte aufsteigend nach Lösungshäufigkeit im PIRLS-Schnitt geordnet

Informationstext Literarischer Text Landesmittelwert

BubenMädchen

Text Text Text

Landesdurchschnitt PIRLS-Durchschnitt

Abbildung 1.2.3: Lösungshäufigkeit der Testitems nach Texten im Ländervergleich (PIRLS 2011)

Abbildung 1.2.4: Geschlechterunterschiede der Lösungshäufigkeit der Testitems nach Texten im Ländervergleich (PIRLS 2011)

Page 34: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

32 Analysen auf Itemebene in Lesen

Zunächst wollen wir der Frage nachgehen, welche Items es sind, die den österreichischen Schülerinnen und Schülern deutlich leichter gefallen sind (sie eine höhere Lösungshäu­

figkeit erreicht haben) als dem PIRLS­Schnitt und welche ihnen schwerer gefallen sind (sie eine niedrigere Lösungs­häufigkeit erreicht haben).

Tabelle 1.2.1: Items, bei denen Österreich besser abschneidet als der PIRLS-Schnitt

Item Nr.

Textart VerstehensprozessFormat

G/O

Lösungshäufigkeit Kompetenz- stufePIRLS Österreich Deutschland England

1 LIT1 Interpretieren G 63 85 84 87 IV2 LIT1 Schlussfolgern G 72 83 83 81 IV3 LIT1 Schlussfolgern G 64 78 85 82 III4 LIT1 Info suchen G 77 91 90 89 IV5 LIT1 Schlussfolgern G 62 75 75 58 IV7 LIT1 Interpretieren O 36 52 53 54 IV8 LIT1 Schlussfolgern O 52 74 71 76 III9 LIT1 Info suchen O 62 85 81 80 IV10 LIT1 Schlussfolgern O 74 96 92 92 IV11 LIT1 Untersuchen G 53 65 61 71 III15 INFO1 Schlussfolgern G 43 61 59 52 II21 INFO1 Schlussfolgern O 31 48 39 38 II24 INFO1 Untersuchen G 57 80 78 77 II27 Adler Info suchen G 66 78 82 76 III28 Adler Schlussfolgern G 63 79 83 74 II29 Adler Info suchen G 82 95 96 91 II33 Adler Interpretieren G 42 59 62 59 IV34 Adler Interpretieren O 30 40 38 46 IV37 Adler Interpretieren O 40 59 36 61 IV40 INFO2 Schlussfolgern G 49 77 80 67 IV43 INFO2 Schlussfolgern G 56 78 76 69 III48 INFO2 Schlussfolgern G 54 74 68 63 III53 Wandern Info suchen G 49 61 71 59 III56 Wandern Schlussfolgern G 58 74 57 62 III57 Wandern Schlussfolgern O 52 72 66 68 III58 Wandern Schlussfolgern G 70 85 86 87 III62 LIT2 Schlussfolgern G 52 70 77 65 III64 LIT2 Untersuchen O 32 53 62 62 IV65 LIT2 Info suchen G 55 69 73 65 III67 LIT2 Info suchen G 58 68 75 68 III68 LIT2 Info suchen G 75 89 91 80 II69 LIT2 Schlussfolgern G 65 81 81 72 III70 LIT2 Schlussfolgern O 61 74 78 74 IV72 Zahn Schlussfolgern O 48 61 67 63 III77 Zahn Info suchen G 62 73 77 75 III81 Zahn Schlussfolgern G 48 64 69 59 IV92 LIT3 Info suchen G 76 91 94 89 II93 LIT3 Info suchen O 72 89 92 83 II94 LIT3 Untersuchen G 62 75 74 69 III95 LIT3 Schlussfolgern G 74 86 86 84 II99 LIT3 Info suchen G 71 82 85 85 II100 LIT3 Interpretieren O 42 52 54 46 III104 LIT3 Interpretieren O 54 66 72 64 III105 LIT3 Schlussfolgern G 80 90 93 91 II106 LIT3 Interpretieren G 61 78 82 75 III110 LIT3 Interpretieren O 51 64 66 72 III117 Kuchen Info suchen O 65 78 82 83 II120 Kuchen Schlussfolgern O 61 78 84 83 II121 Kuchen Schlussfolgern G 73 84 90 90 II123 Kuchen Interpretieren G 52 65 71 66 III128 INFO3 Info suchen O 60 73 76 74 III138 INFO3 Schlussfolgern G 42 67 66 57 IV139 INFO3 Schlussfolgern G 41 58 58 59 IV140 INFO3 Interpretieren O 26 43 40 43 IV

Folgende Texte sind freigegeben: Adler = „Flieg, Adler, flieg!“; Wandern = „Wandern macht Spaß!“Zahn = „Das Rätsel des riesigen Zahns“; Kuchen = „Der Feindkuchen“

G = geschlossenes Antwortformat; O = offenes AntwortformatAngaben der Lösungshäufigkeit in Prozent

Page 35: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Analysen auf Itemebene in Lesen 33

Items, bei denen Österreich besser abschneidet als der Durchschnitt aller PIRLS-Länder

Es muss angemerkt werden, dass der PIRLS­Durchschnitt zwar als Vergleichsbasis herangezogen werden kann und muss, dass aber der Vergleich mit Deutschland, das die glei­che Sprache, eine vergleichbare Kultur und Tradition und ein vergleichbares Schulsystem hat, aus Sicht der Autoren eine größere Relevanz bei der Interpretation der Ergebnisse hat. Das wird weiter unten im Detail ausgeführt.

Tabelle 1.2.1 beinhaltet alle 54 Items, bei denen die öster­reichischen Schüler/innen eine um mindestens 10 Prozent­punkte höhere Lösungshäufigkeit aufweisen als die Schüler/innen aller PIRLS­Länder im Durchschnitt. Es werden die Textart, der erwartete Verstehensprozess, das Aufgabenfor­mat und die Itemschwierigkeit angeführt und Lösungshäu­figkeiten zwischen den interessierenden Ländern verglichen.

Die Tabelle beginnt in der ersten Spalte von links mit der durchlaufenden Itemnummer in PIRLS 2011. Die nächste Spalte gibt die Art des Texts an (LIT = Literarischer Text, INFO = Informationstext). Die dritte Spalte beschreibt, welche Verstehensleistung erwartet wird:

�� Erkennen und Wiedergeben explizit angegebener Infor­mationen (Info suchen); �� Ziehen einfacher Schlussfolgerungen (Schlussfolgern); �� Interpretieren sowie Verknüpfen von Gedanken und

Informationen (Interpretieren); �� Untersuchen und Bewerten von Inhalt, Sprache und

einzelnen Textelementen (Untersuchen).

In der vierten Spalte wird das Aufgabenformat (geschlossen oder offen) angegeben, die Spalten fünf bis acht geben die Lösungshäufigkeiten (LH) in Prozentwerten an – PIRLS­Schnitt, Österreich, Deutschland, England. Und die rechte

Spalte zeigt die Klassifizierung der Itemschwierigkeit laut PIRLS (I bis IV), wobei I die niedrigste ist.

In Abbildung 1.2.5 werden die Items aus Tabelle 1.2.1 nach relevanten Kategorien zusammengefasst. Hier zeigt sich, dass österreichische Kinder bei den geschlossenen Aufgabenformaten (Multiple Choice) öfter bessere Ergeb­nisse erzielen als bei den offenen (wo sie selbst eine Ant­wort formulieren müssen). Das ist zunächst ein wichtiger Indikator dafür, dass das Abschneiden der österreichischen Kinder in PIRLS nicht primär damit beantwortet werden kann, dass sie mit dem Testformat „Multiple Choice“ nicht so vertraut sind wie die Schüler/innen anderer Länder.

Wir können auch davon ausgehen, dass die österreichischen Schüler/innen beim Identifizieren direkt im Text genannter Informationen (Wiedergeben) und bei einfachen Schluss­folgerungen erkennbar besser sind als beim Verknüpfen und Interpretieren von Informationen und beim Untersuchen und Bewerten von Inhalt und Sprache in einem Text.

Im Hinblick auf die Kompetenzstufen zeichnet sich kein Muster ab. Über alle Stufen hinweg beantworteten die ös­terreichischen Schüler/innen die Hälfte bis ein Drittel der Items besser als im PIRLS­Schnitt.

Items, bei denen Österreich schlechter abschneidet

Wie Tabelle 1.2.2 zeigt, gibt es nur wenige Items, bei denen österreichische Kinder schlechter abschneiden als der PIRLS­Schnitt. Die Unterschiede zu Deutschland und zu England sind jedoch bisweilen beträchtlich. Im Folgenden soll hinterfragt werden, was mögliche Ursachen für diese Unterschiede sein könnten.

Je zwei Items zählen zum offenen bzw. geschlossenen Auf­gabenformat. Drei der vier Items werden dem Verstehens­

FrageformatAnzahl der Items

Anzahl der Items

Anzahl der Items

Items80706050 1301201101004030 90 14020100

Itemschwierigkeit

Verstehensprozess

14 322 17 4523 63I II III IV

14 33 11 4525 46 4 18Wiedergeben Schlussfolgern Interpretieren Untersuchen

19 6835 74geschlossen offen

Anzahl der Items, die von österreichischen Schülerinnen und Schülern besser gelöst wurden als der PIRLS-SchnittItems gesamt

schwierigleicht

Abbildung 1.2.5: Anzahl der von österreichischen Schülerinnen und Schülern besser gelösten Items als vom PIRLS-Schnitt (PIRLS 2011)

Page 36: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

34 Analysen auf Itemebene in Lesen

prozess Interpretieren sowie Verknüpfen von Gedanken und Informationen zugeschrieben. Das vierte zählt zu Ziehen einfacher Schlussfolgerungen. Zwei der Items befinden sich auf Schwierigkeitsstufe IV. Die anderen beiden jeweils eine Stufe darunter.

INFO1 (Text nicht freigegeben, daher nur verschlüsselt und abstrakt dargestellt) ist der Grundtext für ein Testitem, bei dem die österreichischen Schüler/innen zwei der vier Items eindeutig schlechter bewältigt haben als der internationale Schnitt. Da, wie oben angedeutet, die unterschiedliche Performanz mehrere Ursachen haben kann, untersuchen wir zunächst den Aufgabentext im Hinblick auf seine Lese­ Verstehens­Schwierigkeit. Dazu kann man zur ersten Orientierung so genannte Lesbarkeitsindizes heranziehen. Wir nehmen diese Indizes, die für unterschiedliche Zwecke gemacht wurden, als erste Orientierung. Da PIRLS keine Begründung für die Schwierigkeitsstufen gibt außer der Lösungshäufigkeit (also rein empirisch – ohne sprachliche Analyse hinsichtlich Wortschatz, Satzlänge, Satztiefe ... und ohne Analyse des für das Verstehen erforderlichen „Weltwis­sens“), bieten diese Indizes eine erste grobe Einschätzung. Für unsere weitere Analyse sind sie nicht relevant. Wir haben den Text mit einigen gebräuchlichen Lesbarkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) überprüft und dabei folgende Resultate erhalten:

�� LIX: sehr niedriger bis niedriger Schwierigkeitsgrad (35)�� Flesch Reading Ease score: 51.3 (text scale)

ziemlich schwer zu lesen;�� The Coleman-Liau Index: 12

gut geeignet für 12. Schulstufe;�� The SMOG Index: 9.4

Grade level: 9. Schulstufe.

Didaktische Beurteilung: Ein linearer Text mit einigen unterstützenden Illustrationen, die jedoch nicht für das Verständnis notwendig sind. Die Lesbarkeitsindizes zeigen zwar, dass der Text an sich nicht für die 5. Schulstufe als typisch angesehen werden kann, aber er dürfte auch keine wirklichen Probleme verursachen – weder vom Wortschatz noch von den grammatischen Konstruktionen her. Er könnte aus einem Jugendlexikon, einem anderen Sachbuch, aus einem Magazin mit Künstlerbiografien für Jugendliche o. Ä. stammen, ist aber fast eher literarisch als informations­

orientiert. Der Text ist im Duktus ausgesprochen narrativ gehalten.

Zwei von zwölf Items (18 und 20) wurden von den öster­reichischen Schülerinnen und Schülern signifikant weniger häufig gelöst als im PIRLS­Schnitt und noch viel weniger häufig im Vergleich mit England (Deutschland fällt in beiden Fällen auch unter den PIRLS­Schnitt). Beide Items sind geschlossen, d. h. sie verlangen eine Auswahl aus vier vorgegebenen Antworten.

Item 18 sieht das Ziehen von Schlussfolgerungen vor und ist auf Schwierigkeitsstufe III angesetzt. Es wird danach gefragt, was ein bestimmtes Wort in einem bestimmten Zusammenhang über die beschriebene Person aussagt.

Wie sehen die Distraktoren (falschen Antwortalternativen) aus? Es sind praktisch alle vorgegebenen Antworten „wahr“, d. h. sie enthalten keine falschen Angaben im Hinblick auf den Text. Die erwartete richtige Antwort kann jedoch nur gegeben werden, wenn man die Bedeutung des als richtig angesehenen Worts kennt.

In Item 20 wird das Interpretieren und Verknüpfen von Gedanken verlangt und es ist auf Stufe II (also eher nied­rig) – aber die Lösung verlangt ein sehr genaues Lesen des Texts. Einer der Distraktoren schlägt eine in Bezug auf den Text offensichtlich falsche Antwort vor, d. h. die Aussage findet sich nirgends im Text, die beiden anderen sind je­doch grundsätzlich „richtig“, erklären aber den Sachverhalt nicht der Fragestellung entsprechend. Die richtige Antwort könnte ganz einfach mit „Weltwissen“ gefunden werden.

Es ist schwer erklärbar, warum die Ergebnisse in Österreich (und in Deutschland) so viel schlechter sind als im PIRLS­Schnitt und vor allem im Vergleich zu England.

Beim Text INFO2, Item 44, ist wiederum der Unterschied zu Deutschland nicht sehr groß, wohl aber zum PIRLS­Schnitt und noch deutlich mehr zu England. Die Fragestel­lung ist in diesem Fall offen. Bemerkenswerterweise errei­chen die österreichischen Schüler/innen bei einem anderen Item zum selben Text die im Vergleich höchste Lösungshäu­figkeit. Einfacher Schluss: An der Art und Schwierigkeit des Testtexts selbst kann es nicht liegen, dass sich ein solcher

Tabelle 1.2.2: Items, bei denen österreichische Schüler/innen schlechter abschneiden als der PIRLS-Schnitt

G = geschlossenes AntwortformatO = offenes Antwortformat

Angaben der Lösungshäufigkeit in ProzentFreigegebener Text: Kuchen = „Der Feindkuchen“

Item Nr.

Textart VerstehensprozessFormat

G/O

Lösungshäufigkeit Kompetenz-stufePIRLS Österreich Deutschland England

18 INFO1 Schlussfolgern G 48 34 42 72 III20 INFO1 Interpretieren G 43 33 32 53 II44 INFO2 Interpretieren O 44 34 39 56 IV126 Kuchen Interpretieren O 39 24 29 56 IV

Page 37: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Analysen auf Itemebene in Lesen 35

Unterschied ergibt, es muss also an der Aufgabenart bzw. der konkreten Aufgabenstellung liegen.

Der verlangte Verstehensprozess ist bei Item 44 „Inter­pretieren“, das Format ist offen. Es muss herausgefunden werden, inwiefern sich bestimmte Sinne von Menschen und Tieren unterscheiden. Die Unterschiede sind im Text zwar implizit genannt, müssen aber dennoch interpretiert bzw. müssen einzelne Teile miteinander verknüpft werden. Die Itemschwierigkeit ist IV, also hoch. Die Fragestellung ist an sich völlig eindeutig, es müssen jedoch im Text Belege dafür gefunden werden, warum eine Antwort richtig ist. Diese Art der Aufgabe hat sich schon mehrmals als eher schwie­rig für österreichische Kinder erwiesen. Es ist offenbar die Kombination aus genauem Lesen und der daraus zu ziehenden Interpretation, die Probleme macht.

Im Text „Der Feindkuchen“ handelt es sich es sich um einen vergleichsweise einfachen literarischen Text. Mit diesem Text gehen österreichische Kinder sehr unterschiedlich um, zumindest zwei Aufgaben lösen sie deutlich besser als der PIRLS­Schnitt, Item 126 ganz schlecht und ein weite­res auch um 9,8 Prozentpunkte schlechter als der PIRLS­Schnitt, was bemerkenswert ist. Das Item 126 wird weiter unten noch genauer besprochen.

Diese Heterogenität deutet darauf hin, dass es nicht der Text als solcher (also literarischer Text, eher gut zu verstehen) ist, der Probleme verursacht. Schlecht schneiden die Schüler/innen bei einer offenen Interpretationsfrage auf Stufe IV ab; gut hingegen bei einem offenen Item, das ein einfaches Schlussfolgern verlangt und Stufe II zugeordnet wurde.

Einzelitems

In diesem Abschnitt besprechen wir zunächst die beiden „Spitzenergebnisse“ in jede Richtung: Einmal, wo die ös­terreichischen Kinder im hohen Ausmaß über dem PIRLS­Schnitt liegen, das zweite Mal, wo sie im hohen Maß unter dem PIRLS­Schnitt liegen.

Österreich schneidet besser ab

Das Item entstammt dem Text „INFO2“. Da dieser Text bisher nicht veröffentlicht wurde, wird er hier nur ver­schlüsselt und abstrakt besprochen.

Die größte Zahl österreichischer Schüler/innen hat dieses Testitem zu einem eklatant höheren Prozentsatz, nämlich 27,9 Prozentpunkte, richtig gelöst als der PIRLS­Schnitt. Hier liegt die Lösungshäufigkeit in Österreich ungefähr wie in Deutschland, aber deutlich höher als in England und wesentlich höher als im PIRLS­Schnitt.

Der zugrunde liegende Text ist vom Typus „Information“, ein linearer Text etwa aus einem Sachbuch, einem Jugend­lexikon oder einem Kindermagazin mit einigen ansprechen­

den Illustrationen, die mit Untertexten versehen sind. Die Aufgabenstellung ist klar und deutlich. Die Aufgabenart verlangt einfache Schlussfolgerungen, weil die Antwort nicht wörtlich im Text aufscheint – aber nahezu. Die Antwort findet sich jedoch nicht im Fließtext, sondern in einer Ab­bildungsbeschriftung. Das Aufgabenformat ist „geschlossen“, das heißt hier, aus vier vorgegebenen Antworten ist eine zu wählen. Das Item ist auf der Schwierigkeitsstufe III.

Der Text

Wir haben den Text wieder mit international üblichen Les­barkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) untersucht und dabei Folgendes festgestellt:

�� Nach dem Lesbarkeitsindex (LIX) erreicht dieser spezielle Textausschnitt, der die gesuchte Information enthält, die Stufe 36, also geringe Schwierigkeit – etwa wie Kin­der­ und Jugendliteratur und Belletristik.

Mit der Flesch­Formel wird ein etwas anderes Ergebnis erzielt:

�� Flesch Reading Ease score: 56.4 (text scale) Flesch Reading Ease ziemlich schwer zu lesen;�� The Coleman-Liau Index: 12

Grade level: 12. Schulstufe�� The SMOG Index: 8.3

Grade level: 8. Schulstufe.

Diese Befunde deuten darauf hin, dass es nicht die beson­dere „Einfachheit“ des Texts sein kann, die zu diesem posi­tiven Ergebnis geführt hat – der Text ist danach zumindest als mittelschwer einzustufen und definitiv nicht so, dass ihn der Durchschnitt der Schüler/innen der Schulstufen 4 und 5 im überwiegenden Ausmaß leicht verstehen könnte.

Der verlangte Verstehensprozess

Hier geht es um das Ziehen einfacher Schlussfolgerun­gen, d. h. die gesuchte Information ist nicht wortwörtlich aus dem Text ablesbar. In diesem Fall ist es tatsächlich ein sehr einfacher Schluss, der gezogen werden muss, denn der

LH = Lösungshäufigkeit

Land LH

PIRLS-Schnitt 49 %Österreich 77 % österr. Mädchen 81 % österr. Buben 73 %Deutschland 80 %England 67 %

Tabelle 1.2.3: Lösungshäufigkeiten zum Item, bei dem Österreich die größte positive Differenz zum PIRLS-Schnitt

aufweist

Page 38: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

36 Analysen auf Itemebene in Lesen

gesuchte Terminus wird im Text genannt, nicht aber im Fließtext (im linearen Haupttext), sondern in einer Abbil­dungsbeschriftung, die man beim Lesen möglicherweise gar nicht so genau zur Kenntnis nimmt. Es spricht für ein genaues Leseverhalten, wenn auch diese Nebentexte offen­sichtlich zur Kenntnis genommen werden.

Das Testformat (Art der Aufgabenstellung)

Hier wird ein geschlossenes Format angewendet, und zwar das Multiple­Choice­Format. Die Schwierigkeit dieses Formats hängt unter anderem von den vorgegebenen Alter­nativen (Distraktoren) ab. Sind die anderen drei Antwort­möglichkeiten völlig unwahrscheinlich, dann fällt die Wahl der richtigen Antwort nicht besonders schwer – immer vorausgesetzt, man hat Text und Fragestellung verstanden. In diesem Fall sind zwei Distraktoren (falsche Antworten) sehr unwahrscheinlich bis augenscheinlich unzutreffend. Zwei Antwortmöglichkeiten sind grundsätzlich plausibel und könnten als richtig eingestuft werden. Die erwar­tete richtige Antwort ist nicht so formuliert, dass Wörter aus dem Bezugstext verwendet werden, sondern dass man schlussfolgern muss. Man muss den Schluss ziehen, dass der Text der richtigen Antwort das mit anderen Worten beschreibt, was im Originaltext steht. Man muss kulturell (zivilisatorisch) wissen, dass die Dinge, von denen hier die Rede ist, auch in einem Mülleimer vorkommen können.

Als Nebenbemerkung zum Multiple­Choice­Testformat muss noch angeführt werden, dass es ein gewisses Unsicher­heitspotenzial hinsichtlich der Aussagekraft enthält: Man kann raten und zufällig das Richtige finden. Dies gilt jedoch für die Kinder aller Länder gleichermaßen.

Österreich schneidet schlechter ab

Das Item, bei dem die österreichischen Schüler/innen die größte negative Differenz zum PIRLS­Schnitt aufweisen, entstammt einem bereits veröffentlichten Text „Der Feind­kuchen“ (vgl. Item 126 in Tabelle 1.2.2).

Das auffälligste Ergebnis ist, dass bei diesem Item die öster­reichischen Schüler/innen eine um 15,2 Prozentpunkte ge­ringere Lösungshäufigkeit aufweisen als der PIRLS­Schnitt.

Hier liegt die Lösungshäufigkeit zwischen Deutschland und Österreich nicht sehr weit auseinander, sie ist jedoch we­sentlich niedriger als in England. Selbst die österreichischen Mädchen erreichen nur knapp die Hälfte der Lösungshäu­figkeiten aller Schüler/innen in England.

Der zugrunde liegende Text ist vom Typus her ein „litera­rischer Text“. Es ist ein völlig linearer Text etwa aus einem Literaturmagazin, einem Jugendbuch, einer Jugendzeit­schrift mit einigen ansprechenden Illustrationen, die nicht mit Untertexten versehen sind und in diesem Sinne nicht zur Information gehören (Typus illustrative Grafik im Ge­gensatz zu einer funktionalen Grafik). Die Aufgabenstellung hingegen ist schwierig: „Was für ein Mensch ist Toms Vater? Nenne dazu ein Beispiel, was er in der Geschichte getan hat.“ Die Aufgabenart verlangt Interpretieren sowie Verknüp-fen von Gedanken und Informationen. Die Antwort findet sich nicht im Fließtext, sondern muss aus Handlungen der Person interpretiert werden. Das Aufgabenformat ist „offen“, das heißt hier, die Schüler/innen müssen die Antwort selbst formulieren – und aus dem Text eine entsprechende Beleg­stelle herausfinden. PIRLS stuft das Item auf der Schwierig­keitsstufe IV ein.

Der Text

Nach den internationalen Lesbarkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) ergibt sich für den zugrunde liegenden Text folgende Bewertung:

�� Nach LIX hat der Text einen Schwierigkeitsindex von 26 (der obige Text – INFO2 – einen Index von 35: etwa Stufe Comic, Luther­Bibel, Werbetext). Der Schwierig­keitsgrad wird also niedriger bemessen als bei dem Text oben, den die österreichischen Kinder wesentlich besser bearbeiten konnten.�� Flesch Reading Ease score: 68.4 (text scale)

Flesch Reading Ease: Standard/durchschnittlich schwer;�� The Coleman-Liau Index: 10

Empfehlung: 10. Schulstufe;�� The SMOG Index: 5.9

Empfehlung: 6. Schulstufe.

Alle Lesbarkeitsindizes zeigen, dass der Text als ziemlich ein­fach zu lesen anzusehen und durchaus mit der Schulstufe kompatibel ist.

Der verlangte Verstehensprozess

Die Aufgabenstellung ist dem Verstehensprozess Interpre-tieren sowie Verknüpfen von Gedanken und Informationen zugeordnet und ist nach dem internationalen PIRLS­Ver­ständnis als beträchtlich schwerer einzuschätzen als das Auffinden von Informationen im Text oder das Ziehen einfacher Schlussfolgerungen (wie im obigen Beispiel). Es gibt im Text keinerlei wörtliche Anhaltspunkte, d. h. die Schüler/innen können nicht einfach nur schauen, ob die

LH = Lösungshäufigkeit

Land LHPIRLS-Schnitt 39 %Österreich 24 % österr. Mädchen 28 % österr. Buben 19 %Deutschland 29 %England 56 %

Land LH

PIRLS-Schnitt 39 %Österreich 24 % österr. Mädchen 28 % österr. Buben 19 %Deutschland 29 %England 56 %

Tabelle 1.2.4: Lösungshäufigkeiten zum Item, bei dem Österreich die größte negative Differenz zum PIRLS-Schnitt

aufweist

Page 39: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Analysen auf Itemebene in Lesen 37

Wörter des Items irgendwo im Text zu finden sind. Sie müssen den Textsinn erfassen, um die Frage beantworten zu können, und sie müssen die Antwort auch selbstständig formulieren. Der zweite Teil der Aufgabenstellung verlangt, dass die Schüler/innen im Text eine Passage finden, die ihre Charakteristik von Toms Vater belegt, d. h. sie müssen im Text einen Satz oder eine Satzfolge finden, mit der sie un­termauern können, dass ihre Aussage (die Antwort auf die Frage, was für ein Mensch Toms Papa ist) richtig ist. Das ist eine Vorgangsweise, die bei einer guten textbezogenen In­terpretation literarischer Texte üblich ist – allerdings nicht auf dieser Schulstufe.

Das Testformat (Art der Aufgabenstellung)

Eine offene Aufgabenstellung verlangt von den Schülerin­nen und Schülern, dass sie die Antwort selbstständig for­mulieren. Sie kreuzen nicht einfach an, was sie für richtig halten (wie im MC­Format), sondern sie müssen die Frage­stellung voll verstehen und darauf eine passende Antwort formulieren können. Sie müssen – wie in diesem Beispiel – darüber hinaus ihre Ansicht aus dem Text belegen können, d. h. sie müssen erkennen, welche Textstelle(n) ihre Aussage wahrscheinlich begründen kann (können). Diese Art der Aufgabenstellung ist eindeutig anspruchsvoller als die meis­ten geschlossenen.

1.2.4 Schlussfolgerungen

Bildungspolitisch wird es kaum im Sinne der österreichi­schen Verantwortlichen sein, sich damit zufrieden zu geben, dass die österreichischen Schüler/innen bei circa einem Drittel der Items (54 von 142) höhere Lösungshäufigkeiten aufweisen als der PIRLS­Schnitt und in 4 (von 142) Fällen signifikant schlechter abschneiden. Der Rest liegt mehr oder minder im PIRLS­Schnitt. Man wird Maßnahmen entweder im curricularen und/oder methodisch­didakti­schen Bereich überlegen müssen, wie die Lesekompetenzen der Schüler/innen in einem Land mit einem elaborierten und vergleichsweise teuren Schulsystem verbessert werden können.

Grosso modo lassen sich im Vergleich zu Deutschland und England keine gravierenden und durchgehenden Unter­schiede erkennen, vor allem lässt sich kaum bestätigen, dass die „Gewöhnung“ der Kinder anderer Länder an solche Tests (vor allem des geschlossenen Typs – Multiple Choice) einen ausschlaggebenden Unterschied erbrächte:

Im geschlossenen Testformat (Multiple­Choice) lösen die österreichischen Kinder bei literarischen Texten 75 %, die deutschen 77 % und die englischen 75 %, der PIRLS­Schnitt liegt bei 64 %. Bei Informationstexten liegt die PIRLS­Lösungshäufigkeit bei 58 %, für Österreich bei 67 %, für Deutschland bei 68 % und für England bei 69 %.

Es ist also eindeutig nicht das Multiple-Choice-Testformat, das den österreichischen Kindern größere Schwierigkeiten be­reitet als denen anderer Länder.

Bei den offenen Antworten, also jenen, die selbst formuliert werden müssen, ergeben sich deutlichere Unterschiede:

Bei den literarischen Texten liegt der PIRLS­Schnitt bei 48  %, Österreich bei 56 %, Deutschland bei 61 % und England bei 65 % Lösungshäufigkeit. Bei den Infor­mationstexten hat PIRLS eine Lösungshäufigkeit von 40 %, Österreich 42 %, Deutschland 48 % und England 53 %. Somit zeigt sich ein deutlicher Trend: Österreichische Kinder haben mit offenen Antworten bei Informationstexten deutlich größere Schwierigkeiten als deutsche und englische, sie liegen nur knapp über dem PIRLS­Schnitt.

Ein deutlicher Unterschied ergibt sich auch bei den Verste­hensprozessen: Es gibt nur geringe Unterschiede beim Auf­finden expliziter Information, ebenso wenig beim Ziehen einfacher Schlussfolgerungen. Die Österreicher liegen je­doch 6 Prozentpunkte hinter den Deutschen und 11 hin­ter den Engländern, was das „Interpretieren“ betrifft, und 4 Prozentpunkte bzw. 10 hinter den beiden Ländern beim „Untersuchen und Bewerten“. Diese Unterschiede ergeben sich vor allem bei Informationstexten. Erstaunlicherwei­se bereitet auch das Auffinden expliziter Information in literarischen Texten ein Problem (46 % Lösungshäufigkeit gegenüber 52  % in Deutschland und 60 % bei den eng­lischen Kindern). Dies könnte allerdings auch heißen, dass österreichische Schüler/innen nicht gelernt haben, litera­rische Texte als Informationsquellen zu nutzen und somit faktische Details eher weniger beachten. Das mag zwar zu­nächst als Erklärungsoption dienen, ist aber letztlich keine Tugend, denn zum Verstehen der durch den jeweiligen Text geschaffenen „Welt“ ist ein Erkennen der konstituierenden Faktoren dieser (fiktionalen) Welt erforderlich.

Unseres Erachtens zeigt die Datenlage folgendes Bild:

Österreichische Kinder …

�� erzielen bei den geschlossenen Aufgabenformaten (Multiple Choice) öfter bessere Ergebnisse als bei den offenen (wo sie selbst eine Antwort formulieren müssen). Das ist ein wichtiger Indikator dafür, dass das eher bescheidene Abschneiden der österreichischen Kinder in PIRLS nicht primär damit beantwortet werden kann, dass sie mit dem Testformat „Multiple Choice“ nicht so vertraut wären wie die Schüler/innen anderer Länder. Und das erfolgt bei denselben Ausgangstexten. Es ist also nicht die relative Schwierigkeit eines Testtexts, der unseren Kindern Probleme bereitet, sondern die Art der Auf­gabenstellung und die Art der erwarteten Antwort; �� haben Schwierigkeiten mit offenen Aufgabenformaten,

d. h. sie arbeiten besser, wenn sie aus mehreren Mög­lichkeiten die richtige wählen können (geschlossenes

Page 40: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

38 Analysen auf Itemebene in Lesen

Format) und nicht die Antwort selbst formulieren müs­sen;�� sind beim Identifizieren direkt im Text genannter In­

formationen (Wiedergeben) und bei einfachen Schluss­folgerungen erkennbar besser als beim Verknüpfen und Interpretieren von Informationen und beim Untersu­chen und Bewerten von Inhalt und Sprache in einem Text;�� haben wenig Probleme mit dem Verstehen von eher

schwer eingestuften Texten;�� haben wenig Schwierigkeiten, wenn sie aus einem Text

Informationen entnehmen und daraus einfache Schlüsse ziehen sollen;�� haben ein Problem damit, wenn sie in literarischen

Texten Interpretationen vornehmen sollen, die nicht direkt aus dem Text erschließbar sind und die sie den­noch aus dem Text belegen sollen.

Daraus können mit aller gebotenen Vorsicht didaktische Rückschlüsse für den Unterricht gezogen werden:

Österreichische Kinder …

�� brauchen mehr Anleitung zum genauen Lesen, um Details wahrnehmen und diese Details in einen inter­pretatorischen Zusammenhang bringen zu können;�� brauchen ganz grundsätzlich mehr Übung im Umgang

mit Informationstexten, das bedeutet jedoch, dass die Nicht­Sprach­Fächer in der Schule stärker gefordert sind, Leseverstehen/Textverstehen mit den Kindern zu trainieren und einzufordern (z. B. auf der Basis der Texte in den jeweiligen Fachlehrbüchern);

�� brauchen mehr Übung im Interpretieren von Textsinn auf der Basis von Evidenz, d. h. sie müssen Textbelege finden lernen, um ihre Interpretationen zu belegen. Sie müssen auch in literarischen Texten die relevanten Informationen/Belegstellen finden;�� brauchen mehr Übung im eigenständigen Formulieren

von Antworten.

Diese didaktischen Rückschlüsse müssen vor allem deshalb mit Vorsicht gezogen werden, weil es sich bei internationa­len Tests wie PIRLS oder PISA nicht um flächendeckende Überprüfungen aller Schüler/innen einer Jahrgangskohorte handelt, sondern „nur“ um eine statistisch ausreichende Auswahl, die eine Hochrechnung erlaubt. Die Auswahl folgt zwar im Prinzip nachvollziehbaren sozioökonomi­schen Kriterien, dennoch ist ein verlässlicher Rückschluss methodisch­didaktischer Art nur im Grundsatz möglich, nicht aber als direkte Handlungsanweisung an die Lehre­rinnen und Lehrer.

Das Abschneiden der österreichischen Kinder bei PIRLS 2011 ist keineswegs „katastrophal“ oder erschreckend, es ist an sich insgesamt nicht schlecht. Jedoch, wie schon oben angedeutet, ist es erstaunlich, dass das Ergebnis nicht deutlich besser ist – in einem traditionsreichen und eher teuren Schulsystem. PIRLS (und auch PISA) erlaubt nur diese Rückschlüsse, die Bildungsverantwortlichen müssen sich allerdings fragen, warum das Ergebnis „nur“ so ist, wie es ist.

Literatur

Lenhard, A. & Lenhard, W. (2011). Lesbarkeitsindex (LIX). Zugriff am 15.10.2013 unter http://psychometrica.de/lix.html

Mullis, I. V. S., Martin, M. O., Kennedy, A. M., Trong, K. L. & Sainsbury, M. (2009). PIRLS 2011 Assessment Framework. Chest-nut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.

Renner, M. (2013). Textkompetenz in allen Unterrichtsgegenständen. Handreichung für Autorinnen und Autoren von Unter-richtsmaterialien. Wien: Kopierzentrale BMUKK.

Scott, B. (2013). Text Readability Consensus Calculator. Retrieved October 15, 2013, from http://www.readabilityformulas.com/free-readability-formula-tests.php

Suchań, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam.

Wallner-Paschon, C. & Widauer, K. (2012). Tests und Fragebögen. In B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Die Studie im Überblick (S. 52–59). Graz: Leykam.

Page 41: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 39

1.3 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

Silvia Salchegger

Einleitung

Die Frage, ob es Geschlechterunterschiede in Mathematik gibt, wurde bereits eingehend beforscht. In der folgenden Einleitung wird zunächst ein Überblick über die Ergebnisse dieser Forschungsarbeiten zur Mathematikleistung, zum Mathematikselbstkonzept und zu Studienraten in mathe-matikintensiven Fächern gegeben. Darüber hinaus wird auf mög liche Gründe für die gefundenen Geschlechterunter-schiede eingegangen.

Geschlechterunterschiede in der Mathematikleistung

Unterscheiden sich Mädchen und Buben in ihrer Mathe-matikleistung? Großangelegte Metaanalysen, in denen eine Vielzahl von Ländern und Erhebungen berücksichtigt wurden, kamen zum Konsens, dass Leistungsunterschiede zwischen Buben und Mädchen in Mathematik meist un - bedeutend sind (Else-Quest, Hyde & Linn, 2010; Hyde, Lindberg, Linn, Ellis & Williams, 2008; Lindberg, Hyde, Peterson & Linn, 2010). Zwar weisen internationale Schüler leistungsvergleiche immer wieder für einige Län-der  – darunter auch Österreich – statistisch signifikante Leistungsunterschiede zwischen Mädchen und Burschen nach (z. B. Filzmoser & Suchań, 2013; OECD, 2009; OECD, 2013; Wallner-Paschon, 2012a), diese sind aller-dings in der Regel von geringer praktischer Bedeutsamkeit.

Eine Metaanalyse von Else-Quest et al. (2010), die sich auf Daten aus 69 Ländern stützt, zeigt, dass es nur in acht Ländern Geschlechterunterschiede in der Mathematikkom-petenz gibt, die die Schwelle zur praktischen Bedeutsamkeit (d +/–0.20; vgl. Methodenteil) überschreiten (zugunsten der 14- bis 16-jährigen Burschen in sechs Ländern, zu-gunsten der gleichaltrigen Mädchen in zwei Ländern). In den rest lichen 61 Ländern sind die Leistungs unterschiede

kleiner als d +/–0.20 und können als praktisch unbedeu-tend ein gestuft werden. Unter diesen Ländern befindet sich auch Österreich mit einer Effektstärke von d = 0.08 (bezogen auf die PISA-2003-Daten). Hier muss jedoch darauf hingewiesen werden, dass die Effektstärken der Geschlechterunterschiede in der Mathematikleistung in Österreich normalerweise größer ausfallen und bei den sonstigen PISA-Erhebungen (2000, 2006, 2009 und 2012) im Bereich von 0.20 bis 0.24 lagen. Am Ende der Grundschule (4. Schulstufe) liegen die Geschlechterunter-schiede in der Mathematikkompetenz fast gleich hoch wie bei den 15-/16-jährigen PISA-Schülerinnen und Schülern (zwischen 0.15 bei TIMSS 1995 sowie TIMSS 2011 und 0.20 bei TIMSS 2007; Wallner-Paschon, 2010, 2012a). Im internationalen Vergleich weist Österreich in den meisten Erhebungen eine überdurchschnittlich hohe Leistungsdiffe-renz in Mathematik auf: Beispielsweise ist der Leistungsvor-sprung von Burschen gegenüber Mädchen bei PISA 2012 OECD-weit nur in Luxemburg und Chile noch größer als in Österreich (Filzmoser & Suchań, 2013). Trotz dieser im Ländervergleich hohen Geschlechterunterschiede wird selbst in Österreich die Schwelle, ab der von einem klei-nen Effekt gesprochen wird (d = 0.20), in allen bisherigen Erhebungen, wenn überhaupt, dann nur geringfügig über-schritten. Bezogen auf die Leistung lässt sich demnach keine bedeutungsvolle männliche Dominanz in Mathematik feststel­len: Buben erzielen in der Regel keine praktisch bedeutsam besseren Mathematikleistungen als Mädchen.

Geschlechterunterschiede im Mathematikselbstkonzept

Ausgehend von diesen geringen Leistungsunterschieden wäre anzunehmen, dass sich Mädchen und Buben nicht wesentlich in der Selbsteinschätzung ihrer Mathematik-kompetenz unterscheiden. Studien zum Mathematikselbst-

Ist die Mathematik eine männliche Domäne? Diese Frage wird anhand von Geschlechterunterschieden in drei mathema­tikbezogenen Merkmalen untersucht: der Mathematikleistung, dem Mathematikselbstkonzept und den Absolventenraten in mathematikintensiven Studienfächern. Während sich bei der Leistung kaum bedeutsame Geschlechterunterschiede finden lassen, schätzen Mädchen in den meisten Ländern ihre mathematischen Fähigkeiten schlechter ein als Buben (d. h. sie verfügen über ein niedrigeres Mathematikselbstkonzept). Auch beim Abschluss mathematikintensiver Studien­richtungen sind Frauen in den OECD­Ländern in der Regel unterrepräsentiert. Es zeigt sich, dass Frauen in jenen Ländern häufiger mathematikintensive Studienrichtungen absolvieren, in denen auch schon bei 10­jährigen Mädchen das Mathematikselbstkonzept positiver ausgeprägt ist.

Page 42: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

40 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

konzept zeigen jedoch, dass Mädchen selbst bei gleicher oder besserer Leistung ihre Mathematikkompetenz geringer einschätzen als Buben (Gabriel, Mösko & Lipowsky, 2011; Helmke, 1997; Marsh & Yeung, 1998; Sáinz & Eccles, 2012). Auch die bereits oben erwähnte ländervergleichende Metaanalyse von Else-Quest et al. (2010) zeigt, dass 14- bis 16-jährige Burschen in der Regel ein deutlich höheres Mathematikselbstkonzept aufweisen als gleichaltrige Mäd-chen, obwohl es kaum Leistungsunterschiede gibt: Die Selbstkonzeptunterschiede zwischen Mädchen und Bur-schen erreichen in 42 Ländern (von 69) die Schwelle von d = 0.20 (ohne Ausnahme immer zugunsten der Buben). In elf Ländern liegt die Effektstärke sogar über 0.40, was von Hattie (2009) als Schwelle für einen mittleren Effekt definiert wird (vgl. Methodenteil). Mit einer Effektstärke von 0.44 reiht sich auch Österreich unter diese elf Länder mit den größten Geschlechterunterschieden im Mathema- tikselbstkonzept 15-Jähriger bei PISA 2003 ein. Auch bei den Kindern am Ende der Volksschule liegen die Geschlech- terdifferenzen im Mathematikselbstkonzept in Österreich bereits ähnlich hoch (d = 0.48 bei TIMSS 2007; Wallner-Paschon, 2010). Bezogen auf das Selbstkonzept ist Mathe­matik demnach eine stärkere männliche Domäne: Burschen schätzen ihre Mathematikleistungen in der Regel bedeutsam höher ein als Mädchen, insbesondere auch in Österreich.

Geschlechterunterschiede bei der Beteiligung an mathematikintensiven Studienrichtungen

Eine dritte wesentliche Komponente bei der Untersuchung von Geschlechterunterschieden in Mathematik ist die Be-rufs- und Bildungswahl. Hier zeigt sich, dass Frauen in mathematisch-naturwissenschaftlichen Fächern unterreprä-sentiert sind (Ceci, Williams & Barnett, 2009; European Commission, 2013; OECD, 2011). Beispielsweise belegen Statistiken der OECD (2011, Tab. A4.6), dass in Öster-reich unter den 25- bis 34-jährigen Erwerbstätigen 2,4 % der Männer, aber nur 0.9 % der Frauen ein naturwissen-schaftliches oder technisches Studium absolviert haben. Im EU-Schnitt ist diese Diskrepanz mit 2,3 % vs. 1,2 % etwas weniger gravierend. Daten der EU (European Commission, 2013) belegen, dass in Österreich der Frauenanteil unter den Doktorandinnen und Doktoranden in Natur wissenschaft, Mathematik und Informatik bei 36 % liegt, im EU-Schnitt beträgt dieser 40 %. Tabelle 1.3.1 (letzte Spalte) gibt einen Überblick über den Anteil von Frauen, der ein mathema-tikintensives Studium (Biowissenschaften, physikalische Wissenschaften, Mathematik und Statistik, Computer-wissenschaften) absolviert hat, für die Teilnehmerländer von TIMSS 2011. Diese Angaben basieren auf Daten der UNESCO (n. d.). Im Durchschnitt der hier berichteten Länder sind 43 % der Absolventinnen und Absolventen weiblich, in Österreich liegt der Anteil mit 34 % deutlich

niedriger. Bemerkenswert sind die hohen Absolventen-quoten von Frauen in arabischen Ländern (Saudi-Arabien, Iran, Oman und Katar). Für die OECD-/EU-Staaten kann jedoch in der Regel festgestellt werden, dass bezogen auf die Abschlussquoten mathematikintensiver Studienrichtungen Mathe matik männlich dominiert ist.

Mögliche Gründe für Geschlechterunterschiede

Woran könnte es liegen, dass Frauen viel seltener mathe-matikintensive Studienrichtungen absolvieren als Männer, obwohl sie etwa dasselbe Leistungspotenzial dazu hätten? Eccles (1994) versucht Bildungs- und Berufsentscheidun-gen anhand eines Erwartung-mal-Wert-Modells zu erklären. Demnach wird die Berufs- und Bildungswahl durch zwei wesentliche Komponenten bestimmt: Der Erwartung für Erfolg und dem subjektiven Wert einer Tätigkeit. Personen werden eher jene Tätigkeiten wählen, von denen sie über-zeugt sind, dass sie sie schaffen werden und denen sie einen hohen Wert zuschreiben. Frauen werden sich also eher dann für mathematikintensive Studienfächer entscheiden, wenn sie a) davon überzeugt sind, über eine hohe Mathematik-kompetenz zu verfügen (d. h. ein hohes Mathematikselbst-konzept aufweisen)1 und b) der Mathematik einen hohen subjektiven Wert zuschreiben (d. h. großes Interesse daran haben, ihr hohe Wichtigkeit und Nützlichkeit beimessen). Im vorliegenden Beitrag wird genauer auf die Bedeutung des Mathematikselbstkonzepts für die geschlechtsspezifi-sche Berufs- und Studienwahl eingegangen. Zur Entwick-lung des Selbstkonzepts wurde gezeigt, dass dieses stark von vorausgehenden Leistungserfahrungen (vor allem Noten) abhängt. Es wird aber auch durch Sozialisationserfahrungen in Schule und Elternhaus sowie durch Vergleichsprozesse mit-bestimmt (vgl. Hellmich & Günther, 2011). Im Folgenden wird genauer darauf eingegangen, inwiefern diese Faktoren dafür verantwortlich sein könnten, dass Mädchen ein deut-lich schlechteres Mathematikselbstkonzept entwickeln als Buben. Zunächst kann festgestellt werden, dass die schlech-teren Fähigkeitseinschätzungen der Mädchen nicht durch schlechtere Mathematiknoten von Mädchen erklärt werden können: Mädchen erhalten in Mathematik etwa gleich gute Noten wie Burschen (vgl. Bacher, Beham & Lachmayr, 2008; Spiel, Schober & Litzenberger, 2008; Schreiner, Breit & Haider, 2008; Voyer & Voyer, 2014).

Bei den Vergleichsprozessen werden soziale und dimensionale Vergleiche als bedeutsam für die Selbstkonzeptentwicklung erachtet. Beim sozialen Vergleich setzen die Kinder ihre eige-ne Leistung in Beziehung zu den Leistungen ihrer Mitschü-ler/innen. Dies hat zur Folge, dass gleich kompetente Kinder in leistungsstarken Klassen im Durchschnitt ein niedrigeres Fähigkeitsselbstkonzept aufweisen als in Klassen mit schwa-

1 Die Komponenten „Erwartung für Erfolg“ und „Selbstkonzept“, werden in Eccles� (1994) Modell als getrennte Faktoren betrachtet. Empirisch lassen sie sich jedoch nicht unterscheiden und werden daher in neueren Studien bedeutungsgleich verwendet (z. B. Nagy et al., 2008). Auch im vorliegenden Beitrag wird nicht zwischen diesen beiden Komponenten unterschieden.

Page 43: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 41

chem Leistungsniveau (z. B. Marsh, 2005). Bisher liegen allerdings keine Befunde vor, dass diese sozialen Vergleiche geschlechtsspezifischen Mustern folgen würden und somit die unterschiedliche Ausprägung im Selbstkonzept von Mäd-chen und Buben erklären könnten (vgl. Gabriel et al., 2011).

Während bei den sozialen Vergleichen ein Kind seine Leis-tung mit jener der Mitschüler/innen in Beziehung setzt, erfolgt ein dimensionaler Vergleich innerhalb einer Person zwischen unterschiedlichen Domänen. Sind die eigenen Leistungen zum Beispiel in Deutsch besser als in Mathe-matik, so erfährt das Deutschselbstkonzept eine Aufwer-tung, während das Mathematikselbstkonzept abgewertet wird (vgl. Marsh, 1986). Bei der Entwicklung geschlechts-spezifischer Mathematikselbstkonzepte könnte dies relevant sein, da Mädchen den Buben in Lesen in fast allen Ländern deutlich überlegen sind (Wallner-Paschon, 2012b), und sie dadurch häufiger zur Feststellung gelangen können, gut in Lesen zu sein; im Sinne des dimensionalen Vergleichs ist die Feststellung, gut in Lesen zu sein, auch gleichzeitig mit der Feststellung, weniger gut in Mathematik zu sein, verbunden und die Mathematikkompetenz wird abgewertet (vgl. Möller & Marsh, 2013). Es wurde gezeigt, dass Effekte dimensionaler Vergleiche für die Selbstkonzepte bei Kindern im Grundschulalter (und damit bei der im vorliegenden Beitrag untersuchten Population) noch keine wesentliche Rolle spielen (vgl. Möller, Kuska & Zaunbauer, 2011), bei älteren Kindern und Jugendlichen jedoch sehr bedeutsam sind (Möller, Pohlmann, Köller & Marsh, 2009).

Eine weitere wesentliche Komponente für die Selbstkonzept-entwicklung von Kindern sind Sozialisationserfahrungen in Schule und Elternhaus (vgl. Hellmich & Günther, 2011). Eltern und Lehrkräfte sind zentrale Vermittler dieser Sozia-lisationserfahrungen. Bisherige Befunde weisen darauf hin, dass die Entwicklung des Selbstkonzepts bedeutsam durch Geschlechtsrollenzuschreibungen und Geschlechterstereo-type von Eltern und Lehrkräften geprägt wird (z B. Frome & Eccles, 1998; Retelsdorf, Schwartz & Asbrock, 2015). Studien hierzu zeigen, dass Einschätzungen von Eltern und Lehrkräften häufig Geschlechterstereotypen folgen, etwa dass Mathematik eher für Buben und weniger für Mädchen ist. Beispielsweise überschätzen Eltern die numerische und figurale Intelligenz ihrer Söhne, die ihrer Töchter unter-schätzten sie dagegen (Steinmayr & Spinath, 2009); auch trauen Eltern Söhnen in Mathematik mehr zu als Töchtern (Buff, Reusser, Dinkelmann & Steiner, 2011). Und diese elterlichen Fähigkeitseinschätzungen beeinflussen über die tatsächliche Leistung hinaus das Mathematikselbstkonzept der Schüler/innen (Frome & Eccles, 1998).

Auch die Lehrkräfte neigen zu geschlechterverzerrten Wahr-nehmungen. So zeigten Ziegler, Kuhn & Heller (1998), dass 27 % der Mathematiklehrer/innen und 30 % der Physiklehrer/innen Buben für begabter halten als Mädchen; umgekehrt hält jedoch keine der befragten Lehrpersonen Mädchen für be-gabter als Buben. Entsprechend würden die Lehrkräfte auch

Mädchen eher Karrieren in Erziehung, Medizin oder Philolo-gie empfehlen, Buben sehen sie hingegen für mathematisch-naturwissenschaftlich-technische Berufe besser geeignet.

In einer Studie von Tiedemann (2000a) schätzten Lehrkräfte Mädchen gegenüber Buben im Durchschnitt als weniger talentiert in Mathematik ein, waren überzeugt, dass Mäd-chen weniger von zusätzlicher Unterstützung profitieren und dass Mädchen sich mehr anstrengen müssen, um gut in Mathematik zu sein. Darüber hinaus führten sie bei Mäd-chen ein Scheitern eher auf mangelnde Fähigkeit und bei Buben eher auf mangelnde Anstrengung zurück. Ähnlich zeigt der Literaturüberblick von Li (1999), dass Lehrkräfte dazu neigen, die Mathematikfähigkeiten von männlichen Schülern zu überschätzen und höhere Erwartungen in die Mathematikleistung von Buben zu setzen.

Ebenso wie die Fähigkeitseinschätzungen der Eltern wirken sich auch jene der Lehrkräfte auf das Selbstkonzept der Kinder aus (Tiedemann, 2000b). Die Einschätzungen der Lehrkräfte scheinen aber noch bedeutsamer zu sein, da diese auch Einfluss auf die Fähigkeitseinschätzungen der Eltern nehmen (Tiedemann, 2000b).

Insgesamt verdeutlichen diese Befunde, dass Mädchen und Buben unterschiedliche soziale Erfahrungen in Bezug auf Mathematik machen. Wie stark etwa diese sozialen Erfah-rungen geschlechtsspezifisch gefärbt sind, wird auch durch kulturelle Faktoren mitbestimmt (vgl. Else-Quest et al., 2010; Tiedemann, 2002). Etwa wurde gezeigt, dass es in einer Vielzahl an Kulturen Geschlechterstereotype dahin-gehend gibt, dass Naturwissenschaft stärker männlich als weiblich konnotiert ist (Nosek et al., 2009). Diese Stereo-type sind zwar unterschiedlich stark ausgeprägt, jedoch in allen 34 untersuchten Ländern nachweisbar.

Kinder internalisieren durch soziale Erfahrungen diese Ste-reotype – etwa im Umgang mit Eltern und Lehrpersonen (vgl. oben). Gesellschaftliche Stereotype spiegeln sich auch in den Berufen wider, die von Frauen und Männern ausge-übt werden. Augenscheinlich für die österreichischen Schü-ler/innen ist dabei, dass Lehrpersonen in der Volksschule fast zur Gänze Frauen sind, mit sozialen und kulturellen Interessen und praktisch nicht ausgeprägten naturwissen-schaftlichen Orientierungen.

Geschlechtsspezifische Unterschiede in der Berufswahl ver-gegenwärtigen den Kindern geschlechtstypische Rollen bilder und beeinflussen auch die Vorstellung der Kinder über Ge-schlechterrollen (z. B. welcher Beruf für Mädchen passend ist; vgl. Eccles, 1994). Hierzu zeigten Else-Quest et al. (2010) einen signifikanten Zusammenhang zwischen Frauenquoten in der Wissenschaft und Geschlechterunterschieden im Mathematikselbstkonzept 14- bis 16-Jähriger: In Ländern, in denen Frauen häufiger in wissenschaftlichen Positionen anzutreffen sind, liegt das Mathematikselbstkonzept von Mädchen weniger hinter jenem von Burschen zurück.

Page 44: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

42 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

Das Selbstkonzept kann in diesem Sinn als „Output“ ge-sellschaftlicher Werte und Normen gesehen werden. Es kann auf der anderen Seite aber auch als „Input“ betrachtet werden, das dazu beiträgt, geschlechterspezifische Rollen-verteilungen in der Gesellschaft aufrechtzuerhalten, indem es die individuelle Berufs- und Bildungswahl mitbestimmt. Beispielsweise zeigten Parker et al. (2012), dass die Ent-scheidung junger Erwachsener, ob sie studieren, stark von schulischen Selbstkonzepten abhängt und das Mathema-tikselbstkonzept ein starker Prädiktor für die Wahl mathe-matikintensiver Hauptfächer ist. Ähnlich belegten Köller, Daniels, Schnabel und Baumert (2000), dass das Mathe-matikselbstkonzept auf der 10. Schulstufe einen hohen Vorhersagewert für die Leistungskurswahl in Mathematik zwei Jahre später hat. Insbesondere konnte die häufigere Leistungskurswahl von Buben zu einem erheblichen Teil durch ihr höheres Selbstkonzept erklärt werden. Eine wei-tere Studie (Guay, Larose & Boivin, 2004) zeigte, dass das schulische Selbstkonzept von Kindern der vierten bis sechsten Schulstufe auf den zehn Jahre später erreichten Bildungsgrad schließen lässt: Ein höheres Selbstkonzept sagt einen höheren Bildungsgrad voraus. Das Selbstkonzept bleibt auch dann ein signifikanter Prädiktor, wenn nach Leistung und sozialem Status kontrolliert wird. Eder (2012) erklärt die geschlechtsspezifische Berufswahl damit, dass es ab dem elften Lebensjahr zu einer fähigkeitsbezogenen Abgrenzung gegenüber bestimmten Aktivitäten kommt. Ausgegrenzt werden jene Aktivitäten, die nicht mit den eigenen Fähigkeiten vereinbar erscheinen. Ist das Mathe-matikselbstkonzept folglich in diesem Alter niedrig, werden mathematikbezogene Interessen ausgegrenzt. Im Geschlech-tervergleich zeigt sich, dass mathematiknahe praktisch-technische Interessen bei 15-jährigen Mädchen deutlich geringer ausgeprägt sind als bei Burschen (vgl. Eder, 2012). Eine Hebung des Mathematikselbstkonzepts von Mädchen könnte daher auch ihre Entwicklung einschlägiger beruf-licher Interessen positiv beeinflussen.

Doch nicht nur auf individueller Ebene wurde ein enger Zusammenhang zwischen Selbstkonzept und Berufs- und Bildungsentscheidungen nachgewiesen, sondern auch auf Länderebene. So hat Lenzer (2006) für die 38 Teilneh-merländer von TIMSS 1999 belegt, dass die Größe der Geschlechterunterschiede im Mathematikselbstkonzept ein signifikanter Prädiktor der Studienrate von Frauen in Mathematik und Computerwissenschaft ist: In Ländern, in denen das Mathematikselbstkonzept 14-jähriger Mädchen stärker hinter jenem ihrer männlichen Altersgenossen zu-rückliegt, wählen Frauen seltener Mathematik und Com-puterwissenschaft als Studienfach.

Das Selbstkonzept scheint somit einen zentralen Angel-punkt einzunehmen: Einerseits wird es durch gesellschaft-liche Normen mitbestimmt, andererseits trägt es zur Berufs- und Bildungswahl bei, womit gesellschaftliche Rollenver-hältnisse aufrechterhalten und weitergeführt werden.

Fragestellung

Der vorliegende Beitrag geht der Frage nach, wie stark Ge-schlechterunterschiede in der Mathematikleistung und im Mathematikselbstkonzept bei 10-Jährigen ausgeprägt sind. Die Analysen beziehen sich auf jene 50 Länder, die sich an TIMSS 2011 mit der vierten Schulstufe beteiligt haben. Darüber hinaus wird untersucht, ob Geschlechterunterschie-de im Mathematikselbstkonzept 10-Jähriger in Zusammen-hang mit Frauenraten in mathematikintensiven Studienrich-tungen stehen. Die vorliegende Studie ist die erste, die diesen Zusammenhang bei einer so jungen Altersgruppe untersucht. Konkret werden die folgenden Hypothesen getestet:

�� Geschlechterunterschiede in der Mathematikleistung 10-Jähriger sind in allen Ländern nur von geringer Effektstärke (zwischen –0.20 und +0.20).�� Geschlechterunterschiede im Mathematikselbstkonzept

sind wesentlich größer als in der Mathematikleistung. Es wird für den Großteil der Länder erwartet, dass Buben ein praktisch bedeutsam höheres Mathematikselbstkon-zept aufweisen als Mädchen; konkret wird angenom-men, dass die Effektstärke des Geschlechterunterschieds im Mathematikselbstkonzept in mehr als der Hälfte der Länder über 0.20 liegt.�� Die Geschlechterunterschiede im Mathematikselbst-

konzept von 10-Jährigen stehen in einem praktisch bedeutsamen Zusammenhang mit der Frauenquote unter den Absolventinnen und Absolventen mathe- matikintensiver Studienrichtungen: In Ländern, in denen Mädchen ihre Mathematikkompetenz ähnlich gut einschätzen wie Buben, ist der Frauenanteil unter den Absolventinnen und Absolventen mathematik-intensiver Studienrichtungen höher. Je weiter die 10-jährigen Mädchen in der Einschätzung ihrer mathe-matischen Fähigkeiten hinter den Buben zurückliegen, desto geringer ist die Beteiligung von Frauen an mathe-matik intensiven Fächern.

Methode

Beschreibung der verwendeten Variablen

Die Skala zum Mathematikselbstkonzept von TIMSS 2011 basiert auf den folgenden sieben Items aus dem Schüler-fragebogen:

�� Normalerweise bin ich gut in Mathematik; �� Mathematik fällt mir schwerer als vielen Kindern

meiner Klasse;�� Ich bin einfach nicht gut in Mathematik;�� Ich lerne schnell in Mathematik;�� Ich kann schwierige Mathematikaufgaben gut lösen;�� Meine Lehrerin sagt, ich bin gut in Mathematik;�� Mathematik fällt mir schwerer als alle anderen Fächer.

Page 45: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 43

Die Kinder sollten für jede dieser Aussagen angeben, wie sehr sie ihr zustimmen. Vier Antwortkategorien standen zur Auswahl, von „stimme völlig zu“ über „stimme eher zu“ und „stimme eher nicht zu“ bis zu „stimme überhaupt nicht zu“. Die kursiv gesetzten Items sind negativ formu-liert und wurden bei der Skalenkonstruktion umgepolt. Die Mathematikselbstkonzept-Skala wurde so konstruiert, dass der Mittelwert über alle Länder bei 10 liegt und die Standardabweichung bei 2. Höhere Werte indizieren ein positiveres Selbstkonzept. Die genaue Skalenkonstruktion wird bei Martin, Mullis, Foy und Arora (2012) beschrieben.

In diesem Dokument wird auch die hohe Reliabilität der Selbstkonzeptskala belegt: In mehr als der Hälfte der Teil-nehmerländer liegt Cronbachs α über 0,80, nur in einem (Marokko) unter 0,60. Die Mittelwerte der Mädchen und Buben jedes Landes sind in Tabelle 1.3.1 eingetragen. Der Anteil fehlender Werte liegt überall unter 10 %, außer für Aserbaidschan (Mädchen 17 %, Buben 18 %) und für die Buben Deutschlands (12 %).

Der Frauenanteil unter den Absolventinnen und Absolventen mathematikintensiver Studienrichtungen (Biowissenschaf ten,

Mathematikleistung MathematikselbstkonzeptFrauenanteil (%) an den Absolvent/innen mathematikintensiver

StudienrichtungenLand MW Buben MW Mädchen d MW Buben MW Mädchen d

ARE 430 (106) 438 (91) –0.08 10.3 (2.0) 10.51 (2.0) –0.09 m

ARM 451 (90) 454 (87) –0.04 10.2 (2.1) 10.17 (2.1) 0.03 49

AUS 519 (89) 513 (83) 0.07 10.3 (2.2) 9.88 (2.1) 0.22 35

AUT 513 (63) 504 (61) 0.15 10.7 (2.1) 9.97 (2.0) 0.37 34

AZE 460 (101) 466 (101) –0.07 10.0 (1.9) 10.19 (1.9) –0.07 56

BEL (fl) 553 (60) 545 (59) 0.13 10.1 (1.9) 9.38 (1.8) 0.41 30

BHR 432 (98) 440 (81) –0.08 10.2 (1.8) 10.30 (1.8) –0.06 m

CHL 466 (83) 457 (77) 0.12 9.6 (1.9) 9.26 (1.9) 0.20 23

CZE 516 (71) 505 (69) 0.16 10.0 (1.9) 9.54 (1.8) 0.27 38

DEU 532 (63) 523 (61) 0.14 10.7 (2.2) 9.79 (2.1) 0.43 44

DNK 540 (71) 534 (70) 0.08 10.2 (1.9) 9.61 (1.7) 0.31 35

ESP 488 (72) 477 (68) 0.16 10.3 (2.1) 9.59 (2.0) 0.36 35

FIN 549 (71) 542 (66) 0.10 10.3 (2.0) 9.49 (2.0) 0.41 46

GBR (E) 544 (93) 541 (85) 0.03 10.3 (1.9) 9.74 (1.8) 0.28 37

GBR (N) 563 (88) 562 (83) 0.00 10.2 (2.0) 9.76 (1.9) 0.22 37

GEO 447 (94) 454 (85) –0.08 10.6 (2.1) 10.46 (2.0) 0.05 49

HKG 604 (69) 598 (63) 0.09 9.8 (2.0) 8.91 (2.0) 0.44 m

HRV 495 (69) 485 (65) 0.16 10.4 (2.3) 9.95 (2.2) 0.20 53

HUN 517 (93) 514 (87) 0.03 10.5 (2.3) 10.11 (2.3) 0.18 38

IRL 529 (81) 526 (75) 0.04 10.5 (2.1) 10.18 (2.1) 0.15 41

IRN 431 (95) 431 (90) 0.00 10.5 (2.0) 10.54 (2.1) –0.04 70

ITA 512 (73) 503 (71) 0.12 10.2 (1.8) 9.69 (1.7) 0.27 m

JPN 587 (75) 584 (70) 0.04 8.9 (1.5) 8.33 (1.4) 0.39 26

KAZ 504 (87) 498 (80) 0.06 10.5 (2.1) 10.47 (1.9) 0.01 m

KOR 608 (70) 601 (66) 0.10 9.1 (1.6) 8.82 (1.3) 0.21 38

KWT 323 (104) 358 (96) –0.35 10.2 (1.9) 10.46 (2.0) –0.15 m

LTU 534 (76) 533 (72) 0.02 10.1 (1.9) 9.56 (1.9) 0.28 37

MAR 331 (104) 338 (101) –0.07 9.6 (1.5) 9.75 (1.6) –0.10 44

MLT 499 (80) 492 (75) 0.09 10.7 (2.3) 10.10 (2.2) 0.25 33

NLD 544 (53) 536 (53) 0.15 10.6 (2.0) 9.62 (2.0) 0.48 23

NOR 499 (71) 492 (66) 0.10 10.7 (2.0) 10.32 (1.8) 0.22 36

NZL 486 (86) 486 (81) 0.00 9.8 (1.8) 9.47 (1.7) 0.17 40

OMN 372 (109) 398 (97) –0.25 10.3 (2.0) 10.63 (2.0) –0.14 67

POL 486 (76) 476 (70) 0.12 10.9 (2.1) 10.40 (2.0) 0.22 45

PRT 535 (70) 529 (67) 0.09 9.9 (1.9) 9.32 (1.6) 0.34 54

QAT 407 (110) 420 (100) –0.13 10.1 (2.0) 10.37 (2.0) –0.13 63

Page 46: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

44 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

physikalische Wissenschaften, Mathematik und Sta tistik, Computerwissenschaften) wurde der Datenbank der UNESCO (n. d.) entnommen. Die Frauenraten beziehen sich auf das Jahr 2010, außer in Australien, Marokko und Korea, wo das Jahr 2009 als Referenzpunkt herangezo-gen wurde, da keine Daten für 2010 vorliegen. Für Eng-land und Nordirland wurde die Rate von Großbritannien insgesamt herangezogen. Für elf der 50 TIMSS-Teilneh-merländer liegen keine Angaben zu Absolventenraten vor (vgl. Tab.  1.3.1). In den übrigen Ländern schwankt der Frauen anteil unter den Absolventinnen und Absolventen mathematikinten siver Studienrichtungen zwischen 23 % in den Niederlanden und 73 % in Saudi-Arabien. In 30 von 39 Ländern liegt der Frauenanteil unter der Schwelle von 50 %, die Geschlechterparität kennzeichnet.

Ermittlung der Effektstärke

Um die Größen der Geschlechterunterschiede über unter- schiedliche Metriken (Mathematik-Leistungsskala, Mathe-matik-Selbstkonzept skala) hinweg vergleichbar zu machen, werden absolute Geschlechterunterschiede in das Effekt-stärkenmaß Cohen’s d transformiert. Dies ist ein etabliertes Maß zur Ermittlung der praktischen Bedeutsamkeit von Mittelwertdifferenzen (Cohen, 1988; Ellis, 2010; vgl. auch die Einleitung zu diesem Bericht). Die Effektstärke d wurde nach folgender Formel berechnet (M steht dabei für Mittel-wert, SD für Standardabweichung des Mittelwerts):

Im vorliegenden Beitrag wird, wie in Studien zu Geschlech-terunterschieden üblich (z. B. Else-Quest et al., 2010), der Mittelwert der Mädchen vom Mittelwert der Buben abge-zogen, womit positive Werte von d anzeigen, dass Buben im Durchschnitt eine höhere Ausprägung als Mädchen aufweisen (d. h. eine höhere Leistung oder ein positiveres Selbstkonzept), negative Werte indizieren eine höhere Aus-prägung der Mädchen.

Angelehnt an Hattie (2009) werden Effekte ab einer Größe von d = 0.20 als klein eingestuft und ab einer Größe von d  =  0.40 als mittel. Effekte unter einer Größe von 0.20 werden als praktisch nicht bedeutsam erachtet (vgl. Cohen, 1988; Else- Quest et al., 2010; Hattie, 2009). Eine Effekt-stärke von 0.20 bedeutet, dass sich 85,3 % der Wertever-teilungen von zwei Gruppen (im vorliegenden Beitrag von Mädchen und Buben) überlappen. Bei einer Effektstärke von 0.40 überlappen sich die Verteilungskurven nur mehr zu 72,6 % und der Unterschied zwischen zwei Mittelwerten beträgt 40 % einer Standardabweichung.

Ergebnisse

In Abbildung 1.3.1 werden Effektstärken von Geschlechter-unterschieden in der Mathematikleistung und im Mathe-matikselbstkonzept dargestellt. Auf der linken Seite der Abbildung sind die Länder entsprechend der Effektstärke der Geschlechterdifferenzen in der Mathematikleistung eingetragen, auf der rechten Seite erfolgt eine Darstellung nach Geschlechterdifferenzen im Mathematikselbstkon-

Tabelle 1.3.1: Mathematikleistung, Mathematikselbstkonzept und Abschluss mathematikintensiver Studienrichtungen im Geschlechtervergleich

Mathematikleistung MathematikselbstkonzeptFrauenanteil (%) an den Absolvent/innen mathematikintensiver

StudienrichtungenLand MW Buben MW Mädchen d MW Buben MW Mädchen d

ROU 484 (105) 481 (106) 0.03 10.3 (2.2) 10.12 (2.1) 0.06 56

RUS 542 (75) 543 (72) –0.02 10.0 (2.0) 9.68 (2.1) 0.15 m

SAU 402 (114) 418 (84) –0.16 10.0 (1.7) 10.73 (1.9) –0.40 73

SGP 604 (81) 608 (75) –0.05 9.5 (2.1) 8.87 (1.9) 0.30 m

SRB 519 (91) 513 (87) 0.07 10.2 (2.0) 9.98 (1.9) 0.12 45

SVK 511 (80) 503 (79) 0.10 10.2 (2.1) 9.69 (2.0) 0.26 43

SVN 518 (70) 508 (67) 0.14 10.7 (2.0) 10.15 (1.9) 0.30 40

SWE 506 (67) 501 (66) 0.07 10.5 (2.0) 10.20 (1.7) 0.15 43

THA 451 (85) 465 (74) –0.18 9.3 (1.3) 9.32 (1.3) –0.04 66

TUN 356 (97) 363 (92) –0.07 10.1 (1.7) 10.12 (1.7) –0.03 m

TUR 469 (102) 470 (99) –0.02 10.4 (2.0) 10.25 (2.0) 0.05 42

TWN 590 (74) 592 (72) –0.02 9.4 (2.1) 8.87 (2.0) 0.27 m

USA 545 (77) 536 (73) 0.11 10.4 (2.1) 10.00 (2.1) 0.21 41

YEM 243 (111) 255 (108) –0.11 9.4 (1.6) 9.63 (1.7) –0.14 m

MW = Mittelwert; d = Effektstärke des Geschlechterunterschieds; m = Werte fehlen; Standardabweichungen stehen in Klammern; Länderkürzel vgl. Abb. 1 (Einführung).

Page 47: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 45

zept. Der Wertebereich zwischen –/+ 0.20 wurde weiß be-lassen. Für Länder in diesem Bereich liegen keine praktisch bedeutsamen Geschlechterunterschiede vor. Im hellblau gekennzeichneten Wertebereich befinden sich Länder, in denen Geschlechterdifferenzen praktisch bedeutsam sind, der Effekt aber insgesamt klein ist. Im mittelblau gekenn-zeichneten Wertebereich befinden sich Länder, in denen Geschlechterdifferenzen praktisch bedeutsam sind und der Effekt eine mittlere Größe erreicht (mindestens 0.40).

Aufseiten der Mathematikleistung wird deutlich, dass in keinem der 50 Länder Buben praktisch bedeutsam höhere Leistungen erbringen als Mädchen. Bemerkenswert ist,

dass im Oman und in Kuwait im Gegenteil sogar Mädchen eine bedeutsam höhere Mathematikleistung aufweisen als Buben. Österreich befindet sich zwar unter den Ländern mit den höchsten Geschlechterunterschieden in der Mathe-matikleistung zugunsten der Buben, bleibt mit d = 0.15 aber trotzdem unter der Schwelle zur praktischen Bedeutsamkeit. Hypothese 1, in der angenommen wurde, dass Leistungsun-terschiede in Mathematik in allen Ländern nur von geringer Effektstärke sind, konnte somit größtenteils bestätigt wer-den: Abgesehen vom Oman und von Kuwait, wo Mädchen eine bedeutsam höhere Mathematikkompetenz aufweisen als Buben, sind keine praktisch bedeutsamen Geschlechter-unterschiede in der Mathematikleistung feststellbar.

NLD

0.45HKGDEU

BEL (fl) FIN0.40

JPN

AUTESP

0.35PRT

DNK0.30 SGP SVN

LTU GBR (E)TWN ITA CZESVK

0.25 MLT

NOR POL GBR (N) AUSUSA KOR

0.20 HRV CHL

HUNNZL

CZE HRV ESPNLD AUT 0.15 SWE IRL RUSDEU SVN

BEL (fl)CHL POL ITA SRB

USAKOR NOR SVK FIN 0.10

PRT MLT HKGDNK

SRB AUS SWEKAZ ROU

0.05 TUR GEOJPN IRL

ROU HUN GBR (E) ARMLTU

KAZ

Effektstärke des G

eschlechterunterschieds

mittlerer E

ffektkleiner E

ffekt

keine praktisch bedeutsamen

Geschlechterunterschiede

praktisch bedeutsame G

eschlechterunterschiede zugung

sten der B

uben

Mathematikleistung Mathematikselbstkonzept0.50

Page 48: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

46 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

Anders verhält es sich beim Mathematikselbstkonzept. Hier schätzen in 27 der 50 Länder Buben ihre Mathematikleis-tung bedeutsam höher ein als Mädchen. Einzig in Saudi-Arabien ist das Mathematikselbstkonzept der Mädchen be-deutsam positiver als jenes der Buben. In Österreich sind die geschlechterspezifischen Selbstkonzeptunterschiede am siebthöchsten unter den 50 Ländern: Die Effektstärke, mit der Mädchen hinter den Buben zurückliegen, beträgt 0.37, womit fast schon die Schwelle für einen mittleren Effekt

(d = 0.40) erreicht wird. Länder, in denen ein solcher mitt-lerer Effekt vorliegt, sind die Niederlande, Hongkong, Deutschland, der flämische Teil Belgiens und Finnland. Somit kann auch Hypothese 2 bestätigt werden: Tatsäch-lich weisen im Großteil der Länder (27 von 50) Buben ein praktisch bedeutsam höheres Mathematikselbstkonzept auf als Mädchen.

IRN NZL GBR (N) 0

TWN RUS TURTUN

ARM THA IRNSGP −0.05

BHRTUN MAR AZE AZEBHR ARE GEO

AREMAR

YEM

QAT QATYEM OMN

−0.15

−0.10

SAU KWT

THA

OMN −0.25

−0.30

−0.50

Länderkürzel vgl. Abb. 1 (Einführung)

−0.40

−0.45

KWT −0.35

SAU

−0.20

mittlerer E

ffektkleiner E

ffekt

keine praktisch bedeutsamen

Geschlechterunterschiede

praktisch bedeutsame G

eschlechterunterschiede zugung

sten der M

ädchen

Mathematikleistung Mathematikselbstkonzept

Abbildung 1.3.1: Effektstärken von Geschlechterunterschieden in der Mathematikleistung und im Mathematikselbstkonzept im internationalen Vergleich (TIMSS 2011)

Page 49: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 47

Abbildung 1.3.2 zeigt den Zusammenhang zwischen dem Mathematikselbstkonzept und der Absolventenrate von Frauen in mathematikintensiven Studienrichtungen. Hier ergibt sich ein sowohl statistisch als auch praktisch hoch bedeutsamer Zusammenhang von r (38) = –.77 (p < .01). Das heißt, je höher in einem Land die Absolventenrate von Frauen in mathematikintensiven Studienrichtungen ist, desto positiver ist das Selbstkonzept von Mädchen ge-genüber jenem von Buben ausgeprägt. Da es sich um ein Zusammenhangsergebnis handelt, kann es natürlich auch umgekehrt gelesen werden: Je positiver das Selbstkonzept von 10-jährigen Mädchen gegenüber jenem gleichaltriger Buben in einem Land ausgeprägt ist, desto höher ist die Absolventenrate von Frauen in mathematikintensiven Studienrichtungen. Zu dieser zweiten Interpretationsmög-lichkeit muss angemerkt werden, dass das Selbstkonzept der aktuell Zehnjährigen natürlich keinen Einfluss auf

die derzeitigen Studienquoten nehmen kann. Ein Längs-schnittvergleich zwischen TIMSS 1995 und TIMSS 2011 deutet jedoch darauf hin, dass Geschlechterunterschiede im Mathe matikselbstkonzept über die Zeit hinweg ziemlich stabil sind. So haben im Jahr 1995 87 % der österreichi-schen Buben und 80 % der Mädchen die Aussage „Ich bin normalerweise gut in Mathematik“2 mit „stimmt genau“ oder „stimmt eher schon“ beantwortet. Im Jahr 2011 haben 81 % der Buben und 75 % der Mädchen der fast iden-ten Aussage „Normalerweise bin ich gut in Mathematik“ etwas oder sehr zugestimmt. Mit 7 bzw. 6 Prozentpunkten Unterschied sind die Geschlechterdifferenzen damit an-nähernd gleich geblieben. Das heißt, bei den heutigen Endzwanzigern (und damit den potenziellen Studienab-solventen von heute) waren die Geschlechterunterschiede im Selbstkonzept am Ende der Volksschule bereits ähnlich hoch ausgeprägt wie bei den aktuell 10-Jährigen. Bemer-

2 Dies ist das einzige Item der aktuellen TIMSS-Selbstkonzeptskala, das auch bereits bei TIMSS 1995 in nahezu identer Form erhoben wurde.

Abbildung 1.3.2: Zusammenhang zwischen dem Mathematikselbstkonzept und dem Anteil von Frauen in mathematikintensiven Studienrichtungen (TIMSS 2011, UNESCO 2010)

AUT

Mädchen haben höheres MSK Buben haben höheres MSK

Länderkürzel vgl. Abb. 1 (Einführung)

Effektstärke des Geschlechterunterschieds im Mathematikselbstkonzept (MSK) 10-Jähriger

.60.40.20.00−.20−.40−.60

Frau

enan

teil

an d

en A

bslo

vent

/inne

n m

athe

mat

ikin

tens

iver

Stu

dien

richt

unge

n

100

90

80

70

60

50

40

30

20

10

% 0

TUR

THA

SWE

ESP

SVN

SVKSRB

ROU

QAT

PRT

POL

OMN

NOR

NZL

NLD

MAR

MLT

KOR

JPN

IRL

IRN

HUN

DEUFIN

DNK

HRV

CHL

AUS

ARM

GBR (E)GBR (N)

AZE

GEO

USACZE

LTU

BEL (fl)

SAU

r = −.77 (p < .01)

Page 50: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

48 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

kenswert ist, dass sowohl die Mädchen als auch die Buben ihre Mathematikkompetenz heute kritischer einschätzen als Mitte der 1990er Jahre.

Im folgenden Diskussionsteil wird die Rolle des Selbst-konzepts als Ursache und Folge von geschlechterverzerrten Studienraten genauer beleuchtet.

Diskussion

Die vorliegende Studie hat gezeigt, dass es bei 10-Jährigen in keinem der 50 untersuchten Länder einen praktisch be-deutsamen Geschlechterunterschied in der Mathematikleis-tung zugunsten der Buben gibt. Geschlechterunterschiede im Mathematikselbstkonzept sind jedoch im Großteil der TIMSS-Länder bedeutsam. Das heißt, obwohl Mäd-chen und Buben etwa gleich gute Mathematikleistungen erbringen, sind Mädchen weniger als Buben davon über-zeugt, gut in Mathematik zu sein. Dies gilt insbesondere auch für Österreich. Zwar ist in Österreich der Geschlechter-unterschied in der Mathematikleistung im Ländervergleich relativ hoch ausgeprägt, die Schwelle zur praktischen Be-deutsamkeit wird aber trotzdem nicht überschritten. Der Geschlechterunterschied im Mathematikselbstkonzept ist hingegen praktisch bedeutsam: Buben schätzen ihre Mathe-matikleistung deutlich besser ein als Mädchen. Ähnliche Ergebnisse lassen sich auch für die OECD-Länder fest-stellen, nicht aber für die arabischen. Vor allem Saudi-Ara-bien fällt aus dem Rahmen: Hier schätzen Mädchen ihre Mathe matikleistungen bedeutsam besser ein als Buben. In einer Reihe weiterer arabischer Länder (z. B. Kuwait, Jemen, Oman und Katar) weisen Mädchen ein tendenziell höhe-res Mathematikselbstkonzept auf als Buben. Auch bei der Mathematikleistung zeigt sich in den arabischen Ländern eher eine Überlegenheit der Mädchen.

Hohe Frauenbeteiligung in arabischen Ländern

Woran könnte es liegen, dass gerade in den arabischen Ländern Mädchen ein positiveres Selbstkonzept aufweisen als Buben? Eine Erklärung geht davon aus, dass in diesen Kulturen Vergleiche mit anderen eher gruppenintern durch-geführt werden (z. B. Costa, Terracciano & McCrae, 2001). Dies hieße, dass sich Mädchen in arabischen Ländern eher nur mit Mädchen vergleichen und Buben mit Buben – ge-schlechterübergreifende Vergleiche finden kaum statt. Dies ist plausibel, da auch die Schulen in diesen Ländern stark geschlechtersegregiert sind (vgl. Wiseman, 2008). Den-noch warnen Else-Quest et al. (2010) davor, den einfachen Schluss zu ziehen, Geschlechtersegregation würde zu mehr Geschlechtergerechtigkeit führen. Wisemann (2008) zeigt, dass in Ländern mit einem hohen Anteil monoedukativer Schulen Leistungsunterschiede in Mathematik sehr hete-r ogen ausfallen. Auch die OECD (2009) bestätigt, dass monoedukativ unterrichtete Mädchen in der Regel keinen

Leistungsvorteil gegenüber koedukativ unterrichteten Mäd-chen haben – insbesondere dann, wenn nach sozialem Status kontrolliert wird. Zuletzt zeigte eine groß angelegte Meta-analyse über 184 Studien aus 21 Nationen (Pahlke, Hyde & Allison, 2014), dass monoedukativer Unterricht keinen Vorteil gegenüber koedukativem hat, weder für Buben noch für Mädchen. Dies gilt für eine breite Reihe an Ergebnis-größen, insbesondere auch für die Mathematikleistung, das Selbstkonzept und Bildungsaspirationen.

Bemerkenswert an den arabischen Ländern ist nicht nur das relativ positive Mathematikselbstkonzept der Mädchen, sondern auch die hohen Frauenanteile in mathematik-intensiven Studienrichtungen (vgl. Tab. 1.3.1). Laut Lenzer (2006) haben Frauen in der arabischen Welt das Bedürfnis, sich in einer männerdominierten Gesellschaft zu beweisen, indem sie herausfordernde Studienrichtungen wählen. Weiters berichtet Lenzer davon, dass in arabischen Ländern jene Berufe als passend für Frauen angesehen werden, die wenig Kontakt mit Männern erfordern, ein Anspruch, den die Arbeit von Mathematikern und Computerwissenschaft-lern in der Regel erfüllt. Charles (2011) geht auch davon aus, dass Frauen in weniger entwickelten Ländern ihre Studienwahl eher nach praktisch-ökonomischen Gesichts-punkten treffen, während in westlichen Gesellschaften der Wunsch nach Selbstverwirklichung im Vordergrund steht.

Im Gegensatz zu den arabischen Ländern sind Frauen in OECD-Staaten in mathematikintensiven Studienrichtun-gen in der Regel unterrepräsentiert. Auch Österreich macht hier keine Ausnahme: Frauen stellen nur 34 % aller Ab-solventinnen und Absolventen in mathematikintensiven Studienrichtungen. Nur in fünf Vergleichsländern ist diese Rate noch niedriger (den Niederlanden, Chile, Japan, dem flämischen Teil Belgiens und in Malta). Eine größere Anzahl von Frauen in MINT (Mathematik, Informatik, Naturwissenschaften, Technik) wäre einerseits mit einem persönlichen Nutzen für diese Frauen verknüpft, da mathe-matikintensive Berufe mit einem höheren Ansehen und einer höheren Entlohnung verbunden sind (Watt, 2008). Mehr Frauen in MINT würden damit eine allgemeine Hebung der beruflichen Stellung von Frauen bedeuten. Andererseits wären mehr Frauen in MINT auch mit einem hohen volkswirtschaftlichen Nutzen verbunden. So weist etwa die Industriellenvereinigung (2013) auf einen starken Mangel an technisch-naturwissenschaftlich qualifizierten Arbeitskräften hin und betont, dass es die gemeinsame Ziel-setzung von Politik, Industrie und Gesellschaft sein muss, „künftig mehr junge Menschen – und hier im Speziellen junge Frauen und Mädchen – für MINT zu interessieren und für entsprechende Bildungswege, Studienrichtungen und berufliche Tätigkeiten zu motivieren“ (S. 4). Auch die OECD (2009, S. 12) sieht Mädchen als „the most obvious resource for increasing science and technology enrolments“.

Page 51: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 49

Wie können mehr Frauen für MINT gewonnen werden?

Um mehr Mädchen für mathematikintensive Berufe zu gewinnen, ist es wichtig jene Faktoren zu kennen, die Mädchen zu solchen Karrieren führen bzw. sie davon abhalten. Wie im Modell von Eccles (1994) in der Ein-leitung erwähnt, spielt das Mathematikselbstkonzept eine wesentliche Rolle für die Berufswahl: Personen mit hohem Mathematikselbstkonzept entscheiden sich eher für mathe-matikintensive Karrieren (vgl. Guay et al., 2004; Parker et al., 2012). Das Mathematikselbstkonzept wird wiederum gespeist durch gesellschaftliche Werte und Normen. Der vorliegende Beitrag konnte erstmals zeigen, dass sich die Beteiligung von Frauen an mathematikintensiven Studien- disziplinen bereits in den Selbstkonzepten 10-Jähriger wider spiegelt: In Ländern mit geringerer Frauenbeteiligung an mathematikintensiven Studienrichtungen hinkt auch das Mathematikselbstkonzept 10-jähriger Mädchen stärker hinter jenem gleichaltriger Buben nach als in Ländern mit starker Frauenbeteiligung. Geschlechtsstereotype werden demnach schon so früh internalisiert, dass sie sich be-reits am Ende der Grundschulzeit in einem verminderten Mathematikselbstkonzept der Mädchen niederschlagen.

Wenn man die Wichtigkeit des Selbstkonzepts für die spätere Berufswahl miteinbezieht, so scheint es in Gesell-schaften mit geringer MINT-Beteiligung von Frauen bereits für 10-jährige Mädchen grundgelegt zu sein, eher keine mathematikbezogenen Berufe zu ergreifen. Somit kann von einem negativen Kreislauf ausgegangen werden: Da nur wenige Frauen mathematikintensiven Berufen nachgehen, haben Mädchen kaum Rollenvorbilder, was sich negativ im eigenen Mathematikselbstkonzept niederschlägt. Das nega-tive Selbstkonzept wiederum lässt Mädchen seltener mathe-matikintensive Studien- und Berufsrichtungen wählen. Auf diese Weise reproduzieren sich Geschlechterverhältnisse in einer Gesellschaft. Wie könnte dieser Reproduktions-mechanismus entschärft werden?

Zunächst kann festgestellt werden, dass Mädchen allein schon aufgrund ihres breiteren Potenzials – sie sind häufiger als Burschen sowohl in Mathematik als auch in Lesen gut (Wang, Eccles & Kenny, 2013) – mehr Wahlmöglichkeit für unterschiedliche Berufe haben. Burschen verfügen da gegen häufiger zwar über gute mathematische, aber nur moderate sprachliche Fähigkeiten, womit sie eher auf die Wahl mathematikintensiver Berufe eingeschränkt sind. Warum aber entscheiden sich Mädchen oft gegen MINT, obwohl sie sich aufgrund ihrer Fähigkeiten auch dafür entscheiden könnten? Hierzu gibt es Indizien, dass bei einer größeren und früheren Spezialisierungsmöglichkeit auf Ebene des Bildungssystems Mädchen eher geschlechtsstereotype Be- rufs- und Bildungsentscheidungen treffen (Charles, 2011; Yazilitas, Svensson, de Vries & Saharso, 2013). So ver-weisen Yazilitas et al. (2013) auf eine englische Studie, in der festgestellt wurde, dass sich der Anteil an weiblichen

Studierenden in MINT-Fächern erhöht hat, nachdem bei den Abschlussprüfungen (A-Levels) mehr MINT-Fächer Pflicht wurden. Ähnlich wurde gezeigt, dass in gesamt-schulartigen Bildungssystemen die Mathematikleistungen von Mädchen (15-/16-Jährigen) weniger hinter jener der Burschen zurückliegen als in differenzierten Bildungssys-temen, in denen eine Auswahl zwischen unterschiedlichen Bildungsgängen getroffen werden muss (van Langen, Bos-ker & Dekkers, 2006). Bradley und Charles (2004) fanden darüber hinaus, dass es in Ländern mit sehr differenzierten und berufsorientierten Sekundarschulsystemen eine stärke-re Geschlechter segregation im tertiären Bereich gibt als in Ländern mit Gesamtschulsystemen (siehe auch Lassnigg, 2012). Bradley und Charles (2004) erklären dies damit, dass a) stark differenzierte Systeme mehr Möglichkeit für die Wahl geschlechtsstereotyper Bildungswege bieten und b) dass diese Entscheidung in der Adoleszenz getroffen werden muss, also in einer Entwicklungsphase, in der der Druck, Geschlechterstereotypen zu entsprechen, besonders groß ist.

Insbesondere in Österreich liegt durch die starke Zerglie-derung des Schulsystems schon relativ früh eine große Wahlmöglichkeit vor und Schüler/innen können sich bereits mit 14 bis 15 Jahren für Bildungsgänge mit sehr unterschiedlich hohem MINT-Anteil entscheiden. Diese Wahl erfolgt stark geschlechtsstereotyp: Burschen sind in Schulformen mit hohem MINT-Anteil drastisch in der Überzahl (vgl. Vogtenhuber et al., 2012). Auch Lassnigg und Laimer (2012) bemängeln die enge zeitliche Verknüpfung zwischen der adoleszenten Geschlechtsidentitätsentwick-lung und der ersten beruflichen Weichenstellung auf der 9. Schulstufe, deren vorbereitende Prozesse in das sensible Alter zwischen 13 und 15 Jahren fallen. Möglicherweise könnten mehr Mädchen an MINT-Studien herangeführt werden, wenn der Zeitpunkt einer berufsbildenden Spezia-lisierung verschoben wird bzw. wenn auch in typischer weise von Mädchen gewählten Schulformen MINT-Fächern ein höher Stellenwert eingeräumt wird und diese auch zu Pflichtgegenständen bei der Matura gemacht werden.

Eine weitere Möglichkeit mehr Mädchen an MINT her-anzuführen wäre, Frauen, die sich für MINT entscheiden, stärker (für Mädchen) sichtbar zu machen und ihnen hohe Wertschätzung entgegenzubringen. Denn Rollenvorbil-der spielen eine wichtige Rolle für die Berufswahl (Eccles, 1994). Nehmen Mädchen es als normal und erwünscht wahr, dass Frauen mathematikintensive Berufe ergreifen, werden sie dies selbst auch eher tun. Auch Else-Quest et al. (2010) betonen, dass Mädchen sehen müssen, dass sich Frauen mit MINT beschäftigen, um MINT als eine Op-tion für sich selbst wahrzunehmen. Wenn also Mädchen in einem gesellschaftlichen Kontext aufwachsen, in dem es geschätzt wird, dass Frauen MINT-Karrieren verfolgen, erhalten sie die Botschaft, dass ein mathematisch-naturwis-senschaftlicher Beruf eine gute Option für sie selbst sein könnte.

Page 52: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

50 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

Ceci et al. (2009) stellen darüber hinaus fest, dass es für Frauen schwieriger ist als für Männer, höhere Positionen in mathematikintensiven Berufen zu erreichen. Auch Valenduc et al. (2004) weisen auf diese mangelnde Geschlechter - gerechtigkeit hin: „The same level of education as men and comparable qualifications are not enough to guarantee a woman’s career in informatics“ (S. 31). Wenn durch ge-schlechtergerechtere Beförderungsstrategien oder auch durch verpflichtend vorgegebene Frauenquoten mehr Frauen in höheren MINT-Positionen zu finden wären, wäre dies ein Signal für Mädchen, dass es sich sehr wohl lohnt, MINT-Berufe zu ergreifen. Und es könnte auch dazu be itragen, die wenigen Frauen, die sich für mathematik-intensive Karrieren entscheiden, stärker dort zu halten; denn wie die aktuelle Forschung zeigt, neigen Frauen eher dazu als Männer, nach einem absolvierten MINT-Studium keine naturwissenschaftliche Karriere einzuschlagen (OECD, 2012) oder bereits eingeschlagene mathematikintensive Karrieren wieder zu verlassen (Ceci et al., 2009). Auch für Österreich ist bekannt, dass weibliche Fachkräfte in Handwerk und Technik wesentlich kürzer in ihrem Beruf verbleiben als ihre männlichen Kollegen (Europäischer Sozialfonds, 2013).

Kessels (2012) betont, dass es nicht nur wichtig ist, Mäd-chen stärker an MINT-Fächer heranzuführen, sondern auch MINT an die Mädchen, indem etwa im naturwissen-schaftlichen Unterricht stärker auf die Interessen von Mäd-chen eingegangen wird. So zeigen Häußler und Hoffmann (1995), dass Mädchen sehr intensiv auf den Wechsel des Kontexts reagieren und es für sie beispielsweise wesentlich interessanter ist, etwas über eine Pumpe zu erfahren, die als künstliches Herz Blut pumpt, als über eine Pumpe, die Erdöl aus großer Tiefe heraufpumpt. Ähnlich zeigen Kerger, Martin und Brunner (2011), dass das mathematisch-natur-wissenschaftliche Interesse von Mädchen wesentlich erhöht werden kann, wenn die Unterrichtsinhalte im Kontext weiblicher Themen präsentiert werden. Darüber hinaus scheint sich ein stark strukturierter naturwissenschaftlicher Unterricht insbesondere positiv auf die Leistungen von Mädchen auszuwirken (Blumberg, Hardy & Möller, 2008).Auch sollte das Image von MINT-Berufen stärker an die

Interessen von Mädchen herangeführt werden, etwa in-dem gezeigt wird, dass auch in diesen Berufen gemeinsam mit Menschen gearbeitet werden kann, diese Berufe einen Nutzen für die Gesellschaft mit sich bringen und sich mit den Bedürfnissen einer eigenen Familie vereinbaren lassen. Auf diese Weise könnten junge Frauen, die sowohl in Mathematik als auch in sprachlichen Domänen hohe Leis-tungen erzielen, vermehrt dazu gewonnen werden, MINT-Karrieren zu ergreifen (vgl. Wang et al., 2013).

Resümee

Die Ergebnisse des vorliegenden Beitrags verweisen auf die Wichtigkeit, die Begeisterung von Mädchen für Mathe-matik bereits im Grundschulalter und davor anzuregen. Denn schon bei 10-Jährigen lassen sich in Österreich – wie in vielen anderen Ländern auch – bedeutsame Geschlech-terdifferenzen im Mathematikselbstkonzept feststellen. Dennoch sollte auch zu späteren Zeitpunkten ständig dar-an weitergearbeitet werden, Mädchen die Nützlichkeit von MINT zu verdeutlichen und ihnen vor Augen zu halten, wie Selbstverwirklichung auch in mathematikintensiven Be-rufen möglich ist. Ein wichtiger Schritt zu mehr Frauen in mathematikintensiven Studiengängen wäre, dass Mädchen bis einschließlich zur Matura mit MINT-Fächern konfron-tiert werden und sie sich nicht frühzeitig für Schulformen mit geringem MINT-Anteil entscheiden können. Denn je früher Bildungsentscheidungen getroffen werden müssen, desto stärker fallen sie in eine sensible Entwicklungsphase der (Geschlechts-)Identität (Erikson, 1968) und desto eher erfolgen sie geschlechtsstereotyp (Bradley & Charles 2004; Lassnigg & Laimer, 2012; Yazilitas et al., 2013). Mädchen haben in der Regel breitere Potenziale als Burschen (Wang et al., 2013). Durch die frühzeitige Abwahlmöglichkeit von MINT bleibt ein Teil dieser Potenziale unentdeckt und un-genutzt.

Der vorliegende Beitrag zeigt ganz klar: Die Überzeugung von Mädchen, nicht gut in Mathematik zu sein, ist stark gesellschaftlich geprägt und sie ist den Mädchen keinesfalls angeboren.

Literatur

Bacher, J., Beham, M. & Lachmayr, N. (Hrsg.) (2008). Geschlechterunterschiede in der Bildungswahl. Wiesbaden: Verlag für Sozialwissenschaften.

Blumberg, E., Hardy, I. & Möller, K. (2008). Anspruchsvolles naturwissenschaftsbezogenes Lernen im Sachunterricht der Grundschule – auch für Mädchen? Zeitschrift für Grundschulforschung, 1, 59–72.

Bradley, K. & Charles, M. (2004). Uneven inroads: Understanding women’s status in higher education. Research in the Socio-logy of Education, 14, 247–274

Page 53: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 51

Buff, A., Reusser, K., Dinkelmann, I. & Steiner, E. (2011). Unser Kind ist gut in Mathematik! – Zur Bedeutung elterlicher kind-bezogener Kompetenzüberzeugungen hinsichtlich Selbstkonzept und Schulerfolg von Schülerinnen und Schülern. In F. Hell-mich (Hrsg.), Selbstkonzepte im Grundschulalter – Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S. 209–227). Stuttgart: Kohlhammer.

Ceci, S. J., Williams, W. M. & Barnett, S. M. (2009). Women’s underrepresentation in science: Sociocultural and biological considerations. Psychological Bulletin, 135, 218–261.

Charles, M. (2011). A world of difference: International trends in women’s economic status. Annual Review of Sociology, 37, 355–371.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum.

Costa, P. T., Jr., Terracciano, A. & McCrae, R. R. (2001). Gender differences in personality traits across cultures: Robust and surprising findings. Journal of Personality and Social Psychology, 81, 322–331.

Eccles, J. S. (1994). Understanding women’s educational and occupational choices. Psychology of Women Quarterly, 18, 585–609.

Eder, F. (2012). Die beruflichen Interessen der 15- und 16-Jährigen. In F. Eder (Hrsg.), PISA 2009. Nationale Zusatzanalysen für Österreich (S. 257–284). Münster: Waxmann.

Ellis, P. D. (2010). The essential guide to effect sizes. Cambridge: Cambridge University Press.

Else-Quest, N. M., Hyde, J. S. & Linn, M. C. (2010). Cross-national patterns of gender differences in mathematics: A meta-analysis. Psychological Bulletin, 136, 103–127.

Erikson, E. H. (1968). Identity, Youth and Crisis. New York: Norton.

Europäischer Sozialfonds (2013). InSight – Magazin des europäischen Sozialfonds, September 2013. Zugriff am 23.06.2014 unter http://www.equi.at/dateien/ESF_InSight_3_2013_web.pdf

European Commission (2013). She figures 2012. Gender in research and innovation. Retrieved September 18, 2013 from http://ec.europa.eu/research/science-society/document_library/pdf_06/she-figures-2012_en.pdf

Filzmoser, S. & Suchań, B. (2013). Mathematik: Unterschiede zwischen Mädchen und Burschen. In U. Schwantner, B. Toferer & C. Schreiner (Hrsg.), PISA 2012. Internationaler Vergleich von Schülerleistungen. Erste Ergebnisse Mathematik, Lesen, Naturwissenschaft (S. 24–25). Graz: Leykam.

Frome, P. M. & Eccles, J. S. (1998). Parents’ influence on children’s achievement-related perceptions. Journal of Personality and Social Psychology, 74, 435–452.

Gabriel, K., Mösko, E. & Lipowsky, F. (2011). Selbstkonzeptentwicklung von Jungen und Mädchen im Anfangsunterricht – Er-gebnisse aus der PERLE-Studie. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter – Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S. 133–158). Stuttgart: Kohlhammer.

Guay, F., Larose, S. & Boivin, M. (2004). Academic self-concept and educational attainment level: A ten-year longitudinal study. Self and Identity, 3, 53–68.

Hattie, J. (2009). Visible Learning – A synthesis of over 800 meta-analyses relating to achievement. New York: Routledge.

Häußler, P. & Hoffmann, L. (1995). Physikunterricht – an den Interessen von Mädchen und Jungen orientiert. Unterrichtswis-senschaft, 23, 107–126.

Hellmich, F. & Günther, F. (2011). Entwicklung von Selbstkonzepten bei Kindern im Grundschulalter – ein Überblick. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter – Modelle, empirische Ergebnisse, pädagogische Konsequenzen ( 19–46). Stuttgart: Kohlhammer.

Page 54: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

52 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

Helmke, A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Ergebnisse aus dem SCHOLASTIK-Projekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 203–216). Weinheim: Beltz.

Hyde, J. S., Lindberg, S. M., Linn, M. C., Ellis, A. & Williams, C. (2008). Gender similarities characterize math performance. Science, 321, 494–495.

Industriellenvereinigung (2013). MINT 2020 – Der Unterricht von morgen. Wien: Autor.

Kerger, S., Martin, R. & Brunner, M. (2011). How can we enhance girls’ interest in scientific topics? British Journal of Educa-tional Psychology, 81, 606–628.

Kessels, U. (2012). Selbstkonzept: Geschlechterunterschiede und Interventionsmöglichkeiten. In H. Stöger, A. Ziegler & M. Heilemann (Hrsg.), Mädchen und Frauen in MINT (S. 163–191). Berlin: LIT.

Köller, O., Daniels, Z., Schnabel, K. U. & Baumert, J. (2000). Kurswahlen von Mädchen und Jungen im Fach Mathematik: Zur Rolle von fachspezifischem Selbstkonzept und Interesse. Zeitschrift für Pädagogische Psychologie, 14, 26–37.

Lassnigg, L. (2012). Die berufliche Erstausbildung zwischen Wettbewerbsfähigkeit, sozialen Ansprüchen und Lifelong Lear-ning – eine Policy-Analyse. In B. Herzog-Punzenberger (Hrsg.), Nationaler Bildungsbericht Österreich 2012. Band 2. Fokus-sierte Analysen bildungspolitischer Schwerpunktthemen (S. 313–354). Graz: Leykam.

Lassnigg, L. & Laimer, A. (2012). Berufsbildung in Österreich: Hintergrundbericht zum Nationalen Bildungsbericht Österreich 2012. Zugriff am 23.06.2014 unter http://www.equi.at/dateien/nbb-hintergrund.pdf

Lenzer, A. (2006). Women in mathematics. Münster: Waxmann.

Li, Q. (1999). Teachers’ beliefs and gender differences in mathematics: A review. Educational Research, 41, 63–76.

Lindberg, S. M., Hyde, J. S., Petersen, J. L. & Linn, M. C. (2010). New trends in gender and mathematics performance: A metaanalysis. Psychological Bulletin, 136, 1123–1135.

Marsh, H. W. (1986). Verbal and math self-concepts: An internal/external frame of reference model. American Educational Research Journal, 23, 129–149.

Marsh, H. W. (2005). The big-fish–little-pond effect on academic self-concept. Zeitschrift für Pädagogische Psychologie, 19, 119–127.

Marsh, H. W. & Yeung, A. S. (1998). Longitudinal structural models of academic self-concept and achievement: Gender diffe-rences in the development of math and English constructs. American Educational Research Journal, 35, 705–738.

Martin, M. O., Mullis, I. V. S., Foy, P. & Arora, A. (2012). Creating and Interpreting the TIMSS and PIRLS 2011 Context Ques-tionnaire Scales. In Martin, M. O. & Mullis, I. V. S. (Eds.), Methods and procedures in TIMSS and PIRLS 2011. Retrieved Sep-tember 18, 2013 from http://timssandpirls.bc.edu/methods/t-context-q-scales.html

Möller, J., Kuska, K. & Zaunbauer, A. M. C. (2011). Internale und externale Bezugsrahmen in der Grundschule. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter – Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S. 159–172). Stuttgart: Kohlhammer.

Möller, J. & Marsh, H. W. (2013). Dimensional comparison theory. Psychological Review, 120, 544–560.

Möller, J., Pohlmann, B., Köller, O. & Marsh, H. W. (2009). A meta-analytic path analysis of the internal/external frame of refe-rence model of academic achievement and academic self-concept. Review of Educational Research, 79, 1129–1167.

Nagy, G., Garrett, J., Trautwein, U., Cortina, K., Baumert, J. & Eccles, J. (2008). Gendered high school course selection as a precursor of gendered careers: The mediating role of self-concept and intrinsic value. In H. Watt & J. Eccles (Eds.), Gender and occupational outcomes: Longitudinal assessments of individual, social, and cultural influences (pp. 115–143). Washing-ton, DC: American Psychological Association.

Page 55: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 53

Nosek, B. A., Smyth, F., Sriram, N., Lindner, N., Devos, T., Ayala, A. … Greenwald, A. G. (2009). National differences in gender-science stereotypes predict national sex differences in science and math achievement. Proceedings of the National Academy of Sciences of the United States of America, 106, 10593–10597. Retrieved September 18, 2013 from http://www.pnas.org/content/106/26/10593.full

OECD (2009). Equally prepared for life? How 15-year-old boys and girls perform in school. Paris, France: Author.

OECD (2011). Education at a Glance. Paris, France: Author.

OECD (2012). Closing the gender gap: Act now. Paris, France: Author.

OECD (2013). PISA 2012 Results: What students know and can do. Student Performance in Mathematics, Reading and Science (Vol. I). Paris, France: Author.

Pahlke, E., Hyde, J. S. & Allison, C. M. (2014). The effects of single-sex compared with coeducational schooling on students’ performance and attitudes: A meta-analysis. Psychological Bulletin, 140, 1042–1072.

Parker, P. D., Schoon, I., Tsai, Y.-M., Nagy, G., Trautwein, U. & Eccles, J. S. (2012). Achievement, agency, gender, and socioeco-nomic background as predictors of postschool choices: A multicontext study. Developmental Psychology, 48, 1629–1642.

Retelsdorf, J., Schwartz, K. & Asbrock, F. (2015). „Michael can’t read!“ Teachers’ gender stereotypes and boys’ reading self-concept. Journal of Educational Psychology, 107, 186–194.

Sáinz, M. & Eccles, J. (2012). Self-concept of computer and math ability: Gender implications across time and within ICT studies. Journal of Vocational Behavior, 80, 486–499.

Schreiner, C., Breit, S. & Haider, G. (2008). Zur Validität der Mathematiknoten. In F. Hofmann, C. Schreiner & J. Thonhauser (Hrsg.), Qualitative und quantitative Aspekte. Zu ihrer Komplementarität in der erziehungswissenschaftlichen Forschung (S. 211–223). Münster: Waxmann.

Spiel, C., Schober, B. & Litzenberger, M. (2008). Evaluation der Eignungstests für das Medizinstudium in Österreich. Zugriff am 23.06.2014 unter http://homepage.univie.ac.at/margarete.halmetschlager/download/Zusammenfassung_Medtest_2008.pdf

Steinmayr, R. & Spinath, B. (2009). What explains boys’ stronger confidence in their intelligence? Sex roles, 61, 736–749.

Tiedemann, J. (2000a). Gender-related beliefs of teachers in elementary school mathematics. Educational Studies in Mathe-matics, 41, 191–207.

Tiedemann, J. (2000b). Parents̓ gender stereotypes and teachers̓ beliefs as predictors of children‘s concept of their mathe-matical ability in elementary school. Journal of Educational Psychology, 92, 144–151.

Tiedemann, J. (2002). Teachers’ gender stereotypes as determinants of teacher perceptions in elementary school mathe-matics. Educational Studies in Mathematics, 50, 49–62.

UNESCO (n. d.). Table 16: Graduates by broad field of education in tertiary education. Retrieved September 18, 2013 from http://stats.uis.unesco.org/unesco/TableViewer/tableView.aspx?ReportId=169

Valenduc, G., Vendramin, P., Guffens, C, Ponzellini, A. M., Lebano, A., D’Ouville, L., Isabelle Collet, I. … Webster, J. (2004). Widening women’s work in information and communication technology. Retrieved September 18, 2013 from http://www. ftu-namur.org/fichiers/D12-print.pdf

van Langen, A., Bosker, R. & Dekkers, H. (2006). Exploring cross-national differences in gender gaps in education. Educatio-nal Research and Evaluation, 12, 155–177.

Vogtenhuber, S., Lassnigg, L., Bruneforth, M., Gumpoldsberger, H., Toferer, B., Schmich, J. … Bergmüller, S. (2012). Indika-toren C: Prozess. In: M. Bruneforth & L. Lassnigg (Hrsg.), Nationaler Bildungsbericht Österreich 2012. Band 1. Das Schulsys-tem im Spiegel von Daten und Indikatoren (S. 61–107). Graz: Leykam.

Page 56: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

54 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich

Voyer, D. & Voyer, S. (2014). Gender differences in scholastic achievement: A meta-analysis. Psychological Bulletin, 140, 1174–1204.

Wang, M., Eccles, J. S. & Kenny, S. (2013). Not lack of ability but more choice: Individual and gender difference in choice of careers in sciences, technology, engineering, and Mathematics. Psychological Sciences, 24, 770–775.

Wallner-Paschon, C. (2010). Kompetenzunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner-Paschon & C. Schreiner (Hrsg.), TIMSS 2007. Mathematik & Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S. 115–129). Graz: Leykam.

Wallner-Paschon, C. (2012a). Mathematik: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwis-senschaft in der Grundschule. Erste Ergebnisse (S. 30–31). Graz: Leykam.

Wallner-Paschon, C. (2012b). Lesen: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner- Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwis-senschaft in der Grundschule. Erste Ergebnisse (S. 18–19). Graz: Leykam.

Watt, H. M. G. (2008). What motivates females and males to pursue sex-stereotyped careers? In H. Watt & J. Eccles (Eds.), Gender and occupational outcomes: Longitudinal assessments of individual, social, and cultural influences (pp. 87–113). Washington, DC: American Psychological Association.

Wiseman, A. W. (2008). A culture of (in)equality?: A cross-national study of gender parity and gender segregation in national school systems. Research in Comparative & International Education, 3, 179–201.

Yazilitas, D., Svensson, J., de Vries, G. & Saharso, S. (2013). Gendered study choice: A literature review. A review of theory and research into the unequal representation of male and female students in mathematics, science, and technology. Educa-tional Research and Evaluation, 1–17.

Ziegler, A., Kuhn, C. & Heller, K. A. (1998). Implicit theories of mathematics and physics teachers of the German gymnasium on gender specific giftedness and motivation. Psychologische Beiträge, 40, 271–287.

Page 57: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 55

1.4 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item

Responses im Large-Scale-Assessment Alexander Robitzsch

Fehlende Item Responses in Large-Scale- Assessments

In Large-Scale-Assessments wie PIRLS, TIMSS, PISA oder den österreichischen Bildungsstandard-Erhebungen werden Kompetenzen von Schülerinnen und Schülern mithilfe von Testitems erfasst. Häufig geben Schülerinnen und Schüler allerdings keine Antwort bei bestimmten Items (fehlender Item Response; fehlende Itemantwort), sodass unklar ist, in-wiefern sich eine Nichtbeantwortung eines Items auf die Bestimmung der Kompetenzwerte niederschlagen soll.

Während die Behandlung fehlender Daten im Rahmen statistischer Analysen in den Sozialwissenschaften mittler-weile verbreitet zu sein scheint (Graham, 2009; Lüdtke & Robitzsch, 2010), ist in jüngerer Literatur (Pohl et al., 2014; Rose et al., 2010) Kritik an konventionellen Verfahren der Behandlung fehlender Item Responses in Item-Response-Modellen (IRT-Modelle) der Kompetenzmessung in Large-Scale-Assessments zu finden. Typischerweise wird dabei die Missing-Behandlung zwischen dem Prozess der Kalibrie-rung (Ermittlung von Itemparametern) und der Skalierung (Ermittlung von Kompetenzwerten) unterschieden.

In PIRLS/TIMSS und PISA werden bei der Kalibrierung ausschließlich fehlende Item Responses am Ende eines Test-hefts (sog. Not Reached Items) weggelassen (d. h. igno riert), um Schätzungen der Itemschwierigkeiten nicht zu „ver-zerren“. Für die Skalierung werden fehlende Item Responses typischerweise als falsch bewertet.

Die o. g. Literatur argumentiert jedoch, dass alle fehlenden Item Responses niemals (d. h. sowohl in Kalibrierung als Skalierung) als falsch zu kodieren seien (Rose, 2013; Pohl et al., 2014) und schlägt alternative Item-Response-Modelle

zur Behandlung der fehlenden Itemantworten vor. Der folgende Beitrag geht dabei zunächst auf die in der Literatur angebrachten Kritikpunkte (Rose, 2013; Pohl et al. 2014) zur Behandlung fehlender Item Responses als Falschantwort und die vorgeschlagenen modell basierten Alternativen ein. Ich argumentiere in diesem Beitrag im Gegensatz zur o. g. Literatur, dass nur aus Gründen der Validität und nicht aus (schein baren) testtheoretischen Gründen eine bestimmte Methode für den Umgang mit fehlenden Item Responses präferiert werden sollte. Da im Allgemeinen Annahmen über den Datenausfall bei Item Responses empirisch nicht testbar sind, werden zwei alternative Item-Response-Modelle vorge-schlagen, in denen verschiedene Annahmen an den Ausfall-prozess parametrisiert werden. Abschließend diskutiere ich mög liche psychometrische Konsequenzen im Large-Scale- Assessment zur Erfassung von Kompetenzen bei unterschied-lichen Behandlungsweisen fehlender Itemantworten.

Eine Auseinandersetzung mit Kritikpunkten des „traditionellen“ Vorgehens bei fehlenden Item Responses

Für die Ermittlung von Kompetenzwerten werden im Large- Scale-Assessment bei einer Skalierung typischerweise fehlende Item Responses als falsch bewertet. Konträr dazu wird in einer Reihe aktueller Publikationen (Rose, 2013; Pohl & Carstensen, 2012, 2013; Pohl et al., 2014) behauptet, dass fehlende Item Responses niemals als falsch zu bewerten seien, und es wird empfohlen, diese traditionelle „Ad-Hoc-Methode“ nicht im Large-Scale-Assessment einzusetzen. Im Folgenden gehe ich dabei auf die Begründungen der Autorinnen und Autoren ein und gelange zur Feststellung, dass diese auf Annahmen und Schlussfolgerungen beruhen,

In neuerer Literatur werden alternative Modellierungen fehlender Item Responses im Large-Scale-Assessment vorgeschlagen. Prinzipiell argumentieren diese Ansätze auf Basis von Simulationen und testtheoretischen Überlegungen, dass fehlende Item Responses niemals als falsch zu bepunkten, sondern eher als ignorierbar zu behandeln seien (z. B. Pohl, Gräfe & Rose, 2014). Der vorliegende Beitrag zeigt auf, dass diese Argumentationen eingeschränkte Gültigkeit besitzen und illus-triert anhand eines Ländervergleichs in PIRLS 2011, dass eine andere Bewertung der fehlenden Item Responses als die einer Falschantwort zu deutlichen Änderungen in Länderreihenfolgen führt und daher nichtignorierbare Konsequenzen hinsichtlich der Validität der Ergebnisse besitzt. Zusätzlich werden zwei alternative Item-Response-Modelle vorgeschlagen, mit denen verschiedene Annahmen für das Zustandekommen fehlender Werte bei den Item Responses beschrieben werden können.

Page 58: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

56 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment

die in der Anwendung von Item-Response- Modellen unty-pisch sind und daher die in der o. g. Literatur befindlichen Empfehlungen als fragwürdig zu erachten sind.

Nützlich für die folgenden Überlegungen erweist sich dabei die von Denoeux (2011) vorgeschlagene Unterschei-dung bei der Quantifikation der Unsicherheit in Daten (den Item Responses) und damit korrespondierenden Modellierungen, die in der Abgrenzung der Konzepte der „Probability“ (Wahrscheinlichkeit) und „Possibility“ (Möglichkeit) bedeutsam sind. Durch Stichproben ziehung oder Modellierung existierender Daten (Datensatz mit allen Item Responses) entstehende Unsicherheit wird dabei als aleatorische Unsicherheit bezeichnet. Unsicherheit (bzw. Unschärfe in der Terminologie von Fuzzy-Daten) für jedes einzelne Datum (jede einzelne Itemantwort) wird als epistemische Unsicherheit bezeichnet. Denoeux (2011) argumentiert, dass man aleatorische Unsicherheit mittels Wahrscheinlichkeiten modellieren solle, was im Falle des vorliegenden Kompetenztests bedeutet, ein IRT-Modell für fest vorgegebene Item Responses anzupassen. Die Beobach-tung der einzelnen Daten (der einzelnen Item Responses jeder Schülerin oder jedes Schülers) erfolgt dabei mit dem Konzept epistemischer Unsicherheit, das in Anwendungen dann häufig in unscharfen Beobachtungen (sog. Fuzzy- Daten) mündet (Denoeux, 2011, 2013). Bei fehlenden Item Responses ist demzufolge unklar, welche Bepunktung das Fehlen eines Item Response nach sich ziehen soll. Es ist aber in dieser Konzeption offensichtlich, dass Annahmen an die einzelnen Daten (den einzelnen Item Responses) strikt von Annahmen in einem Wahrscheinlichkeitsmodell (ein gemeinsames Modell für alle Item Responses) zu un-terscheiden sind. Zur Illustration dieser begrifflichen Un-terscheidung wird angenommen, dass man die Verteilung der Laufzeiten in einem 50-Meter-Lauf für eine definierte Population österreichischer Schüler/innen der 4. Schulstufe erfassen möge. Dazu wird eine Stichprobe von Schülerin-nen und Schülern ge zogen. Die mit dieser Stichprobenzie-hung verbundene Unsicherheit auf die Population wird mit Wahrscheinlich keiten im Kontext der aleatorischen Unsi-cherheit ausgedrückt. Jede Messung der Laufzeit einer Schü-lerin/eines Schülers ist aber niemals exakt, sondern immer nur unscharf (z. B. liegt die gemessene Laufzeit aufgrund der Messunsicherheit im Intervall zwischen 8.75 und 8.85 Sekunden, das ein Fuzzy-Datum darstellt). Diese Unsicher-heit entspricht dem Konzept epistemischer Unsicherheit.

Die Kritik der Falschbewertung fehlender Item Responses fußt dabei auf simulationsbasierten und testtheoretischen Begründungen (Rose, 2013), auf die ich in weiterer Folge jeweils näher eingehe.

Die meisten Simulationsstudien versuchen zu vermitteln, dass eine Falschbewertung von fehlenden Item Responses zu „verzerrten“ Itemparametern und Personenparametern führt. Dabei wird ein fehlender Item Response meist durch eine Abhängigkeit von einer weiteren latenten Variable oder

Personenkovariaten (nicht aber in Abhängigkeit des Items selbst) simuliert. Dann ist die berichtete Verzerrung bei einer Bewertung als falsch in Parametern folgerichtig, denn das der Simulation zugrunde liegende datengenerierende Modell stimmt nicht mit dem Analysemodell (Missings sind falsche Itemantworten) überein. Nimmt man jedoch um gekehrt an, dass ein IRT-Modell für die Item Responses passt und es werden bei allen Items fehlende Werte gene-riert, für die das Item falsch gelöst wurde, dann führt natür-lich jede zur Falschbewertung alternative Missingbehand-lung zu verzerrten Parametern (siehe Rohwer, 2013). Ob eine simulationsbasierte Argumentation gegen eine Falsch-bewertung von fehlenden Item Responses zutreffend ist, hängt dem zufolge von der Plausibilität des datengenerieren-den Modells für den Ausfallprozess ab. Ich argumentiere, dass Ansätze, die den Ausfall auf einem Item unabhängig von der unbekannten Itemantwort selbst modellieren, unplau sibel sind. Somit helfen Simulationsstudien bei der Frage nach der Begründung einer „richtigen Bewertung“ fehlender Item Responses nicht weiter.

In der testtheoretischen Begründung ist der Kern der Kritik, dass eine Falschbewertung fehlende Items „deterministisch“ behandeln würde und demzufolge modellimplizierte Wahr-scheinlichkeiten des IRT-Modells ungültig seien (Rose, 2013; Pohl et al., 2014). Bezeichnet man mit Rni die Dummy-variable, dass für Person n das Item i beobachtet wird, so wird bei einer Falschbewertung der Item Response Yni auf null (d. h. falsch) gesetzt, also P(Yni = 1|Rni = 0) = 0 unabhängig von der Personenfähigkeit θn. Dadurch entstünde ein Widerspruch, denn über die Vorhersage im IRT-Modell (z. B. das Rasch-Modell) würde man eine Wahrscheinlichkeit P(Yni = 1|θn) > 0 annehmen, d. h. die Datenbehandlung sei deterministisch und das IRT-Modell sei probabilistisch (Rose, 2013), weshalb Modellannahmen im IRT-Modell verletzt seien. Formal ist der Widerspruch mit den beiden verschiedenen Konzepten der Unsicherheit nach Denoeux (2011) auflösbar, denn in der Argumentation von Rose (2013) und Pohl et al. (2014) erfolgt eine Konfundierung von epistemischer und aleatorischer Unsicherheit, so dass man damit gar nicht von einer Gleichsetzung der ver-schiedenen Wahrscheinlichkeiten ausgehen sollte. Bettet man die Überlegungen stärker in Begrifflichkeiten der Psychometrie ein, so fällt auf, dass die Argumentation der Ablehnung als Falschbewertung offenbar auf einer intra-individuellen Interpretation der Wahrscheinlichkeiten im IRT-Modell im Sinne der Stochastic-Subject-Perspektive (d.  h. Wahrscheinlichkeiten des IRT-Modells können für jede Kombination einer Person n mit einem Item i inter-pretiert werden) beruht (siehe Holland, 1990; für eine auf der Stochastic Subject basierende Testtheorie siehe Steyer & Eid, 2001), die in Anwendungen des Large-Scale Assessments allenfalls historische und geringe praktische Bedeutung besitzt (Wainer, 2010). Stellt man eine Random- Sampling-Perspektive (Holland, 1990; Molenaar, 1995) an, so interpretiert man Wahrscheinlichkeiten als Ergebnis einer Stichprobenziehung von Personen und führt Item parameter

Page 59: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 57

sowie eine Verteilung für Personenfähigkeiten θ als Repräsen-tation einer hochdimensionalen Kontingenz tafel für multi-variate diskrete Beobachtungen Y ein. Dann ergibt sich for-mal als statistisches Modell eine Repräsen tation als Integral:

(1)

In dieser Schreibweise wird deutlich, dass in IRT-Modellen eine Verteilung für Personen spezifiziert wird und nicht ein-zelne Individuen repräsentiert werden (siehe auch Rohwer, 2013).

Wenn man jedoch die intraindividuelle Perspektive im Sinne der Stochastic-Subject-Perspektive annimmt, so beruht die Argumentation auf der Behauptung, dass bei einem Scoring der Missings als falsch die Wahrscheinlichkeit für eine korrekte Lösung eines Items deterministisch sei, denn die Bewertung als falsch führe zu einer falschen Antwort mit Wahrscheinlichkeit 1. Die Bewertung einer Antwort als falsch steht aber in keinem Zusammenhang zur proba-bilistischen Modellierung der Itemantworten einer Person. Denn es könnten auch die nichtfehlenden Items durch einen wie auch immer gearteten deterministischen Prozess zustande gekommen sein, was nicht der probabilistischen Modellierung im statistischen Modell für alle Item Respon-ses widerspricht. Man muss daher zwischen einem „realen Antwortprozess“ – der deterministisch oder probabilistisch erfolgen kann, aber sicher in den seltensten Fällen der vor-gegebenen probabilistischen Spezifikation des IRT-Modells folgt – und der statistischen Modellannahme zur Definition einer Fähigkeit im Sinne einer Skalenkonstruktion unter-scheiden (Rohwer, 2013).

Auch statistische Gründe im Sinne der Stochastic-Subject- Perspektive entkräften die Kritik an einer Falschbewertung der fehlenden Item Responses. Bei der Modellierung int-raindividueller Verteilungen in einem IRT-Modell für eine Person werden dabei Itemparameter als feste und bekannte Parameter vorausgesetzt und die Personenfähigkeit θn ist als ein der Person zugeordneter fester Effekt (fixed effect) zu interpretieren. Die Annahme der lokalen stochastischen Unabhängigkeit bezieht sich dann auf eine bedingte Unab-hängigkeit der Itemantworten für eine feste Person n an-hand der vorgegebenen Itemmenge und ist damit empirisch nicht widerlegbar, sondern eine Setzung zur Identifikation der Fähigkeit θn dieser Person. D. h. die Personenfähigkeit θn ist erst durch die Spezifikation der Likelihood und der Itemantworten Y definiert. Im Rasch-Modell ist bei einer festen Person n und Item i die Wahrscheinlichkeit einer korrekten Itemantwort durch P(Yni = 1|θn) = Ψ(θn – bi) (mit der logistischen Funktion Ψ) gegeben, die in der Likeli-hood-Schätzung für den Parameter θn verwendet wird. Ob eine einzelne Beobachtung dann in diesem Modell „passt“, ist empirisch nicht entscheidbar, so dass eine Falschbewer-tung der fehlenden Item Responses nicht per se das IRT-Modell verletzen kann.

Zusammenfassend sind die in der Literatur auffindbaren simulationsbasierten und testtheoretischen Begründungen, die gegen die Bewertung der fehlenden Antworten als falsch angebracht werden, aus meiner Sicht für typische Anwen-dungen im Large-Scale-Assessment nicht zutreffend. Es soll hier aber angemerkt werden, dass aus Gründen der Validi-tät durchaus andere Bewertungen als falsch in Anwendun-gen adäquat sein könnten. Zentral in der Argumentation der Kritik der Autorinnen und Autoren ist, dass aus dem Antwortverhalten von Schülerinnen und Schülern in einer querschnitt lichen Messung (inter -individuelle Perspektive) fälschlicherweise auf ein Antwortverhalten eines einzelnen Schülers (intraindividuelle Perspektive) rückgeschlossen wird (siehe Molenaar, 2004).

Modellbasierte Behandlung fehlender Item Responses

In diesem Abschnitt werden verschiedene modellbasierte Verfahren zur Behandlung fehlender Item Responses dis-kutiert, wobei im Folgenden nur IRT-Modelle für dicho-tome Daten in der Familie der Rasch-Modelle (Fischer & Molenaar, 1995) betrachtet werden. Allerdings sind unsere Über legungen auch für allgemeinere Modellklassen wie 2PL-Modelle oder IRT-Modelle für polytome Daten gültig.

Unter den modellbasierten Verfahren werden häufig IRT-Modelle für ignorierbare und nichtignorierbare Item Responses unterschieden (Holman & Glas, 2005). Bei einer Ignorierung fehlender Item Responses werden Items für Schüler/innen aus der Likelihood-Funktion in der Schätzung weggelassen (d. h. ignoriert), für die das jewei-lige Item fehlend ist. Ignoriert man die fehlenden Item Responses in der Schätzung, so kann man zeigen, dass fehlende Item Responses unter dieser Annahme mit einer Wahrscheinlichkeit von Pni(θn, M) als richtig imputiert (d. h. bepunktet) werden, wenn θn, M die Fähigkeit von Person n bezeichnet, die ausschließlich mit den nichtfehlenden Items ermittelt wurde. D. h. praktisch, dass das IRT-Modell und die beobachteten Item Responses genutzt werden, um die fehlenden Items zu ersetzen. Da die Wahrscheinlichkeit Pni(θn, M) immer größer als null ist, führt die Ignorierung von Item Responses bei fest gehaltenen Itemparametern immer zu höheren Personenfähigkeiten als eine Bewer-tung als falsch. Das Ignorieren fehlender Item Responses bedeutet nicht, dass der Ausfall unabhängig von der Fähigkeit ist (d. h. der Ausfall ist nicht missing completely at random, MCAR; siehe Lüdtke & Robitzsch, 2010). Er ist dadurch charakterisiert, dass die gesamte Information über die Fähigkeit θn bereits aus den beobachteten Item Responses rekonstruierbar ist, d. h. der Ausfall ist missing at random (MAR). D. h. unter dieser Annahme kann der Fall ein treten, dass der Anteil fehlender Item Responses bei leistungsschwächeren Schülerinnen und Schülern größer als bei leistungsstärkeren Schülerinnen und Schülern ist.

Page 60: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

58 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment

Die Behandlung fehlender Item Responses als falsch kann dabei als ein Extremum, die Ignorierung als ein anderes Extremum angesehen werden (Rost, 2004, S. 324 ff.). Im ersten Fall besteht die Gefahr einer Unterschätzung der Personenfähigkeit, im zweiten gegebenenfalls eine Über-schätzung der Personenfähigkeit.

Alternativ zur Ignorierung fehlender Item Responses wurden mehrdimensionale IRT-Modelle für nichtignorierbare Item Responses vorgeschlagen (Holman & Glas, 2005; Rose et al., 2010). Das zweidimensionale Modell von Holman und Glas (2005) führt neben der latenten Fähigkeit θ eine latente individuelle Response Propensity (Antworttendenz) ξ ein, die dem Ausfall der Item Responses zugrunde liegt. Für die Responsevariablen Rni nimmt man dabei ebenso ein Rasch-Modell an:

P(Rni = 1|θn, ξn) = Ψ(ξn – βi) (2)

Die Wahrscheinlichkeit, eine Itemantwort zu produzie-ren, hängt demnach von der Antworttendenz ξn und von der „Schwierigkeit“ eines nichtfehlenden Responses βi ab. Ob ein Item fehlt oder nicht, hängt allerdings nicht vom Item Response selbst ab. Das zweidimensionale Modell schätzt damit eine bivariate Verteilung von (θ, ξ). Aller-dings existiert für jede Person nur eine EAP-Schätzung und keine Maximum-Likelihood-Schätzung (Yen & Fitzpatrick, 2006) für die Fähigkeit θn. Als Konsequenz ist dann nur unter Vorgabe einer Korrelation von Fähigkeit θ und Ant-worttendenz ξ eine Schätzung der Fähigkeit möglich.

Lässt sich dann die Antworttendenz ξ als ξ = ρθ + ε schrei-ben, so kann man zeigen, dass fehlende Item Responses eine Bepunktung von Pni(θn, M) erfahren (siehe Bertoli-Barsotti & Punzo, 2013). Im Unterschied zum Modell mit igno-rierbaren Item Responses werden Fähigkeitsschätzungen demzufolge in Abhängigkeit der Regression der Antwort-tendenz auf die Fähigkeit um die Konstante ρ adjustiert. Nur wenn Antworttendenz und Fähigkeit unkorreliert sind (ρ = 0), führen beide Modelle zu denselben Personenpara-meterschätzungen.

Als Approximation des zweidimensionalen Modells schla-gen Rose et al. (2010; siehe auch Pohl et al., 2014) ein eindimensionales IRT-Modell (bei Ignorierung fehlender Item Responses) für die Fähigkeit mit einem latenten Hintergrundmodell vor, in dem der Anteil fehlender Items als manifeste Kovariate verwendet wird. Diese Kovariate soll dabei näherungsweise die Rolle der Response Propensity ξ einnehmen. Ich bezweifle aber die Nützlichkeit dieses Mo-dells: Bei längeren Tests mit vielen Items dominiert bei der Schätzung der Personenfähigkeit die Likelihood der nicht-fehlenden Item Responses im Vergleich zur Priorverteilung des latenten Hintergrundmodells, so dass man für Tests mit hinreichend vielen Items näherungsweise das Vorgehen der Ignorierbarkeit fehlender Item Responses erhält.

Weitere modellbasierte Verfahren verallgemeinern das biva-riate IRT-Modell von Holman und Glas (siehe Rose, 2013, Bertoli-Barsotti & Punzo, 2013) oder setzen Mischvertei-lungsansätze ein (Bacci & Bartolucci, 2013; Pietsch, 2011). Ich beziehe diese Modelle allerdings nicht in die verglei-chenden Analysen dieses Beitrags ein.

Zwei alternative Item-Response-Modelle für nichtignorierbare Item Responses: Ansätze für eine Sensitivitätsanalyse

In diesem Abschnitt sollen zwei alternative modellbasierte Ansätze diskutiert werden, die die fehlenden Item Responses als nichtignorierbar behandeln. Im ersten Modell soll der Ansatz der teilrichtigen Bewertung von Lord (1974) ange-wendet werden. Ein zweites IRT-Modell erweitert das zwei-dimensionale IRT-Modell von Holman und Glas (2005) um eine mögliche Abhängigkeit des Ausfallens eines Items vom unbekannten Item Response selbst, sodass sich die Bewertung einer fehlenden Itemantwort als falsch als ein Spezialfall ergibt. Die beiden vorgeschlagenen Modelle können dabei als eine so genannte Sensitivitätsanalyse an-gesehen werden, bei der unter einer Variation verschiedener Annahmen an den Ausfallprozess die erhaltenen Ergebnisse studiert werden (z. B. Resseguier, Roch & Paoletti, 2011).

Ein Pseudo-Likelihood-Ansatz für partielles Scoring der Item Responses

Im Pseudo-Likelihood-Ansatz nach Lord (1974) können Item Responses als partiell korrekt (teilrichtige Bepunk-tung) bewertet werden. Die Pseudo-Likelihood-Funktion Ln (genauer: die Pseudo-Log-Likelihood) für Person n ist definiert als

(3)

Dabei ist Pni die Wahrscheinlichkeit der korrekten Beant-wortung von Item i durch Person n und wni ist der Punkt-wert (Score) von Person n auf Item i. Liegen keine fehlen-den Item Responses vor, dann sind die Scores wni entweder gleich 1 (bei einer richtigen Antwort) oder gleich 0 (bei einer falschen Antwort). Lord (1974) argumentiert, dass bei fehlenden Item Responses bei Multiple-Choice-Items mit M Antwortalternativen die Scores wni gleich einer Ratewahrscheinlichkeit von 1/M gesetzt werden können und die entstehende Likelihood (3) optimiert wird. Würde man die fehlenden Item Responses ignorieren, dann bedeutet e dies – wie oben argumentiert –, fehlende Items mit wni = Pni (θn, M) zu bepunkten, wobei θn, M die Fähigkeits-schätzung für Person n auf Basis der nichtfehlenden Item Responses ist. Bei einer Behandlung der fehlenden Item Responses als falsch wählt man die Scores wni = 0. Diese beiden Fälle sollen als „Extrema“ der Behandlung fehlen-

Page 61: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 59

der Item Responses aufgefasst werden (siehe Rost, 2004, S. 324 ff.) und „dazwischen liegende“ Annahmen durch einen Sensitivitätsparameter ρ = 0 (Behandlung der Missings als falsch) und ρ = 1 (Behandlung der Missings als igno-rierbar) im Rahmen einer Sensitivitätsanalyse studiert werden. Setzt man in diesem Ansatz als Bepunktung von Item i für Person n den Score wni = ρ ∙ Pni(θn, M) und ermit-telt die Ergebnisse der Skalierung bei Variation des Para-meters ρ. Diese Technik der Sensitivitätsanalysen ist bei der Imputation fehlender Daten für nichtignorierbare Missings verbreitet (van Buuren, 2012; Resseguier, Roch & Paoletti, 2011). Dabei ist zu bemerken, dass der Parameter ρ selbst nicht schätzbar ist, sondern für die Schätzung vorgegeben werden muss. Dies wird auch dadurch gestützt, dass die Pseudo-Likelihood-Funktion in Abhängigkeit von ρ nur ein Maximum bei ρ = 0 oder ρ = 1 annehmen kann.

Modellierung des Ausfallprozesses der Item Responses

Im zweiten Modell werden die fehlenden Item Responses ähnlich dem zweidimensionalen Modell von Holman und Glas (2005; siehe auch Rose et al., 2010) modelliert. Schreibt man wiederum Ψ als Abkürzung für die logistische Funktion, so gilt unter der Annahme des Rasch-Modells (Yen & Fitzpatrick, 2006) folgende Gleichung für die Wahrscheinlichkeit eines korrekten Item Responses:

P(Yi = 1|θ) = Ψ(θ – bi) (4)

Die Modellgleichung für einen fehlenden Wert des Items i mithilfe der Response Propensity (Ausfalltendenz) ξ möge nun allerdings auch vom unbekannten Item Response Yi selbst abhängen (siehe Mislevy & Wu, 1996). Dafür defi-nieren wir:

P(Ri = 1|Yi = k, ξ) = Ψ(ξ – βi + kδ) mit k = 0,1 (5)

Die Wahrscheinlichkeit eines nichtfehlenden Item Response (d. h. Ri =1) in Abhängigkeit des Item Response Yi entsteht dabei unter der Annahme δ ≠ 0. Wählt man δ = 0, so gelangt man zum IRT-Modell für nichtignorierbare Item Responses von Holman und Glas (2005). Der Parameter δ ist jedoch ebenso wie der Parameter ρ im Pseudo-Likelihood-Ansatz nicht aus den Daten schätzbar (d. h. nicht empirisch iden-tifizierbar). Wiederum können im Rahmen einer Sensiti-vitätsanalyse Skalierungsergebnisse in Abhängigkeit vorge-gebener Parameterwerte für δ studiert werden. Für sehr kleine Werte von δ (also z. B. δ = –10) erhält man P(Ri = 1|Yi = 1, ξ) = 1, also P(Ri = 0|Yi = 1, ξ) = 0. D. h. alle Schüler/innen, die die korrekte Itemantwort wissen, geben mit einer Wahrscheinlichkeit von 1 auch einen korrekten Item Res-ponse und lassen daher dieses Item nicht aus. Daraus folgt allerdings nach dem Satz von Bayes die Beziehung P(Yi = 1|Ri = 0; θ, ξ) = 0, d. h. fehlende Item Responses werden mit einer Wahrscheinlichkeit von 1 als falsch bewertet.

Wie im Pseudo-Likelihood-Ansatz modelliert man demzu-folge auch mit diesem Modell die Extrema der Ignorierbar-keit von Missings (δ = 0) und der Behandlung von Missings als falsch (δ = –10).

Das vorgeschlagene Item-Response-Modell schätzt Item-schwierigkeiten bi, Itemparameter bi für die Response- Tendenz sowie die bivariate Verteilung von (θ, ξ). Dabei werden in der Ermittlung der Likelihood für Item i die Wahrscheinlichkeiten dreier disjunkter Ereignisse P(Ri = 1, Yi = 0|θ, ξ), P(Ri = 1, Yi = 1|θ, ξ) und P(Ri = 0|θ, ξ) verwen-det. Die Wahrscheinlichkeit eines fehlenden Item Responses P(Ri = 0|θ, ξ) ist dabei durch die totale Wahrscheinlichkeit

P(Ri = 0|θ, ξ) = P(Ri = 0|Yi = 0|θ, ξ) P(Yi = 0|θ) + P(Ri = 0| Yi = 1|ξ) P(Yi = |θ) (6)

gegeben, die man aus den Itemparametern berechnen kann. Fehlende Item Responses Yi werden dabei praktisch in Ana-logie zu fehlenden Items in Large-Scale-Assessments mit der Marginal Maximum Likelihood (MML)-Schätzmethode ausintegriert (von Davier & Sinharay, 2014; siehe auch Mislevy & Wu, 1996; Hanson, 2000).

Ländervergleich von vier Ländern in PIRLS 2011

Im folgenden Abschnitt soll ein Vergleich der Lesekom-petenzleistungen in PIRLS 2011 anhand eines Testhefts für vier ausgewählte Länder, Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und die Niederlande (NLD), vorgenommen und die Abhängigkeit der Ländermittelwerte in Abhängigkeit verschiedener Behandlungen der fehlenden Item Responses untersucht werden.

Daten

Für die Analyse sollen die Schülerantworten des Testhefts 13 in PIRLS 2011 („PIRLS Reader“) mit 35 Items (da-von 15 Multiple-Choice-Items mit 4 Antwortalternativen) verwendet werden. Dabei resultierten 968 österreichische, 809 deutsche, 901 französische und 802 niederländische Schüler/innen in der Stichprobe. Zur Vereinfachung der Analysen wurden alle polytomen Items dichotomisiert, wobei nur der höchste Punktwert bei einem Item zu einer Richtigantwort führt.

Deskriptive Analysen zeigen, dass die mittleren Missing-anteile der Items zwischen den Ländern stark variierten (Ö: 11.2 %, DEU: 7.9 %, FRA: 13.6 %, NLD: 2.7 %). Diese Missinganteile waren bei den offenen Items deutlich stärker als bei den Multiple-Choice-Items ausgeprägt (z. B. Ö: offen – 17.7 %, Multiple Choice – 2.6 %). Bei einer Bewertung der fehlenden Item Responses als Falschantwort erreichten österreichische Schüler/innen im Mittel 55.1 %

Page 62: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

60 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment

richtige Antworten und übertrafen damit leicht Frankreich (53.7 %), erreichten aber signifikant niedrigere Ergebnisse als deutsche Schüler/innen (63.0 %) und niederländische Schüler/innen (64.4 %).

Analysen

Für die Ländervergleiche werden sechs verschiedene Item-Response-Modelle (im Folgenden als M1, …, M6 bezeich-net) unter Berücksichtigung der Schülergewichte für das Testheft 13 berechnet. Für eine vereinfachte Beschreibung der Effekte der Länderreihenfolgen transformieren wir in jedem IRT-Modell erhaltene Fähigkeitsschätzungen so, dass österreichische Schüler/innen einen Mittelwert von 500 und eine Standardabweichung von 100 besitzen. Die Kompe-tenzwerte für Deutschland, Frankreich und die Niederlande wurden derselben Transformation unterworfen, so dass Ländervergleiche in allen Modellen immer relativ zur mitt-leren Leistung Österreichs vorgenommen wurden.

In Modell M1 werden in einem eindimensionalen Rasch-Modell mit vier Gruppen (den vier verschiedenen Ländern) fehlende Item Responses als falsch bepunktet. Im Modell M2 werden fehlende Item Responses ignoriert, d. h. als Missing in der Likelihood-Schätzung betrachtet und da-mit ignoriert. In Erweiterung zu M2 wird in Modell M3 ein zweidimensionales Rasch-Modell mit den zwei laten-ten Variablen der Fähigkeit θ und der Response-Tendenz ξ spezifiziert. In Modell M4 werden im Pseudo-Likelihood-Ansatz des Rasch-Modells nur fehlende Item Responses für die Multiple-Choice-Items mit vier Antwortalternativen mit dem Score wni =1/4 bepunktet, während fehlende Item Responses bei offenen Items als falsch bepunktet werden (d. h. Score wni = 0). In den Modellen M1 bis M4 werden Itemschwierigkeiten und die Fähigkeitsverteilung in den vier Ländern simultan geschätzt.

Für die Modelle M5 und M6 werden in einer ersten Analy-se durch eine Bewertung der fehlenden Item Response sals Falschantworten gemeinsame Itemschwierigkeiten für alle vier Länder erhalten, die in einem zweiten Schritt fixiert werden. In Modell M5 wird der Pseudo-Likelihood-An-satz (siehe 4.1) im Rahmen des Rasch-Modells eingesetzt, bei dem fehlende Item-Responses mit dem Score wni = ρ ∙ Pni (θn, M) versehen sind, wobei θn, M die Personenfähigkeit unter ausschließlicher Berücksichtigung der nichtfehlen-den Item Responses bezeichnet. Die Personenfähigkeit θn, M wurde dabei aus der individuellen Posteriorverteilung si-muliert. Die Ländermittelwerte werden in Abhängigkeit des Sensitivitätsparameters ρ = 0,0.01,…,0.99,1 berechnet. In Modell M6 wird die Erweiterung des zweidimensiona-len Modells M3 durch die Modellierung des Ausfallpro-zesses die Abhängigkeit des Fehlens eines Item Responses vom Item selbst vorgenommen (siehe 4.2). Dieses Modell wird in Abhängigkeit des Sensitivitätsparameters δ = –10, –9.5,…, –0.5, 0 berechnet.

Für alle Item-Response-Modelle sollen die Ländermittel-werte Deutschlands, Frankreichs und der Niederlande im Vergleich zu Österreich verglichen werden.

Die gesamte Datenaufbereitung und Schätzung der Modelle fand in der Software R (R Core Team, 2014) statt. Für die Berechnung der Modelle M1 bis M3 wurde das R-Paket TAM (Kiefer, Robitzsch & Wu, 2014) verwendet. Die in M4, M5 und M6 eingesetzten Modelle sind in der Funktion rasch.mml2 des R-Paketes sirt (Robitzsch, 2014) implemen-tiert.

Ergebnisse

In Tabelle 1.4.1 sind die Ländermittelwerte für alle Modelle M1 bis M6 dargestellt. Dabei fällt auf, dass zwischen den beiden Extrema der Missingbehandlung von Modell M1 (Missings werden als falsch bewertet) und Modell M2 (Missings sind ignorierbar) für Deutschland und Frankreich kleinere Unterschiede für die Differenz zum Österreich-Mittelwert entstehen (M1-DEU: 537.5, M2-DEU: 534.2; M1-FRA: 488.7, M2-FRA: 492.4), während die verschiede-nen Modelle für die Niederlande zu deutlichen Differenzen führen (M1-NLD: 540.3, M2-NLD: 523.4). Dieser Be-fund ist aufgrund der deutlich geringeren Missinganteile bei den Item Responses (2.7 %) der niederländischen Schüler/ innen im Vergleich zum Missinganteil der Referenz der österreichischen Schüler/innen (11.2 %) erklärbar.

Das Modell M3, das neben einer Fähigkeit auch eine Response-Tendenz als latente Variable enthält, weist nur geringe Abweichungen zum Modell M2 der Ignorierung von Missings auf (z. B. M2-DEU: 534.2, M3-DEU: 534.9). Dies steht im Einklang mit der Literatur (Rose et al., 2010; Pohl et al., 2014). Über die vier Länder hinweg ist die Fähigkeit mit der Response-Tendenz zu .37 korreliert, d. h. „fähigere Schüler/innen“ (wobei Fähigkeit hier modell - implizit in Modell M3 definiert ist) produzieren weniger häufig fehlende Item Responses. Imputiert man nur die fehlenden Item Responses der Multiple-Choice-Items im Pseudo-Likelihood-Ansatz von Modell M4 mit dem Kehr-wert der Anzahl der Antwortalternativen (1/4), so werden nur geringe Abweichungen zur Falschbewertung der Missings in Modell M1 beobachtet (z. B. M1-DEU: 537.5, M4-DEU: 537.6). Dies ist damit zu begründen, dass generell Multiple-Choice-Items einen niedrigen Missinganteil in PIRLS be-sitzen und daher diese Missings nur einen geringen Einfluss auf Analysen besitzen.

Die Modelle M5 und M6 variieren dabei die Sensitivitäts-parameter ρ bzw. δ im Rahmen einer Sensitivitätsanalyse hinsichtlich verschiedener Annahmen an den Ausfall prozess der Item Responses. Praktisch bilden die Befunde aus Tabelle 1.4.1 die Spannweite der Ländermittelwerte zwischen den Extrema der Falschbewertung (Modell M1) und der Ignorier barkeit (Modell M2). In Abbildung 1.4.1 erfolgt eine Darstellung der Ländermittelwerte in Abhängig keit

Page 63: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 61

der Sensitivitätsparameter der Modelle M5 und M6. Die Ränge von Deutschland und den Niederlanden tauschen dabei bei einem bestimmten Wert der Parameter ρ bzw. δ.

Die Ländermittelwerte sind dabei stetige und monotone Funktionen der Sensitivitätsparameter.

Modell Ö DEU FRA NLD

M1: Missing = falsch 500 537.5 488.7 540.3

M2: Missing = ignorierbar 500 534.2 492.4 523.4

M3: 2-dim. Modell 500 534.9 492.5 524.8

M4: Pseudo-Likelihood (für Multiple-Choice-Items) 500 537.6 489.4 539.5

M5: Pseudo-Likelihoodρ = 0 ρ = 0.3ρ = 0.7ρ = 1

500500500500

537.3537.0535.9534.6

488.9490.1491.8493.1

539.9535.9529.5524.0

M6: 2-dim. – Modellierung des Ausfallprozessesδ = –10 δ = –1.5 δ = –0.5 δ = 0

500500500500

538.0535.9535.1534.6

489.1490.6491.5492.1

540.7532.4528.0525.7

Tabelle 1.4.1: Mittelwerte für die Länder Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und die Niederlande (NLD). Der Mittelwert für Österreich wurde in allen Item-Response-Modellen auf 500 fixiert.

Abbildung 1.4.1: Sensitivitätsanalysen für Ländermittelwerte der Länder Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und der Niederlande (NLD).

Links: Pseudo-Likelihood-Schätzung (Modell M5) in Abhängigkeit des Sensitivitätsparameters ρRechts: Zweidimensionales Modell M6 in Abhängigkeit des Sensitivitätsparameters δ

–10 –8 –6 –4 –2 0

490

500

510

520

530

540

490

500

510

520

530

540

Mitt

elw

ert

0.0 0.2 0.4 0.6 0.8 1.0

Mitt

elw

ert

ÖFRA

NLDDEU

ÖFRA

NLDDEU

δρ

Page 64: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

62 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment

Diskussion

Im Gegensatz zu Behauptungen der neueren Literatur (Pohl & Carstensen, 2013; Pohl et al., 2014) wurde anhand von Analysen in PIRLS 2011 gezeigt, dass das Ignorieren feh-lender Item Responses einen Einfluss auf zentrale Resultate einer Studie besitzt. Länderunterschiede bei verschiedenen Behandlungen fehlender Item Responses fallen dabei deut-lich verschieden aus, was die Frage nach einer validen Analysemethode nach sich zieht.

Es kann argumentiert werden, dass die in der Literatur auffindbare testtheoretisch basierte Kritik an einer Falsch-bewertung fehlender Item Responses (Rose, 2013; Pohl et al., 2014) bestenfalls auf einer intraindividuellen Interpreta-tion von Wahrscheinlichkeiten beruht. In dieser Argumen-tation werden dann jedoch fälschlicherweise die Konzepte der aleatorischen Unsicherheit (das statistische Modell) und epistemischen Unsicherheit (das Zustandekommen der Daten betreffend) konfundiert. Es wurde ebenso auf-gezeigt, dass Simulationsstudien für die Wahl der „richti-gen Behandlung“ fehlender Item Responses keine Rele-vanz besitzen (siehe auch Rohwer, 2013). Da die Frage der Festlegung einer adäquaten Bepunktungsregel für die Missings nicht empirisch entscheidbar ist, wurden in diesem Beitrag zwei IRT-Modelle vorgeschlagen, die Sensititivitäts-analysen gegenüber der Annahme der Ignorierbarkeit feh-lender Item Responses vornehmen. Das erste alternative eindimensionale IRT-Modell (Modell M5) basiert auf einem Pseudo-Likelihood-Ansatz, bei dem für fehlende Item Responses Punktwerte zwischen 0 und 1 zugelassen werden. Dieser Ansatz besitzt jedoch gegenüber dem zweiten alter-nativen zweidimensionalen IRT-Modell den Nachteil, dass die Bepunktung für die fehlenden Item Responses von einer ausschließlich auf den nichtfehlenden Items bestimmten weiteren Fähigkeit abhängen. Im zweiten Modell (Modell M6) wird neben der Fähigkeit auch eine dazu korrelierte Response-Tendenz angenommen. Dabei kann das Fehlen eines Item Responses auch vom unbekannten Item Res-ponse selbst abhängen. Rechnerisch ist das zweidimensio-nale Modell aufwändiger als das ein dimensionale Modell und besitzt zusätzlich das Problem, dass keine Maximum-Likelihood-Schätzung der Personenfähigkeit existiert (wenn δ verschieden von null ist). Allerdings beruht in diesem Modell die Berechnung der Fähigkeit nicht wie bei Modell M5 auf einer zusätzlichen Ermittlung der Fähigkeit auf den nichtfehlenden Items.

Typischerweise werden die in diesem Artikel durchge-führten Sensitivitätsanalysen bei der Imputation fehlender Daten gegenüber komplexeren Modellspezifikationen wie Pattern-Mixture-Modellen (Pietsch, 2011) vorgezogen, wenn ein Bereich plausibler Analyseergebnisse unter einer Variation von plausiblen Annahmen an den Ausfallprozess vorgenommen wird (van Buuren, 2012).

Wird zusätzlich eine Priorverteilung über einen die An - nahmen des Ausfallprozesses charakterisierenden Sensitivi-tätsparameter spezifiziert, so kann man im Rahmen einer Multi-Model-Inference Analyseergebnisse entsprechend theoretischen Vorannahmen gewichten (Siddique, Harel & Crespi, 2012), was häufig zu größeren Standardfehlern interessierender Modellparameter führt. Eine integrierte statistische Inferenz im Hinblick auf die Generalisierbarkeit hinsichtlich Personen, Items und verschiedener statistischer Modelle hat daher auch im Large-Scale-Assessment Bedeu-tung (Robitzsch, Dörfler, Pfost & Artelt, 2011).

Im Rahmen der vorgestellten Analysen wurde auf eine Beschränkung auf die Familie der Rasch-Modelle vorge-nommen. Formal sind die Betrachtungen jedoch einfach auf komplexere IRT- Modelle wie das 2PL- oder das 3PL-Modell oder Modelle für polytome Daten übertragbar. An-stelle eines für alle Items gültigen Sensitivitätsparameters kann dieser separat für jedes einzelne Item oder für einzel-ne Itemgruppen (etwa Multiple- Choice Items und offene Items) spezifiziert werden.

Der vorgeschlagene Pseudo-Likelihood-Ansatz ermöglicht zusätzlich, Messfehler oder Unreliabilität bei der Erfassung der einzelnen Item Responses (etwa aufgrund eines Ra-tings bei einem offenen Item, das keine perfekte Reliabilität besitzt) zu berücksichtigen, indem beobachtete Item Res-ponses von 0 (falsch) bzw. 1 (richtig) auf nichtganzzahlige Scores modifiziert werden, die die Größe der Raterüber-einstimmung abbilden soll. Alternativ zum Pseudo-Likeli-hood-Ansatz kann allerdings auch mit dem statistischen Ansatz der Belief Functions nach Denoeux (2013) in IRT-Modellen gearbeitet werden, der auf anderen Modellannah-men der Likelihood-Funktion für die Schätzung beruht.

Neben der Betrachtung der Konsequenzen der Behandlung fehlender Item Responses für Personenfähigkeiten hat die Analysestrategie durchaus auch Bedeutung für Itempara-meterschätzungen (d. h. die Kalibrierung). Da offene Items meistens höhere Missinganteile als Multiple-Choice-Items besitzen, sind die Schwierigkeitsreihenfolgen der Items mit verschiedenen Itemformaten unter den Extrembehandlun-gen der Falschbewertung und der Ignorierbarkeit in vielen Large-Scale-Assessments mit substanziellen Missinganteilen bedeutsam voneinander verschieden. Die Wahl der Methode der Itemparameterbestimmung hat allerdings Konsequen-zen für die Verankerung von Items auf Kompetenzstufen und damit die Interpretation von Kompetenzwerten.

Die Konsequenzen einer Bewertung der fehlenden Item Responses als fehlende Itemantwort (und damit als igno-rierbar) können vor allem bei Skalierungen in Längsschnitt-studien bedeutsam sein, wenn Missinganteile schulform- und klassenstufen- oder zeitpunktspezifisch (sowie in deren Interaktion) variieren. In IRT-Modellen mit ignorierbaren fehlenden Item Responses scheint in dieser Situation die Bedeutung einer ermittelten Fähigkeit unklar. Wird eine

Page 65: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 63

Fähigkeit in einer bestimmten Domäne in einem Test jedoch als Ausmaß der korrekten Beantwortung von Items einer vorgegebenen Itemmenge in einer vorgegebenen maximalen Testbearbeitungszeit definiert (wie dies beispielsweise in

PIRLS/TIMSS oder PISA der Fall ist), so führt dies zu einer nichtzirkulären und aus unserer Sicht valideren Definition dieser Fähigkeit. Daraus folgt die Konsequenz, dass fehlende Item Responses nicht ignorierbar sein können.

Literatur

Bacci, S. & Bartolucci, F. (2013). A multidimensional latent class IRT model for non-ignorable missing responses. Retrieved from http://ssrn.com/abstract=2213721.

Bertoli-Barsotti, L. & Punzo, A. (2013). Rasch analysis for binary data with nonignorable nonresponses. Psicologica, 34, 97–123.

Denoeux, T. (2011). Maximum likelihood estimation from fuzzy data using the EM algorithm. Fuzzy Sets and Systems, 183, 72–91.

Denoeux, T. (2013). Maximum likelihood estimation from uncertain data in the belief function framework. IEEE Transactions on Knowledge and Data Engineering, 25, 119–130.

Fischer, G. H. & Molenaar, I. W. (1995). Rasch models. Foundations, recent developments, and applications. Berlin: Springer.

Graham, J. W. (2009). Missing data analysis: Making it work in the real world. Annual Review of Psychology, 60, 549–576.

Hanson, B. (2000). IRT parameter estimation using the EM algorithm. Technical report. Retrieved from http://www.b-a-h.com/.

Holland, P. W. (1990). On the sampling theory foundations of item response theory models. Psychometrika, 55, 577–601.

Holman, R. & Glas, C. A. (2005). Modelling non‐ignorable missing‐data mechanisms with item response theory models. British Journal of Mathematical and Statistical Psychology, 58, 1–17.

Kiefer, T., Robitzsch, A. & Wu, M. (2014). TAM: Test analysis modules. R package version 1.0-2. http://CRAN.R-project.org/package=TAM

Lüdtke, O. & Robitzsch, A. (2010). Umgang mit fehlenden Daten in der empirischen Bildungsforschung. In S. Maschke & L. Stecher (Hrsg.), Enzyklopädie Erziehungswissenschaft Online. Fachgebiet Methoden der empirischen erziehungswissen-schaftlichen Forschung, Quantitative Forschungsmethoden. Weinheim: Juventa.

Mislevy, R. J. & Wu, P.-K. (1996). Missing responses and IRT ability estimation: Omits, choice, time limits, and adaptive testing. ETS Research Report No. RR-96-30. Princeton, NJ: Educational Testing Service.

Molenaar, I. W. (1995). Some background for item response theory and the Rasch model. In G. H. Fischer & I. W. Molenaar (Hrsg.), Rasch models. foundations, recent developments, and applications (S. 3–14). New York: Springer.

Molenaar, P. C. M. (2004). A manifesto on psychology as idiographic science: Bringing the person back into scientific psycho-logy, this time forever. Measurement: Interdisciplinary Research & Perspective, 2, 201–218.

Pietsch, M. (2011). Fehlende Daten bei Unterrichtsbeobachtungen: Eine Sensitivitätsanalyse anhand von Daten der Schulins-pektion Hamburg. Empirische Pädagogik, 25, 47–87.

Pohl, S. & Carstensen, C. H. (2012). NEPS technical report – Scaling the data of the competence tests. NEPS Working Paper No. 14. Bamberg: NEPS.

Pohl, S. & Carstensen, C. H. (2013). Scaling of competence tests in the National Educational Panel Study: Many questions, some answers, and further challenges. Journal for Educational Research Online, 5(2), 189–216.

Pohl, S., Gräfe, L. & Rose, N. (2014). Dealing with omitted and not-reached items in competence tests evaluating approa-ches accounting for missing responses in item response theory models. Educational and Psychological Measurement, 74, 3, 423 –452.

Page 66: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

64 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment

R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. http://www.R-project.org/.

Resseguier, N., Roch, G. & Paoletti, X. (2011). Sensitivity analysis: When data are missing not-at-random. Epidemiology, 22, 282–283.

Robitzsch, A. (2014). sirt: Supplementary item response theory models. R package version 0.44-48. http://CRAN.R-project.org/package=sirt.

Robitzsch, A., Dörfler, T., Pfost, M. & Artelt, C. (2011). Die Bedeutung der Itemauswahl und der Modellwahl für die längsschnitt-liche Erfassung von Kompetenzen. Zeitschrift für Entwicklungspsychologie und pädagogische Psychologie, 43, 213–227.

Rohwer, G. (2013). Making sense of missing answers in competence tests. NEPS Working Paper No. 30. Bamberg: NEPS.

Rose, N. (2013). Item nonresponses in educational and psychological assessment. Dissertationsschrift. Friedrich-Schiller-Universität Jena.

Rose, N., von Davier, M. & Xu, X. (2010). Modeling nonignorable missing data with item response theory (IRT). ETS Research Report No. RR-10-11. Princeton, NJ: Educational Testing Service.

Rost, J. (2004). Lehrbuch Testtheorie-Testkonstruktion. Bern: Hans Huber.

Siddique, J., Harel, O. & Crespi, C. M. (2012). Addressing missing data mechanism uncertainty using multiple-model multiple imputation: Application to a longitudinal clinical trial. Annals of Applied Statistics, 6, 1814–1837.

Steyer, R. & Eid, M. (2001). Messen und Testen. Berlin: Springer.

van Buuren, S. (2012). Flexible imputation of missing data. Boca Raton: CRC Press.

von Davier, M. & Sinharay, S. (2014). Analytics in international large-scale assessments: Item response theory and population models. In L. Rutkowski, M. von Davier & D. Rutkowski (Eds.), Handbook of international large-scale assessment (pp. 155–174). Boca Raton: CRC Press.

Wainer, H. (2010). Schrödinger̓s cat and the conception of probability in item response theory. Chance, 23, 53–56.

Yen, W. M. & Fitzpatrick, A. R. (2006). Item response theory. In R. L. Brennan (Hrsg.), Educational measurement (S. 111–154). Westport: Praeger Publisher.

Page 67: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

II. Familiäre und vorschulische

Unterstützung

Page 68: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 69: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 67

2.1 Migrationshintergrund und Lesekompe-tenz: Entwicklung seit dem Jahr 2000

Silvia Salchegger, Barbara Herzog-Punzenberger & Sandra Filzmoser

Einleitung

Im vorliegenden Beitrag wird der Frage nachgegangen, wie gut es dem österreichischen Bildungssystem gelingt, das Potenzial von Kindern mit Migrationshintergrund zur Entfaltung zu bringen. Ein wesentlicher Gradmesser für diese Bemühungen ist, wie gut Kinder und Jugendliche mit Migrationshinter­grund die deutsche Sprache beherrschen. Deutsch sprechen und verstehen zu können, ist eine wesentliche Voraussetzung für die Teilhabe am gesellschaftlichen Leben in Österreich so­wie für den persönlichen bildungsmäßigen und beruflichen Erfolg. Bei PISA und PIRLS wird ein wichtiger Teilaspekt des Sprachverständnisses gemessen, die Lesekompetenz. Anhand der Daten dieser Studien kann somit untersucht werden, wie gut Kinder und Jugendliche aus Zuwandererfamilien in der Lage sind, deutsche Texte zu verstehen und zu nutzen.

Kinder mit Migrationshintergrund kommen zu Hause in der Regel weniger mit der deutschen Sprache in Berüh­rung als jene ohne. So sprechen 16 % der Kinder mit Migrationshintergrund zu Hause ausschließlich (eine) an­dere Sprache(n) als Deutsch, 68 % sprechen in der Familie sowohl Deutsch als auch zumindest eine andere Sprache und weitere 16 % sprechen dort ausschließlich Deutsch (Vogtenhuber, Lassnigg & Bruneforth 2012, S.  25). Bei den Kindern ohne Migrationshintergrund sprechen dage­gen 87 % ausschließlich Deutsch zu Hause.

Mehrsprachigkeit ist eine wichtige Ressource in einer glo­balisierten Welt. Sie stellt jedoch auch besondere Heraus­forderungen an das Bildungssystem. Da Kinder mit Mig­rationshintergrund in ihren Elternhäusern die deutsche Sprache in der Regel weniger vermittelt bekommen, sind sie beim Deutschlernen stärker auf Bildungseinrichtungen (Kindergarten und Schule) angewiesen als Kinder ohne

Migrationshintergrund. Auch darüber hinaus sind Kinder mit Migrationshintergrund in besonderem Maße auf eine hohe Qualität der (vor)schulischen Bildung angewiesen: Ihre Eltern beherrschen die Landessprache fallweise nicht ausreichend, um ihren Kindern bei den schulbezogenen Aufgaben helfen zu können. Sie sind mit dem österrei­chischen Bildungssystem weniger vertraut und stärker mit Hürden in den unterschiedlichsten Lebensbereichen (wie z. B. dem Rechtssystem) konfrontiert als Eltern, die nicht zugewandert sind (Latcheva & Herzog­Punzenberger, 2011). Das Bildungssystem sollte diese spezifischen Be­nachteiligungen möglichst kompensieren und die Kompe­tenzen von Kindern mit Migrationshintergrund im Laufe ihrer Schulkarriere an die Kompetenzen von jenen ohne Migrationshintergrund heranführen.

Bisherige Studien zeigen, dass dies nur unzureichend ge ­ lingt. Starke Kompetenzunterschiede zwischen Kindern mit und ohne Migrationshintergrund lassen sich nicht nur bei der Sprachstandsmessung im Kindergarten (Breit & Schneider, 2009) und bei der Messung der Lesekompetenz am Ende der Volksschule (Unterwurzacher, 2009) feststel­len, sondern auch noch bei den 15­/16­Jährigen am Ende der Schulpflicht (Breit, 2009b; Reiter, 2002; Schreiner & Breit, 2006; Wroblewski, 2012). Hierbei muss natürlich bedacht werden, dass Kinder mit Migrationshintergrund in der Regel unter schwierigeren sozioökonomischen Bedin­gungen aufwachsen und ein Teil der Leistungsunterschie­de auf Unterschiede in der sozialen Lage zurückgeführt werden kann (vgl. unten). Neben sprachlichen und sozio­ökonomischen Faktoren werden auch interaktionale und institutionelle Diskriminierung (Gomolla & Radtke 2002; Herzog­Punzenberger, 2009), ein geringer Grad an kultu­rell­sprachlicher Responsivität der Bildungsinstitutionen und gesamtgesellschaftlich ein hoher „chill1 factor“ (Heath

Wie hat sich die Lesekompetenz von Kindern und Jugendlichen mit Migrationshintergrund im Vergleich zu jenen ohne Migrationshintergrund seit der Jahrtausendwende entwickelt? Die Daten von PIRLS (seit dem Jahr 2006) und PISA (seit dem Jahr 2000) zeigen, dass der Leistungsunterschied kleiner geworden ist. Dies ist darauf zurückzuführen, dass sich die Lesekompetenz der Schüler/innen mit Migrationshintergrund in Relation zu jenen ohne positiver entwickelt hat: Bei PIRLS ist die Lesekompetenz bei den Kindern ohne Migrationshintergrund zurückgegangen, bei jenen mit hingegen etwa gleich geblieben. Bei PISA ist von 2000 auf 2012 die Lesekompetenz von Jugendlichen ohne Migrationshintergrund etwa gleich geblieben, bei jenen aus Zuwandererfamilien ist sie hingegen signifikant gestiegen. Darüber hinaus zeigt sich, dass bei PIRLS (4. Schulstufe) die Leistungsunterschiede größer ausfallen als bei PISA (15-/16-Jährige), was auf einen positiven Effekt längerer Beschulung für Zuwandererkinder hindeuten könnte.

1 Das englische Wort „chill“ steht für „kühl, frostig“. Der „chill­factor“ gibt die gefühlte Temperatur an, die durch Wind oder Nässe wesentlich unter den mit dem Thermometer gemessenen Graden liegen kann.

Page 70: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

68 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

& Li, 2010) als weitere Gründe für den Leistungsrück­stand von Kindern mit Migrationshintergrund diskutiert. Allerdings gibt es auch gesellschaftliche Situationen und Zuwanderungsgruppen, bei denen die erreichten Kompe­tenzen jene der Kinder einheimischer Eltern mit demselben Bildungshintergrund übertreffen. Dieses Phänomen wird in der wissenschaftlichen Literatur „immigrant optimism“ ge­nannt und beschreibt die hohe Motivation von Kindern aus zugewanderten Familien, aber auch die hohen Erwartungen der Eltern (Kao & Tienda 1998). Beispielhaft können hier Kinder von vietnamesischen Einwanderern in Deutschland erwähnt werden (Spiewak, 2009).

Die Sprachkompetenzen der mehrsprachigen Kinder messen

Über 100 Sprachen werden von Schulkindern in Öster­reich derzeit gesprochen (Brizic & Hufnagl, 2011, S. 27). Mehr als zwanzig Sprachen werden in der österreichischen Schule im Rahmen des muttersprachlichen Unterrichts angeboten (BMBF, 2014, S. 15). 230.000 Schüler/innen verwenden derzeit auch eine andere Sprache als Deutsch in ihrer familiären Kommunikation (BMBF, 2015, S. 14). Eine wesentliche Aufgabe der Schule ist es, systematische Benachteiligung mehrsprachiger Kinder, die sich am Ende ihrer Schullaufbahn in niedrigeren Deutschkompeten­zen im Vergleich zu einsprachigen Kindern ausdrücken würde, zu verhindern. Gleichzeitig soll die Mehrsprachig­keit gefördert und sollen damit auch die Kompetenzen in der jeweiligen Erstsprache entwickelt werden. Es kann davon ausgegangen werden, dass selbst unter günstigen Voraussetzungen (strukturierte durchgängige Förderung) fünf bis sieben Jahre notwendig sind, um die Zweitspra­che auf muttersprachenähnlichem Niveau zu beherrschen (de Cillia, n. d.). In Ermangelung verlässlicher Alternativen werden im vorliegenden Beitrag die sprachlichen Kompe­tenzen der Schüler/innen ohne Migrationshintergrund als Maßstab für den Erfolg der Beschulung von Kindern mit Migrationshintergrund verwendet. Hierbei muss jedoch bedacht werden, dass ein Teil der Schüler/innen die öster­reichische Schule (inklusive Kindergarten) zum Testzeit­punkt noch gar nicht fünf bis sieben Jahre besucht hat2.

Bisherige Analysen haben gezeigt, dass die soziale Situ­ation von Schülerinnen und Schülern mit Migrations­hintergrund wesentlich schlechter ist als jene ohne (z. B. Herzog­Punzenberger & Gapp, 2009; Wroblewski, 2012). Zwar haben Kinder mit Migrationshintergrund fast eben­so häufig Eltern, die eine Universität oder Fachhochschule abgeschlossen haben, wie Kinder ohne Migrationshinter­grund; der Anteil an Kindern, deren Eltern maximal über eine Pflichtschulausbildung verfügen, ist hingegen bei je­nen mit Migrationshintergrund etwa fünfmal so hoch wie bei jenen ohne Migrationshintergrund (vgl. Vogtenhuber et

al., 2012, S. 23). Und selbst hoch qualifizierte Zuwanderer stehen oft auf einer niedrigeren sozialen Stufe als im Inland geborene Personen gleichwertiger Qualifikation, weil sie ihre Bildungszertifikate (aus dem Herkunftsland) auf dem österreichischen Arbeitsmarkt nicht einsetzen können und daher häufig Berufe ausüben, die deutlich unter ihrer Qua­lifikation liegen (Österreichischer Integrationsfonds, 2014). Bei einem Vergleich der Leistungen von Schülerinnen und Schülern mit und ohne Migrationshintergrund muss daher stets ihre ungleiche soziale Situation mitberücksichtigt wer­den. Der Spracherwerb ist neben dem familiären Kontext auch in einen schulischen und gesellschaftlichen Kontext eingebettet. Im Folgenden wird beleuchtet, wie sich der schulische und gesellschaftliche Kontext in Bezug auf den Deutschspracherwerb von Kindern mit Migrationshinter­grund in den vergangenen Jahren verändert hat.

Entwicklung der Sprachförderung in Gesellschaft und Schule seit den 1990er Jahren

Nachdem in Österreich zu Beginn der 1990er Jahre die Rückkehrorientierung der österreichischen „Gastarbeiter­politik“ und damit auch die Abkommen zum Mutter­sprachen­ und Heimatkundeunterricht mit den Entsende­ländern Jugoslawien und der Türkei beendet wurden, wurde mit dem Schuljahr 1992/93 die österreichische Schulpolitik hinsichtlich der sprachlich und kulturell vielfältiger werden­den Schule neu ausgerichtet. Die darauffolgenden zwanzig Jahre, 1992–2012, können in drei Phasen eingeteilt werden. In der ersten Phase der 1990er Jahre konnte die ministerielle Verwaltung großzügige Rahmenbedingungen (außerordent­licher Status, Deutschförderung bis zu 22 Wochenstunden, muttersprachlicher Unterricht bis zu sechs Wochenstunden, zusätzliche Lehrerwerteinheiten pro Schüler/in mit einer anderen Erstsprache als Deutsch, interkulturelles Lernen als Unterrichtsprinzip, Sprachentausch; vgl. BMUKK, 2011) durchsetzen, die aber in der inhalt lichen Tiefe von den politischen Entscheidungsträgerinnen und ­trägern (u.  a. auch wegen der zersplitterten Verantwortungsstruktur zwi­schen Bund und Ländern) nicht mitgetragen wurden. Dies war möglich, da sie kaum Verpflichtungscharakter hatten und schließlich nur in begrenztem Ausmaß umgesetzt wurden (vgl. Çinar & Davy, 1998).

Die zweite Phase in den 2000er Jahren war von Large­Scale­Assessments wie PISA, PIRLS und TIMSS geprägt. Durch diese rückte der internationale Vergleich stärker in den Fokus und es wurde durch das mittelmäßige Abschneiden Öster­reichs in diesen Leistungsvergleichen von den Medien und der Zivilgesellschaft Handlungsdruck aufgebaut. Das The­ma des Leistungsrückstands der Schüler/innen mit Migra­tionshintergrund wurde in Österreich ab Dezember 2004 (infolge der Veröffentlichung der PISA­2003­Ergebnisse) im nationalen Rahmen breit diskutiert. Dadurch stieg die

2 Dieser Anteil ist jedoch gering: Bei PISA 2012 waren 9 % der 15­/16­Jährigen mit Migrationshintergrund bei der Zuwanderung nach Österreich älter als 8 Jahre. Die allermeisten (67 %) wurden bereits in Österreich geboren.

Page 71: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 69

allgemeine Sensibilität für diese Fragestellung sowie die Akzeptanz für etwaige Maßnahmen hierzulande erheblich. Als unmittelbare Reaktion wurde ab 2005/06 die Schul­einschreibung um ein Jahr vorgezogen und Kindern, die von der Schulleitung als förderbedürftig in der Unterrichts­sprache eingestuft wurden, ein Sprachticket zur Verfügung gestellt. Da die Wirksamkeit dieser Maßnahme nicht nach­gewiesen werden konnte, kam es zu neuen Maßnahmen im Elementarbereich wie der Sprachförderung im Kindergar­ten ab 2008, einer Sprachstandsfeststellung ab 2009 und schließlich dem verpflichtenden letzten Kindergartenjahr ab 2010.

Die dritte Phase kann mit dem Jahr 2008 angesetzt werden. In diesem Jahr wurden einerseits verpflichtende Maßnah­men in der vorschulischen Bildung für Kinder mit sprach­lichem Aufholbedarf eingeführt und andererseits die Abtei­lung „Migration, interkulturelle Bildung, Sprachenpolitik“ im Bundesministerium für Unterricht, Kunst und Kultur eingerichtet. Dort entstanden nachhaltige und breit ange­legte Strategien mit Dutzenden Einzelmaßnahmen, die die seit Anfang der 1990er Jahre prägenden Vorgangsweisen (siehe oben) komplettierten. Darunter auch die Handlungs­empfehlungen der OECD­Länderprüfung „Migration und Schulbildung“ (Nusche, Shewbridge & Rasmussen, 2009).

Das seit Dezember 2013 umbenannte BMBF (Bundes­ministerium für Bildung und Frauen, früher Bundesmi­nisterium für Unterricht, Kunst und Kultur: BMUKK) beschreibt seine Vorgangsweise anhand von fünf Strategien (BMUKK, n. d.):

1. Stärkung der Schüler/innen mit anderen Erstsprachen als Deutsch,

2. Professionalisierung von Lehrkräften, Schulleitungen und Schulaufsicht,

3. Unterstützung der Eltern mit Migrationshintergrund,4. Initiativen in der Erwachsenenbildung für Personen mit

Migrationshintergrund,5. Sensibilisierung der Öffentlichkeit für Mehrsprachig­

keit, Interkulturalität und Integration.

Abgesehen von den ressorteigenen Aktivitäten des Unter­richtsministeriums wird die Effektivität einschlägiger Maß­nahmen durch öffentlichkeitswirksame Aktivitäten an­derer Spitzenpolitiker/innen und Ressorts im Bereich der Migration/Integration wesentlich beeinflusst. Daher ist es relevant, dass in diese dritte Phase auch die Einrichtung einer Koordinierungsstelle für Integration 2008 im Bundes­ministerium für Inneres, der Ausbau des österreichischen Integrationsfonds zu einem Hauptakteur der Umsetzung integrationspolitischer Maßnahmen (www.oeif.at) sowie schließlich 2011 die Erfüllung der langjährigen Forderung

zivilgesellschaftlicher Akteure nach einem „Staatssekretariat für Integration“ (2011)3 fällt. Was in den Jahrzehnten zuvor in Form von wissenschaftlichen Publikationen (Boeckmann et al., 1988; Busch & de Cillia, 2003; Çinar, 1998; Fischer, 1986; Matuschek, 1982; Plutzar & Kerschhofer­Puhalo, 2009; Viehböck & Bratić, 1994) und zivilgesellschaftlichen Forderungen in die öffentliche Debatte eingebracht und medial kaum wahrgenommen wurde, erlebt in der dritten Phase durch die Verankerung auf ministerieller Ebene und entsprechende finanzielle Mittel eine deutliche Aufwertung.

In ihrer Gesamtheit sollten die vielfältigen Maßnahmen zu einer Erhöhung der Kompetenzen der Schüler/innen mit Migrationshintergrund führen. Allerdings kann dies mit den vorliegenden Daten aus PISA und PIRLS nur mit Einschränkungen geprüft werden. Einerseits weil die Kinder und Jugendlichen von neueren Maßnahmen noch nicht profitieren konnten. So kann die allgemein verpflich­tende Maßnahme der Sprachförderung im Kindergarten frühestens bei Schülerinnen und Schülern des Geburten­jahrgangs 2003 (und daher erst bei PIRLS 2016 bzw. PISA 2021) Wirkung zeigen. Andererseits sind die Maßnahmen in der ersten Implementierungsphase meist nicht voll wirk­sam bzw. kann es auch vorher ähnliche Maßnahmen auf anderen Ebenen (Bundesland, Stadt, …), unter anderem Titel oder in anderer Ausprägung (Sprachticket für den freiwilligen Gebrauch) gegeben haben. Außerdem ist bei Längsschnittvergleichen die Veränderung der Gruppenzu­sammensetzung, sei es nach Herkunftsländern oder nach sozioökonomischem Hintergrund, zu beachten. Trotz all dieser einschränkenden Faktoren sind die Daten aus den PIRLS­ und PISA­Erhebungen aufgrund ihrer Qualität und Repräsentativität ein wichtiger Anhaltspunkt, um Kompe­tenzveränderungen festzustellen.

Die vorliegende Untersuchung

Die vorliegende Untersuchung ist die erste für Österreich, die die Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund syste­matisch über unterschiedliche Studien (PIRLS und PISA) und unterschiedliche Erhebungszeitpunkte (ab dem Jahr 2000 bis zum Jahr 2012) darstellt. Dabei wird den folgen­den Fragen nachgegangen:

1. Gibt es Veränderungen in der Zusammensetzung der Schüler/innen mit Migrationshintergrund seit dem Jahr 2000? Konkret, gibt es Veränderungen in den Anteilen der Schüler/innen, die selbst zugewandert sind (1. Ge­neration) bzw. deren Eltern zugewandert sind (2. Gene­ration), gibt es Veränderungen nach dem Geburtsland der Eltern und nach dem familiären Sprachgebrauch?

2. Wie sehr hat sich das Ausmaß des Leistungsunterschieds

3 Gleichzeitig gelang es nicht, die übergeordnete Koordinierungsstelle vom Innenministerium ins Bundeskanzleramt zu übersiedeln. Die Agenden des Staatssekretariats für Integration wurden ab Dezember 2013 gemeinsam mit dem Amtsträger Sebastian Kurz erstmals ins „Bundesministerium für Europa, Integration und Äußeres (BMEIA)“ überführt.

Page 72: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

70 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund im Zeitverlauf verändert?

3. Wie viel des jeweiligen Leistungsunterschieds kann durch Faktoren des sozialen Hintergrunds erklärt werden?

4. Wie haben sich die Anteile an leseschwachen Schülerin­nen und Schülern (bei PISA sogenannte Risikoschüler/innen) unter jenen mit Migrationshintergrund entwi­ckelt?

5. Wie und in welchem Ausmaß wird bei der Gestaltung schulischer Rahmenbedingungen auf Multikulturalität und Mehrsprachigkeit eingegangen?

Methode

Stichprobe

Die vorliegende Untersuchung inkludiert Daten aus fol­genden internationalen Schülerleistungsstudien, an denen sich Österreich beteiligte: PIRLS 2006, PIRLS 2011, PISA 2000, PISA 2003, PISA 2006, PISA 2009 und PISA 2012. Alle Studien umfassten repräsentative Stichproben von je­weils mehr als 4500 Schülerinnen und Schülern. Bei PIRLS sind diese Stichproben repräsentativ für Schüler/innen der vierten Schulstufe (vgl. Suchań & Wintersteller, 2012). Bei PISA sind die Stichproben repräsentativ für Schüler/innen, die 16 Jahre vor der Erhebung geboren worden sind und demnach zum Zeitpunkt der Testung 15/16 Jahre alt sind (vgl. Schwantner & Schreiner, 2013). Bei PISA 2012 war dies der Geburtsjahrgang 1996 (d. h. Schüler/innen, die von 1. 1. 1996 bis 31. 12. 1996 geboren worden sind), bei PISA 2009 war es der Geburtsjahrgang 1993 usw. Bemer­kenswert ist, dass ein Großteil der bei PIRLS 2006 geteste­ten Schüler/innen (56 %) im Jahr 1996 geboren worden ist und demnach genau dem Jahrgang angehört, der auch bei PISA 2012 getestet wurde. Dem Vergleich von PIRLS 2006 und PISA 2012 kommt daher ein besonderer Stellenwert zu.

Tabelle 2.1.1 gibt einen Überblick über die Geburtsjahrgänge der Schüler/innen unterschiedlicher PISA­Erhebungen und zeigt zudem, in welchen beiden Jahren der Großteil der Schüler/innen, der bei PIRLS teilgenommen hat, geboren worden ist.

Für alle Berechnungen zu PISA 2000 wurden die im Jahr 2003 neu adjustierten Gewichte verwendet (Neuwirth,

2006). Für PISA 2009 muss beachtet werden, dass es zu einem bislang nicht geklärten Leistungsrückgang kam (vgl. Bacher, 2012) und die Ergebnisse mit Vorsicht interpretiert werden sollten.

Verwendete Maße

Migrationshintergrund

In den Schülerfragebögen von PIRLS und PISA wurde er­hoben, ob die Schüler/innen sowie deren Eltern innerhalb oder außerhalb Österreichs geboren wurden. Die Einstu­fung des Migrationshintergrunds erfolgt nach den Regeln der OECD (z. B. OECD, 2012). Dabei werden drei Grup­pen unterschieden:

1. Einheimische Schüler/innen (= Schüler/innen ohne Mi­grationshintergrund): zumindest ein Elternteil wurde im Inland geboren, unabhängig vom Geburtsland des Kinds.

2. Schüler/innen zweiter Generation: Schüler/in wurde im Inland geboren, beide Elternteile jedoch im Ausland.

3. Schüler/innen erster Generation: Sowohl die Schülerin/der Schüler selbst als auch beide Elternteile wurden im Ausland geboren.

Wie oben angeführt, wurden bei PIRLS sowohl die Eltern als auch die Schüler/innen danach gefragt, ob Eltern und/oder Kind im In­ oder Ausland geboren worden sind. Wenn sich die Angaben von Eltern und Kindern widersprechen, werden jene der Eltern herangezogen. Fehlende Angaben wurden jeweils wechselseitig ergänzt. In den meisten der folgenden Analysen werden Schüler/innen erster und zwei­ter Generation zusammengefasst und als „Schüler/innen mit Migrationshintergrund“ bezeichnet.

Wenn keine Angaben zum Geburtsland des Kinds und zumindest eines Elternteils vorlagen, konnte der Migrati­onshintergrund nicht rekodiert werden. Dies war jedoch nur bei einem sehr geringen Anteil an Schülerinnen und Schülern der Fall (bei PISA zwischen 0,5 % im Jahr 2000 und 2,1 % im Jahr 2009, bei PIRLS zwischen bei 0,6 % im Jahr 2006 und bei 0,3 % im Jahr 2011). Schüler/innen mit fehlenden Werten wurden in den nachfolgenden Analysen zum Migrationshintergrund ausgeschlossen. Da der Anteil fehlender Werte gering ist, ist auch die Wahrscheinlich­keit einer Ergebnisverzerrung durch den Ausschluss dieser

Altersgruppe 15-/16-Jährige4. Schulstufe

(in der Regel 10-Jährige)

Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011

Geburtsjahrgang1 1984 1987 1990 1993 19961996 (56 %)1995 (41 %)

2001 (57 %) 2000 (40 %)

1 Bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren; bei PIRLS sind jene beiden Jahre eingetragen, in denen die meisten getesteten Schüler/innen geboren wurden. Der genaue Anteil steht in Klammern.

Tabelle 2.1.1: Einbezogene Studien nach Geburtsjahrgang der Schüler/innen

Page 73: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 71

beruhen auf diesen reskalierten Werten. In allen Analysen, in denen der ESCS­Index als Kontrollvariable dient, wurde jeweils der originale Index verwendet (mit Ausnahme von PISA 2000, wo im Originaldatenfile noch keine ESCS­ Variable enthalten ist – hier wurde der im Rahmen von PISA 2009 nachskalierte Index verwendet). Der Anteil fehlender Werte schwankte beim ESCS zwischen 0,3 % bei PISA 2003 und 2,4 % bei PISA 2009. In der Erhebung 2012 lag dieser Anteil bei 1 %.

Für PIRLS gibt es keinen vergleichbaren Index. Als Maß für den sozialen Hintergrund wurden hier zwei Variablen her­angezogen: a) die Bildung der Eltern (laut Elternangaben) umgerechnet in die Anzahl der Bildungsjahre; diese Um­rechnung erfolgte entsprechend den Vorgaben der OECD (2013a) und b) die Anzahl der Bücher im Elternhaus laut Schülerangaben; dabei handelt es sich um eine fünfstufige Variable: von „keine oder sehr wenige (0–10)“ bis „drei oder mehr Bücherregale (200 oder mehr)“. Der Schüleranteil mit fehlenden Werten zur Bildung der Eltern lag bei PIRLS 2006 bei 6,6 % und bei PIRLS 2011 bei 5,7 %. Von 2,8 % der Schüler/innen lagen 2006 und von 2,2 % lagen 2011 kei­ne Angaben zum Buchbesitz vor. Bei der Interpretation der Ergebnisse muss beachtet werden, dass der soziale Hinter­grund bei PISA durch ein breiteres Variablenspektrum erfasst wird als bei PIRLS und kein direkter Vergleich möglich ist.

Zu Hause gesprochene Sprache

Sowohl bei PISA als auch bei PIRLS wurden die Schüler/in­nen gefragt, ob sie zu Hause (auch) eine andere Sprache als Deutsch sprechen. Der konkrete Fragewortlaut unterschied sich geringfügig zwischen den beiden Studien. Bei PIRLS wurde gefragt: „Wie oft sprichst du zu Hause Deutsch?“ Die Antwortkategorien waren: „Ich spreche zu Hause im­mer oder fast immer Deutsch“, „Ich spreche zu Hause manchmal Deutsch und manchmal eine andere Sprache“ und „Ich spreche zu Hause nie Deutsch“. Bei PISA wurden die Jugendlichen gefragt: „Welche Sprache sprichst du zu Hause am häufigsten?“ In einer Liste von konkreten Spra­chen sollten sie dann die entsprechende ankreuzen. Der Anteil fehlender Werte schwankte bei PISA zwischen 2,9 % bei der Erhebung 2006 und 8,8 % bei der Erhebung 2012. Bei PIRLS fehlte die Angabe zur Sprache bei 13,4 % der Schüler/innen im Jahr 2006 und bei 1,3 % im Jahr 2011.

Lesekompetenz

Bei PIRLS wird Lesekompetenz definiert als „die Fähig­keit, jene geschriebenen Sprachformen zu verstehen und zu nutzen, die von der Gesellschaft verlangt werden und/oder für die jeweilige Person nützlich und wertvoll sind. Junge Leser/innen können die Bedeutung von verschiedensten Texten erfassen. Sie lesen, um zu lernen, um an der Ge­

4 Mazedonien und Slowenien wurden zumindest bei einer Erhebung nicht gesondert abgefragt, weshalb diese beiden Länder in der Kategorie „Exjugosla­wien“ nicht berücksichtigt werden.

Schüler/innen gering. Es soll dennoch darauf hingewiesen werden, dass fehlende Werte nicht zufällig sind, sodass leis­tungsschwächere Schüler/innen mit Migrationshintergrund aus unteren sozialen Schichten untererfasst werden (vgl. Bacher, 2009, S. 84).

Herkunftsland der Eltern

Bei PISA wurde ab der Erhebung von 2003 das Herkunfts­land der Eltern ermittelt, indem die Schüler/innen in einer Liste von Ländern ankreuzen sollten, in welchem Land ihr Vater und in welchem Land ihre Mutter geboren wurde. Bei PISA 2000 wurden noch keine konkreten Geburtsländer er­fragt. Bei PIRLS wurden die Eltern (im Elternfragebogen) gebeten, aus einer Liste von Ländern jenes anzukreuzen, in dem sie geboren wurden (getrennt für Mutter und Vater). Die nachfolgenden Analysen zum Geburtsland der Eltern basieren damit bei PISA auf Schülerangaben und bei PIRLS auf den Angaben der Eltern.

In den Analysen dieses Beitrags werden bei Kindern mit Migrationshintergrund folgende Herkunftsländer der El­tern unterschieden:

�� Türkei: beide Eltern wurden in der Türkei geboren;�� Exjugoslawien: Mutter und Vater stammen aus einem

der folgenden Staaten: Serbien, Montenegro, Kosovo, Bosnien­Herzegowina oder Kroatien4;�� anderes Land oder gemischte Herkunft: beide Eltern wur­

den in einem anderen Land geboren oder die Eltern wurden in zwei unterschiedlichen Ländern geboren.

Sozialer Hintergrund

Der soziale Hintergrund wurde bei PISA im Index des öko­nomischen, sozialen und kulturellen Status (ESCS) zusam­mengefasst. Der ESCS­Index setzt sich aus folgenden drei Indizes zusammen: a) der beruflichen Stellung der Eltern, b) der Bildung der Eltern, umgerechnet in Bildungsjahre, c) Besitztümer zu Hause (Wohlstandsindikatoren, kulturelle Besitztümer, Bildungsressourcen und Bücher). Der ESCS­Index wurde so standardisiert, dass der Mittelwert über alle OECD­Länder bei 0 liegt und die Standardabweichung bei 1. Eine detaillierte Beschreibung des ESCS­Index findet sich in OECD (2012) und OECD (2013a). Dieser Index wird von der OECD (2013a) unter anderem herangezogen, um zu kontrollieren, wie viel des Leistungsunterschieds zwi­schen Schülerinnen und Schülern mit und ohne Migrati­onshintergrund durch Unterschiede in der Verteilung der sozioökonomischen Merkmale der beiden Gruppen erklärt werden kann. Diesem Standard wird auch im vorliegenden Beitrag gefolgt. Für Trendanalysen wurde der ESCS­Index auf der Basis der Erhebung von 2012 reskaliert (vgl. OECD, 2013a). Alle Analysen zur zeitlichen Entwicklung des ESCS

Page 74: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

72 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

meinschaft der Lesenden in der Schule sowie im täglichen Leben teilzunehmen und zum Vergnügen“ (Grafendorfer, Wallner­Paschon, Suchan & Widauer, 2012, S. 13). Lese­kompetenz bedeutet bei PISA „geschriebene Texte zu ver­stehen, zu nutzen, über sie zu reflektieren und sich mit ihnen auseinanderzusetzen, um eigene Ziele zu erreichen, das eigene Wissen und Potenzial weiterzuentwickeln und am gesellschaftlichen Leben teilzunehmen“ (Schwantner & Schreiner, 2013, S. 20). In beiden Definitionen bedeutet Lesen weit mehr, als einen Text vorlesen zu können. Es geht darum, die Bedeutung von Texten zu erfassen und das Ge­lesene für sich nutzen zu können.

Bei der ersten PIRLS­Erhebung im Jahr 2001 (an der sich Österreich noch nicht beteiligte) wurde die PIRLS­Lese­skala so verankert, dass der Mittelwert über alle damaligen Teilnehmerländer 500 beträgt und die Standardabweichung 100. Höhere Werte indizieren eine höhere Kompetenz. Eine genaue Beschreibung der Leseskala von PIRLS erfolgt bei Gonzalez (2003) sowie bei Foy, Brossman & Galia (2012). Die PISA­Leseskala wurde im Jahr 2000 so verankert, dass der Mittelwert über alle OECD­Länder, die sich an PISA 2000 beteiligten, 500 beträgt, die Standardabweichung 100 (Adams & Carstensen, 2002). Die Konstruktion der PISA­Leseskala wird durch die OECD (2012) genauer beschrieben.

Durch diese Verankerung auf einen bestimmten Erhe­bungszeitpunkt können die Leistungen unterschiedlicher Erhebungszeitpunkte derselben Studie (PIRLS bzw. PISA) miteinander verglichen werden. So kann etwa festgestellt werden, ob sich die Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund über die Zeit hinweg verändert hat. Ein direkter Vergleich von Leistungswerten zwischen den beiden Studien ist allerdings nicht möglich, da sich die Skalierung auf unterschiedliche Länder (vgl. oben) und Leseframeworks bezieht.

Über den Umweg der Berechnung von Effektstärken (Co­hen, 1988; Ellis, 2010) ist es jedoch möglich, die Größe der Leistungsunterschiede zwischen Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund über un­terschiedliche Studien hinweg vergleichbar zu machen. So kann festgestellt werden, ob der Leistungsunterschied zwi­schen Schülerinnen und Schülern mit bzw. ohne Migrati­onshintergrund am Ende der Volksschule (PIRLS) oder am Ende der Schulpflicht (PISA) größer ist. In der Einführung zu diesem Bericht sowie in Kapitel 1.3 wird die Berechnung und Interpretation von Effektstärken genauer beschrieben.

Die Berechnungen erfolgten für PISA mit SPSS 21 unter Verwendung des Replicates Add­In 8.1. Für PIRLS wurde der IEA­IDB­Analyzer Version 3.1 verwendet. Diese Pro­gramme berücksichtigen das komplexe Stichprobendesign der beiden Studien. Alle Analysen wurden mit gewichteten Daten durchgeführt. Jede Schülerin/jeder Schüler geht da­mit gemäß ihrem/seinem Anteil in der Population in die Analysen ein. Genauere Informationen zu Stichproben­

design und Datengewichtung finden sich für PISA z. B. bei der OECD (2009) und für PIRLS bei Foy (2012). Alle Signifikanzprüfungen erfolgten auf einem Alpha­Niveau von < 0.05. Die statistische Signifikanz von Mittelwertdif­ferenzen wurde mittels t­Tests für unabhängige Stichproben ermittelt. Bei Analysen mit PISA­Daten wurde in die Stan­dardfehler der Differenz bei Trendvergleichen zusätzlich ein Link Error eingerechnet (vgl. OECD, 2013b, S. 281 ff.). Schüler/innen mit fehlenden Werten zumindest einer für die jeweilige Analyse relevanten Variable wurden von der jeweiligen Analyse ausgeschlossen.

Ergebnisse

Anteile und Zusammensetzung der Schüler/innen mit Migrationshintergrund im Zeitverlauf

Abbildung 2.1.1 zeigt, dass sich der Anteil an Schülerin­nen und Schülern mit Migrationshintergrund unter den 15­/16­Jährigen von PISA 2000 (Geburtsjahrgang 1984) bis PISA 2012 (Geburtsjahrgang 1996) von 11 % auf 17 % erhöht hat. Es wird deutlich, dass der Anteil an Schülerin­nen und Schülern mit Migrationshintergrund, der bereits in Österreich geboren wurde (2. Generation), in diesem Zeitraum stark zugenommen hat, während der Anteil jener, die selbst erst nach Österreich zugewandert sind (1. Gene­ration), rückläufig ist. Bei einem Zeitvergleich, der nur die PISA­Daten (also 15­/16­Jährige) berücksichtigt, fällt auf, dass sich zwischen 2006 und 2009 eine deutliche Änderung in der Zusammensetzung ergeben hat. Während bis 2006 die selbst zugewanderten Jugendlichen eindeutig in der Überzahl waren, bilden ab 2009 die in Österreich gebore­

0

2000

2003

2012

2006

2009

5

10

15

20

25%

%

Sch

üler

/inne

n (g

esam

t)

2006

2011

Schüler/innen mit Migrationshintergrund gesamt

vgl. Tabelle A.5 im Anhang für genaue Werte

1. Generation 2. Generation

PISA PIRLS

Abbildung 2.1.1: Entwicklung der Anteile von Kindern und Jugendlichen mit Migrationshintergrund

Page 75: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 73

nen Jugendlichen (2. Generation) die Mehrheit unter den Jugendlichen mit Migrationshintergrund5.

Abbildung 2.1.2 zeigt den Anteil an Kindern und Jugendli­chen mit Migrationshintergrund, der zu Hause (auch) eine andere Sprache als Deutsch spricht. Zu allen Erhebungszeit­punkten gaben zumindest 70 % der Schüler/innen mit Mi­grationshintergrund an, zu Hause (auch) eine andere Spra­che als Deutsch zu sprechen. Bei PIRLS liegen die Anteile noch etwas höher als bei PISA. Dies könnte einerseits damit zu tun haben, dass bei PIRLS die Frage nach Mehrsprachig­keit weiter gefasst war: Während bei PIRLS auch jene Schü­ler/innen zu den Mehrsprachigen zählen, die zu Hause nur manchmal eine andere Sprache als Deutsch sprechen, sind es bei PISA nur diejenigen, die zu Hause am häufigsten eine andere Sprache als Deutsch sprechen (vgl. Methodenteil). Andererseits könnte gerade die Dauer des Schulbesuchs, die von der deutschen Sprache geprägt ist, zu einer vermehr­ten Benutzung des Deutschen auch zuhause und insbeson­dere unter den Geschwistern führen. Insgesamt zeigt sich jedoch für beide Studien, dass ein Migrationshintergrund eng mit Mehrsprachigkeit verknüpft ist. Dabei ist zu be­achten, dass etwa bei PISA 2012 4 % der zugewanderten Eltern aus Deutschland stammen und daher Deutsch mit großer Wahrscheinlichkeit ihre Erstsprache ist. Daten der Bildungsstandard­Baseline­Erhebung 2010 (4.  Schulstufe) zeigen, dass in den meisten Herkunftsgruppen (z. B. Eltern aus der Türkei oder dem ehemaligen Jugoslawien) knapp über 10 % der zugewanderten Familien nur Deutsch zu­hause sprechen, zwei Drittel bis drei Viertel Deutsch und eine andere Sprache und die verbleibenden 13 % bis 22 % (je nach Herkunftsgruppe) nur eine andere Sprache als Deutsch (Vogtenhuber et al., 2012, S. 25).

In Abbildung 2.1.3 wird der Anteil an Kindern und Ju­gendlichen mit Migrationshintergrund getrennt nach dem Geburtsland ihrer Eltern dargestellt. Bei PISA 2000 wurden noch keine konkreten Geburtsländer der Eltern erhoben. Bei PISA 2003 (Geburtsjahrgang 1987) zeigte sich, dass fast die Hälfte aller Jugendlichen mit Migrationshintergrund (46 %) Eltern hatten, die im ehemaligen Jugoslawien gebo­ren worden waren. Jeweils weniger als 30 % hatten Eltern, die aus der Türkei (25 %) oder einem anderen Land (29 %) zugewandert waren. Die neuesten Erhebungen zeigen eine Zunahme an Schülerinnen und Schülern, deren Eltern aus anderen Ländern als der Türkei oder Exjugoslawien stam­men. Diese machen nun 44 % der Kinder mit Migrations­hintergrund in den Volksschulen aus (PIRLS 2011) und 37 % der 15­/16­Jährigen (PISA 2012). Die Vielfalt der Herkunftsländer ist insgesamt größer geworden.

Die Zusammensetzung der Schüler/innen mit Migrations­hintergrund wird damit heterogener. Ein immer größerer Teil stammt nicht mehr aus den klassischen Zuwande­rungsländern Exjugoslawien und Türkei, sondern aus einer Vielzahl unterschiedlicher Länder. Angesichts der immer größeren Anteile von Schülerinnen und Schülern mit Mig­rationshintergrund und auch ihrer größeren Diversität wird in der Folge untersucht, inwiefern dieser gesteigerten Multi­kulturalität im Unterrichtsalltag entsprochen wird.

PISA PIRLS

0

2000

2003

2012

2006

2009

20

40

60

80

100

10

30

50

70

90%

%

Sch

üler

ante

il m

it M

igra

tions

hint

ergr

und,

der

zwei

spra

chig

ist

2006

2011

7771

78 74 73

8879

5 Diese Veränderungen können mit einer sich verändernden Zusammensetzung der Elterngenerationen als Folge von politischen Gegebenheiten in den Auswanderungsländern zusammenhängen (z. B. keine Kriegsflüchtlinge mehr aus Exjugoslawien), aber auch mit Veränderungen in der Einwanderungs­politik Österreichs (z. B. Regelung des Familiennachzugs).

Abbildung 2.1.2: Anteile an Kindern und Jugendlichen mit Migrationshintergrund nach Sprachgebrauch zu HauseAbbildung 2.1.3: Entwicklung der Anteile von Kindern und

Jugendlichen mit Migrationshintergrund nach Herkunftsland der Eltern

0

2000

*

PISA PIRLS

2003

2012

2006

2009

10

20

30

40

50%

%

Sch

üler

/inne

n m

it M

igra

tions

hint

ergr

und

5

15

25

35

45

2006

2011

anderes Land oder gemischte Herkunft

Eltern in Exjugoslawien geborenEltern in der Türkei geboren

*Herkunftsland nicht erhoben

vgl. Tabelle A.5 im Anhang für genaue Werte

Page 76: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

74 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

Die Beachtung von Mehrsprachigkeit und Multi­kulturalität im Unterrichtskontext

Im Rahmen von PIRLS und PISA wurden auch einige Fragen zum Unterrichtskontext gestellt, die sich auf Multi­kulturalität und Mehrsprachigkeit beziehen, vor allem auf die Kompetenzen der Lehrpersonen und die Aktivitäten der Schulleitungen. Diese Maßnahmen im Aus­ und Weiterbil­dungsbereich, aber auch die Durchführung entsprechender Aktivitäten im Schulalltag finden sich auch im Maßnah­menkatalog des BMUKK (n. d.) und wurden in den Na­tionalen Aktionsplan für Integration 2012 (Bundesminis­terium für Innere Angelegenheiten, 2012) aufgenommen. Kenntnisse zur Sprachentwicklung mehrsprachiger Kinder sowie zur Entwicklung von Deutsch als Zweitsprache sind besonders wichtig zur Führung mehrsprachiger Klassen. Daher wurden die Lehrkräfte bei PIRLS 2006 und bei PIRLS 2011 gefragt, wie intensiv sie sich im Rahmen ihrer Aus­ und Fortbildung mit Deutsch als Fremdsprache be­schäftigt haben.

Im Jahr 2006 wurden 61 % der Kinder von Lehrkräften un­terrichtet, die angaben, überhaupt keine derartige Aus­ oder Fortbildung zu haben, im Jahr 2011 waren es immer noch 57 % (vgl. Abb. 2.1.4). Darüber hinaus wurde analysiert, wie hoch der Anteil an Kindern mit Migrationshintergrund ist, deren Lehrkraft sich in der Aus­ und Fortbildung mit Deutsch als Fremdsprache beschäftigt hat. Hier zeigt sich, dass bei PIRLS 2011 45 % der Kinder mit Migrationshin­tergrund von einer Lehrkraft ohne entsprechende Aus­ oder Fortbildung unterrichtet worden sind. 42 % der Kinder mit Migrationshintergrund wurden von einer Lehrkraft unter­richtet, die im Rahmen ihrer Aus­ und Fortbildung einen Überblick oder eine Einführung in das Gebiet erhalten hat, nur 13 % der Kinder mit Migrationshintergrund hatten eine

Lehrkraft, die sich in ihrer Ausbildung schwerpunktmäßig mit „Deutsch als Fremdsprache“ auseinandergesetzt hat. Der Zeitvergleich zeigt, dass seit 2006 die Zahl der Lehrkräfte, die zumindest einen Überblick oder eine Einführung aufwei­sen kann, größer geworden ist. Dieser Anteil ist von 39 % bei PIRLS 2006 auf 44 % bei PIRLS 2011 gestiegen und der Anteil ohne derartige Ausbildung wurde geringer. Jedoch hatten 2011 (mit 13 %) sogar etwas weniger Kinder mit Mi­grationshintergrund eine Lehrkraft, die einen Schwerpunkt in dieser Ausbildung vorweisen konnte, als 2006 (17 %).

In diesem Zusammenhang bemängelt auch die Europäische Kommission (2013), dass in Österreich Kompetenzen im Bereich der kulturellen Diversität und Deutsch als Fremd­sprache keine Voraussetzung sind, um Schüler/innen mit Migrationshintergrund unterrichten zu dürfen.

Im Rahmen von PISA 2012 wurden die Schulleiter/innen unter anderem gefragt, wie viele Lehrer/innen mit einer an­deren Erstsprache als Deutsch an ihrer Schule beschäftigt sind und ob es an ihrer Schule im laufenden Schuljahr Akti­vitäten gibt, die sich auf das Leben in einer multikulturellen Gesellschaft beziehen (interkulturelle Kompetenz, Anti­diskriminierung, rassismusfreie Schule). Es wird deutlich, dass insgesamt 61 % der 15­/16­Jährigen ohne Migrations­hintergrund und 68 % der Jugendlichen mit Migrations­hintergrund eine Schule besuchten, in der es im Schuljahr 2011/12 laut Schulleiterangaben solche Aktivitäten gab. Dies bedeutet umgekehrt auch, dass fast ein Drittel der Jugendlichen mit Migrationshintergrund eine Schule be­suchte, in der keine solche Aktivität durchgeführt wurde.

Analysen zum Lehreranteil mit einer anderen Erstsprache als Deutsch zeigen, dass 55 % der Jugendlichen von PISA 2012 eine Schule besuchen, in der es keine einzige Lehrkraft mit einer anderen Erstsprache als Deutsch gibt. Weitere 35 % besuchen eine Schule, in der es zwar zumindest eine Lehrkraft mit anderer Erstsprache gibt, ihr Anteil am Lehrkörper aber weniger als 5 % ausmacht. 15­/16­Jährige kommen damit im Rahmen ihrer Ausbildung nur sehr selten mit Lehrkräften, die eine andere Erstsprache sprechen, in Berührung.

Entwicklung der Lesekompetenz von Kindern und Jugendlichen mit Migrationshintergrund

Die bisher vorgestellten Ergebnisse haben gezeigt, dass die Schülerschaft kulturell vielfältiger wird und wie dieser Viel­falt im Unterrichtsalltag entsprochen wird. Im Folgenden wird der Frage nachgegangen, inwiefern sich die Lesekom­petenz der Schüler/innen mit Migrationshintergrund im vergangenen Jahrzehnt verändert hat.

Abbildung 2.1.5 zeigt die Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit und ohne Migrations­hintergrund im Zeitvergleich. Die Mittelwerte der Schüler/innen mit Migrationshintergrund werden durch dunkelrote Rautensymbole dargestellt, jene der Einheimischen mittels

0 20

gesamt

gesamt

mit Migrations-hintergrund

mit Migrations-hintergrund

40 60 80 100% %

PIRLS2006

PIRLS2011

PIRLS2006

PIRLS2011

keine Ausbildung im Bereich „Deutsch als Fremdsprache“

Schüleranteil, der von einer Lehrkraft mitentsprechender Qualifikation unterrichtet wird

Überblick oder Einführung in das Gebiet„Deutsch als Fremdsprache“ war ein Schwerpunkt

61 30 9

57 34 10

50 34 17

45 42 13

Abbildung 2.1.4: Aus- und Fortbildung der Lehrer/innen im Bereich „Deutsch als Fremdsprache“ (PIRLS 2006 & 2011)

Page 77: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 75

hellroter Rautesymbole. Darüber hinaus sind für alle Mit­telwerte die 95­Prozent­Konfidenzintervalle eingetragen (vgl. „Zur Interpretation der Ergebnisse“ in der Einführung zu diesem Bericht). Da sich der Geburtsjahrgang der bei PISA 2012 und PIRLS 2006 getesteten Schüler/innen zum Großteil deckt (Jahrgang 1996), wird in den folgenden Abbildungen PIRLS 2006 immer im Anschluss an PISA 2012 präsentiert. Diese chronologische Darstellung nach Geburtsjahrgang bringt es mit sich, dass die Ergebnisse für ältere Schüler/innen (PISA) vor den Ergebnissen jüngerer Schüler/innen (PIRLS) angeführt werden.

Der Vergleich der PISA­Erhebungen von 2000 und 2012 zeigt, dass sich die Lesekompetenz der Jugendlichen mit Migrationshintergrund signifikant verbessert hat: von 409 Punkten im Jahr 2000 auf 449 Punkte im Jahr 2012. Die Lesekompetenz der Jugendlichen ohne Migrationshinter­grund ist hingegen etwa gleich geblieben (502 Punkte im Jahr 2000 und 499 Punkte im Jahr 2012). Dass 15­jähri­ge Schüler/innen mit Migrationshintergrund seit dem Jahr 2000 immer besser lesen (abgesehen von PISA 2009), die­jenigen ohne Migrationshintergrund ihre Kompetenzen im Vergleich zu PISA 2000 aber nicht verbessern konnten, hat zur Folge, dass sich die Leistungsunterschiede zwischen die­sen beiden Gruppen verringern. Während die Effektstärke des Leistungsunterschieds bei PISA 2000 noch d = –0,94 (großer Effekt) und 93 Leistungspunkte betrug, sind es bei PISA 2012 nur mehr 51 Leistungspunkte und der Effekt erreicht eine mittlere Größe (–0,56; siehe auch Tab. 2.1.2, Modell 1). Bei PIRLS entwickelt sich die Lesekompetenz bei den Kindern mit Migrationshintergrund weniger nega­tiv als bei den Kindern ohne Migrationshintergrund. Bei

Ersteren beträgt der Leistungsrückgang von 2006 auf 2011 nur zwei Punkte und ist statistisch nicht signifikant. Kin­der ohne Migrationshintergrund schneiden hingegen 2011 signifikant schlechter ab als 2006 (–10 Punkte; vgl. Abb. 2.1.5, rechte Grafik). Es ist somit der Unterschied in der Lesekompetenz zwischen Kindern mit und ohne Migrati­onshintergrund kleiner geworden: Während diese im Jahr 2006 noch 49 Kompetenzpunkte trennten (d = –0,77), sind es im Jahr 2011 nur mehr 42 Punkte (d = –0,67; siehe auch Tab. 2.1.3, Modell 1).

Auch wenn die vorliegenden Ergebnisse zeigen, dass die Leis­tungsunterschiede zwischen Kindern und Jugendlichen mit und ohne Migrationshintergrund geringer werden, muss im Auge behalten werden, dass über alle Erhebungszeitpunkte und über alle Studien (PISA und PIRLS) hinweg Schüler/innen mit Migrationshintergrund eine wesentlich geringere Lesekompetenz aufweisen als jene ohne. Dieser Unterschied ist stets statistisch signifikant und von mittlerer bis hoher praktischer Bedeutsamkeit (vgl. Tab. 2.1.3, Modell 1).

Für Kinder und Jugendliche macht es einen Unterschied, ob sie bereits im Einwanderungsland der Eltern geboren wur­den (2. Generation) oder ob sie selbst eingewandert sind (1. Generation). Vergleicht man die erste und zweite Ge­neration in ihren Leseleistungen, muss man allerdings auf ihre interne Zusammensetzung und die Veränderung der­selben über die Zeit achten. Abbildung 2.1.6 zeigt die Leis­tungsentwicklung von Migrantinnen/Migranten der ersten und zweiten Generation im Trendvergleich. Seit dem Jahr 2000 kam es bei PISA insbesondere bei den 15­Jährigen, die selbst mit ihren Eltern zugewandert sind – der ersten Ge­

Schüler/innen mit Migrationshintergrund Schüler/innen ohne Migrationshintergrund

PISA

2000 2003 2006 2009 2012350

400

450

500

550

2006Erhebungsjahr

Geburtsjahr der gestesteten Schüler/innen1

2011

1984 1987 1990 1993 1996 1996 2001

450

500

550

600

Lese

kom

pete

nz

hoch

nied

rig

PIRLS

Mittelwert

Manche Konfidenzintervalle sind aufgrund ihrer geringen Größe nicht sichtbar

vgl. Tabelle A.6 im Anhang für genaue Werte

1Bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren; bei PIRLS ist jenes Jahr eingetragen, in dem der Großteil der getesteten Schüler/innen geboren wurde.

Konfidenzintervall (+/– 1.96 SE)}

Abbildung 2.1.5: Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit und ohne Migrationshintergrund

Page 78: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

76 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

neration – zu einer deutlichen und statistisch signifikanten Leistungssteigerung (plus 46 Punkte von 2000 auf 2012). Auch Jugendliche der zweiten Generation erreichten eine höhere Punktanzahl (plus 22 Punkte von 2000 auf 2012) – dieser Zuwachs ist jedoch statistisch nicht signifikant. Für die aktuellsten Erhebungen (PIRLS 2011 und PISA 2012) zeigt sich, dass Schüler/innen mit Migrationshintergrund, die bereits in Österreich geboren sind (2. Generation), kei­ne signifikant besseren Leseleistungen aufweisen als Schü­ler/innen, die erst im Laufe ihres Lebens nach Österreich zugewandert sind (1. Generation).

Abbildung 2.1.7 zeigt die Leistungsentwicklung von Schü­lerinnen und Schülern mit Migrationshintergrund getrennt nach ihrem Herkunftsland. Es wird deutlich, dass Schü­ler/innen, deren Eltern in der Türkei geboren wurden, die relativ schwächste Lesekompetenz aufweisen. Schüler/in­nen mit Eltern aus Exjugoslawien liegen im Mittelfeld und lesen etwa gleich gut wie Schüler/innen mit Migrationshin­tergrund im Durchschnitt. Die relativ leistungsstärksten Schüler/innen mit Migrationshintergrund finden sich in der Gruppe „anderes Herkunftsland“. Das sind Kinder und Jugendliche mit Migrationshintergrund, die ihre Wurzeln nicht in Exjugoslawien oder der Türkei haben oder deren Eltern aus zwei unterschiedlichen Ländern stammen. Diese Gruppe besteht bei PISA 2012 zu 12 % aus Jugendlichen, deren Eltern aus Deutschland zugewandert sind und damit im Regelfall die gleiche Muttersprache haben wie einhei­mische Schüler/innen. Würde man die deutschen Schüler/innen aus der Berechnung ausschließen, würde sich der Mittelwert der Gruppe „andere oder gemischte Herkunft“ geringfügig verringern, von 481 auf 475 Punkte. Der Ge­samtmittelwert der Jugendlichen mit Migrationshinter­

grund würde unter Ausnahme der deutschen Jugendlichen leicht von 449 auf 445 Punkte zurückgehen. Das heißt, selbst bei PISA 2012, wo der Anteil deutschstämmiger Jugendlicher unter allen Erhebungen bisher am größten ist, spielt diese Gruppe kaum eine Rolle für die Leistungs­entwicklung der Jugendlichen mit Migrationshintergrund insgesamt.

Es muss darauf hingewiesen werden, dass sich die unter­schiedlichen Migrantengruppen in ihrem sozialen Hin­tergrund stark unterscheiden. Den eindeutig niedrigsten ESCS (ökonomischen, sozialen und kulturellen Status) weisen türkischstämmige Schüler/innen auf (M = –1,17; SE = 0,07), der ESCS für Jugendliche, die aus Exjugosla­wien stammen, liegt signifikant höher (M = –0,54; SE = 0,04) und Jugendliche anderer oder gemischter Herkunft (M = –0,05; SE = 0,07) weisen einen signifikant höheren ESCS auf als beide eben genannten Gruppen (bezogen auf PISA 2012)6. Bei der Interpretation der Leseleistungen muss stets dieser ungleiche soziale Hintergrund mitbedacht werden. Wenn man die unterschiedliche soziale Herkunft statistisch kontrolliert, dann verringert sich bei PISA 2012 der Leistungsnachteil türkischer Jugendlicher von 87 auf 36 Punkte, bei exjugoslawischen von 60 auf 32 Punkte und bei Jugendlichen anderer oder gemischter ausländischer Her­kunft von 18 auf 9 Punkte – jeweils gegenüber den Jugend­lichen ohne Migrationshintergrund.

Im Zeitvergleich wird deutlich, dass sich die Lesekompetenz der türkischstämmigen Jugendlichen zuerst lange Zeit auf dem etwa gleichen Niveau befunden hat, bei PISA 2012 aber deutlich angestiegen ist: Während der Durchschnittswert dieser Gruppe in allen vorhergehenden PISA­Erhebungen

2006 2011

PIRLS

3502000

PISA

2003 20122006 2009

370

390

410

430

470

450

490

460

470

480

490

510

500

520

Lese

kom

pete

nz

hoch

nied

rig

Lese

kom

pete

nz

hoch

nied

rig

1. Generation

2. Generation

Schüler/innen mit Migrationshintergrund gesamt

Mittelwert Konfidenzintervall (+/– 1.96 SE)}

vgl. Tabelle A.6 im Anhang für genaue Werte

Abbildung 2.1.6: Leseleistungsentwicklung: 1. und 2. Generation im Vergleich

6 Jugendliche ohne Migrationshintergrund haben einen mittleren ESCS von 0,19 (SE = 0,02).

Page 79: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 77

maximal 372 Punkte betrug, verbesserte er sich bei PISA 2012 signifikant auf 412 Punkte. Auch bei PIRLS lässt sich ein tendenzieller Leistungsanstieg bei den türkischstämmi­gen Kindern erkennen, während bei den anderen Gruppen die Tendenz eher rückläufig ist. Der Leistungsrückstand der türkischstämmigen Schüler/innen zu jenen der anderen Herkunftsgruppen ist damit sowohl bei PISA als auch bei PIRLS in neuester Zeit kleiner geworden.

Bildungsgerechtigkeit spiegelt sich nicht nur in (möglichst geringen) Mittelwertsunterschieden wider, sondern auch darin, dass möglichst alle Schüler/innen grundlegende Fähigkeiten erwerben sollen. Schüler/innen, die bei PISA oder PIRLS nur maximal Kompetenzstufe 1 erreichen, fehlt es an grundlegenden Lesefertigkeiten für die aktive Teil habe an der Gesellschaft. Abbildung 2.1.8 zeigt getrennt nach Migrationshintergrund, wie viele Schüler/innen zu den Leseschwachen7 zählen. Es wird deutlich, dass der Anteil an Schülerinnen und Schülern mit Migrationshintergrund unter den Leseschwachen zwar beständig kleiner wird (mit Ausnahme von PISA 2009), aber noch immer beachtlich hoch ist: Während im Jahr 2000 51 % der Jugendlichen mit Migrationshintergrund zur Risikogruppe zählten, sind es im Jahr 2012 mit 34 % zwar deutlich weniger, aber immer noch mehr als ein Drittel. Bei den Schülerinnen und Schü­lern ohne Migrationshintergrund ist der Risikoschüleranteil (mit 15 % im Jahr 2000 und 16 % im Jahr 2012) jedoch etwa gleich geblieben. Bei PIRLS zählen 2006 und 2011 konstant 37 % der Viertklässler/innen zu den Leseschwa­chen. Bei den Einheimischen ist der Anteil Leseschwacher jedoch größer geworden: von 12 % im Jahr 2006 auf 16 % im Jahr 2012. So zeigt sich auch beim Anteil leseschwacher Schüler/innen bei jenen mit Migrationshintergrund eine

vergleichsweise bessere Entwicklung als bei jenen ohne – sowohl für PISA als auch für PIRLS. Dennoch ist der Anteil an Schülerinnen und Schülern mit Migrationshintergrund, der zur Risikogruppe gehört, mit 34 % (bei PISA 2012) bzw. 37 % (bei PIRLS 2011) nach wie vor mehr als doppelt so hoch wie bei den Einheimischen mit 16 % (sowohl bei PISA 2012 als auch bei PIRLS 2011).

Es wurde bereits wiederholt gezeigt, dass Schüler/innen mit Migrationshintergrund im Durchschnitt unter schlechteren sozialen Bedingungen leben als Schüler/innen der Mehr­heitsbevölkerung (z. B. Breit, 2009a; Herzog­Punzenberger

PISA300

2000 2003 20122006 2009

340

380

320

360

400

440

500

480

420

460

Schüler/innen mit Migrationshintergrund gesamtanderes Land oder gemischte Herkunft

Lese

kom

pete

nz

hoch

nied

rig Lese

kom

pete

nz

hoch

nied

rig

Mittelwert Konfidenzintervall (+/– 1.96 SE)

2006

PIRLS

2011420

440

480

460

500

540

520

Eltern in Exjugoslawien geborenEltern in der Türkei geboren

vgl. Tabelle A.6 im Anhang für genaue Werte

}

Abbildung 2.1.7: Leseleistungsentwicklung nach Herkunftsland

PIRLS

2006

2011

0

20

40

60

10

30

50

%

%

Sch

üler

ante

il au

f ode

r un

ter

Leve

l 1PISA

2000

2003

2012

2006

2009

51

42 40

50

3437 37

15 17 1823

1612

16

Schüler/innen ohne MigrationshintergrundSchüler/innen mit Migrationshintergrund

Abbildung 2.1.8: Entwicklung des Anteils an Risikoschüler-innen und -schülern bei PISA bzw. leseschwacher Schüler/

innen bei PIRLS nach Migrationshintergrund

7 Es handelt sich hierbei um Schüler/innen, die maximal Kompetenzstufe 1 erreichen. Bei PISA werden diese Schüler/innen auch als „Risikogruppe“ be­zeichnet.

Page 80: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

78 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

& Gapp, 2009) und ein wesentlicher Teil der Leistungs­unterschiede zwischen diesen beiden Gruppen durch ihre soziale Herkunft erklärt werden kann (Breit, 2009b; Unter­wurzacher, 2009). Auch die PISA­2012­Daten zeigen, dass Jugendliche mit Migrationshintergrund (M = –0,49) einen signifikant schlechteren ökonomischen sozialen und kultu­rellen Status (ESCS) aufweisen als jene ohne (M = 0,19). Im Zeitvergleich (PISA 2000 zu PISA 2012) wird deutlich, dass der ESCS der Jugendlichen mit Migrationshintergrund (plus 0,42 Indexpunkte) etwa im gleichen Umfang gestiegen ist, wie bei den Jugendlichen ohne Migrationshintergrund (plus 0,40 Indexpunkte). Dass der Leistungsunterschied in Lesen zwischen Jugendlichen mit und ohne Migrati­onshintergrund kleiner geworden ist, kann somit definitiv nicht durch eine Verringerung sozialer Unterschiede erklärt werden. Denkbar wäre jedoch, dass sich die Wirkung des sozialen Hintergrunds verstärkt hat, sodass der gleiche Un­terschied zu größeren Differenzen führt.

Die Tabellen 2.1.2 und 2.1.3 (jeweils Modell 2) zeigen die Ergebnisse von Regressionsmodellen, in denen nach dem ökonomischen sozialen und kulturellen Status (ESCS) kontrolliert wird. Es wird deutlich, dass je nach Studie 30–54 % des Leistungsunterschieds zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund durch soziale Faktoren erklärt werden können. Wird beispielsweise bei PISA 2012 nach dem sozialen Hintergrund kontrol­liert, verringert sich der Leistungsunterschied von 51 auf 23 Punkte. Bemerkenswert ist, dass der soziale Hintergrund über die Zeit hinweg immer mehr Varianz in den (rück­läufigen) Leistungsunterschieden erklärt: Konnten bei PISA 2000 nur 30 % des Leistungsunterschieds zwischen Schüle­rinnen und Schülern mit und ohne Migrationshintergrund auf den sozialen Hintergrund zurückgeführt werden, sind es bei PISA 2012 54 %. Leistungsunterschiede werden also insgesamt kleiner und sie können in einem immer stärkeren Umfang auf soziale Faktoren zurückgeführt werden, ob­

Tabelle 2.1.2: Unterschiede in der Lesekompetenz zwischen Jugendlichen mit und ohne Migrationshintergrund: ohne und mit Kontrolle des sozialen Hintergrunds (PISA 2000, 2003, 2006, 2009, 2012)

PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012

B SE B SE B SE B SE B SE

Modell 1

Konstante 502.48** 2.84 501.46** 3.81 499.07** 3.45 481.97** 2.95 499.09** 2.73

Migrationshintergrund –93.28** 7.89 –75.73** 8.47 –60.86** 13.90 –68.21** 6.75 –50.54** 5.78

R2 .09 .06 .04 .06 .04

Effektstärke des Leistungs-unterschieds zwischen Einheimischen und Migrant/innen (ohne Kontrolle des sozialen Hintergruns)

–0.94 –0.74 -0.55 –0.71 -0.56

Modell 2

Konstante 500.27** 2.77 496.61** 2.83 487.18** 3.53 474.76** 2.86 492.06** 2.68

Migrationshintergrund –64.99** 7.13 –41.87** 6.80 –34.40** 10.22 –37.02** 6.67 –23.33** 5.54

ESCS 36.87** 2.40 49.80** 2.39 43.11** 3.08 43.23** 2.39 39.13** 2.51

R2 .18 .23 .14 .18 .16

Effektstärke des Leistungs-unterschieds zwischen Einheimischen und Migrant/innen unter Kontrolle des sozialen Hintergrunds

–0.65 –0.41 –0.31 –0.38 -0.26

Anteil (%) des Leistungs-unterschieds zwischen Einheimischen und Migrant/innen, der durch den sozialen Hintergrund erklärt wird1

30 45 43 46 54

**Werte sind signifikant (p < .01); 1berechnet als (1-(B-Koeffizient zum Migrationshintergrund aus Modell 2/B-Koeffizient zum Migrations-hintergrund aus Modell 2))*100.

Page 81: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 79

wohl der Unterschied im ESCS zwischen Jugendlichen mit und ohne Migrationshintergrund im Jahr 2012 etwa gleich hoch ausfällt wie im Jahr 2000.

Wie in der Einleitung erwähnt, kommt dem Vergleich von PIRLS 2006 mit PISA 2012 eine besondere Bedeutung zu, da sich die Schülerkohorte zu großen Teilen deckt. Beim Vergleich dieser beiden Studien zeigt sich, dass die Effekt­stärke des Leistungsunterschieds zwischen Schülerinnen

und Schülern mit und ohne Migrationshintergrund am Ende der Grundschule deutlich höher liegt (d = –0,77) als bei PISA (d = –0,56). Dies deutet darauf hin, dass die Leis­tungskluft zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund mit zunehmender Beschulung geringer wird8.

In der Folge werden die wichtigsten Ergebnisse zusammen­gefasst und mögliche Gründe für die positive Leistungs­entwicklung bei Jugendlichen mit Migrationshintergrund diskutiert.

Diskussion

Wie bereits mehrfach für die Allgemeinbevölkerung doku­mentiert (z. B. Statistik Austria, 2013), zeigt der vorliegende Beitrag, dass auch bei den Jugendlichen in der Schule der Migrantenanteil seit der Jahrtausendwende deutlich gestie­gen ist. Unter den 15­/16­Jährigen hatten im Jahr 2000 11 % einen Migrationshintergrund (d. h. beide Elternteile wurden im Ausland geboren), im Jahr 2012 waren es 17 %. Und aus den neuesten Volksschuldaten zeichnet sich ab, dass auch dieser Anteil weiter steigen wird. So haben bei PIRLS 2011 19 % der Viertklässler/innen einen Migrati­onshintergrund. Auch zeigen die vorliegenden Ergebnisse, dass die kulturelle Vielfalt unter den Kindern mit Migra­tionshintergrund größer geworden ist. So stammen bei PIRLS 2011 nur mehr 55 % der Schüler/innen mit Mig­rationshintergrund aus den klassischen Zuwanderungslän­dern Exjugoslawien und Türkei (bei PISA 2003 waren es noch 71 %) und ein Anteil von 45 % kommt aus einer Viel­zahl weiterer Länder.

Der vorliegende Beitrag zeigt erstmals für den langen Zeitraum von 12 Jahren, wie sich die Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund in Österreich entwickelt hat. Bei PISA konnte hier eine we­sentliche Verringerung des Leistungsunterschieds zwischen Jugendlichen mit und ohne Migrationshintergrund festge­stellt werden: Während im Jahr 2000 15­/16­Jährige mit Migrationshintergrund noch hoch bedeutsam (–93 Punk­te) hinter Gleichaltrigen ohne Migrationshintergrund zu­rücklagen, fällt der Leistungsunterschied im Jahr 2012 mit 51 Punkten wesentlich geringer aus. Es muss aber dennoch betont werden, dass auch dieser Unterschied nach wie vor beträchtlich und statistisch signifikant ist.

Trendergebnisse belegen, dass sich die Leistungskluft zwi­schen Schülerinnen und Schülern mit und ohne Migrati­onshintergrund immer mehr schließt, weil sich die Lese­

8 Hierbei muss bedacht werden, dass bei PISA etwa 5 % der Jugendlichen nicht mehr im Schulsystem zu finden sind (vgl. Pareiss, 2013). Es kann ange­nommen werden, dass es sich dabei überwiegend um sehr leistungsschwache Schüler/innen (oft mit Migrationshintergrund) handelt. Würden die Leis­tungen aller 15­/16­Jährigen erfasst werden und nicht nur jene der beschulten, würde der Leistungsunterschied zwischen Jugendlichen mit und ohne Migrationshintergrund bei PISA wahrscheinlich höher ausfallen.

PIRLS 2006 PIRLS 2011

B SE B SE

Modell 1

Konstante 546.72** 1.93 536.79** 1.74

Migrationshintergrund –49.17** 3.10 –41.70** 3.63

R2 .08 .07

Effektstärke des Leistungsunterschieds zwischen Einheimi-schen und Migrant/in-nen (ohne Kontrolle des sozialen Hintergrunds)

–0.77 –0.67

Modell 2

Konstante 439.53** 8.05 422.66** 6.30

Migrationshintergrund –27.70** 2.71 –22.66** 3.75

Bildung der Eltern (umgerechnet in Jahre)

5.44** 0.56 5.35** 0.51

Buchbesitz 12.25** 1.21 13.98** 1.05

R2 .16 .18

Effektstärke des Leis-tungsunterschieds zwi-schen Einheimischen und Migrant/innen unter Kontrolle des sozialen Hintergrunds

–0.43 –0.36

Anteil (%) des Leis-tungsunterschieds zwi-schen Einheimischen und Migrant/innen, der durch den sozialen Hintergrund erklärt wird1

44 46

**Werte sind signifikant (p < .01); 1berechnet als (1-(B-Koeffizi-ent zum Migrationshintergrund aus Modell 2/B-Koeffizient zum Migrationshintergrund aus Modell 2))*100.

Tabelle 2.1.3: Unterschiede in der Lesekompetenz zwischen Kindern mit und ohne Migrationshintergrund: ohne und mit

Kontrolle des sozialen Hintergrunds (PIRLS 2006, 2011)

Page 82: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

80 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

kompetenz bei Jugendlichen mit Migrationshintergrund von PISA 2000 auf PISA 2012 positiv entwickelt hat (+39 Punkte), während sie bei Jugendlichen ohne Migrations­hintergrund konstant geblieben ist (–3 Punkte, n.  s.). Bei PIRLS ist die Lesekompetenz der Kinder mit Migrations­hintergrund von 2006 auf 2011 etwa gleich geblieben (–2 Punkte, n.  s.), Kinder ohne Migrationshintergrund haben sich hingegen signifikant verschlechtert (–10 Punkte).

Bemerkenswert ist die positive Entwicklung der Lesekom­petenz von Jugendlichen mit türkischen Wurzeln. Zwischen 20039 und 2009 waren die Leistungswerte ungefähr gleich geblieben, verbesserten sich aber 2012 sehr deutlich um 40 Punkte. Und dies, obwohl der soziale Status bei den tür­kischen Jugendlichen im Zeitverlauf (2003–2012) in einem geringeren Ausmaß gestiegen ist (plus 0,13 ESCS­Index­punkte) als bei Jugendlichen mit Migrationshintergrund insgesamt (plus 0,28 Indexpunkte) und Jugendlichen ohne Migrationshintergrund (plus 0,37 Indexpunkte).

Nach wie vor lässt sich ein beachtlicher Teil der Leistungs­unterschiede zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund durch Unterschiede im so­zialen Hintergrund erklären. Kinder und Jugendliche mit Migrationshintergrund wachsen im Durchschnitt unter wesentlich schlechteren sozioökonomischen Bedingungen auf als jene ohne. Für PIRLS 2011 und PISA 2012 zeigt sich, dass die Leistungsunterschiede nur etwa halb so groß ausfallen würden, wenn Kinder und Jugendliche mit und ohne Migrationshintergrund unter denselben sozioökono­mischen Bedingungen aufwachsen würden10. Über die Zeit hinweg ist der Anteil des Leistungsunterschieds, der durch sozioökonomische Faktoren erklärt werden kann, immer größer geworden. Waren dies bei PISA 2000 nur 30 %, sind es 12 Jahre später 54 %. Insgesamt zeigt sich damit, dass die Leistungsunterschiede zwischen Jugendlichen mit und ohne Migrationshintergrund kleiner werden, gleichzeitig aber der soziale Hintergrund eine immer größere Rolle bei der Erklä­rung dieser Leistungsunterschiede spielt.

Die vorliegenden Ergebnisse belegen, dass Jugendliche mit Migrationshintergrund heute im Durchschnitt eine höhere Lesekompetenz aufweisen als zur Jahrtausendwen­de. Die Ursachen für diese Verbesserung können mit den PISA­Daten allerdings nicht eindeutig geklärt werden. Es ist davon auszugehen, dass eine Vielzahl von Faktoren da­für verantwortlich ist. Diese Faktoren sind einerseits in der Zusammensetzung der Jugendlichen mit Migrationshinter­grund zu suchen. Beispielsweise zeigt sich, dass der Anteil an Schülerinnen und Schülern, die nicht aus den klassi­schen Einwanderungsländern Exjugoslawien und Türkei stammen, deutlich gewachsen ist und gerade diese Jugend­

lichen (Gruppe „anderes Herkunftsland oder gemischte Herkunft“) die höchste Lesekompetenz unter den Schüle­rinnen und Schülern mit Migrationshintergrund aufweisen. Gleichzeitig ist der Anteil türkischer Jugendlicher – und da­mit der traditionell leistungsschwächsten Zuwanderungs­gruppe in Österreich – kleiner geworden. Dabei soll jedoch der deutliche Leistungsanstieg bei den türkischen Jugendli­chen in letzter Zeit nicht übersehen werden, der bei dieser Gruppe in den letzten Jahren am stärksten war. Möglicher­weise spielen hierfür Initiativen in der türkischen „Commu­nity“ selbst, die sich durch eine starke Bildungsorientierung auszeichnen, wie etwa die Gülen­Bewegung, eine Rolle (vgl. für Deutschland Agai, 2010, 36–46; Geier & Frank, 2014).

Ein weiterer Grund für die Steigerung der Lesekompetenz bei Jugendlichen mit Migrationshintergrund könnte in ver­besserten schulischen Rahmenbedingungen liegen. So wird in der Lehreraus­ und ­fortbildung ein stärkerer Fokus auf Interkulturalität, Mehrsprachigkeit und Deutsch als Zweit­sprache gelegt. Die vorliegenden Ergebnisse zeigen, dass Volksschullehrer/innen 2011 häufiger eine Ausbildung in „Deutsch als Fremdsprache/Zweitsprache“ aufweisen als noch 2006. Dennoch wurden auch im Jahr 2011 noch immer 45 % der Kinder mit Migrationshintergrund von einer Lehrkraft ohne entsprechende Ausbildung unterrich­tet. Auch zeigen die PISA­2012­Daten, dass es noch immer nur sehr selten Lehrkräfte mit einer anderen Erstsprache als Deutsch gibt: Mehr als die Hälfte der PISA­Schüler/innen hatte im Schuljahr 2011/12 überhaupt keine solche Lehr­kraft an der Schule.

Neben Maßnahmen in der Schule wird in letzter Zeit der Sprachförderung im Kindergarten eine immer größere Bedeutung beigemessen (vgl. Einleitung). Von der frühen Sprachförderung (beginnend mit 2008) konnten allerdings die PISA­ und PIRLS­Schüler/innen noch nicht profitie­ren. So wurden die bei PISA 2012 getesteten Jugendlichen in der Regel bereits im Jahr 2002 eingeschult und die bei PIRLS 2011 getesteten Kinder im Jahr 2007.

Bemerkenswert am Einflussfaktor Schule ist, dass die Effekt stärke der Leistungsdifferenz mit zunehmender Be­schulung kleiner wird. Wie erwähnt, teilt sich ein großer Teil der Schülerkohorte von PIRLS 2006 und PISA 2012 das Geburtsjahr (1996). Als sich die (zum Großteil) 1996 Geborenen auf der vierten Schulstufe befanden (PIRLS 2006), betrug die Effektstärke der Leistungsdifferenz zwi­schen Kindern mit und ohne Migrationshintergrund –0,77. Sechs Jahre später, als die 1996 Geborenen bei PISA 2012 getestet wurden, betrug die Effektstärke nur mehr –0,54. Wenn man also Schülerkohorten untersucht, deren Ge­burtsjahrgang sich stark überlappt, zeigen sich mit längerer

9 Bei der PISA­Testung im Jahr 2000 wurde nur danach gefragt, ob Mutter und Vater im Inland oder im Ausland geboren wurden, sodass in den Analysen der PISA­2000­Daten nicht nach Geburtsland (z. B. Türkei) unterschieden werden kann.

10 Wie in der Einleitung erwähnt, wurde bei PIRLS und PISA der soziale Hintergrund unterschiedlich operationalisiert, wodurch die Vergleichbarkeit der Ergebnisse zwischen PIRLS und PISA in diesem Punkt eingeschränkt ist.

Page 83: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 81

Beschulung geringere Leistungsunterschiede. Dies könnte auch darauf hindeuten, dass die Aufholprozesse mehrspra­chiger Kinder mit zunehmendem Alter stärker zur Ent­faltung kommen. Wie in der Einleitung erwähnt, ist eine durchgängige Sprachförderung von fünf bis sieben Jahren notwendig, um Kinder in der Zweitsprache an ein bildungs­sprachliches Niveau heranzuführen (de Cillia, n. d.). Eine längere Beschulung könnte bei geeigneten Rahmenbedin­gungen daher insbesondere für Kinder mit Migrationshin­tergrund weitergehende positive Effekte haben.

Darüber hinaus könnten sich auch die in der Einleitung be­schriebenen gesellschaftlichen Veränderungen auf die Leis­tungen der Schüler/innen mit Migrationshintergrund aus­wirken. Integration wird auch auf gesamtgesellschaftlicher Ebene immer stärker wahrgenommen und die Handlungs­empfehlungen im Bereich Bildung (Volf & Bauböck, 2001; Herzog­Punzenberger & Unterwurzacher, 2009; Nusche, Shewbridge & Rasmussen, 2009) schrittweise umgesetzt.

Zusammenfassend belegen die vorliegenden Ergebnisse, dass die Lesekompetenz bei Jugendlichen (15­/16­Jährigen) mit Migrationshintergrund im Zeitraum 2000–2012 ge­stiegen ist, während sie bei Jugendlichen ohne Migrations­hintergrund etwa gleich geblieben ist. Bei den Volksschul­kindern mit Migrationshintergrund ist die Lesekompetenz etwa gleich geblieben, während sie bei den Kindern ohne Migrationshintergrund signifikant gesunken ist (von 2006 auf 2011). Damit sind die Leistungsunterschiede in Lesen zwischen Schülerinnen und Schülern mit und ohne Migra­tionshintergrund sowohl in der Volksschule als auch bei den 15­/16­Jährigen kleiner geworden. Die Gründe für diese positivere Leistungsentwicklung bei den Jugendlichen mit Migrationshintergrund (im Vergleich zu jenen ohne Mig­rationshintergrund) können mit den vorliegenden Daten allerdings nicht im Detail festgestellt werden. Anzunehmen ist ein Zusammenspiel von individuellen, schulischen und gesellschaftlichen Faktoren.

Literatur

Adams, R. & Carstensen, C. (2002). Scaling Outcomes. In R. Adams & M. Wu (Eds.), PISA 2000 Technical Report (pp. 149–162). Paris: OECD Publishing.

Agai, B. (2010). Die Arbeit der Gülen-Bewegung in Deutschland: Akteure, Rahmenbedingungen, Motivation und Diskurse. In W. Homolka, J. Hafner, A. Kosman & E. Karakoyun (Hrsg.), Muslime zwischen Tradition und Moderne. Die Gülen-Bewegung als Brücke zwischen den Kulturen (S. 9–55). Freiburg i. B.: Herder.

Bacher, J. (2009). Soziale Ungleichheit, Schullaufbahn und Testleistungen. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volksschule (S. 79–101). Graz: Leykam.

Bacher, J. (2012). Repräsentativität der PISA2009-Erhebung. In F. Eder (Hrsg.), PISA 2009. Nationale Zusatzanalysen für Österreich (S. 483–511). Münster: Waxmann.

BMBF – Bundesministerium für Bildung und Frauen (2014). Der muttersprachliche Unterricht in Österreich. Statistische Aus-wertung für das Schuljahr 2012/13. Informationsblätter des Referats für Migration und Schule Nr. 5/2013/14. Zugriff am 23.06.2014 unter http://www.schule-mehrsprachig.at/fileadmin/schule_mehrsprachig/redaktion/Hintergrundinfo/info5-13-14.pdf

BMBF – Bundesministerium für Bildung und Frauen (2015). SchülerInnen mit anderen Erstsprachen als Deutsch. Statistische Übersicht Schuljahre 2007/08 bis 2013/14. Informationsblätter des Referats für Migration und Schule Nr. 2/2014/15. Zugriff am 16.04.2015 unter http://www.schule-mehrsprachig.at/fileadmin/schule_mehrsprachig/redaktion/Hintergrundinfo/info2-14-15.pdf

BMUKK – Bundesministerium für Unterricht, Kunst und Kultur (2011). Gesetzliche Grundlagen schulischer Maßnahmen für SchülerInnen mit anderen Erstsprachen als Deutsch. Gesetze und Verordnungen. Zugriff am 23.03.2014 unter http://www.grg23vbs.ac.at/fileadmin/media/infomat/leistungsbeurteilung/01_Gesetzliche_Grundlagen_fuer_Schueler_mit_nichtdeut-scher_Muttersprache.pdf

BMUKK – Bundesministerium für Unterricht, Kunst und Kultur (n.d.). Unveröffentlichtes Arbeitspapier der Abteilung I/5 Diver-sitäts- und Sprachenpolitik, Sonderpädagogik und inklusive Bildung, Begabungsförderung.

Boeckmann, B., Brunner, K. M., Egger, M., Gombos, G., Juric, M. & Larcher, D. (1988). Identität und Assimilation. In R. Bau-böck, G. Baumgartner & K. Pintér (Hrsg.), ...und raus bist du! Ethnische Minderheiten in der Politik (S. 209–223). Wien: Verlag für Gesellschaftskritik.

Page 84: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

82 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

Breit, S. (2009a). Sozialisationsbedingungen von Schülerinnen und Schülern mit Migrationshintergrund. In C. Schreiner & U. Schwantner (Hrsg.), PISA 2006. Österreichischer Expertenbericht zum Naturwissenschaftsschwerpunkt (S. 136–145). Graz: Leykam.

Breit, S. (2009b). Kompetenzen von Schülerinnen und Schülern mit Migrationshintergrund. In C. Schreiner & U. Schwantner (Hrsg.), PISA 2006. Österreichischer Expertenbericht zum Naturwissenschaftsschwerpunkt (S. 146–158). Graz: Leykam.

Breit, S. & Schneider, P. (2009). Ergebnisse der Sprachstandsfeststellung. In S. Breit (Hrsg.), Frühkindliche Sprachstandsfest-stellung. Konzept und Ergebnisse der systematischen Beobachtung im Kindergarten (S. 22–44). Graz: Leykam.

Brizic, K. & Hufnagl, C. (2011). Multilingual Cities Wien: Bericht zur Sprachenerhebung in den 3. und 4. Volksschulklassen. Zugriff am 25.06.2014 unter http://www.academia.edu/1826419/Brizic_K._and_Hufnagl_Claudia_Lo_2011_Multilingual_ Cities_Vienna._Preliminary_school_report_on_a_home-language_survey_in_Viennese_primary_schools_in_German_._Austrian _Academy_of_Sciences._Online

Bundesministerium für Innere Angelegenheiten (2012). Nationaler Aktionsplan für Integration. Maßnahmen. Zugriff am 23.03.2014 unter http://www.bmi.gv.at/cms/cs03documentsbmi/817.pdf

Busch, B. & de Cillia, R. (Hrsg.). (2003). Sprachenpolitik in Österreich. Eine Bestandsaufnahme. Frankfurt am Main: Peter Lang.

Çinar, D. (Hrsg.). (1998). Gleichwertige Sprachen? Muttersprachlicher Unterricht für die Kinder von Einwanderern. Innsbruck: StudienVerlag.

Çinar, D. & Davy, U. (1998). Von der Rückkehrförderung zum Interkulturellen Lernen: Rahmenbedingungen des muttersprach-lichen Unterrichts. In D. Çinar (Hrsg.), Gleichwertige Sprachen? Muttersprachlicher Unterricht für die Kinder von Einwanderern (S. 23–80). Innsbruck: StudienVerlag.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum.

de Cillia, R. (n.d.). Spracherwerb in der Migration – Deutsch als Zweitsprache. Bundesinstitut für Bildungsforschung, Innova-tion und Entwicklung des österreichischen Schulwesens BIFIE. Zugriff am 23.03.2014 unter https://www.bifie.at/system/files/dl/srdp_cillia_spracherwerb_migration_2011-10-11.pdf

Ellis, P. D. (2010). The essential guide to effect sizes. Cambridge: Cambridge University Press.

Europäische Kommission (2013). Study on educational support for newly arrived migrant children. Case study report Austria. Zugriff am 16.04.2015 unter http://edz.bib.uni-mannheim.de/daten/edz-b/gdbk/13/bld/migrant_austria_en.pdf

Fischer, G. (1986). Gastarbeiterkinder an österreichischen Pflichtschulen. In H. Wimmer (Hrsg.), Ausländische Arbeitskräfte in Österreich (S. 307–330). Frankfurt am Main: Campus.

Foy, P. (2012). Estimating standard errors for the TIMSS and PIRLS 2011 achievement scales. In M. O. Martin & I. V. S. Mullis (Eds.), Methods and procedures in TIMSS and PIRLS 2011. Retrieved September 18, 2013 from http://timssandpirls.bc.edu/methods/pdf/TP11_Estimating_Achievement.pdf

Foy, P., Brossman, B. & Galia, J. (2012). Scaling the TIMSS and PIRLS 2011 achievement data. In M. O. Martin & I. V. S. Mullis (Eds.), Methods and procedures in TIMSS and PIRLS 2011. Retrieved September 18, 2013 from http://timssandpirls.bc.edu/methods/pdf/TP11_Scaling_Achievement.pdf

Geier, T. & Frank M. (2014). Bildung im hizmet – zu Bildungspraxen und Biographien junger Studierender im Kontext der ‚Gülen-Bewegung‘. In T. Geier & K. U. Zaborowski (Hrsg.), Migration: Auflösungen und Grenzziehungen. Zu aktuellen Perspek-tiven einer erziehungswissenschaftlichen Migrationsforschung.

Gomolla, M. & Radtke, F. O. (2002). Institutionelle Diskriminierung. Die Herstellung ethnischer Differenz in der Schule. Opladen: Leske+Budrich.

Page 85: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 83

Gonzalez, E. J. (2003). Scaling the PIRLS Reading Assessment Data. In M. O. Martin, I. V. S. Mullis & A. M. Kennedy (Eds.), PIRLS 2001 Technical Report (pp. 151–168). Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.

Grafendorfer, A., Wallner-Paschon, C., Suchan, B. & Widauer, K. (2012). Was messen PIRLS & TIMSS? In B. Suchan, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S. 12–48). Graz: Leykam.

Heath, A. & Li, Y. (2010). The feasibility of constructing a race equality index. Research report No 695, Department for Work and Pensions. Retrieved March 23, 2014 from https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/214468/rrep695.pdf

Herzog-Punzenberger, B. (2009). Jenseits individueller Charakteristiken – welche Bedeutung haben gesellschaftliche Struktu-ren für den Bildungserfolg von Schülerinnen und Schülern mit Migrationshintergrund? In C. Schreiner & U. Schwantner (Hrsg.), PISA 2006. Österreichischer Expertenbericht zum Naturwissenschafts-Schwerpunkt (S. 159–166). Graz: Leykam.

Herzog-Punzenberger, B. & Gapp, P. (2009). Sozialisationsbedingungen von Schülerinnen und Schülern mit Migrationshinter-grund. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volksschule (S. 55–65). Graz: Leykam.

Herzog-Punzenberger, B. & Unterwurzacher, A. (2009). Migration – Interkulturalität – Mehrsprachigkeit. In W. Specht (Hrsg.), Nationaler Bildungsbericht Österreich 2009 (S. 161–182). Graz: Leykam. Zugriff am 25.6.2014 unter https://www.bifie.at/buch/1024/b/2

Kao, G. & Tienda, M. (1998). Educational aspirations of minority youth. American Journal of Education, 106, 349–84.

Latcheva, R. & Herzog-Punzenberger, B. (2011). Integration revisited. Zur Dynamik und Kontextabhängigkeit individueller Integrationsverläufe am Beispiel von MigrantInnen der ersten Generation in Wien. Österreichische Zeitschrift für Soziologie, 36, 3–27.

Matuschek, H. (1982). Die Auswirkungen der „Ausländerpolitik“ auf Schul- und Berufsausbildung der jugoslawischen und türkischen Jugendlichen in Wien und Niederösterreich. Situation und Lösungsmöglichkeiten. Wien: Europäisches Zentrum für Ausbildung und Forschung auf dem Gebiet der Sozialen Wohlfahrt.

Neuwirth, E. (2006). PISA 2000. Sample weight problems in Austria. Retrieved September 18, 2013 from http://www.oecd-ilibrary.org/education/pisa-2000_220456725273

Nusche, D., Shewbridge, C. & Rasmussen, C. (2009). OECD Reviews of Migrant Education. Austria. Zugriff am 25.6.2014 unter http://www.oecd.org/austria/44192225.pdf

OECD (2009). PISA data analysis manual – SPSS (2nd ed.). Paris: OECD Publishing.

OECD (2012). PISA 2009 Technical Report. Paris: OECD Publishing.

OECD (2013a). PISA 2012 results: Excellence through equity: Giving every student the chance to succeed – Volume II. Paris: OECD Publishing.

OECD (2013b). PISA 2012 results: What students know and can do – Volume I. Paris: OECD Publishing.

Österreichischer Integrationsfonds (2014). Migration & Integration – Schwerpunkt: Arbeit und Beruf. Zugriff am 04.06.2014 unter http://www.integrationsfonds.at/zahlen_und_fakten/migration_integration_schwerpunkt_arbeit_und_beruf/

Pareiss, M. (2013). Sampling-Design und Stichproben. In U. Schwantner & C. Schreiner (Hrsg.), PISA 2012. Internationaler Vergleich von Schülerleistungen. Technischer Bericht. Zugriff am 30.01.2014 unter https://www.bifie.at/buch/2431/4

Plutzar, V. & Kerschhofer-Puhalo, N. (Hrsg.). (2009). Nachhaltige Sprachförderung. Zur veränderten Aufgabe des Bildungs­wesens in einer Zuwanderergesellschaft. Bestandsaufnahmen und Perspektiven. Innsbruck: StudienVerlag.

Page 86: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

84 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000

Reiter, C. (2002). Wenn die Testsprache nicht der Muttersprache entspricht … In C. Reiter & G. Haider (Hrsg.), PISA 2000 Lernen für das Leben Österreichische Perspektiven des internationalen Vergleichs (S. 61–68). Innsbruck: StudienVerlag.

Schreiner, C. & Breit, S. (2006). Kompetenzen von Schüler/innen mit Migrationshintergrund. In G. Haider & C. Schreiner (Hrsg.), Die PISA-Studie. Österreichs Schulsystem im internationalen Wettbewerb (S. 179–194). Wien, Köln, Weimar: Böhlau.

Schwantner, U. & Schreiner, C. (Hrsg.). (2013). PISA 2012. Internationaler Vergleich von Schülerleistungen. Die Studie im Überblick. Graz: Leykam.

Spiewak, M. (2009). Das vietnamesische Wunder. Die Zeit, Nr. 5/2009. Zugriff am 27.03.2014 unter http://www.zeit.de/ 2009/05/B-Vietnamesen

Statistik Austria (2013). Migration & Integration. Zahlen – Daten – Indikatoren 2013. Zugriff am 04.06.2014 unter http://www.bmeia.gv.at/fileadmin/user_upload/bmeia/media/Integration/Integrationsbericht_2013/Statistische_Jahrbuch_2013.pdf

Suchań, B. & Wintersteller, A. (2012). Population und Stichprobe von PIRLS & TIMSS. In B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft. Die Studie im Überblick (S. 49–51). Graz: Leykam.

Unterwurzacher, A. (2009). Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund: Einfluss das familiären Hintergrundes. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volks-schule (S. 66–78). Graz: Leykam.

Viehböck, E. & Bratić, L. (1994). Die zweite Generation. Migrantenjugendliche im deutschsprachigen Raum. Innsbruck: Studien -Verlag.

Vogtenhuber, S., Lassnigg, L., Bruneforth, M. (2012). Indikatoren A: Kontext des Schul- und Bildungswesens. In M. Bruneforth & L. Lassnigg (Hrsg.), Nationaler Bildungsbericht Österreich 2012. Band 1. Das Schulsystem im Spiegel von Daten und Indi-katoren (S. 15–30). Graz: Leykam.

Volf, P. & Bauböck, R. (2001). Wege zur Integration. Was man gegen Diskriminierung und Fremdenfeindlichkeit tun kann. Kla-genfurt: Drava.

Wroblewski, A. (2012). Situation und Kompetenzen von Schüler/inne/n mit Migrationshintergrund: Deskriptive und multivariate Analyse der Determinanten der Testleistung. In F. Eder (Hrsg.), PISA 2009. Nationale Zusatzanalysen für Österreich (S. 337–366). Münster: Waxmann.

Page 87: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 85

2.2 Die Bedeutung von familiären, schuli-schen und individuellen Merkmalen für die Mathematikkompetenz

Christina Wallner-Paschon & Gerda Hagenauer

Die schulische Leistung wird von verschiedenen Faktoren beeinflusst, die in komplexer, wechselseitiger Abhängigkeit zueinander stehen. Helmke und Weinert (1997; entnom­men aus Helmke, 1997, S. 203) gehen in ihrem Modell schulischer Leistung davon aus, dass sowohl Merkmale der Lernenden wie auch Faktoren der schulischen, außerschu­lischen und familiären Umwelt die Schulleistung bestim­men. Heller (1997, S. 185) schreibt dabei motivationalen Merkmalen, die wiederum, ebenso wie die Schulleistung, von den Kontextbedingungen beeinflusst werden, eine ver­mittelnde Funktion zwischen der Kognition (z. B. Vorwis­sen, IQ) und der aktuellen Schulleistung zu.

Aus diesen Annahmen zur Erklärung der schulischen Leis­tung im Allgemeinen wurde ein Modell zur Erklärung der Mathematikkompetenz am Ende der Grundschule abgelei­tet, das im vorliegenden Beitrag empirisch überprüft wird. Dabei wird der Frage nachgegangen, inwieweit familiäre, schulische und individuelle Merkmale unter Berücksichti­gung von Geschlecht und Migrationsstatus zur Aufklärung der Mathematikkompetenz beitragen können (s. Abbildung 2.2.1). Die folgenden Abschnitte gehen auf die wissen­schaftliche Befundlage der einzelnen Merkmale dieses Modells und deren Bedeutung für die Mathematikleistung näher ein.

Der Beitrag hat das Ziel, die Mathematikkompetenz von Grundschülerinnen und ­schülern auf der 4. Schulstufe zu erklären. In Anlehnung an Schulleistungsmodelle und auf Basis bisheriger Ergebnisse wird ein Modell abgeleitet, das die Bedeutung familiärer, schulischer und individueller Merkmale für die Mathematikkompetenz untersucht. Die an­genommenen Strukturen werden empirisch mit den TIMSS­2011­Daten überprüft. Die Analysen zeigen, dass der Zu­sammenhang zwischen sozioökonomischen Merkmalen der Eltern und der Mathematikleistung der Kinder vor allem indirekt, beispielsweise über kulturelle Ressourcen, vermittelt wird. Bei den Geschlechtereffekten ist vor allem das deutlich höhere Vertrauen der Buben in ihre Mathematikkompetenz trotz vergleichbarer familiärer Rahmenbedingungen her­vorzuheben. Ihr tatsächlicher Leistungsvorsprung in Mathematik ist jedoch nur gering. Eine geringe Leistungsdifferenz bei gleichen Rahmenbedingungen gilt auch für Kinder mit und ohne Migrationshintergrund. Insgesamt kann durch das Modell ein wesentlicher Anteil an Leistungsunterschieden in Mathematik (41 %) erklärt werden, dessen Konsequenzen für Wissenschaft und Unterrichtspraxis am Ende des Beitrags diskutiert werden.

Familiäre und schulische Sozialisationseinflüsse

Kognitive Merkmale der Lernenden

Motivationale Merkmale der Lernenden

Mathematikkompetenz

Exogene Merkmale:GeschlechtMigrationsstatus

Abbildung 2.2.1: Rahmenmodell zur Erklärung der Mathematikleistung (eigene Illustration basierend auf Helmke & Weinert [1997] und Heller [1997])

Page 88: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

86 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz

Mathematikkompetenz und Merkmale der Lernenden

Im Hinblick auf die Lernenden spielen sowohl kognitive als auch motivationale Merkmale1 eine Rolle für die Ent­wicklung von Mathematikkompetenz. Als wichtigstes Merkmal zur Erklärung der Mathematikkompetenz gelten nach wie vor kognitive Merkmale der Lernenden. Neben der kognitiven Fähigkeit im Allgemeinen (numerische, räumliche, sprachliche Intelligenz etc.; z. B. Weinert & Stefanek, 1997) hat dabei insbesondere das Vorwissen der Schüler/innen eine wichtige Funktion (Helmke & Weinert, 1997). Umso mehr Vorwissen Schüler/innen in einem Un­terrichtsfach mitbringen (z. B. zu Beginn des Schuljahrs), desto höher ist deren Leistung in diesem Fach (z. B. am Ende des Schuljahrs). Daher ist davon auszugehen, dass die mathematische Kompetenz, die Kinder vor dem Ein­tritt in die Grundschule aufweisen (= Vorwissen), eine hohe Erklärungskraft für die Kompetenz am Ende der Grund­schule besitzt. Vorwissen und Intelligenz hängen dabei eng zusammen, da die Intelligenz – neben zahlreichen weiteren Faktoren (z. B.: Förderung im Elternhaus) – am Aufbau des Vorwissens beteiligt ist (z. B. Gröhlich, 2012; Grube & Hasselhorn, 2006; Weinert & Helmke, 1995).

Im Vergleich dazu ist die Erklärungskraft der motivationalen Faktoren der Lernenden als geringer einzustufen. Dennoch dürfen sie für die Leistungsentwicklung nicht vernachlässigt werden, da sie das Lernverhalten steuern und somit indirekt ebenfalls die Leistung beeinflussen. Als sehr fruchtbar zur Erklärung der schulischen Lernmotivation hat sich dabei das Erwartungs­Wert­Modell (Eccles et al., 1983; Wigfield & Eccles, 2000) erwiesen. Entsprechend diesem Modell entsteht Motivation dann, wenn eine Situation als kon­trollierbar (erwartbar) und als wertvoll eingeschätzt wird. Das schulische Fähigkeitsselbstkonzept und die schulische Selbstwirksamkeitsüberzeugung haben sich bei diesem Mo­dell als wichtige motivationale Merkmale durchgesetzt, wel­che die Erwartungskomponente des Modells widerspiegeln. Im Hinblick auf die Wertkomponente werden intrinsische und extrinsische Wertzuschreibungen unterschieden: Inter­esse (intrinsisch), Nützlichkeit (extrinsisch) und Wichtigkeit (subjektiver Wert). Gemäß der Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) ist eine intrinsische oder eine identifizierte (subjektiv wertvolle) Motivations­lage der rein extrinsischen Motivation vorzuziehen. Intrin­sisch und subjektiv wertvolle Motivationslagen (auch als autonome Motivationslagen bezeichnet) gehen häufiger mit einem optimalen Lernverhalten einher, wie beispielsweise tiefergehenden Lernstrategien, einer längeren Aufmerksam­keitsspanne, einer größeren Anstrengungsbereitschaft sowie

einer höheren Mitarbeit (Hagenauer & Hascher, 2011), und lösen auch häufiger positive Emotionen aus (z. B. Lern­freude, Hagenauer, 2011).

Mathematikkompetenz und Unterrichtsgestaltung

Unterricht kann auf verschiedenen Ebenen beschrieben werden, die wiederum von mehreren Merkmalen gekenn­zeichnet sind. So unterscheiden Helmke, Hosenfeld und Schrader (2002) Merkmale der Unterrichtsqualität (z. B. Klarheit, Strukturiertheit), der Unterrichtsquantität (Zeit­nutzung im Unterricht), der Lehrerpersönlichkeit (z. B. Engagement, Enthusiasmus) und des Lehr­Lern­Materials (z. B. individualisierte Aufgabengestaltung). Diese Unter­richtsfaktoren tragen alle für sich, jedoch in unterschiedlich starkem Ausmaß, zur Leistungsentwicklung der Schüler/innen bei. Das Angebots­Nutzungs­Modell, entwickelt von Helmke (2000; entnommen aus Helmke, Hosenfeld & Schrader, 2002, S. 426), geht davon aus, dass die Ange­bote des Unterrichts allerdings nicht direkt auf die Schul­leistung der Schüler/innen wirken, sondern diese durch das Nutzungsverhalten der Schüler/innen (z. B. aktive Lernzeit, Engagement) und deren Motivationslage vermittelt wird. Lehrkräfte können demnach im Unterricht zwar geziel­te Angebote setzen (z. B. innere Differenzierung bei der Aufgabengestaltung), die Auswirkung dieses Angebots auf die schulische Leistung hängt jedoch nicht nur von dessen Qualität ab, sondern auch davon, wie dieses von den Schü­lerinnen und Schülern genutzt wird, und ob es in der Lage ist, Schüler/innen motivational anzusprechen.

Diese motivationale Anregung gelingt entsprechend der oben bereits angeführten Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) durch die Erfüllung der drei psychologischen Grundbedürfnisse – der Bedürfnisse nach Autonomie, Kompetenz und Eingebundenheit. Das Bedürfnis nach Autonomie kann durch eine autonomie­unterstützende Lernumgebung gefördert werden, die sich beispielsweise durch wenig kontrollierendes Verhalten der Lehrperson, das Gewähren von Freiräumen/Wahlmöglich­keiten und auch durch das Aufzeigen der Relevanz von Inhalten charakterisiert. Kompetenzerleben kann durch das Ermöglichen von Erfolgen für alle Schüler/innen, z. B. durch individualisierte Aufgabengestaltung, unterstützt werden, während das Gefühl der Eingebundenheit auf positiven Lehrer­Schüler­Beziehungen sowie auf positiven Schüler­Schüler­Beziehungen aufbaut (Reeve, Bolt & Cai, 1999). Klieme et al. (2006, S. 131) subsumieren all jene Methoden, die auf die Erfüllung der Grundbedürfnisse und

1 Geht es darum, Schüler/innen zu motivieren, wird in der Forschung zwischen Motivation (z. B. Interesse an Mathematik) und Emotionen (Freude an Mathe­ matik) unterschieden (Wild & Möller, 2014). In diesem Beitrag werden auch emotionale Faktoren, z. B. Freude an Mathematik, unter dem Begriff „motiva­tionale Merkmale“ subsumiert. Diese sprachlich vereinfachte Darstellung erscheint sinnvoll, da aus Forschungsarbeiten bekannt ist, dass Motivationskonst­rukte, wie z. B. das schulische Interesse (Krapp, 2009), neben persönlicher Bedeutsamkeit ebenso eine emotionale Komponente (positive Gefühle) enthalten.

Page 89: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 87

somit auf die Erhöhung der Schülermotivation abzielen, unter dem Begriff „unterstützendes Unterrichtsklima“. Die­ses ist abzugrenzen von weiteren – vordergründig auf die Förderung der Kognition gerichteten – Dimensionen der Unterrichtsqualität (z. B. kognitive Aktivierung).

Mathematikkompetenz und das Elternhaus

Neben der schulischen Umwelt spielt entsprechend dem Modell auch das Elternhaus eine bedeutende Rolle für die Entwicklung der Mathematikkompetenz. Die Leis­tungsentwicklung in Mathematik beginnt bereits vor dem Grundschulalter (im Überblick, siehe z. B. Krajewski, Grüßling und Peter­Koop, 2009) und dem Elternhaus als primärer Sozialisationsinstanz kommt hier eine zentrale Schlüssel rolle zu. Weinert und Helmke (1997) konnten in der SCHOLASTIK­Grundschulstudie zeigen, dass Kinder ihren Leistungsrückstand zu Beginn der Grundschulzeit während der Grundschulzeit nicht mehr aufholen konnten, d. h. Leistungspositionen bleiben im Grundschulalter relativ stabil (siehe auch Grube & Hasselhorn, 2006), weshalb die mathematische Frühförderung im Elternhaus und/oder auch die externe Frühförderung, z. B. in Kindergärten, wesentlich für die Leistungsentwicklung ist.

Familiäre Einflüsse können hinsichtlich struktureller und prozessualer Aspekte unterschieden werden. Die struktu­rellen Merkmale umfassen Statusmerkmale, wie z. B. Bil­dungsabschluss und Beruf der Eltern. Prozessuale Faktoren fokussieren auf den Prozess beim Erwerb von Mathematik­kompetenz, wie z. B. die Qualität der elterlichen Unterstüt­zung beim Lernen, Frühförderung im Elternhaus oder auch gemeinsame kulturelle Aktivitäten etc. (für ein entspre­chendes Modell siehe Ehmke & Siegle, 2008, S. 256). Die Bedeutung der Statusmerkmale für die schulische Leistung der Kinder gilt als vielfach belegt, lediglich die Stärke des Einflusses ist länderspezifisch unterschiedlich. Österreich zählt dabei zu jenen Ländern mit den größten Chancen­ungleichheiten (Bruneforth, Weber, & Bacher, 2013). Bereits in TIMSS 2007 konnte ein enger Zusammenhang zwischen der Herkunft des Kinds und dessen Leistung in Mathematik festgestellt werden: Schwache Leistungen wer­den überdurchschnittlich häufig von Kindern aus Familien mit geringem sozialem Status erbracht (Bergmüller, 2010). Nach Bourdieu (1983) werden diese Rückstände in der Leis­tung durch Benachteiligung in den frühen Sozialisations­erfahrungen, basierend auf Unterschieden im Vorhanden­sein kultureller Ressourcen und kultureller Praxis, ausgelöst.

Die Befunde bezüglich der Relevanz der Prozessmerkmale der familiären Umwelt für die Leistungsentwicklung der Kinder sind weniger eindeutig. Während sich eine anregende häusliche Umwelt positiv auf die Kompetenzentwicklung der Kinder auszuwirken scheint, gibt es eine weniger konsis­tente Befundlage im Hinblick auf die elterliche Lernunter­

stützung. Diese scheint nicht per se positiv auf die Leistung der Kinder zu wirken, sondern von der Qualität der Unter­stützungsleistung der Eltern bestimmt zu werden (Niggli et al., 2007).

Mathematikkompetenz in Abhängigkeit von Geschlecht und Migrationsstatus

Eine Vielzahl an empirischen Studien illustriert, dass Mäd­chen im Vergleich zu Buben eine geringere Schulleistung in Mathematik aufweisen und auch deren motivationale Merkmale weniger positiv ausgeprägt sind (z. B. Faber, Tiedemann & Billmann­Mahecha, 2011; Rustemeyer & Fischer, 2007). Dieser Unterschied zeigt sich bereits in der Grundschule. So weisen Mädchen beispielsweise ein ge­ringeres Selbstkonzept in Mathematik auf, zeigen weniger Lernfreude (Helmke, 1993, 1997) und messen der Mathe­matik weniger Wert bei (Wigfield et al., 1997). Während die Unterschiede in motivationalen Faktoren relativ hoch sind, sind die tatsächlichen Leistungsunterschiede zwischen Mädchen und Buben in der Grundschule relativ gering aus­geprägt, wie eine Metaanalyse aus Deutschland, die Studien zwischen 1991 und 2008 umfasst, aufzeigt (Mücke, 2009). Ähnlich geringe Unterschiede in der Mathematikkompetenz zugunsten der Buben bestätigen sich im amerikanischen Raum (Hyde, Fennema & Lamon, 1990). Ebenso lassen sich in Österreich in TIMSS 1995, 2007 und 2011 die bes­seren Leistungen der Buben in Mathematik belegen, jedoch auch hier basierend auf einer (relativ) kleinen Effektstärke von 0.15 (1995, 2011) bzw. 0.20 (2007) (Cohen, 1988; Wallner­Paschon, 2010; 2012). Die Unterschiede in der Mathematikkompetenz zwischen den Geschlechtern ver­größern sich jedoch im Laufe der Schulzeit, einhergehend mit einem Anstieg der Unterschiede im mathematischen Interesse und Selbstkonzept. Dies kann zur Folge haben, dass Mädchen weniger häufig Mathematik als Schwer­punktfach in der Oberstufe oder als Studienfach wählen als Buben (Köller, Daniels, Schnabel & Baumert, 2000).

Neben dem Geschlecht spielt auch der Migrationsstatus der Schüler/innen eine Rolle in der Erklärung der Mathema­tikleistung. Aus bisherigen Studien ist bekannt, dass Mig­rantinnen und Migranten durchschnittlich eine schlechtere Leistung in Mathematik zeigen als Schüler/innen ohne Migrationshintergrund. Dabei hängen Migrationsstatus und Mathematikleistung stärker zusammen als Geschlecht und Leistung. In Deutschland konnten Bos et al. (2003; zitiert nach Heinze et al. 2007) belegen, dass Migranten­kinder eine etwa um ein Schuljahr schlechtere Mathema­tikleistung erbringen als ihre einheimischen Klassenkame­radinnen und Klassenkameraden. Auch Breit und Wanka (2010) errechneten einen Kompetenzunterschied von 44 Punkten für Österreichs Grundschüler/innen mit und ohne Migrationsstatus (TIMSS 2007; S. 101).

Page 90: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

88 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz

Neben den familiären und kulturellen Hintergrundmerk­malen, anhand derer sich Migrantenkinder häufig von einheimischen Schülerinnen und Schülern unterscheiden, wird insbesondere der Sprachbeherrschung im Hinblick auf die Entwicklung der Mathematikkompetenz eine wesent­liche Funktion zugeschrieben, denn auch die Erbringung guter Leistungen in Mathematik setzt eine gute Sprach­beherrschung voraus. Heinze, Herwartz­Emden und Reiss (2007) konnten die signifikante Korrelation (r = .35) zwi­schen dem Sprachstand und der Mathematikleistung in der Grundschule empirisch absichern. Wurde der Sprach­stand kontrolliert, zeigten sich keine weiteren Unterschie­de in der Mathematikleistung zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund. Während Migrantenkinder durchschnittlich schlechtere Leistungen in Mathematik zeigen, weisen sie im Vergleich zu den ein­heimischen Gleichaltrigen jedoch eine höhere Motivation auf (z. B. Faber, Tiedemann & Billmann­Mahecha, 2011; Helmke & Reich, 2001). Durchgehend berichten Kinder mit Migrationshintergrund in diversen Studien im deutsch­sprachigen Raum von einem höheren Selbstkonzept in Mathematik, obwohl sie in den (standardisierten) Mathe­matiktests schlechtere Leistungen erbringen.

Forschungsanliegen und Ableitung des Vorhersagemodells

Aufbauend auf dem theoretischen Rahmenmodell der schu­lischen Leistung (s. Abbildung 2.2.1) und der empirischen Befundlage zu den Prädiktoren wird im Folgenden das zu tes­tende Wirkmodell zur Erklärung der Mathematikkompetenz näher beschrieben. Abbildung 2.2.2 zeigt dieses empirisch überprüfbare Wirkmodell, das zentrale Annahmen der For­schung über die Zusammenhänge von motivationalen In­dividualmerkmalen und schulischen Merkmalen sowie die Relevanz familiärer Struktur­ und Prozessmerkale integriert. Primäres Ziel der Analyse ist es, die Wirkung dieser Merkmale auf die Mathematikkompetenz der österreichischen Schüler/innen darzustellen. Konkret sollen mit dem vorliegenden Pfadmodell folgende Forschungsfragen beantwortet werden:

1. Inwieweit ist der in Österreich relativ starke Zusam­menhang zwischen Schulbildung und Beruf der Eltern und der Mathematikleistung der Kinder durch indirekte Effekte vermittelt?

2. Welche familiären, schulischen und individuellen Merk­male wirken sich direkt auf motivationale Merkmale in Mathematik sowie auf die Mathematikleistung aus?

3. In welchen Bereichen zeigen sich Geschlechter­ und Migrationseffekte?

Der Modellaufbau erfolgt chronologisch nach dem zeit­lichen Ablauf der Sozialisation. Die Anordnung der moti­vationalen Merkmale erfolgt theoriegeleitet entsprechend dem Erwartungs­Wert­Modell nach Eccles et al. (1983).

Die Modellannahmen lassen sich wie folgt skizzieren:

Als wichtiges Ausgangsmerkmal gelten die familiären Struk­turmerkmale. Sie umfassen die Bildungsnähe sowie den Beruf der Eltern im Modell. Entsprechend der Theorie von Bourdieu (1983) wird angenommen, dass diese sozioökono­mischen Faktoren indirekt über familiäre Prozessmerkmale wie kulturelle Ressourcen zu Hause und die kulturelle Praxis in der Familie (z. B. Theater­ und Museumsbesuche) auf die Mathematikkompetenz der Schüler/innen wirken. Als rele­vante Merkmale kultureller Ressourcen sind die Leseressour­cen (ermittelt über den Besitz von Büchern), der Besitz eines Musikinstruments im Haushalt sowie das (Nicht­)vor­handensein eines eigenen Fernsehers im Kinderzimmer im Modell berücksichtigt. Als Indikator für die kulturelle Praxis wurde die familiäre mathematische Frühförderung im Mo­dell integriert. Es wird angenommen, dass der Zusammen­hang zwischen strukturellen Merkmalen (Schulbildung und Beruf der Eltern) und der Schulleistung der Kinder nicht nur direkt, sondern primär indirekt über die familiären Prozess­merkmale gebildet wird. Das für die Leistungsentwicklung überaus bedeutende Vorwissen der Schüler/innen geht mit dem Merkmal Mathematikfähigkeit zu Schulbeginn in das Modell ein. Da die Leistungspositionen im Grundschul­alter relativ stabil bleiben und ein zu Schulbeginn feststell­barer Leistungsrückstand in der Regel nicht mehr aufgeholt wird, werden deutliche Effekte des Vorwissens auf die Ma­thematikkompetenz auch noch am Ende der Grundschule erwartet. Es wird angenommen, dass sich das mathematische Wissen zu Schulbeginn sowohl direkt als auch indirekt über gute Noten und hohe Ausprägungen bei den motivationalen Merkmalen positiv auf die Mathematikleistung auswirkt.

Die Berücksichtigung der Unterrichtsqualität im Modell erfolgt über die beiden Merkmale autonomiegestützter und anregender Mathematikunterricht aus Schülersicht. Beide Merkmale sollen entsprechend der Selbstbestimmungsthe­orie der Motivation vor allem motivationsfördernd wirken. Es wird deshalb postuliert, dass diese Unterrichtsmerkmale primär positive Effekte auf die motivationalen Merkmale im Modell zeigen und keine bzw. nur geringfügige direkte Effekte auf die Mathematikleistung.

Als nächste Dimension werden die motivationalen Merk­male (mathematisches Selbstkonzept, Freude an Mathema­tik und subjektiver Wert der Mathematik) in das Modell integriert. Aufgrund der Annahme des Erwartungs­Wert­Modells wird zuerst das Selbstkonzept als Erwartungskom­ponente aufgenommen und anschließend die Freude an Mathematik sowie der subjektive Wert der Mathematik, die beide die Wertkomponente abbilden. Das Selbstkon­zept entwickelt sich im Laufe der Grundschulzeit und wird von vorausgegangenen Leistungsvergleichen und Leistungs­rückmeldungen wie beispielsweise durch Noten beeinflusst. Die Wertekomponente des Modells wird u. a von der Ein­schätzung des eigenen Könnens (Selbstkonzept) bestimmt. Entsprechend der Modellannahme wird davon ausgegan­

Page 91: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 89

gen, dass das mathematische Selbstkonzept sowohl direkt als auch über die Freude und den subjektiven Wert einen positiven Effekt auf die Mathematikleistung hat. Darüber hinaus werden auch direkte positive Effekte der Wertekom­ponente auf die Leistung erwartet.

Aufgrund der signifikanten, aber praktisch kaum relevanten Geschlechterunterschiede zugunsten der Buben am Ende der Grundschule (Wallner­Paschon, 2012) werden nur ge­ringe Geschlechtereffekte bei der vorschulischen Förderung in Mathematik sowie der Mathematikfähigkeit zu Schul­beginn angenommen. Deutlichere Effekte zugunsten der Buben werden bei den motivationalen Merkmalen erwar­tet. Es wird davon ausgegangen, dass Buben trotz gleicher familiärer Rahmenbedingen ein höheres Selbstkonzept und mehr Freude an Mathematik haben als Mädchen und dar­über hinaus der subjektive Wert der Mathematik bei ihnen höher ist. In Bezug auf den Migrationshintergrund werden die aus anderen Studien bereits bekannten Effekte – hohe Motivation bei gleichzeitig geringerer Leistung – erwartet.

Methodischer Zugang

Untersuchungsvariablen

Als Indikator für den sozioökonomischen Status wurden die Elternangaben im Fragebogen über deren Bildungsnähe und den beruflichen Status herangezogen.

Die elterliche Bildungsnähe wurde aus den Elternangaben zu ihrer Schulbildung ermittelt. Der Index Höchste Schul­ bildung der Eltern untergliedert sich in die vier Kategorien (1) max. Pflichtschule, (2) Lehre/berufsbildende mittlere Schule/Meisterprüfung, (3) Matura und (4) akademischer Abschluss. Zur Indexbildung wurde jeweils der höchste Bil­dungsabschluss der beiden Elternteile verwendet.

Das Merkmal Höchste berufliche Position der Eltern unter­gliedert sich in sechs Kategorien: (1) nie einer beruflichen Tätigkeit nachgegangen, (2) Arbeiter, (3) Facharbeiter, (4) Angestellte, (5) Kleinunternehmer sowie (6) Fachkräfte (Akademiker/innen, Techniker/innen und Führungskräfte). Bei Unterschieden zwischen den beiden Elternteilen wurde jeweils der höhere Statuswert berücksichtigt.2

Die Operationalisierung der Leseressourcen erfolgte über zwei Fragen im Elternfragebogen (Cronbachs Alpha = .85). Zum einen wurde nach dem Buchbesitz zu Hause allge­mein, zum anderen nach dem Besitz von Kinderbüchern gefragt. Als Antwortkategorien standen fünf Möglichkeiten zur Auswahl: 0–10 Bücher, 11–25, 26–100, 101–200 und über 200 Bücher. Bei den Kinderbüchern konnten Eltern zwischen 0–10, 11–25, 26–50, 51–100 und über 100 Bücher wählen. Fehlende Elternangaben bei den Kinder­büchern zu Hause wurden durch die Angaben ihrer Kinder im Schülerfragebogen ergänzt.

Die Frage, ob es zu Hause ein Musikinstrument gibt (aus dem Schülerfragbogen), wird als Dummy­Kodierung (1 = es

2 Die berufliche Position der Eltern wurde im Fragebogen etwas detaillierter auf Nominalskalen­Niveau abgefragt und für Österreich zu sinnvollen Kategori­en auf Ordinalskalen­Niveau rekodiert. Die Ordinalität dieses Merkmals (also ob ein Kleinunternehmer tatsächlich eine höhere berufliche Position als ein Angestellter hat) wurde nicht überprüft bzw. konnte im Rahmen der vorliegenden Untersuchung mit den vorhandenen Daten auch nicht überprüft werden.

Leseressourcen

Mathe- fähigkeiten

zu Schulbeginn

Anregender Mathematik-

unterricht Beruf der Eltern

.44

Note in Mathematik

Mathematisches Selbstkonzept

Fernseher

Musikinstrument

Subjektiver Wert der Mathematik

Mathematische Frühförderung

Autonomiege- stützter

Mathematik- unterricht

Freude an Mathematik

Migrations- hintergrund Geschlecht

Schulbildung der Eltern

FamiliäreStrukturen

Familiäre Prozesse Schulische Merkmale

IndividuelleMerkmale

Mathematik- kompetenz

Abbildung 2.2.2: Empirisches Prüfmodell der Untersuchung

Page 92: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

90 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz

gib ein Musikinstrument; 0 = es gibt kein Musikins trument) im Modell verwendet. Die Frage zum eigenen Fernseher (im Kinderzimmer) geht ebenfalls als Dummy­Kodierung in das Modell ein (1 = eigener Fernseher, 0 = kein eigener Fernseher).

Das Merkmal familiäre mathematische Frühförderung um­fasst Fragen zu familiären Aktivitäten vor dem Schulein­tritt, wie Zahlenreime sprechen, Abzähllieder singen oder verschiedene Dinge zählen. Die Fragen stammen aus dem Elternfragebogen und wurden mit den vorgegebenen Antwortkategorien nie oder fast nie, manchmal und oft erhoben. Es handelt sich dabei um eine nach der Item­Response­Theorie (IRT) konstruierte Skala.3 Die interne Konsistenz als Qualitätsmerkmal der Skala mit insgesamt 5 Items kann mit einem Cronbachs­Alpha­Wert von .68 als ausreichend beurteilt werden.

Beim Merkmal Mathematikfähigkeit zu Schulbeginn handelt es sich ebenfalls um ein IRT­skaliertes Merkmal, das auf sechs Statements im Elternfragebogen zu einfachen mathe­matischen Fertigkeiten der Kinder bei Schulbeginn basiert. Diese Fertigkeiten inkludieren das Zählen, das Erkennen von Formen (z. B. Dreieck, Kreis) und von geschriebenen Zahlen, das Schreiben von Zahlen sowie das einfache Addieren und Subtrahieren. Die Qualität der Skala kann mit einem Cronbachs­Alpha­Wert von durchschnittlich .76 als gut beurteilt werden. Es ist jedoch darauf hinzuweisen, dass es sich hier um keinen objektiven Test zum Vorwis­sen handelt, sondern um eine retrospektive Einschätzung seitens der Eltern.

Die nationale Skala zum autonomiegestützten Mathematik­unterricht besteht aus sechs Items (z. B. „Bei einer neuen Aufgabe darf ich selber probieren, wie das funktioniert.“) und wird im Kapitel Innere Differenzierung im Mathema­tikunterricht 4.3 im Detail beschrieben.

Beim anregenden Mathematikunterricht (IRT, Cronbachs Alpha = .68, 5 Items) handelt es sich um ein Merkmal, bei dem vor allem die wahrgenommene Instruktionsqualität bzw. die Strukturiertheit des Unterrichts (z. B. „Ich weiß, was meine Lehrerin von mir erwartet.“) sowie die moti­vationale Aktivierung (z. B. „Mich interessiert, was meine Lehrerin sagt.“) thematisiert wird.

Als Note in Mathematik ging ein Durchschnittswert der Eltern­ und Schülerangaben zur Mathematiknote im letz­ten Semesterzeugnis ein.

Die drei motivationalen Merkmale mathematisches Selbst­konzept, Freude an Mathematik und der subjektive Wert der

Mathematik basieren auf vierstufigen Likertskalen mit den Antwortkategorien „Stimme überhaupt nicht zu“, „Stimme eher nicht zu“, „Stimme eher zu“ und „Stimme völlig zu“. Das Merkmal mathematisches Selbstkonzept (IRT) wurde über sieben Aussagen (z. B. „Normalerweise bin ich gut in Mathematik.“, „Mathematik fällt mir schwerer als vielen Kindern meiner Klasse.“) erhoben (Cronbachs Alpha = .87). Das Merkmal Freude an Mathematik (IRT) beruht auf fünf Statements (z. B. „Ich lerne gern Mathematik.“, „Mathe matik ist langweilig.“). Die Qualität der Skala ist mit einem Cronbachs­Alpha­Wert von durchschnittlich .89 als sehr gut zu beurteilen. Der subjektive Wert der Mathematik wurde durch folgende zwei Items ermittelt: (1) Es ist wich­tig, gut in Mathematik zu sein. (2) Für meine Zukunft ist es notwendig, gut rechnen zu können. Die Qualität der Skala mit einem Cronbachs Alpha von .65 ist noch ausreichend. Die bei TIMSS eingesetzten Indikatoren zur Messung des Selbstkonzepts erfassen die Bewertung der eigenen Fähig­keiten (evaluative Komponente), ohne den emotionalen Anteil des Selbstkonzepts zu berücksichtigen. Deshalb kann im Modell sehr gut zwischen der Erwartungskomponente (Selbstkonzept) und der Wertkomponente (Freude an Mathematik und subjektive Bedeutung des Fachs) differen­ziert werden.

Sowohl der Migrationshintergrund (1 = mit Migrations­hintergrund, 0 = ohne Migrationshintergrund) als auch das Geschlecht (1 = Mädchen, 0 = Buben) gehen als Dummy­Variable in das Modell ein.4 Der Migrationshintergrund der Kinder definiert sich über das Geburtsland der Eltern. Demnach haben Kinder ohne Migrationshintergrund Eltern, die beide im Inland geboren wurden, und jene mit Migrationshintergrund haben zumindest einen Elternteil, der im Ausland geboren wurde.

Auswertungsverfahren

Für die Analyse der Wirkungszusammenhänge der fami­liären, schulischen und individuellen Merkmalsbereiche wurde ein Pfadmodell in Mplus 7 (Muthén & Muthén, 1998–2012) berechnet. Dabei wurden entsprechend der Fragestellung Regressionspfade von den beiden Struktur­merkmalen über die familiären Prozessmerkmale und indi­viduellen Merkmale zur Mathematikkompetenz modelliert und ebenso von den Prozessmerkmalen über die individu­ellen Merkmale zur Mathematikkompetenz. Darüber hin­aus wurden auch Pfade von den Unterrichtsmerkmalen zu den individuellen Merkmalen und zur Mathematikleistung spezifiziert (s. Abbildung 2.2.2). Interkorrelationen zwi­schen den im Modell untereinanderstehenden Merkmalen wurden im Modell berücksichtigt, aber grafisch nicht dar­

3 Dabei wurde das Partial­Credit­Modell als Erweiterung des Rasch­Modells eingesetzt. Details zur Skalierung der Merkmale bei PIRLS & TIMSS 2011 sind im internationalen Technischen Bericht (Martin & Mullis, 2012) dokumentiert.

4 Zum einen zeigen sich dadurch die Effekte der familiären und schulischen Sozialisation um den Migrations­ und Geschlechtereffekt bereinigt und zum anderen kann überprüft werden, inwieweit der Migrationshintergrund und das Geschlecht unter Einbeziehung aller Modellvariablen einen eigenständi­gen und unabhängigen Einfluss haben.

Page 93: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 91

gestellt. Nicht statistisch signifikante Pfade im Modell wurden zugelassen und nicht auf null gesetzt. Zur Beur­teilung der Modellanpassung wurden der „Comparative Fit Index“(CFI) und der „Standardized Root Mean Square Residual“ (SRMR) herangezogen. Ein Modell weist eine zu­friedenstellende Anpassung auf, wenn der CFI nahe bei 1 liegt sowie SRMR < .11 ausfallen (Bühner, 2011). Aufgrund der individualpsychologischen Fragestellung wurde auf die Modellierung eines Mehrebenenmodells verzichtet. Die mit der Ziehung von Schulklassen verbundene hierarchische Struktur der Daten wurde in der Spezifikation des Modells (Analyseoption Type = Complex in Mplus) berücksichtigt. Dabei verwendet das Programm Mplus standardmäßig den Full­Information­Maximum­Likelihood­Algorithmus (FIML), der die Behandlung der fehlenden Werte und die Parameterschätzung des Modells in einem gemeinsamen Schritt vornimmt (Lüdtke et al., 2007). Bei dieser Metho­de werden keine fehlenden Werte imputiert oder geschätzt, sondern die Schätzung der Populationsparameter und ihrer Standardfehler wird auf der Basis der vorhandenen Daten vorgenommen (Lüdtke et al., 2007). Die Stichprobengröße, auf der das Pfadmodell beruht, beträgt demnach N = 4668.

Die Berechnung der indirekten Effekte erfolgte ebenfalls mit Mplus und mit den oben angeführten Analyseoptio­nen. Die Imputation der fünf Plausible Values ist jedoch bei

der Berechnung indirekter Effekte nicht möglich, weshalb die Analysen für jeden der fünf Plausible Values getrennt gerechnet und gemittelt wurden.

Ergebnisse

In Abbildung 2.2.3 sind die statistisch geprüften Wirkungs­zusammenhänge graphisch dargestellt. Bevor die Ergebnisse dieses Modells näher beschrieben werden, wird ausgeführt, wie dieses Modell zu lesen und zu verstehen ist:

Die Pfeile symbolisieren die direkten Effekte und zeigen in Richtung der abhängigen bzw. zu erklärenden Variablen. Der Pfeil von der höchsten Schulbildung der Eltern auf die Leseressourcen bedeutet beispielsweise, dass die Anzahl der Bücher direkt von der Schulbildung der Eltern abhängt. Bei den eingetragenen Effekten handelt es sich um partielle, standardisierte Effekte (standardisierte Beta­Koeffizienten), die ab einem Absolutbetrag von größer/gleich .10 inhalt­lich bedeutsam sind und im Modell eingetragen wurden. Die links stehenden Merkmale fungieren dabei immer als erklärende Variablen (Prädiktoren) für die jeweils rechts stehenden Merkmale, d. h. die hier dargestellten Effekte sind bereits um die Wirkung aller anderen Variablen, die

Leseressourcen (Bücher) R2 = .34

Mathe- fähigkeiten

zu Schulbeginn

R2 = .10

Mathematik- kompetenz

R2 = .41

.41

.17

.23

.26

.20 .12

–.19

Freude an Mathematik

R2 = .43

.29

.10 –.11

.16

Höchste berufliche Position der Eltern .22

–.15 –.10

.44

.16 .28

Note in Mathematik

R2 = .22

–.15 –.13

–.20

–.30

Mathematisches Selbstkonzept

R2 = .34

Eigener Fernseher R2 = .06

Musikinstrument R2 = .11

Subjektiver Wert der Mathematik

R2 = .14

–.12

.26

–.43

.26

Kind ist Mädchen Migrations- hintergrund

Familiäre Mathematische Frühförderung

R2 = .09

Autonomiege- stützter

Mathematik- unterricht R2 = .02

–.30

–.26

.13

.12

.44

Höchste Schulbildung der Eltern

–.11 .13

–.18

.33

Eingetragen sind standardisierte Effekte (standardisierte Beta-Koeffizienten), ab .10.Direkte Effekte auf die Leistung sind blau, Migrationseffekte grün und Geschlechtereffekte rot hervorgehoben. Indizes der Modellgüte: CFI = 0,884; SRMR = 0.060

FamiliäreStrukturen Familiäre Prozesse

Schulische Merkmale

IndividuelleMerkmale

–.14

Anregender Mathematik-

unterricht R2 = .07

Abbildung 2.2.3: Erklärungsmodell zur Mathematikleistung (TIMSS 2011)

Page 94: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

92 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz

weiter links davon stehen, bereinigt und wirken unabhängig davon (partielle Effekte).

Durch die Pfadanalyse können nicht nur direkte Pfade und damit die spezifische Wirkung eines Prädiktors auf eine ab­hängige Variable in Form von standardisierten Beta­Koeffi­zienten gezeigt werden, sondern es ist auch eine Schätzung der gemeinsamen Wirkung aller Prädiktoren auf ein Merk­mal möglich. Diese Wirkung wird in Form des Determina­tionskoeffizienten (R2) ausgedrückt, der den Anteil erklärter Varianz aller (links stehenden) Prädiktoren für die jeweils abhängige Variable angibt. Das in der Abbildung angege­bene R2 von .34 beim Merkmal Leseressourcen bedeutet, dass 34 % der Streuung des Merkmals Bücher­ und Kin­derbücher zu Hause (Leseressourcen) durch die links davon stehenden Merkmale (Schulbildung der Eltern, berufliche Position der Eltern) aufgeklärt werden können.

Bei der Ergebnisinterpretation werden nun einleitend jene Merkmale dargestellt, die einen direkten Einfluss auf die Mathematikleistung der österreichischen Kinder haben. Für die Mathematikkompetenz, deren Varianz zu 41 % durch das Modell erklärt werden kann, zeigen sich unter den hier berücksichtigten Merkmalen insgesamt sechs direkte Ein­flussgrößen (s. blaue Pfade in Abbildung 2.2.3):

Die erste Einflussgröße sind die Leseressourcen in Form der Anzahl an (Kinder­)Büchern im Haushalt, die trotz Berück­sichtigung der anderen Merkmale im Modell einen positi­ven Effekt auf die Mathematikkompetenz der Schüler/in­nen haben. Auch ein eigener Fernseher (im Kinderzimmer) zeigt bei Kontrolle der übrigen Merkmale einen deutlichen negativen Effekt auf die Mathematikleistung. Ebenso zei­gen die mathematischen Fähigkeiten zu Schulbeginn noch am Ende der Grundschule einen positiven Effekt auf die Mathematik leistung. Auf der Unterrichtsebene geht der autonomiegestützte Mathematikunterricht mit schlechteren

Leistungen in Mathematik einher (Erklärung s. unten). Die deutlichsten Effekte zeigen sich bei den Noten und dem mathematischen Selbstkonzept. Erwartungsgemäß sind gute Noten sowie ein hohes mathematisches Selbstkonzept mit besseren Leistungen in Mathematik verbunden.

Die weitere Ergebnisinterpretation erfolgt der chronolo­gischen und theoriegeleiteten Modellierung entsprechend von links nach rechts. Das postulierte Modell hat sich im Wesentlichen bestätigt und stellt sich wie folgt dar:

Die strukturellen Familienmerkmale (Schul­ und Berufs­bildung der Eltern) haben unter Berücksichtigung der Modellmerkmale keinen direkten Effekt (<0.10) auf die Mathematikkompetenz. Beide Merkmale wirken primär indirekt über das kulturelle Kapital (Leseressourcen, Musik­ instrument im Haushalt oder Fernseher im eigenen Zim­mer) und über die Schulnoten und das mathematische Selbstkonzept auf die Mathematikleistung. Somit lässt sich der relativ starke positive Zusammenhang zwischen Schul­bildung und Beruf der Eltern und der Mathematikleistung der Kinder in erster Linie dadurch erklären, dass Kinder aus höheren Bildungs­ und Berufsschichten über mehr kul­turelles Kapital (Bücher, Musikinstrumente, kein eigener Fernseher im Kinderzimmer) verfügen, bessere Noten be­kommen und dadurch vermittelt auch ein besseres mathe­matisches Selbstkonzept aufbauen. Der Anteil der direkten und indirekten Effekte am Gesamteffekt ist in Tabelle 2.2.1 dargestellt. Hier zeigt sich sowohl für die Schulbildung als auch den Beruf der Eltern, dass ¾ der Gesamteffekte auf die Mathematikleistung indirekt bedingt sind.

Die mathematischen Fähigkeiten zu Schulbeginn (mathema­tisches Vorwissen) zeigen sowohl direkte als auch indirekte Effekte auf die Mathematikleistung. Der direkte Pfad von 0.10 wurde bereits anfangs beschrieben und besagt, dass auch bei gleichen familiären Bedingungen (von der Schulbil­

„Bildung der Eltern“

„Beruf der Eltern“Mathematische Fähigkeiten zu Schulbeginn

„Autonomiege-stützter Mathe-

Unterricht“

„Anregender Mathe-

Unterricht“Mathematiknote

Gesamt-effekt

0.27 100 % 0.11 100 % 0.18 100 % 0.17 100 % 0.10 100 % –0.38 100 %

direkter Effekt

0.06 24 % 0.03 23 % 0.10 54 % 0.14 84 % n. s. n. s. –0.30 78 %

indirekter Effekt

0.20 76 % 0.08 77 % 0.08 46 % 0.03 16 % 0.10 100 % –0. 08 22 %

„primär bedingt durch …“

Noten, Bücher, Noten – Selbstkon-zept* Fernseher im Zimmer, Musikinst-

rument

Noten, Bücher, Noten – Selbstkon-zept*, Musikinstru-

ment

Noten, Noten – Selbstkonzept*, Selbstkonzept

Noten, Noten – Selbstkonzept*

Selbstkonzept, Noten, Noten – Selbstkonzept*subjektiver Wert der Mathematik

Selbstkonzept

* indirekter Effekt, der über das höhere Selbstkonzept bedingt durch gute Noten die Leistung beeinflusstn. s. = nicht signifikant

Tabelle 2.2.1: Direkte und indirekte Effekte auf die Mathematikleistung (TIMSS 2011)

Page 95: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 93

dung und dem Beruf der Eltern bis hin zur mathe matischen Frühförderung) das mathematische Vorwissen zu Schulbe­ginn bessere Mathematikleistungen am Ende der Grund­schule bedingt. Es zeigen sich aber auch indirekte Effekte von 0.08, die vor allem vermittelnd über bessere Noten und ein höheres Selbstkonzept sowie ein höheres Selbstkonzept bedingt durch bessere Noten die Mathe matik leistung posi­tiv beeinflussen (s. Tabelle 2.2.1). Das mathematische Vor­wissen zu Schulbeginn beeinflusst jedoch weder die Freude an Mathematik noch den subjektiven Wert, der Mathe­matik beigemessen wird.

Das Unterrichtsmerkmal autonomiegestützter Mathematik­unterricht zeigt vor allem negative Effekte auf die Mathe­matikleistung: Autonomie im Mathematikunterricht geht demnach mit schlechteren Leistungen einher (Erklärung s. unten). Indirekt wird dieser Effekt vor allem über schlech­tere Mathematiknoten vermittelt.

Der anregende Mathematikunterricht zeigt hingegen die erwartete positive Wirkung auf die Mathematikleistung, wenngleich sich diese Wirkung auch nur in indirekter Form zeigt: Die Leistung wird im anregenden Unterrichtssetting primär über bessere Noten, ein höheres mathematisches Selbstkonzept sowie ein höheres Selbstkonzept bedingt durch bessere Noten positiv beeinflusst. Ein anregender Mathematikunterricht wird auch von mehr Freude und einem höheren subjektiven Wert, der Mathematik zuge­schrieben wird, begleitet.

Gute Mathematiknoten gehen auch bei gleichen familiären und schulischen Bedingungen mit einem höheren Selbstkon­zept und besseren Mathematikleistungen einher. Effekte auf die motivationalen Merkmale, wie Freude und subjektiver Wert der Mathematik, können keine beobachtet werden. So­mit werden auch die indirekten Effekte von 0.08 ausschließ­lich über das Selbstkonzept vermittelt (s. Tabelle 2.2.1).

Das mathematische Selbstkonzept zeigt, wie angenommen, einen direkten positiven Effekt auf die Mathematikleistung sowie positive Effekte auf die Freude und den subjektiven Wert. Ein vermittelter Effekt über Freude und subjektiven Wert auf die Mathematikleistung kann jedoch nicht bestä­tigt werden. Ebenso bleibt auch der direkte Effekt der bei­den Merkmale „Freude an Mathematik“ und „subjektiver Wert der Mathematik“ auf die Leistung aus.

Migrationseffekte

Wie erwartet, geht der Migrationshintergrund mit gerin­geren sozioökonomischen Merkmalsausprägungen einher5. Vor allem die berufliche Position der Eltern zeigt dahinge­

hend deutliche Effekte: Kinder mit Migrationshintergrund haben häufiger Eltern in niedrigeren beruflichen Positio­nen. Sie besitzen auch deutlich weniger Leseressourcen zu Hause und erfahren weniger häufig eine mathematische Frühförderung im Elternhaus. Wie zu erwarten war, erfah­ren sie jedoch häufiger einen autonomiegestützten Mathe­matikunterricht. Ihre Mathematikfähigkeiten zu Schulbe­ginn werden von den Eltern aber höher eingeschätzt als bei Kindern ohne Migrationshintergrund. Kinder mit Migra­tionshintergrund haben mehr Freude an Mathematik und messen der Mathematik mehr subjektiven Wert bei (dabei handelt es sich um Effekte unter 0.10; diese sind aufgrund des strengen Schwellenwerts im Modell nicht eingetragen).

Werden die familiären, schulischen und individuellen Unterschiede statistisch kontrolliert, reduziert sich der ur­sprüngliche Effekt auf die Leistung von –0.25 auf –0.09. Das heißt, dass Kinder mit Migrationshintergrund unter gleichen Rahmenbedingungen nur geringfügig geringere Mathematikfähigkeiten aufweisen.

Geschlechtereffekte

Einige der im Folgenden berichteten Geschlechtereffekte im Modell sind zwar statistisch signifikant, praktisch jedoch von geringer Größe (Effektstärken kleiner .10), weshalb sie im Modell nicht eingezeichnet sind. Aufgrund der Bedeu­tung des Themas werden diese Ergebnisse dennoch berich­tet.

Im Hinblick auf das kulturelle Kapital berichten Mädchen eine positivere familiäre Situation als Buben: Sie haben häufiger ein Musikinstrument im Haushalt (Effekt = .16) und besitzen seltener einen eigenen Fernseher im Kinder­ zimmer (Effekt = .10). Sie erwähnen auch eine höhere Anzahl von Büchern zu Hause, wobei dieser Effekt nur gering ist (Effekt: 0.04). Dennoch werden die mathemati­schen Fähigkeiten zu Schulbeginn bei den Buben von ihren Eltern höher eingestuft (Effekt = 0.09).

Während der Schulzeit spricht der anregende Unterricht eher die Mädchen an (Effekt = 0.08), wobei sich im Hin­blick auf die Autonomieunterstützung im Unterricht keine Unterschiede zeigen. Ein deutlicher Effekt zeigt sich beim mathematischen Selbstkonzept, das bei den Buben deutlich höher ist als bei den Mädchen. Auch die Freude an Mathe­matik sowie die Leistung in Mathematik sind unter Berück­sichtigung von sozioökonomischen, kulturellen, familiären und unterrichtlichen Unterschieden bei den Buben etwas höher (Effekte unter 0.10).

5 Der Migrationseffekt im Zusammenhang mit der Schulbildung der Eltern ist signifikant und beträgt –.09. Er liegt damit knapp unter dem strengen Schwellenwert und ist deshalb im Modell nicht eingetragen.

Page 96: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

94 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz

Diskussion

Im vorliegenden Beitrag wurde die Mathematikkompetenz durch individuelle, familiäre und unterrichtliche Merkma­le anhand eines Pfadmodells erklärt. Dieses Modell basiert auf dem Rahmenmodell schulischer Leistung, wie es 1997 im Rahmen der SCHOLASTIK­Studie von Helmke und Weinert postuliert wurde, und das um die Annahmen des Angebots­Nutzungs­Modells (Helmke, 2006) ergänzt und erweitert wurde. Im Folgenden werden die zentralen Ergeb­nisse zusammengefasst, diskutiert und Konsequenzen für die Praxis abgeleitet.

Beginnend mit den Schülerinnen und Schülern selbst (= in­ dividuelle Faktoren), lässt sich die Bedeutung der motiva­tionalen Faktoren für die Schülerleistung bestätigen. Das schulische Selbstkonzept, das neben der positiven Beziehung zur Leistung auch mit einer höheren Freude in Mathematik und einer höheren Wertzuschreibung für das Fach einher­geht, stellt dabei das wichtigste Merkmal dar. Für eine op­timale Entwicklung der Mathematikkompetenz ist es daher von Relevanz, dass Schüler/innen Vertrauen in die eigene Leistungsfähigkeit in Mathematik entwickeln. Dies sollte möglichst frühzeitig erfolgen, da sich Selbstkonzepte mit zunehmenden Schuljahren kontinuierlich verfestigen und dadurch auch schwerer beeinflussbar werden (Möller & Trautwein, 2009). Konkret für die Unterrichtspraxis bedeu­tet dies, dass den Schülerinnen und Schülern ein positives Kompetenzerleben ermöglicht werden sollte. Dies könnte beispielsweise durch Klarheit in der Instruktion, durch An­wendung einer individuellen Bezugsnormorientierung und auch durch Individualisierung im Unterricht (z. B. durch die Darbietung von Aufgaben mit unterschiedlichem An­spruchsniveau) realisiert werden. Auch der Notenpraxis kommt eine bedeutende Rolle zu, beeinflusst die Schulnote doch deutlich die Entwicklung des Selbstkonzepts (Jung, 2014).

Insbesondere Mädchen sollten in ihrer Zuversicht, auch in Mathematik gute Leistungen erbringen zu können, geför­dert werden, da sie ein niedrigeres Selbstkonzept als Buben aufweisen. Hier sollte auch an der geschlechtlichen Identi­tät gezielt gearbeitet und ein Aufbrechen der geschlechts­bezogenen Interessen angestrebt werden (z. B. Lazarides & Ittel, 2011; Paseka, 2009). Dass Mädchen und Buben un­terschiedliche Sozialisationserfahrungen bereits vor Schul­beginn haben, spiegelt sich auch in den Unterschieden im frühen mathematischen Bildungserfolg wider: Aus Eltern­sicht bestätigt sich die geringere Fähigkeit in Mathematik von Mädchen bereits vor Schuleintritt. Eine Förderung des mathematischen Selbstkonzepts der Mädchen sollte sinnvollerweise daher immer in Zusammenarbeit mit und unter Einbindung der Familie erfolgen. Dies steht auch in Einklang mit Erkenntnissen aus der Frühförderung: Früh­förderungsprogramme sind langfristig nur dann wirksam, wenn auch das familiäre Umfeld in diese Programme einbe­zogen wird (Hany, 1997). Aus der Geschlechterforschung

ist des Weiteren bekannt, dass soziale Bezugspersonen, wozu neben den Mitschülerinnen und ­schülern sowohl die Lehrkräfte wie auch die Familie und der nähere Bekannten­ und Freundeskreis zählen, insbesondere dann an Bedeutung gewinnen, wenn im geschlechtsuntypischen Fach Vertrau­en und Interesse aufgebaut werden soll. Hier braucht es im Besonderen die Unterstützung, aber auch das Vorbild der sozialen Umwelt (Lazarides & Ittel, 2011).

Während die Mädchen ein geringeres Selbstkonzept entwi­ckeln als die Buben, stellt dieses eine Ressource von Schü­lerinnen und Schülern mit Migrationshintergrund dar. Wie auch schon in früheren Studien aufgezeigt (z. B. Faber et al., 2011), berichten Migrantenkinder von einem höheren Selbstkonzept in Mathematik trotz geringerer vorhandener Mathematikleistung. Neben möglicherweise kulturellen Unterschieden im Einschätzungsverhalten (= Schüler/innen mit Migrationshintergrund beurteilen „optimistischer“) oder auch der Bedeutung der Note für die Selbstkonzeptent­wicklung (= Migrantinnen und Migranten weisen keine inhaltlich bedeutsam schlechteren Schulnoten in Mathe­matik auf ), könnte dieser Effekt auf die Art der herange­zogenen Vergleichs dimension zurückgeführt werden. Es ist wahrscheinlich, dass das Selbstkonzept in Mathematik durch vergleichsweise geringe Leistungen im Fach Deutsch aufgewertet wird. Man nennt dies „dimensionales Verglei­chen“ (= internal frame of reference): Schüler/innen verglei­chen ihre Leistungen nicht nur mit ihren Klassenkamera­den (= external frame of reference), sondern es finden auch intraindividuelle Vergleiche statt (siehe z. B. Dickhäuser, 2003). Dadurch, dass Migrantinnen und Migranten auf­grund von Schwierigkeiten in der Sprachbeherrschung meist ein geringeres Selbstkonzept in Deutsch aufweisen, ist es sehr wahrscheinlich, dass im Vergleich dazu die mathematische Fähigkeit überdurchschnittlich positiv eingeschätzt – folglich auch „überschätzt“ – wird. Man spricht hier von „Kontrast­effekten“ (Möller & Trautwein, 2009, S. 193). Die Schule ist aufgrund des Wissens um auftretende Kontrasteffekte daher besonders gefordert, realistische Selbsteinschätzungen der Schüler/innen zu fördern, ohne dabei aber die Ressour­ce des „positiven Selbstkonzepts“ zu gefährden. Dies könnte zum Beispiel durch den Einsatz einer gezielten regelmäßigen Feedbackpraxis gekoppelt mit Selbsteinschätzungselementen erfolgen. Im Hinblick auf die Form des Feedbacks erscheint eine Kombination aus einer auf den Leistungsfortschritt be­zogenen Rückmeldung (individuelle Bezugsnorm) verbun­den mit Informationen über die Erreichung des Leistungs­ziels (= Kriterium; kriteriale Bezugsnorm) sinnvoll.

Neben dem Selbstkonzept erweist sich die schulische Leis­tungsfähigkeit der Kinder vor Beginn der Grundschule (= Vor­wissen) direkt und auch indirekt – vermittelt über die moti­vationalen Variablen – als die Mathematikleistung am Ende der Grundschule beeinflussend. Entsprechend bisherigen Befunden bestätigt sich also auch in TIMSS 2011 die Be­deutung des Vorwissens für die Leistungsentwicklung der Kinder. Wie bereits bei Helmke und Weinert (1997) auf­

Page 97: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 95

gezeigt, lassen sich somit Leistungsvorsprünge respektive ­nachteile, die bereits zu Beginn der Grundschulzeit exis­tieren, nicht mehr vollständig aufholen, womit dem Eltern­haus sowie den vorschulischen Einrichtungen eine zentrale Rolle für die Leistungsentwicklung zukommt.

Am Ausmaß des Vorwissens maßgeblich beteiligt sind vor allem der Zugang zu Leseressourcen im Elternhaus und die mathematische familiäre Frühförderung. Leseressourcen im Elternhaus, deren Vorhandensein wiederum vom sozio­ökonomischen Status der Eltern (= operationalisiert durch Schulbildung und Beruf der Eltern) abhängt, weisen auch einen direkten Einfluss auf die Mathematikleistung am Ende der 4. Klasse auf. Insbesondere Migrantenkinder sind im Hinblick auf das im Elternhaus vorhandene kul­turelle Kapital benachteiligt, was sich sowohl durch einen geringeren Zugang zu Büchern als auch in einer weniger häufig stattfindenden mathematischen Frühförderung in der Familie äußert. Laut Elternangaben sollten Schüler/innen mit Migrationshintergrund jedoch ein höheres ma­thematisches Vorwissen zu Schulbeginn aufweisen. Dass ein geringeres kulturelles Kapital zu einer höheren Mathe­matikleistung zu Schulbeginn führen sollte, scheint jedoch sehr unplausibel und ist möglicherweise durch kulturelle Unterschiede im Einschätzungsverhalten bedingt. Möglich wäre auch, dass die geringen Unterschiede in den Mathe­matiknoten zwischen Kindern mit und ohne Migrations­hintergrund, die den Eltern als Basis zur Einschätzung der Mathematikkompetenz dienen, dazu beitragen, dass Eltern mit Migrationshintergrund das „Vorwissen“ der Kinder vor Beginn der Grundschule systematisch überschätzen.

Neben diesem vorerst unplausibel erscheinenden Befund, dem allerdings mit der aktuellen Datenlage nicht weiter nachgegangen werden kann (es liegt keine objektive Mes­sung der Leistung zu Beginn der Grundschule vor), spre­chen die Daten im Hinblick auf familiäre Merkmale jedoch ein klares Bild: Sie heben die Relevanz der vorschulischen Förderung und des im Elternhaus zur Verfügung stehenden kulturellen Kapitals hervor. Bildungsungleichheiten bzw. auch ­ungerechtigkeiten bilden sich demnach sehr früh und das österreichische Bildungssystem ist gefordert, dieser Ent­wicklung entgegenzusteuern. Die Verpflichtung zum min­destens ein Jahr dauernden Kindergartenbesuch ist ein Ver­such, diese durch Unterschiede im kulturellen Kapital im Elternhaus verursachte Ungerechtigkeit zu verringern. Es ist jedoch nicht anzunehmen, dass die externe Frühförderung Unterschiede in den familiären Sozialisationsbedingungen vollständig kompensieren kann, wofür auch der direkte Pfad der Leseressourcen zur Mathematikleistung spricht. Um optimale Entwicklungen zu ermöglichen, ist die Ein­bindung der Eltern in die Bemühungen der Frühförderung erstrebenswert, wie bereits im Hinblick auf die Entwicklung des Vorwissens angesprochen wurde.

Eine weitere Möglichkeit, der bestehenden Bildungsun­gleichheit entgegenzuwirken, wäre eine Modifikation bei

der Anerkennung der beruflichen Ausbildung von Migran­tinnen und Migranten in Österreich. Die Analysen zeigen, dass Kinder mit Migrationshintergrund vor allem Eltern in niedrigeren beruflichen Positionen und weniger mit gerin­ger Schulbildung haben. Dieses Ergebnis steht im Einklang mit der Erkenntnis, dass in Österreich Migration, bei glei­cher formaler Schulbildung, mit einer geringeren beruf­lichen Position verbunden ist (Gächter, 2010). Ergänzend muss jedoch hinzugefügt werden, dass es bis dato keine datenbasierten Untersuchungen gibt, die sich mit der Aner­kennung beruflicher Ausbildung und einer damit einherge­henden Reduzierung von Bildungsungleichheit beschäftigt haben.

Als dritter Bereich wurden im Modell Faktoren des Unter­richts – konkret ein autonomieunterstützender Unterricht und eine anregende Unterrichtsgestaltung (z. B. Förderung des Interesses im Unterricht) – berücksichtigt. Während der anregende Mathematikunterricht die erwartete Wir­kung zeigt, nämlich die Förderung der Schülermotivation (Selbstkonzept/Freude/Wert), und auch mit besseren Noten einhergeht, erweist sich die Wirkung des autonomieunter­stützenden Unterrichts als komplexer und weniger ein­deutig. Während Autonomieunterstützung im Unterricht wie erwartet von den Schülerinnen und Schülern als po­sitiv anregend eingeschätzt wird, und in Folge mit einem erhöhten Selbstkonzept und einer höheren Wertzuschrei­bung einhergeht, erreichen Schüler/innen, die von einer höheren Autonomieunterstützung berichten, schlechtere Noten in der Schule. Die Noten wirken wiederum negativ auf das schulische Selbstkonzept und sind auch mit einer schlechteren Mathematikleistung in TIMSS assoziiert. Das heißt, Autonomieunterstützung wirkt entsprechend dem berechneten Modell zum einen motivational güns­tig, zum anderen jedoch eher ungünstig auf die Leistung. Eine Erklärungsmöglichkeit für diesen Befund könnte in der Selbstregulationsfähigkeit der Schüler/innen liegen: Um optimales Lernen in einer relativ frei gestalteten Lern­umgebung (= hohe Autonomie) zu erzielen, müssen die Schüler/innen über eine entsprechende Selbstregulations­kompetenz, wozu auch Lernstrategien zählen, verfügen, um diese Offenheit entsprechend nützen zu können. Fehlt diese Kompetenz im selbstgesteuerten Lernen, kann Autonomie im Klassenzimmer der Leistungsentwicklung auch hinder­lich sein. Autonomieerleben ist demnach entsprechend der Selbst bestimmungstheorie der Motivation (Deci & Ryan, 1993) eine hilfreiche Unterrichtsstrategie, um Lernmoti­vation zu fördern. Soll sie jedoch auch leistungssteigernd sein, so sind Lehrkräfte darin beraten, die Selbstregulati­onsfähigkeiten der Schüler/innen explizit zu fördern. Hier­zu gibt es bereits eine Reihe an Trainings (Götz & Nett, 2011). Damit der Transfer der Selbstregulationsfähigkeiten in den schu lischen Alltag gelingt, ist es notwendig, diese Trainings möglichst nah am schulischen Lernen und den dort zu verarbeitenden Inhalten zu orientieren (Hasselhorn & Labuhn, 2010).

Page 98: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

96 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz

Zusammenfassend lässt sich mit dem in diesem Beitrag berechneten Modell demnach belegen, dass die Mathema­tikkompetenz – wie es von Rahmenmodellen schulischer Leistung angenommen wird – multideterminiert ist. Im Bewusstsein, dass bei internationalen Schulleistungsstudi­en Restriktionen im Hinblick auf die Länge der Fragebö­gen vorliegen und Indikatoren sehr komprimiert erhoben werden müssen, wäre für zukünftige Zyklen von TIMSS die zusätzliche Aufnahme von Schülerverhaltensvariablen, wozu beispielsweise Selbstregulationsstrategien zählen wür­

den, wünschenswert (für die Erfassung von Lernstrategien in Lesen siehe PISA­Studie, z. B. Artelt, Naumann & Schneider, 2010). Entsprechend dem Angebots­Nutzungs­Modell, das zu Beginn des Beitrags vorgestellt wurde, me­diiert das Nutzungsverhalten die Beziehung zwischen dem Unterrichtsangebot, der ausgelösten Motivationslage und der daraus resultierenden Schülerleistung. Damit stellt das Schülerverhalten eine wesentliche Variable zur Erklärung der Schülerleistung dar.

Literatur

Artelt, C., Naumann, J. & Schneider, W. (2010). Lesemotivation und Lernstrategien. In E. Klieme et al. (Hrsg.), PISA 2009. Bilanz nach einem Jahrzehnt (S. 73–112). Münster: Waxmann.

Bergmüller, S. (2010). Leistungsschwache Schüler/innen: Kompetenzen und Charakteristika. In B. Suchan, C. Wallner­ Paschon & C. Schreiner (Hrsg.), TIMSS 2007. Mathematik und Naturwissenschaft in der Grundschule. Österreichischer Exper­tenbericht (S. 64–81). Graz: Leykam.

Breit, S. & Wanka, R. (2010). Schüler/innen mit Migrationshintergrund: Ein Portrait ihrer Kompetenzen im Licht ihrer familiären und schulischen Sozialisation. In B. Suchan, C. Wallner­Paschon & C. Schreiner (Hrsg.), TIMSS 2007. Mathema­tik und Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S. 96–114). Graz: Leykam.

Bourdieu, P. (1983). Ökonomisches Kapital, kulturelles Kapital, soziales Kapital. In R. Kreckel (Ed.), Soziale Ungleichheit (S. 183–198). Göttingen: Schwartz.

Bruneforth, M., Weber, C. & Bacher, J. (2013). Chancengleichheit und garantiertes Bildungsminimum in Österreich. In B. Herzog­Punzenberger (Hrsg.), Nationaler Bildungsbericht Österreich 2012: Band 2 Fokussierte Analysen bildungspolitischer Schwerpunktthemen (S. 189–227). Graz: Leykam.

Bühner, M. (2011). Einführung in die Test­ und Fragebogenkonstruktion. München: Pearson Studium.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Erlbaum.

Deci, E. L. & Ryan, R. M. (1993). Die Selbstbestimmungstheorie der Motivation und ihre Bedeutung für die Pädagogik. Zeitschrift für Pädagogik, 39 (2), 223–238.

Dickhäuser, O. (2003). Überprüfung des erweiterten Modells des internal/external frame of reference. Zeitschrift für Entwick­lungspsychologie und Pädagogische Psychologie, 35 (4), 200–207.

Eccles (Parsons), J., Adler, T. F., Futterman, R., Goff, S. B., Kaczala, C. M., Meece, J. L. & Midgley, C. (1983). Expectancies, values, and academic behaviors. In J. T. Spence (Ed.), Achievement and achievement motivation (pp. 75–146). San Francisco, CA.: W. H. Freeman.

Ehmke, T. & Siegle, T. (2008). Einfluss elterlicher Mathematikkompetenz und familialer Prozesse auf den Kompetenzerwerb von Kindern in Mathematik. Psychologie in Erziehung und Unterricht, 55 (4), 253–264.

Faber, G., Tiedemann, J. & Billmann­Mahecha, E. (2011). Selbstkonzept und Lernfreude in der Grundschulmathematik: Die Bedeutung von Migration und Geschlecht. Längsschnittliche Ergebnisse aus der Hannoverschen Grundschulstudie. Heilpäd­agogische Forschung, 37 (3), 127–143.

Gächter, A. (2010). Der Integrationserfolg des Arbeitsmarktes. In H. Langthaler (Hrsg.), Integration in Österreich: Sozial­wissenschaftliche Befunde (S. 143–163). Wien: StudienVerlag.

Page 99: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 97

Götz, T. & Nett, U. E. (2011). Selbstreguliertes Lernen. In T. Götz (Hrsg.), Emotion, Motivation und selbstgesteuertes Lernen (S. 143–183). Paderborn: Schöningh. Gröhlich, C. (2012). Bildungsqualität. Strukturen und Prozesse in Schule und Unterricht und ihre Bedeutung für den Kompetenz­erwerb (Reihe: Empirische Erziehungswissenschaft). Münster: Waxmann.

Grube, D. & Hasselhorn, M. (2006). Längsschnittliche Analysen zur Lese­, Rechtschreib­ und Mathematikleistung im Grundschulalter: zur Rolle von Vorwissen, Intelligenz, phonologischem Arbeitsgedächtnis und phonologischer Bewusstheit. In I. Hosenfeld & F.­W. Schrader (Hrsg.), Schulische Leistung. Grundlagen, Bedingungen, Perspektiven (S. 87–105). Münster: Waxmann.

Hagenauer, G. (2011). Lernfreude in der Schule. Münster: Waxmann.

Hagenauer, G. & Hascher, T. (2011). Lernfreude, engagierte Mitarbeit im Unterricht und erfolgreiches Leisten bei instrumen­tellen Formen der Lernmotivation – ein Widerspruch in sich? Zeitschrift für Bildungsforschung, 1 (2), 97–113.

Hany, E. A. (1997). Entwicklung vor, während und nach der Grundschulzeit. Literaturüberblick über den Einfluss der vor­schulischen Entwicklung auf die Entwicklung im Grundschulalter. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 391–404). Weinheim: Beltz.

Hasselhorn, M. & Labuhn, A. S. (2010). Lernstrategien. In T. Hascher & B. Schmitz (Hrsg.), Pädagogische Interventionsfor­schung (S. 73–84). Weinheim & München: Juventa.

Heinze, A., Herwartz­Emden, L. & Reiss, K. (2007). Mathematikkenntnisse und sprachliche Kompetenz bei Kindern mit Migrationshintergrund zu Beginn der Grundschulzeit. Zeitschrift für Pädagogik, 53 (4), 562–581.

Heller, K. A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Literaturüberblick. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 183–202). Weinheim: Beltz

Helmke, A. (2006). Unterrichtsqualität: Erfassen, Bewerten, Verbessern (4. Aufl.). Seelze: Kallmeyersche Verlagsbuchhandlung.

Helmke, A. (1993). Die Entwicklung der Lernfreude vom Kindergarten bis zur 5. Klassenstufe. Zeitschrift für Pädagogische Psychologie, 7 (2–3), 77–86.

Helmke, A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Ergebnisse aus dem SCHOLASTIK­Projekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 203–216). Weinheim: Beltz.

Helmke, A., Hosenfeld, I. & Schrader, F.­W. (2002). Unterricht, Mathematikleistung und Lernmotivation. In A. Helmke & R. S. Jäger (Hrsg.), Das Projekt MARKUS. Mathematik­Gesamterhebung Rheinland Pfalz: Kompetenzen, Unterrichtsmerkmale, Schulkontext (S. 413–480). Landau: Empirische Pädagogik.

Helmke, A. & Reich, H. H. (2001). Die Bedeutung der sprachlichen Herkunft für die Schulleistung. Empirische Pädagogik, 15 (4), 567–600.

Helmke, A. & Weinert, F. E. (1997). Bedingungsfaktoren schulischer Leistungen. In F. E. Weinert (Hrsg.), Psychologie des Unterrichts und der Schule (S. 71–176). Göttingen: Hogrefe.

Hyde, J. S., Fennema, E. & Lamon, S. J. (1990). Gender differences in mathematics performance: A meta­analysis. Psycholo­gical Bulletin, 107 (2), 139–155.

Jung, J. (2014). Reform­ und Alternativschulen. In W. Einsiedler, M. Götz, A. Hartinger & F. Heinzel (Hrsg.), Handbuch Grundschulpädagogik und Grundschuldidaktik (pp. 74–78): UTB GmbH.

Klieme, E., Lipowsky, F., Rakoczy, K. & Ratzka, N. (2006). Qualitätsdimensionen und Wirksamkeit von Mathematikun­terricht. Theoretische Grundlagen und ausgewählte Ergebnisse des Projekts „Pythagoras“. In M. Prenzel & L. Allolio­Näcke (Hrsg.), Untersuchungen zur Bildungsqualität von Schule (S. 127–146). Münster: Waxmann.

Page 100: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

98 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz

Köller, O., Zoe, D., Schnabel, K. U. & Baumert, J. (2000). Kurswahlen von Mädchen und Jungen im Fach Mathematik: Zur Rolle von fachspezifischem Selbstkonzept und Interesse. Zeitschrift für Pädagogische Psychologie, 14 (1), 26–37.

Krajewski, K., Grüßing, M. & Peter­Koop, A. (2009). Die Entwicklung mathematischer Kompetenzen bis zum Beginn der Grundschulzeit. In A. Heinze & M. Grüßing (Hrsg.), Mathematiklernen vom Kindergarten bis zum Studium (S. 17–34). Münster: Waxmann.

Krapp, A. (2009). Interesse. In V. Brandstätter & J. H. Otto (Hrsg.), Handbuch der Allgemeinen Psychologie – Motivation und Emotion (S. 54–57). Göttingen: Hogrefe.

Lazarides, R. & Ittel, A. (2011). Soziale und individuelle Bedeutungsfaktoren für mathematisches Fachinteresse und ge­schlechtsspezifisches Verhalten. In A. Hadjar (Hrsg.), Geschlechtsspezifische Bildungsungleichheiten (S. 309–330) Wiesbaden: VS.

Lüdtke, O., Robitzsch, A., Trautwein, U. & Köller, O. (2007). Umgang mit fehlenden Werten in der psychologischen For­schung. Probleme und Lösungen. Psychologische Rundschau, 58 (2), 103–117.

Martin, M. O. & Mullis, I. V. S. (Eds.). (2012). Methods and procedures in TIMSS and PIRLS 2011. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. [Zugriff am 09. 09. 2013 unter http://timssandpirls.bc.edu/methods/t­context­q­scales.html].

Möller, J. & Trautwein, U. (2009). Selbstkonzept. In E. Wild & J. Möller (Hrsg.), Pädagogische Psychologie (S. 179–203) Heidelberg: Springer.

Mücke, S. (2009). Schulleistungen von Jungen und Mädchen in der Grundschule – eine metaanalytische Bilanz. Empirische Pädagogik, 23 (3), 290–337.

Muthén, L. K. & Muthén, B. O. (1998–2012). Mplus User’s Guide. 7th Ed. Los Angeles, CA: Muthén & Muthén.

Niggli, A., Trautwein, U., Schnyder, I., Lüdtke, O. & Neumann, M. (2007). Elterliche Unterstützung kann hilfreich sein, aber Einmischung schadet. Psychologie in Erziehung und Unterricht, 54 (1), 1–14.

Paseka, A. (2009). Geschlecht lernen rekonstruieren – dekonstruieren – konstruieren. Einige Anregungen für eine geschlechts­sensible Pädagogik und Didaktik. In T. Schweiger & T. Hascher (Hrsg.), Geschlecht, Bildung und Kunst (S. 15–39). Wies­baden: VS.

Reeve, J., Bolt, E. & Cai, Y. (1999). Autonomy­supportive teachers: How they teach and motivate students. Journal of Edu­cational Psychology, 91, 537–548.

Rustemeyer, R. & Fischer, N. (2007). Geschlechterdifferenzen bei Leistungserwartung und Wertschätzung im Fach Mathema­tik. In P. H. Ludwig & H. Ludwig (Hrsg.), Erwartungen in himmelblau und rosarot. Effekte, Determinanten und Konsequenzen von Geschlechterdifferenzen in der Schule (S. 83–101). Weinheim & München: Juventa.

Wallner­Paschon, C. (2010). Kompetenzunterschiede für Mädchen und Buben. In B. Suchan, C. Wallner­Paschon & C. Schreiner (Hrsg.), TIMSS 2007. Mathematik und Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S. 96–114). Graz: Leykam.

Wallner­Paschon, C. (2012). Mathematik: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner­Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwis­senschaft in der Grundschule. Erste Ergebnisse (S. 30–31). Graz: Leykam.

Weinert, F. E. & Helmke, A. (1995). Interclassroom differences in instructional quality and interindividual differences in cognitive development. Educational Psychologist, 30, 15–20. Weinert, F. E. & Helmke, A. (1997). Entwicklung im Grundschulalter. Weinheim: Beltz.

Weinert, F. E. & Stefanek, J. (1997). Entwicklung vor, während und nach der Grundschulzeit. Ergebnisse aus dem SCHO­LASTIK­Projekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 423–452). Weinheim: Beltz.

Page 101: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 99

Wigfield, A. & Eccles, J. S. (2000). Expectancy – value theory of motivation. Contemporary Educational Psychology, 25 (1), 68–81.

Wigfield, A., Eccles, J. S., Suk Yoom, K., Harold, R., Abreton, A. J. A., Freedman­Doan, C. & Blumenfeld, P. C. (1997). Change in children’s competence beliefs and subjective task values across the elementary school years: a 3­year study. Journal of Educational Psychology, 89 (3), 451–469.

Wild, E. & Möller, J. (2014). Pädagogische Psychologie. Springer: Berlin Heidelberg.

Page 102: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

100 Effekte der Geschwisterkonstellation auf schulische Kompetenzen

2.3 Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf schulische Kompetenzen

Christine Schmid & Anna Glaeser

Einleitung

Der vorliegende Beitrag widmet sich der Frage, ob und in welcher Weise Geschwister mit der Entwicklung von schu­lischen Kompetenzen in Lesen, Mathematik und Natur­wissenschaft im Zusammenhang stehen. In der Literatur zu Geschwisterbeziehungen wird beschrieben, dass ältere Geschwister gegenüber den jüngeren häufig die Rolle von Lehrenden und Betreuenden übernehmen und in dieser Funktion sogar erfolgreicher sein können als die Eltern (Kasten, 1993; Liegle, 2006). Die Vermutung liegt nahe, dass ältere Geschwister mit den jüngeren auch für die Schule lernen und es stellt sich die Frage, ob Kindern mit älteren Geschwistern dadurch ein systematischer Vorteil beim Erwerb schulischer Kompetenzen erwächst.

Der Vermutung, dass Kinder mit älteren Geschwistern einen Lernvorteil haben, steht die Annahme gegenüber, dass Kinder mit jüngeren Geschwistern einen Kompetenz­vorsprung aufweisen. Diese Annahme ist durch den soge­nannten teaching effect begründet, den Zajonc und Markus (1975) auf der Grundlage des in den 1970er Jahren ent­wickelten confluence models in die Diskussion brachten (s. auch Zajonc, 2001; Zajonc & Sulloway, 2007). Kinder mit jüngeren Geschwistern sollen davon profitieren, dass sie die Möglichkeit haben, lehrendes Verhalten auszuüben. Tatsächlich belegen experimentelle Untersuchungen einen positiven Effekt solchen Verhaltens auf die Entwicklung von kognitiven Kompetenzen bei Kindern (z. B. Bargh & Shul, 1980; Kagan, 1992). Anderen etwas beibringen führt demnach zu einer Strukturierung des eigenen Wissens und der eigenen Fähigkeiten, die auch der Entwicklung schuli­scher Kompetenzen förderlich sein könnte.

Inwieweit sich Evidenzen für die eine wie für die andere Annahme ergeben, soll im Folgenden auf der Grundlage der im Jahr 2011 im Rahmen von PIRLS & TIMSS erhobenen Daten für österreichische Schüler/innen der 4. Schulstufe geprüft werden.

Die Geschwisterbeziehung als Lernkontext

Geschwisterbeziehungen weisen eine Reihe von Charakter­istika auf, die als besonders lernförderlich gelten können (Azmitia & Perlmutter, 1989; Rogoff, 1990). Ein älteres Ge­schwister mit hinreichend großem Altersabstand verfügt im Vergleich zum jüngeren Geschwister über weiterent wickelte soziale und kognitive Fähigkeiten und ist dadurch ab einem gewissen Alter in der Lage, die gemeinsamen Interaktionen zu strukturieren. Gleichzeitig ist die kognitive Überlegen­heit älterer Geschwister geringer als diejenige der Eltern, weshalb es älteren Geschwistern unter Umständen leichter gelingt, an die Sichtweisen und den Erfahrungshorizont des jüngeren Geschwisters anzuknüpfen.

Experimentelle Untersuchungen belegen zum einen, dass ältere Geschwister das sogenannte scaffolding beherrschen (McGillicuddy­De Lisi, 1993). Der Begriff des scaffolding ist schwer ins Deutsche zu übersetzen. Er bedeutet, dass ältere Geschwister in der Lage sind, Lernkontexte für jüngere Geschwister so zu gestalten, dass deren „Zone der nächsten Entwicklung“ stimuliert wird (Vygotsky, 1978). Nach Vygotsky werden kognitive Fähigkeiten schrittweise erworben und zwar zuerst interaktiv unter der Anleitung kompetenterer sozialer Agenten, bevor sie dann in das eigene, selbstständig ausführbare Repertoire übernommen werden. Die „Zone der nächsten Entwicklung“ ist durch die Differenz zwischen den zunächst nur interaktiv

Lernen Kinder von älteren Geschwistern und erwächst Kindern mit älteren Geschwistern dadurch ein Vorteil für den schulischen Kompetenzerwerb? Welche Rolle spielt in diesem Zusammenhang die Hausaufgabenhilfe? Der Annahme des Lernens von älteren Geschwistern steht die Annahme des Lernens durch Lehren jüngerer Geschwister gegenüber. Profitieren Kinder mit jüngeren Geschwistern davon, dass sie diesen etwas beibringen? Einen solchen „teaching effect“ haben Zajonc und Markus (1975; vgl. auch Zajonc, 2001) im Rahmen des von ihnen entwickelten „confluence models“ postuliert. Im vorliegenden Beitrag werden sowohl die beiden genannten Hypothesen als auch weitere Annahmen zur elterlichen Ressourcenverdünnung wie zum „confluence model“ überprüft.

Page 103: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Effekte der Geschwisterkonstellation auf schulische Kompetenzen 101

vorhandenen und den bereits eigenständig anwendbaren Fähigkeiten definiert. Zum anderen zeigte sich in Studien zur kooperativen Bearbeitung von Problemlöseaufgaben, dass Kinder, die mit ihrem älteren Geschwister zusammen­arbeiteten, bessere Ergebnisse erzielten als Kinder, die mit Freunden, Fremden (Azmitia & Hesser, 1993; Cicirelli, 1972) oder alleine (Cicirelli, 1974) arbeiteten.

Untersuchungen, in denen das kooperative Problemlösen von Kindern mit ihren Müttern mit dem von Kindern in Zusammenarbeit mit ihren älteren Geschwistern verglichen wurde, zeigten, dass nicht nur Mütter, sondern auch ältere Geschwister lehrende Verhaltensweisen, sogenanntes tuto-ring, ausüben (Cicirelli, 1975; 1976). Die Art und Qualität dieser Verhaltensweisen erwies sich allerdings als abhängig von der Geschlechterkonstellation: Die Zusammenarbeit mit älteren Schwestern war erfolgreicher als jene mit älteren Brüdern (Cicirelli 1972; 1974). Zudem schienen Mädchen vor allem von der Zusammenarbeit mit älteren Schwestern zu profitieren, während Buben eher durch die Rivalität mit älteren Brüdern angespornt wurden. Schließlich schienen die Mütter mit ihrem eigenen Verhalten auf die Geschlech­ terkonstellation zu reagieren: Sie gaben jüngeren Geschwistern weniger Hilfe und Feedback, wenn das jüngere Geschwister männlich und das ältere Geschwister weiblich war.

In experimentellen Untersuchungen werden nur kurzfris­tige Effekte erfasst, sie können von daher keine Auskunft darüber geben, inwieweit jüngeren Geschwistern durch das Vorhandensein älterer ein systematischer Entwicklungs­vorteil erwächst. Das Auftreten eines solchen Vorteils dürfte unter anderem davon abhängen, in welchem Ausmaß Eltern und ältere Geschwister die Rolle des Tutors/der Tutorin übernehmen, beispielsweise indem sie Hausaufgabenhilfe leisten. Auch dieser Frage soll im vorliegenden Beitrag nach­gegangen werden.

Das „confluence model“

In Studien zu Bildungs­Outcomes zeigt sich häufig ein negativer Effekt der Zahl der Kinder in der Familie auf ent­sprechende abhängige Größen wie beispielsweise die Zahl der besuchten Schuljahre, Bildungsabschlüsse, Schulnoten oder auch Leistungstestwerte (z. B. Black, Devereux & Sal­vanes, 2005; Blake 1989; Booth & Kee, 2009; Kanazawa, 2012). Sozialökonomen erklären diesen Zusammenhang in der Regel im Rahmen eines Ressourcenverdünnungsmo-dells (im Überblick s. Downey, 2001). Mit zunehmender Zahl der Kinder werden die begrenzten elterlichen Res­sourcen  – finanzieller, affektiver wie intellektueller Art – auf eine h öhere Anzahl an Kindern verteilt, so dass für jedes einzelne Kind ein entsprechend geringerer Anteil verbleibt. Erstgeborene erhalten zunächst die volle Zuwen­dung ihrer Eltern, der Anteil verringert sich jedoch mit der Geburt jedes weiteren Kinds. Da Kinder mit steigen­dem Geburtsrangplatz in für sie zunehmend ungünstigere familiäre Ressourcenverhältnisse geboren werden, kann

vor dem Hintergrund dieses Erklärungsmodells nicht nur ein negativer Effekt der Zahl der Kinder, sondern auch des Geburtsrangplatzes auf die Bildungs­Outcomes erwartet werden. Ein solch negativer Effekt des Geburtsrangplatzes konnte allerdings nur vereinzelt in Studien bestätigt werden (z. B. Black et al., 2005; Booth & Kee, 2009; Taubmann & Behrmann, 1986; dazu auch Hertwig, Davis & Sulloway, 2002), sodass verschiedene Autoren zu dem Schluss kamen, der Geburtsrangplatz hätte offenbar – im Unterschied zur Zahl der Kinder – keinen systematischen Einfluss auf den Erwerb von schulischen Kompetenzen (Ernst & Angst, 1983; Kanazawa 2012; Retherford & Sewell, 1991; Rod­gers, Cleveland, van den Oord & Rowe, 2000; Schooler, 1972).

Dieser Schlussfolgerung widersprachen Zajonc und Mull­ ally (1997), Zajonc und Sulloway (2007) sowie Sulloway (2007) vor dem Hintergrund des confluence models (Zajonc, 1983; Zajonc, 2001; Zajonc & Bargh, 1980; Zajonc & Markus, 1975). Die Grundlage der Überlegungen zum con-fluence model bildete eine Studie über holländische Militär­rekruten (Belmont & Marolla, 1973), deren Intelligenztest­scores, erhoben im Alter von 19 Jahren, ein charakteristisches Muster aufwiesen: Rekruten aus Zweikindfamilien zeigten höhere Intelligenzwerte als Rekruten aus Dreikindfamilien, diese wiederum höhere als Rekruten aus Vierkindfamilien, letztere wiederum höhere als Rekruten aus Fünfkindfami­lien usw. Bis zu diesem Punkt erscheint die Abnahme der Intelligenztestscores rein durch die zunehmende Zahl der Kinder begründbar. Zusätzlich zeigte sich jedoch eine Abhängigkeit der Scores vom Geburtsrangplatz. Wäh­rend in Zwei­ bis Vierkindfamilien die Intelligenzscores mit steigendem Geburtsrangplatz abnahmen, begannen die Werte in Familien mit mehr als vier Kindern mit den späteren Geburtsrangplätzen wieder anzusteigen. Die Ver­läufe nach Geburtsrangplatz waren demnach nicht line­ar, sondern zumindest in größeren Familien kurvilinear. Außerdem traten in den Daten zwei Anomalien auf, die weder mit der Familiengröße noch mit dem Geburtsrang­platz der Rekruten zu erklären waren: Die Intelligenz­testscores von Einzelkindern lagen unter den Werten der Erstgeborenen aus Zwei­ und Dreikindfamilien, etwa auf der Höhe der Erstgeborenen aus Vierkindfamilien. Zudem ergab sich in allen Familiengrößen ein stärkerer Abfall der Werte der Letzt geborenen im Vergleich zu den Vorgebo­renen. Diese Anomalien veranlassten Zajonc und Markus (1975) zur Annahme des teaching effect. Einzelkindern und Letztge borenen soll ein systematischer Nachteil dadurch er­wachsen, dass sie keine jüngeren Geschwister haben, denen sie etwas beibringen können.

Theoretisch postuliert das confluence model, dass die Ent­wicklung der intellektuellen Fähigkeiten von Kindern vom durchschnittlichen Fähigkeitsniveau der Familie abhängig sei. In das durchschnittliche Fähigkeitsniveau der Familie fließen die Niveaus aller Familienmitglieder inklusive dem des Zielkinds ein. Es verändert sich demnach mit dem Alter

Page 104: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

102 Effekte der Geschwisterkonstellation auf schulische Kompetenzen

und der Zahl der Kinder. Mit steigender Zahl der Kinder nimmt das durchschnittliche Familienniveau ab – hier teilt das confluence model die Annahme der Ressourcenverdün-nung, denn das hohe elterliche Niveau verliert mit der Zahl der Kinder an Gewicht im familiären Gesamtniveau.1 Mit steigendem Geburtsrangplatz muss sich jedoch keineswegs eine solche Abnahme ergeben, dies konnten Zajonc und Markus (1975) anhand von mathematischen Modellrech­nungen zeigen. Beispielsweise kann ein Zweitgeborenes schon nach wenigen Jahren eine günstigere familiäre Um­welt vorfinden, als das Erstgeborene im selben Alter vor­fand.2 Dieser Effekt, bei dem die familiäre Umwelt für die später Geborenen günstiger wird als für die vorher Gebore­nen, ist abhängig vom Altersabstand zwischen den Kindern. Er tritt umso eher auf, je größer der Altersabstand ist. Dane­ben spielt aber auch das Testalter der Kinder eine Rolle. In großen Datensätzen zeigten sich mit höherem Geburtsrang­platz umso eher positive Effekte, je niedriger das Testalter war. Erst ab einem Testalter von etwa 11 Jahren (+/– 2 Jah­re) ergab sich ein Abfall von Intelligenz­ oder Leistungstest­werten bei den später Geborenen (Zajonc, 1976; Zajonc & Bargh, 1980; Zajonc, 2001). Die Ursache für diese abfallen­den Werte bei höherem Testalter sehen die Autoren in der Zeit, welche der teaching effect braucht, um seine Wirkung zu entfalten. In jedem Fall liefert das confluence model durch diesen Umkehreffekt eine stichhaltige Erklärung für den häufig fehlenden negativen Effekt des Geburtsrangplatzes und prognostiziert gleichzeitig einen möglichen positiven oder auch kurvilinearen Effekt bei niedrigerem Testalter.

Im vorliegenden Beitrag soll überprüft werden, ob sich in den Daten aus PIRLS & TIMSS 2011 ein ähnliches Muster nach der Zahl der Kinder und dem Geburtsrangplatz zeigt, wie bei Zajonc und Markus (1975) oder Zajonc und Bargh (1980) berichtet. Außerdem soll geprüft werden, ob sich Hinweise auf den durch das confluence model postulierten teaching effect auch bei österreichischen Schülerinnen und Schülern der 4.  Schulstufe zeigen. Hinweise auf einen solchen ergäben sich vor allem durch ein Handicap von Ein­zelkindern und von Letztgeborenen sowie durch eine Bestä­tigung der Übernahme lehrender Verhaltensweisen aufseiten älterer Geschwister.

Vorgehensweise und Hypothesen

Im ersten Schritt wird deshalb zunächst untersucht, in wel­chem Ausmaß Kinder von Geschwistern Unterstützung

bei den Hausaufgaben erhalten und ob eine derartige Un­terstützung vom Vorhandensein älterer Geschwister sowie von der Zahl der Kinder abhängt. Aufgrund begrenzter zeitlicher Ressourcen sollte die elterliche Hausaufgabenhilfe mit steigender Zahl der Kinder abnehmen. Im Gegenzug könnte die geschwisterliche Hausaufgabenhilfe zunehmen, insbesondere wenn ältere Geschwister vorhanden sind. Zudem wird überprüft, inwieweit sich das Vorhandensein älterer Geschwister und die Zahl der Kinder negativ auf die Häufigkeit von privater Nachhilfe und Nachmittagsbe­treuung auswirken. Ersteres ist anzunehmen, wenn ältere Geschwister häufiger die Betreuung jüngerer Geschwister übernehmen und Hilfestellung bei der Hausübung geben, anstatt dass auf private Nachhilfe und externe Nachmit­tagsbetreuung zurückgegriffen wird. Letzteres könnte mit begrenzten finanziellen Ressourcen in größeren Familien im Zusammenhang stehen, aber auch durch ein häufige­res Zuhausebleiben von Müttern im Falle mehrerer Kinder begründet sein.

Um zu überprüfen, ob sich im vorliegenden Datensatz ähnliche Muster ergeben, wie bei Zajonc und Markus (1975) oder bei Zajonc und Bargh (1980) berichtet, werden im zweiten Schritt die Kompetenzwerte für Lesen, Mathe­matik und Naturwissenschaft nach der Zahl der Kinder und dem Geburtsrangplatz dargestellt. Erwartet werden abnehmende Kompetenzwerte mit höherer Zahl der Kin­der sowie, insbesondere in Familien mit mehreren Kindern, eventuell ein Wiederanstieg der Kompetenzwerte mit höhe­rem Geburtsrangplatz. Vor dem Hintergrund des teaching effect ist außerdem zu erwarten, dass die Kompetenzwerte der Einzelkinder unter den Werten der Erstgeborenen aus Zwei­ und Dreikindfamilien liegen sowie die Werte der Letztgeborenen jeweils einen Abfall gegenüber den Wer­ten der Vorgeborenen zeigen. Die Erwartung eines Abfalls der Kompetenzwerte mit steigender Zahl der Kinder sowie eines möglichen kurvilinearen Verlaufs mit höherem Ge­burtsrangplatz wird anschließend einer regressionsanalyti­schen Prüfung unterzogen.

Im dritten Schritt sollen die beiden Hypothesen des Lernens von älteren Geschwistern sowie des Lernens durch Lehren (teaching effect) einer regressionsanalytischen Prüfung unter­zogen werden. Hierzu werden Kinder mit und ohne ältere Geschwister sowie Kinder mit und ohne jüngere Geschwis­ter jeweils miteinander verglichen. Im Falle des Lernens von älteren Geschwistern wäre zu erwarten, dass Kinder mit

1 Um die Annahmen des confluence model zu verdeutlichen, soll idealtypisch angenommen werden, dass Erwachsene ein intellektuelles Niveau von 30 besitzen, Neugeborene mit einem Niveau von 0 in das Gesamtniveau eingehen und Kinder pro Lebensjahr einen Zuwachs von 1 verzeichnen. Die intellektuelle Umgebung eines Erstgeborenen im Alter von 10 Jahren aus einer Zweikindfamilie mit einem siebenjährigen Geschwister ((30 + 30 + 10 + 7) /4 = 19,25) wäre demnach höher als die eines Erstgeborenen im Alter von 10 Jahren aus einer Dreikindfamilie mit einem sieben­ und einem vierjährigen Geschwister ((30 + 30 + 10 + 7 + 4)/5 = 16,2). Ähnliche Modellrechnungen finden sich bei Zajonc (2001).

2 Obwohl die Bedingungen für das Erstgeborene bei der Geburt denjenigen des Zweitgeborenen überlegen sind, ist das Verhältnis im folgenden Beispiel im Alter von vier Jahren umgedreht: Bei der Geburt liegt das Niveau für das Erstgeborene mit (30 + 30 + 0)/3 = 20 über dem Niveau für das Zweitge­borene (30 + 30 + 4 + 0)/4 = 16, im Alter von vier Jahren liegt das Niveau für das Erstgeborene mit (30 + 30 + 4 + 0)/4 = 16 unter dem Niveau für das Zweitgeborene (30 + 30 + 8 + 4)/4 = 18.

Page 105: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Effekte der Geschwisterkonstellation auf schulische Kompetenzen 103

älteren Geschwistern höhere Kompetenzwerte aufweisen als Kinder ohne ältere Geschwister. Im Fall des Lernens durch Lehren sollten Kinder mit jüngeren Geschwistern höhere Werte aufweisen als Kinder ohne jüngere Geschwister.

Methode

Die Analysen basieren auf den österreichischen Datensätzen der Studien PIRLS & TIMSS von 2011. Getestet wurden Schüler/innen auf der 4. Schulstufe im Frühjahr 2011. Das Durchschnittsalter der Schüler/innen lag bei 10,3 Jahren.

Für die Analysen wurden die Gesamtwerte der Kompe­tenzmessungen für die Lesekompetenz aus dem PIRLS­Datensatz (N = 4670) sowie für die Mathematik­ und Natur wissenschaftskompetenz aus dem TIMSS­Datensatz (N = 4668) herangezogen, die jeweils in Form von fünf plausible values vorliegen.

Die Angaben zur Hausaufgabenhilfe entstammen dem Schülerfragebogen der PIRLS­Testung („Wer hilft dir am meisten bei den Hausübungen?“).3 Die Angaben zu Ge­schwistern wurden dem Elternfragebogen entnommen.4 Die Eltern wurden nach der Anzahl der Schwestern so­wie nach der Anzahl der Brüder gefragt, die mit dem bei PIRLS & TIMSS 2011 getesteten Kind im gemeinsamen Haushalt leben. Außerdem wurde gefragt, wie viele dieser Geschwister jünger sind als das Zielkind. Aus diesen Angaben ließ sich die Zahl der Kinder im Haushalt, der Geburtsrangplatz (Erst­, Zweit­, Drittgeborene/r usw.) so­wie die Geschwisterposition (Einzelkind, ältestes, mittleres oder jüngstes Kind) ermitteln.5 Die Geschwisterpositi­on diente dann der Bildung von zwei Dummy­Variablen: 1. „Älteres Geschwister vorhanden“ – mit dieser werden mittlere und jüngste Kinder gegen Einzelkinder und älteste getestet – und 2. „Jüngeres Geschwister vorhanden“, mit der älteste und mittlere Kinder gegen Einzelkinder und jüngste getestet werden.

Da mit den Variablen Zahl der Kinder und Geburtsrang­platz sehr differenzierte Analysen durchgeführt wurden und es sich um kategoriale Größen handelt, wurden fehlende Werte für diese Variablen (solche ergaben sich in beiden Datensätzen für 5,8 % der Fälle) nicht imputiert. Außer­dem wurden Familiengrößen ab fünf Kindern aus dem Daten satz ausgeschlossen, weil für diese Familiengrößen die Fallzahlen für eine Auswertung zu gering waren und zum

Teil unplausible Werte im Datensatz vorlagen (dies betrifft weitere 5  % der Fälle in beiden Datensätzen). Dadurch reduzierte sich die Zahl der gültigen Fälle für Berechnun­gen mit den PIRLS­Daten auf 4167 Schüler/innen und für Berechnungen mit den TIMSS­Daten auf 4166 Schüler/innen. Alle im Folgenden berichteten Ergebnisse lassen sich somit nur auf Familien mit ein bis vier Kindern verall­gemeinern.

Auf Grundlage dieser Fallzahlen wurden fehlende Werte in den abhängigen Variablen sowie in den Variablen zur Hausaufgabenhilfe, Nachmittagsbetreuung und privaten Nachhilfe mittels multipler Imputation ersetzt. Für die Imputation wurde ein umfangreiches Variablenset herange­zogen, das sowohl Größen aus dem Elternfragebogen wie auch aus dem Schülerfragebogen enthielt (z. B. Geschlecht, kulturelles Kapital,6 Migrationshintergrund, Bildung der Eltern, häusliche Lernressourcen). Es wurden für jeden Kompetenz bereich (Lesen, Mathematik, Naturwissen­schaft) fünf Datensätze mit imputierten Daten generiert. Der i­te imputierte Datensatz (i = 1, …, 5) verwendet dabei jeweils den i-ten plausible value. Die Imputationen wurden mit dem Modul „Impute Missing Data Values“ in SPSS (Version 20) unter Anwendung der Methode „Predictive Mean Matching“ (PMM) durchgeführt. Die Analysen wur­den mit MPlus7 (Muthen & Muthen, 1998–2012) unter Berücksichtigung der Populations­ und der Replikations­gewichte sowie der geschachtelten Datenstruktur durchge­führt.7 Als Schätzverfahren wurde „Maximum­Likelihood“ (ML) verwendet.

Im Folgenden werden sowohl standardisierte Regressions­koeffizienten (Beta­Gewichte) als auch in einzelnen Fällen unstandardisierte Regressionskoeffizienten (B­Gewichte) berichtet. An Stellen, an denen es nicht sinnvoll ist, Beta­Gewichte zu berichten,8 werden die B­Gewichte herange­zogen. Diese geben direkt den Unterschied in den Kom­petenzwerten zwischen den verglichenen Gruppen wieder.

Ergebnisse

Hausaufgabenhilfe, private Nachhilfe und Nach- mittagsbetreuung in Abhängigkeit von älteren Geschwistern und der Zahl der Kinder

Auf die Frage „Wer hilft dir am meisten bei den Hausübun­gen?“ gaben insgesamt 27 % der Kinder an, keine Hilfe zu

3 https://www.bifie.at/system/files/dl/Sch%C3%BClerfragebogen.pdf (S. 35)4 https://www.bifie.at/system/files/dl/Elternfragebogen.pdf (S. 20)5 Missings wurden durch den Wert 0 ersetzt, wenn eine der beiden anderen Fragen beantwortet wurde. Dieser Vorgehensweise liegt die Annahme zugrunde,

dass die Frage bei Nichtzutreffen übersprungen wurde. Die Variablen zur Geschwisterkonstellation würden sonst über 30 % fehlende Werte aufweisen.6 Anzahl der Bücher zu Hause7 Spezifikation in M­PLUS: TYPE = COMPLEX, REPSE = JACKKNIFE28 An einigen Stellen geht es nicht um den Zusammenhang zweier Größen, sondern um den Unterschied von Gruppen.

Page 106: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

104 Effekte der Geschwisterkonstellation auf schulische Kompetenzen

benötigen, 50 % erhielten Hilfe von Eltern oder Groß eltern, nur 1 % erhielt private Nachhilfe, 7 % erhielten am meisten Hilfe in der Nachmittagsbetreuung, 6 % bekamen Unter­stützung durch andere Personen und 3 % der Kinder gaben an, von niemandem Hilfe zu bekommen. Nur etwa 7  % der Kinder erhielten am meisten Hilfe von Geschwistern. Ob ein älteres Geschwister vorhanden ist oder nicht, stand in keinem signifikanten Zusammenhang mit dem Anteil an Hilfe durch andere Personen (6 %) oder dem Anteil an privater Nachhilfe (1  %). Dagegen erhielten Kinder mit älteren Geschwistern signifikant seltener Hausaufgabenhilfe durch Eltern oder Großeltern (47 % zu 52 %, Beta­Gewicht = –.05, p < .01) aber häufiger durch Geschwister im Ver­gleich zu Kindern ohne ältere Geschwister (11 % zu 2 %, Beta­Gewicht = .19, p < .01). Hilfe in der Nachmittags­betreuung erhielten Kinder mit älteren Geschwistern eben­falls signifikant seltener im Vergleich zu Kindern ohne ältere Geschwister (6 % zu 8 %, Beta­Gewicht = –.05, p < .01). Sind ein oder mehrere ältere Geschwister vorhanden, nimmt demnach die Hausaufgabenhilfe durch Eltern oder Groß­eltern sowie in der Nachmittagsbetreuung ab, während die Hausaufgabenhilfe durch Geschwister zunimmt.

Gemäß der Annahme der Ressourcenverdünnung sollte die Hausaufgabenhilfe durch Eltern und Großeltern jedoch nicht in erster Linie vom Vorhandensein älterer Geschwister, sondern vor allem von der Zahl der Kinder abhängen. Ab­bildung 2.3.1 dokumentiert die entsprechenden Prozentan­teile. Bei der Überprüfung dieser Annahme ergab sich zwar ein niedriges negatives Beta­Gewicht für den Effekt der Zahl der Kinder auf die Häufigkeit der Hausaufgabehilfe durch Eltern oder Großeltern, dieser war jedoch nicht signifikant. Statistisch absichern ließ sich dagegen die Zunahme der Häufigkeit der Hausaufgabenhilfe durch Geschwister mit steigender Zahl der Kinder (von 6 % in Zweikind familien auf 18 % in Vierkindfamilien;9 Beta­Gewicht = .15, p < .01). Für die Häufigkeit von privater Nachhilfe ergab sich kein signifikanter Zusammenhang mit der Zahl der Kinder. Die Häufigkeit von Hilfe in der Nachmittags betreuung jedoch nahm mit steigender Zahl der Kinder signifikant ab (von 13  % in Einkindfamilien auf 3 % in Vierkindfamilien; Beta­Gewicht = –.10, p < .01).

Insgesamt ergab sich also keine Abhängigkeit der elterlichen Hausaufgabenhilfe von der Zahl der Kinder, wohl aber vom Vorhandensein älterer Geschwister. Offenbar sehen sich Eltern seltener veranlasst, selbst Hausaufgabenhilfe zu leisten, wenn ältere Geschwister dies übernehmen können. Möglicherweise wird auch eine nachmittägliche Betreuung häufiger den älteren Geschwistern überlassen, was sich letzt­lich negativ auf den Anteil an Hilfe in der Nachmittags­betreuung ausgewirkt haben könnte. Allerdings kann hier nicht ausgeschlossen werden, dass bei einer höheren Zahl an Kindern die Mütter häufiger zu Hause blieben und eine

externe Nachmittagsbetreuung deshalb seltener in An­spruch genommen wurde. Aus lerntheoretischer Sicht müsste Kindern durch die Hilfe und Betreuung durch ältere Geschwister kein Nachteil entstehen. Es könnte sich im Gegenteil sogar als ein Vorteil erweisen, denn ältere Geschwister liegen näher am Erfahrungshorizont ihrer jüngeren Geschwister als Eltern und können deshalb mög­licherweise besser an deren Wissensstand anschließen.

Entgegen der Erwartung wirkte sich die Zahl der Kinder nicht auf die Häufigkeit privater Nachhilfe aus, wobei angemerkt werden muss, dass der Anteil an Kindern, die angaben, private Nachhilfe zu erhalten, insgesamt auf einem sehr niedrigen Niveau lag. Auf die Häufigkeit von Hilfe in der Nachmittagsbetreuung dagegen zeigte die Zahl der Kinder einen Effekt: Solche Unterstützung war umso unwahrscheinlicher, je mehr Kinder in einer Familie waren. Wie bereits erwähnt, muss dieser Befund nicht bedeuten, dass ältere Geschwister in größeren Familien häufiger die Nachmittagsbetreuung übernehmen. Ebenso wahrschein­lich ist, dass bei mehr als einem Kind die Mütter ihre Berufstätigkeit aufgeben und dann, weil sie selbst zu Hause sind, auf eine externe Nachmittagsbetreuung für die Kinder verzichten.

9 Bei den nicht plausiblen Angaben zur Hausaufgabenhilfe durch Geschwister in Einkindfamilien (2 %) in Abbildung 2.3.1 dürfte es sich um Messfehler handeln.

0

100 %

%

90

80

70

60

50

40

10

30

20

21 3 4Zahl der Kinder in der Familie

Angaben in Prozent; Werte unter 4 % sind nicht eingetragen;

brauche keine Hilfe Eltern/Großeltern Geschwisterprivate Nachhilfe

Nachmittagbetreuungandere Personkeine/r hilft mir

24

51

14

7

28

48

45

9

23

46

5

18

28

51

66

6

Abbildung 2.3.1: Hilfe bei den Hausaufgaben in Abhängigkeit von der Zahl der Kinder (Angaben der

Schüler/innen; PIRLS 2011)

Page 107: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Effekte der Geschwisterkonstellation auf schulische Kompetenzen 105

Ein genauer Blick auf die Daten zeigte außerdem, dass bei Weitem nicht alle Kinder mit älteren Geschwistern Haus­aufgabenhilfe durch Geschwister erhielten. 52 % der Kin­der im Datensatz hatten ältere Geschwister, aber nur 11 % dieser Kinder (7 % insgesamt) gaben an, von Geschwistern Hausaufgabenhilfe zu erhalten. In Familien mit vier Kin­dern lag der Anteil an Hausaufgabenhilfe durch Geschwister jedoch immerhin bei 18 %.

Kompetenzniveaus nach Anzahl der Kinder und Geburtsrangplatz

Nachfolgend soll überprüft werden, ob sich für die Kom­petenzwerte im vorliegenden Datensatz ähnliche Muster ergeben, wie bei Zajonc (1976, S. 228) oder Zajonc und Bargh (1980) berichtet. Dazu wurde in den Abbildungen 2.3.2 bis 2.3.4 die Lese­, Mathematik­ und Naturwissen­schaftskompetenz nach der Zahl der Kinder in der Familie und dem Geburtsrangplatz des im Rahmen von PIRLS & TIMSS 2011 getesteten Kinds dargestellt. Wie im Metho­denteil bereits angesprochen, liegen für Familien mit mehr als vier Kindern keine ausreichenden Fallzahlen vor, sodass auf deren Darstellung verzichtet wird. Schon die Darstel­lung der Kompetenzwerte von Kindern aus Vierkindfa­milien gerät deutlich an die Grenzen. Hier betragen die Fallzahlen für die Lese­/Mathematik­/Naturwissenschafts­kompetenz n = 38/38/38 für Erstgeborene, n = 62/63/63 für Zweitgeborene, n = 103/102/102 für Drittgeborene und n = 102/102/102 für Viertgeborene.

Im Groben bestätigte sich das Bild, das sich auch bei Zajonc (1976) oder Zajonc und Bargh (1980) zeigte: Die Erst­ und Zweitgeborenen aus Zweikindfamilien liegen rein deskrip­tiv betrachtet mit ihren Kompetenzwerten über den Werten der Erst­, Zweit­ und Drittgeborenen aus Dreikindfamilien und diese wiederum über den Werten der Erst­, Zweit­, Dritt­ und Viertgeborenen aus Vierkindfamilien. Lediglich bei der Lese kompetenz ergab sich eine Abweichung von die­sem Muster, hier liegen die Werte für die Erst­ und Zweit­geborenen aus Vierkindfamilien höher als erwartet. Diese Abweichung vom erwarteten Muster ist schwer zu erklären, insbesondere da sie auch nur in einem der drei Kompetenz­bereiche auftritt.

In allen drei Kompetenzbereichen liegen die Werte der Einzelkinder nicht, wie vor dem Hintergrund eines reinen Ressourcenverdünnungsmodells zu erwarten wäre, über den Werten der Erstgeborenen aus Zweikindfamilien, sondern eher, wie vor dem Hintergrund des confluence model und dem damit verbundenen Einzelkindhandicap erwartet werden würde, auf der Höhe der Erstgeborenen aus Dreikindfamili­en (Mathematik) oder zumindest zwischen den Erstgebore­nen aus Zwei­ und Dreikindfamilien (Lesen und Naturwis­senschaft). In allen drei Kompetenzbereichen erwies sich der Unterschied zwischen den Einzelkindern und den Erstgebo­renen aus Zweikindfamilien als signifikant (Lesekompetenz: B­Gewicht = 8.14, p < .05; Mathematik kompetenz: B­Ge­

wicht = 10.81, p < .01; Naturwissenschaftskompetenz: B­Gewicht = 6.88, p < .05; die unstandardisierten B­Ge­wichte geben hier den Punktunterschied in den Kompe­tenzmessungen wieder). Die Unterschiede zwischen den Einzelkindern und den Erstgeborenen aus Drei­ und Vier­

540

550

530

520

500

510

490

480

Lesekompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds

Erst- Zweit-

geborene/r

Dritt- Viert-

ZweikindfamilienEinkindfamilien Dreikindfamilien

VierkindfamilienLe

seko

mpe

tenz

hoch

nied

rig

540

550

530

520

500

510

490

480

Mathematikkompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds

Mat

hem

atik

kom

pete

nz

hoch

nied

rig

Erst- Zweit-

geborene/r

Dritt- Viert-

ZweikindfamilienEinkindfamilien Dreikindfamilien

Vierkindfamilien

Abbildung 2.3.2: Lesekompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (PIRLS 2011)

Abbildung 2.3.3: Mathematikkompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (TIMSS 2011)

Page 108: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

106 Effekte der Geschwisterkonstellation auf schulische Kompetenzen

kindfamilien waren dagegen allesamt nicht signifikant, auch nicht im Falle der Lesekompetenz, wo die Erst­ und Zweitgeborenen aus Vierkindfamilien – vom üblichen Muster abweichend – ungewöhnlich hohe Kompetenzwerte aufwiesen.

Der prognostizierte mögliche kurvilineare Verlauf nach Geburtsrangplatz ab einer Familiengröße von vier Kindern zeigte sich ebenfalls deskriptiv in allen drei Kompetenzbe­reichen, auch wenn der Unterschied zwischen den Dritt­ und den Viertgeborenen in keinem der Fälle signifikant wurde. Der erwartete Abfall der Letztgeborenen gegen­über den jeweils vorgeborenen Kindern, der gleichfalls erst ab einer Familiengröße von vier Kindern sichtbar werden sollte, war dagegen in den Daten nicht zu erkennen.

Die regressionsanalytische Überprüfung eines Abfalls der schulischen Kompetenzwerte mit steigender Zahl der Kinder erwies sich für alle drei Kompetenzbereiche als signifikant (Lesekompetenz: Beta­Gewicht = –.08, p < .01; Mathematikkompetenz: Beta­Gewicht = –.06, p < .01; Natur­ wissenschaftskompetenz: Beta­Gewicht = –.10, p <.01). Eine Überprüfung des kurvilinearen Verlaufs der Kompetenz­werte nach Geburtsrangplatz mittels Regressionsanalysen, die neben einem linearen Term außerdem einen quadrier­ten Term für den Geburtsrangplatz enthielten,10 erbrachte dagegen bei Kontrolle der Zahl der Kinder weder für den linearen noch für den quadrierten Term s ignifikante Ergeb­nisse; dies gilt für alle drei Kompetenzbereiche. In den vor­

540

550

530

520

500

510

490

480

Naturwissenschaftskompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds

Nat

urw

isse

nsch

afts

kom

pete

nz

hoch

nied

rig

Erst- Zweit-

geborene/r

Dritt- Viert-

ZweikindfamilienEinkindfamilien Dreikindfamilien

Vierkindfamilien

Abbildung 2.3.4: Naturwissenschaftskompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (TIMSS 2011)

liegenden Daten ergaben sich demnach keine signifikanten Effekte des Geburtsrangplatzes über einen Effekt der Zahl der Kinder hinaus. Der durch das confluence model prognos­tizierte mögliche Wieder anstieg der Werte später Geborener gegenüber mittleren Geburtsrangplätzen, der insbesondere in größeren Familien auftreten sollte, ließ sich somit infe­renzstatistisch nicht absichern.

Zusammengefasst kann festgehalten werden, dass sich eine höhere Zahl der Kinder, wie durch die Annahme der Res-sourcenverdünnung und das confluence model prognostiziert, linear negativ auf die Kompetenzwerte der Zielkinder aus­wirkte. Der prognostizierte mögliche kurvilineare Verlauf des Geburtsrangplatzes ab einer Familiengröße von vier Kin­dern zeichnete sich lediglich deskriptiv ab. Mög licherweise wäre ein solcher Effekt deutlicher hervorgetreten, wenn grö­ßere Familien in der Stichprobe stärker vertreten gewesen wären. Für einen Abfall der Letztgeborenen gegenüber den Vorgeborenen ergaben sich ebenfalls keine Hinweise. Hier­zu ist anzumerken, dass sich ein solcher Abfall der Letzt­geborenen auch in den von Zajonc (1976, S. 192) sowie Zajonc und Bargh (1980) berichteten Daten keineswegs durchgängig zeigte. Was sich jedoch in den vorliegenden Daten abzuzeichnen scheint, sind relativ niedrige Werte von Einzelkindern. Diese niedrigen Werte sind mit einem reinen Ressourcenverdünnungsmodell nicht in Einklang zu bringen, denn gemäß diesem müssten Einzelkinder die höchsten Kompetenzwerte aufweisen, da sie in den alleinigen Genuss sämtlicher elterlicher Ressourcen kommen. Das confluence model hingegen postuliert ein Handicap von Einzelkindern, da diese keine jüngeren Geschwister haben, denen gegen­über sie lehrende Verhaltensweisen ausüben können. Ein solches Einzelkindhandicap sollte umso stärker ausgeprägt sein, je höher das Testalter von Kindern ist und der teaching effect Zeit hatte, seine Wirkung zu entfalten. Einschränkend angemerkt werden muss allerdings, dass es für die vorgefun­denen niedrigen Werte von Einzelkindern auch alternative Erklärungen geben könnte, die hier nicht geprüft wurden, wie beispielsweise eine häufigere Herkunft aus alleinerzie­henden Haushalten, was mit besonderen ökonomischen Härten einhergehen könnte, oder eine schwierige Persön­lichkeit der Kinder, welche die Entscheidung für weite­ren Nachwuchs verhindert hat (Downey, 2001; Steelman, 1985; Sulloway, 2007).

Lernen von älteren versus Lernen durch jüngere Geschwister

Die Prüfung der Hypothese, nach der jüngere Geschwister systematisch von älteren Geschwistern profitieren könn­ten, weil diese effektive Tutoren/Tutorinnen für jüngere Geschwister darstellen, ist im oberen Teil der Tabelle 2.3.1 dokumentiert. Entgegen der Annahme wirkte sich das Vor­handensein älterer Geschwister in allen drei Kompetenz­bereichen zunächst einmal signifikant negativ aus (vgl.

10 Kurvilineare Zusammenhänge können im regressionsanalytischen Ansatz mittels einfacher und quadrierter Terme geprüft werden (Aiken & West, 1991).

Page 109: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Effekte der Geschwisterkonstellation auf schulische Kompetenzen 107

Tabelle 2.3.1 oberer Teil, Beta­Gewichte für Modell 1). Da Kinder mit älteren Geschwistern sehr wahrscheinlich häufi­ger aus größeren Familien stammen als die Referenzgruppe der Kinder ohne ältere Geschwister – zu letzteren zählen auch die Einzelkinder – und die Zahl der Kinder einen negativen Effekt auf die Kompetenzwerte hat, wurde in einem zweiten Modell die Zahl der Kinder kontrolliert. Die Beta­Gewichte des Modells 2 zeigen, dass sich der Effekt des Vorhandenseins älterer Geschwister durch die Kontrolle der Zahl der Kinder verringerte, allerdings blieb er im Falle der Lese­ und der Naturwissenschaftskompetenz signifikant negativ. Die Analysen ergaben somit keine Hinweise darauf, dass jüngeren Geschwistern durch das Vorhandensein älte­rer Geschwister hinsichtlich schulischer Kompetenzen ein systematischer Vorteil erwächst. Sie scheinen im Gegenteil, auch bei Konstanthaltung der Familiengröße, eher einen Nachteil zu haben.

Im unteren Teil der Tabelle 2.3.1 ist die Prüfung der ge­genteiligen Hypothese dargestellt. Diese besagt, dass älteren Geschwistern durch das Vorhandensein von jüngeren Ge­schwistern ein systematischer Vorteil erwächst, weil erstere davon profitieren, letzteren etwas beibringen zu können. Die Beta­Gewichte für das Vorhandensein eines jüngeren Geschwisters ohne die Kontrolle der Zahl der Kinder waren für alle drei Kompetenzbereiche niedrig und nur im Falle der Lesekompetenz schwach signifikant positiv (s. Tabelle 2.3.1 unterer Teil, Beta­Gewichte für Modell 1). Da Kinder mit jüngeren Geschwistern auch hier eine höhere Wahr­scheinlichkeit haben, aus Familien mit einer höheren Zahl an Kindern zu stammen als die Referenzgruppe, wurde wie­derum ein zweites Modell unter Kontrolle der Zahl der Kin­der berechnet. Bei konstanter Familiengröße erhöhten sich die Effekte für das Vorhandensein eines jüngeren Geschwis­ters und die entsprechenden Beta­Gewichte waren nun für alle drei Kompetenzbereiche signifikant positiv (s. Tabelle 2.3.1 unterer Teil, Beta­Gewichte für Modell 2). Somit kann festgehalten werden, dass sich deutliche Hinweise da­rauf ergaben, dass Kinder mit jüngeren Geschwistern einen systematischen Vorteil in der Entwicklung ihrer schulischen Kompetenzen haben.

Diskussion

Die Ergebnisse unterstützen insgesamt einige zentrale The­sen, die vor dem Hintergrund des Erklärungsmodells der Ressourcenverdünnung sowie des confluence model formuliert wurden: Mit zunehmender Zahl der Kinder nahmen die Kompetenzwerte signifikant ab. Der Geburtsrangplatz da­gegen hatte keinen signifikanten Effekt über die Zahl der Kinder hinaus, auch wenn sich deskriptiv, insbesondere in größeren Familien, ein kurvilinearer Verlauf der Kom­petenzwerte nach Geburtsrangplatz abzeichnete. Wie ein­gangs beschrieben, hängen gemäß dem confluence model Effekte des Geburtsrangplatzes mit dem Testalter der Kin­der zusammen. Negative Effekte des Geburtsrangplatzes wären eher bei höherem Testalter als dem hier vorliegenden zu erwarten, positive Effekte eher bei niedrigerem Testalter (Zajonc, 2001; Zajonc & Bargh, 1980).

Gleichzeitig bestätigte sich, dass Kinder mit älteren Ge­schwistern seltener Hausaufgabenhilfe durch Eltern und Großeltern, häufiger aber von Geschwistern erhielten. Dieses Ergebnis stützt die Annahme des confluence model, nach dem ältere Geschwister lehrende Verhaltensweisen gegenüber ihren jüngeren Geschwistern ausüben. Die Zahl der Kinder wirkte sich ebenfalls in erwarteter Weise auf die Häufigkeit der Hausaufgabenhilfe durch Geschwister aus, nicht aber auf diejenige durch Eltern und Großeltern. Die Annahme der elterlichen Ressourcenverdünnung konnte mit Blick auf die Unterstützung bei Hausübungen somit nicht bestätigt werden.

Das Vorhandensein von älteren Geschwistern zeigte keinen positiven, sondern im Gegenteil einen negativen Effekt auf die schulischen Kompetenzen. Dieses Ergebnis schließt keineswegs aus, dass jüngere Geschwister von den älteren lernen. Es bedeutet lediglich, dass jüngeren Geschwistern dadurch kein systematischer Vorteil gegenüber Kindern ohne ältere Geschwister erwächst. Umgekehrt zeigten Kin­der mit jüngeren Geschwistern auch bei Konstanthaltung der Familiengröße höhere schulische Kompetenzen im Ver­gleich zu Kindern ohne jüngere Geschwister. Dieser Befund

LesekompetenzMathematik-kompetenz

Naturwissenschafts-kompetenz

Modell 1 Modell 2 Modell 1 Modell 2 Modell 1 Modell 2

Ältere Geschwister vorhanden –.09*** –.07** –.05* –.03 –.08*** –.04*Zahl der Kinder –.05* –.05* –.08***R2 .01 .01 .00 .00 .01 .01Jüngere Geschwister vorhanden .04* .08*** .03 .06** .02 .07***Zahl der Kinder –.12*** –.08*** –.13***R2 .00 .01 .00 .01 .00 .01

Legende: *** p < .001; ** p < .01; * p < .05

Tabelle 2.3.1: Betagewichte einfacher und multipler Regressionen der Kompetenzwerte auf Geschwistervariablen (PIRLS & TIMSS 2011)

Page 110: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

108 Effekte der Geschwisterkonstellation auf schulische Kompetenzen

kann durch das im Rahmen des confluence model postulierte Lernen durch Lehren (teaching effect) erklärt werden. Im Unterschied zu Einzelkindern und zu Letztgeborenen haben ältere Geschwister ein jüngeres, dem sie etwas beibringen können. Kindern ohne ein jüngeres Geschwister fehlt diese Lerngelegenheit. Hinweise auf einen teaching effect erbrach­te auch die deskriptive Darstellung der Kompetenzwerte nach Zahl der Kinder und dem Geburtsrangplatz: Im Ver­gleich mit den Erstgeborenen aus Zweikindfamilien wiesen die Einzelkinder signifikant niedrigere schulische Kompe­tenzwerte auf. Dieses Einzelkindhandicap ist nicht mit den Annahmen eines reinen Ressourcenverdünnungsmodells, aber mit dem durch das confluence model postulierten teaching effect vereinbar. Einzelkindern fehlt das jüngere Geschwis­ter, demgegenüber sie lehrende Verhaltensweisen ausüben könnten. Bereits erwähnt wurde, dass es für dieses Einzel­kindhandicap auch alternative Erklärungen geben könnte.

Um solche alternativen Erklärungen in Zukunft ausschlie­ßen zu können, sollte in nachfolgenden Analysen für Grö­ßen kontrolliert werden, welche mit der Zahl der Kinder oder der Geschwisterposition im Zusammenhang stehen könnten. Dazu gehören in erster Linie der sozioökonomi­sche Status der Familie und der Migrationshintergrund, aber auch die Herkunft aus einem alleinerziehenden Haus­halt oder einer Stieffamilie sowie die Berufstätigkeit von Müttern. Ohne die kontrollierende Berücksichtigung dieser Größen müssen die hier favorisierten Erklärungen für den Einfluss der Zahl der Kinder und des Einzelkindhandicaps als vorläufig bezeichnet werden.11

Im Rahmen von Schulleistungsstudien wäre allerdings rela­tiv einfach nachprüfbar, inwieweit schulische Kompetenz­vorteile älterer Geschwister tatsächlich dem postulierten teaching effect geschuldet sind. Dazu bedürfte es allerdings der Aufnahme einer weiteren Frage in den Fragebogen: Neben der Frage nach der erhaltenen Hausaufgabenhilfe durch Geschwister und andere Bezugspersonen müsste die Frage gestellt werden, wie häufig die Kinder selbst jünge­ren Geschwistern Hausaufgabenhilfe erteilen oder anderen Kindern Nachhilfe geben. Mithilfe der entsprechenden An­gaben könnte ein Mediationsmodell berechnet werden, das prüft, inwieweit der gefundene Kompetenzvorsprung älterer Geschwister tatsächlich auf solch lehrende Verhaltensweisen zurückzuführen ist. In einem ähnlichen Modell unter Hin­zuziehung der Angaben zur erhaltenen Hausaufgabenhilfe durch Geschwister konnte bereits gezeigt werden, dass sich der Unterschied in der Lesekompetenz in PISA 2000 zwi­schen Kindern mit und ohne ältere Geschwister durch die geschwisterliche Hausaufgabenhilfe verringerte, die Haus­aufgabenhilfe durch ältere Geschwister somit einen positi­ven Effekt erzielte, der allerdings den negativen Effekt nicht aufwiegen konnte, der sich dadurch ergab, dass Kinder mit

älteren Geschwistern weniger Unterstützung durch Eltern erhielten (vgl. Schmid, 2015).

Abschließend bleibt noch anzumerken, dass die Geschwis­terkonstellationsvariablen insgesamt nur relativ schwache Zusammenhänge mit den schulischen Kompetenzwerten aufwiesen. Der Anteil an aufgeklärter Varianz lag in den Modellen mit Kontrolle der Zahl der Kinder gerade ein­mal bei einem Prozent. Allerdings betrug der Unterschied zwischen Kindern ohne und mit älteren Geschwistern bei der Lesekompetenz immerhin 12 Testpunkte ohne die Kon­trolle der Zahl der Kinder, und noch 9 Testpunkte mit ent­sprechender Kontrolle. Der Unterschied zwischen Buben und Mädchen lag in PIRLS 2011 im Vergleich dazu bei nur 8 Testpunkten zugunsten der Mädchen (Suchan, Wallner­Paschon, Bergmüller & Schreiner, 2012). Die Effekte der Geschwisterkonstellation liegen somit etwa in derselben Größenordnung wie der Geschlechtseffekt und sind damit als nicht ganz unerheblich zu bezeichnen.

11 Entsprechende Analysen auf der Grundlage der deutschen PISA­Studie 2000 erbrachten auch unter Einbezug der genannten Kontrollgrößen weit gehend vergleichbare Ergebnisse (Schmid, 2015).

Page 111: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Effekte der Geschwisterkonstellation auf schulische Kompetenzen 109

Literatur

Aiken, L. S. & West, S. G. (1991). Multiple regression. Testing and interpreting interactions. Thousand Oaks, CA: Sage.

Azmitia, M. & Hesser, J. (1993). Why siblings are important agents of cognitive development: A comparison of siblings and peers. Child Development, 64, 430–444.

Azmitia, M. & Perlmutter, M. (1989). Social influences on children’s cognition: State of the art and future directions. Advances in Child Development and Behaviour, 22, 89–144.

Bargh, J. A. & Shul, Y. (1980). On the cognitive benefit of teaching. Journal of Educational Psychology, 72 (5), 593–604.

Belmont, L. & Marolla, F. (1973). Birth order, family size, and intelligence. A study of a total population of 19-year-old men born in Netherlands is presented. Science, 182, 1096–1101.

Black, S. E., Devereux, P. J. & Salvanes, K. G. (2005). The more the merrier? The effect of family size and birth order on children’s education. The Quarterly Journal of Economics, 120 (2), 669–700.

Blake, J. (1989). Family size and achievement. Los Angeles: University of California Press.

Booth, A. L. & Kee, H. J. (2009). Birth order matters: The effect of family size and birth order on educational attainment. Jour-nal of Population Economics, 22, 367–397.

Cicirelli, V. G. (1972). The effect of sibling relationship on concept learning of young children taught by childteachers. Child Development, 43, 282–287.

Cicirelli, V. G. (1974). Relationship of sibling structure and interaction to younger sib’s cenceptual style. The Journal of Genetic Psychology, 125, 37–49.

Cicirelli, V. G. (1975). Effects of mother and older sibling on the problemsolving behavior of the younger child. Developmental Psychology, 11 (6), 749–756.

Cicirelli, V. G. (1976). Motherchild and sibling-sibling interactions on a problem solving task. Child Development, 47, 588–596.

Downey, D. B. (2001). Number of siblings and intellectual development. The resource dilution explanation. American Psycho-logist, 56 (6/7), 497–504.

Ernst, C. & Angst, J. (1983). Birth order: Its influence on personality. Berlin: Springer.

Hertwig, R., Davis, J. N. & Sulloway, F. J. (2002). Parental investment: How an equity motive can produce inequality. Psycho-logical Bulletin, 128 (5), 728–745.

Kagan, S. (1992). Cooperative learning. San Juan Capistrano, CA: Resources for Teacher.

Kanazawa, S. (2012). Intelligence, birth order, and family size. Personality and Social Psychology Bulletin, 38 (9), 1157–1164.

Kasten, H. (1993). Die Geschwisterbeziehung. Göttingen: Hogrefe.

Liegle, L. (2006). Bildung und Erziehung in früher Kindheit. Stuttgart: Kohlhammer.

McGillicuddy-De Lisi, A. V. (1993). Sibling interactions and children’s communicative competency. Journal of Applied Develop-mental Psychology, 14, 365–383.

Muthén, L. K. & Muthén, B. O. (1998–2012). Mplus User’s Guide. Seventh Edition. Los Angeles, CA: Muthén & Muthén.

Retherford, R. D. & Sewell, W. H. (1991). Birth order and intelligence: Further tests of the confluence model. American Socio-logical Review, 56 (2), 141–158.

Page 112: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

110 Effekte der Geschwisterkonstellation auf schulische Kompetenzen

Rodgers, J. L., Cleveland, H. H., van den Oord, E. & Rowe, D. C. (2000). Resolving the debate over birth order, family size, and intelligence. American Psychologist, 55 (6), 599–612.

Rogoff, B. (1990). Apprenticeship in thinking. Cognitive development in social context. New York NY: Oxford University Press.

Schmid, C. (2015). Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf die Lesekompetenz und Hausaufgabenhilfe in PISA 2000. Zeitschrift für Erziehungswissenschaft 18, 3, 591–615.

Schooler, C. (1972). Birth order effects: Not here not now! Psychological Bulletin, 78, 161–175.

Steelman, L. C. (1985). A tale of two variables: A review of the intellectual consequences of sibship size and birth order. Review of Educational Research, 55 (3), 353–386.

Suchan, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam.

Sulloway, F. J. (2007). Psychology. Birth order and intelligence. Science, 316 (5832), 1711–1712.

Taubmann, P. & Behrmann, J. R. (1986). Effects of number and position of siblings on child and adult outcomes. Social Bio-logy, 33, 22–34.

Vygotsky, L. S. (1978). Mind in society: The development of higher psychological processes. Cambridge, MA: Havard Univer-sity Press.

Zajonc, R. B. (1976). Familiy configuration and intelligence. Science, 192 (4236), 227–236.

Zajonc, R. B. (1983). Validating the confluence model. Pschological Bulletin, 95 (3), 457–480.

Zajonc, R. B. (2001). The family dynamics of intellectual development. American Psychologist, 56 (6/7), 490–496.

Zajonc, R. B. & Bargh, J. (1980). The confluence model: parameter estimation for six divergent data sets on family factors and intelligence. Intelligence, 4, 349–361.

Zajonc, R. B. & Markus, G. B. (1975). Birth order and intellectual development. Psychological Review, 82 (1), 74–88.

Zajonc, R. B. & Mullally, P. R. (1997). Birth order: Reconciling conflicting effects. American Psychologist, 52 (7), 685–699.

Zajonc, R. B. & Sulloway, F. J. (2007). The confluence model: Birth order as a within-family or between-family dynamic? Per-sonality and Social Psychology Bulletin, 33 (9), 1187–1194.

Page 113: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

III. Unterricht in Lesen, Mathematik & Naturwissenschaft an Österreichs Volksschulen

Page 114: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 115: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 113

3.1 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung

Gerda Hagenauer & Konrad Oberwimmer

In der schulischen Praxis wird von Lehrkräften, Eltern und auch Schülerinnen und Schülern der Wert von Hausauf-gaben für die schulische Leistung selten in Frage gestellt. Unter Hausaufgaben werden dabei „solche Aufgaben ver-standen, die vom Lehrer den Schülern zugewiesen werden und die von den Schülern außerhalb der Schule bearbeitet werden sollen“ (Mischo & Haag, 2006, S. 226; in Anleh-nung an Trautwein und Köller, 2003a). In ganztägigen Schulformen liegt häufig eine in den Ganztagsbetrieb „integrierte Hausaufgabenpraxis“ (Hascher & Bischof, 2000) vor. Es herrscht die gängige Überzeugung, dass bei Hausaufgaben durch die Wiederholung des Lernstoffs die Inhalte memorierend gefestigt und die Anwendung von Re-geln bzw. Algorithmen geübt werden, was wiederum eine Leistungssteigerung nach sich ziehen sollte. Nach Ansicht der (meisten) Lehrkräfte stellen Hausaufgaben somit ein didaktisches Werkzeug zur Förderung schulischen Lernens dar (z. B. Trautwein, Niggli, Schnyder & Lüdtke, 2009). In der empirischen Bildungsforschung wird die Sinnhaf-tigkeit von Hausauf gaben allerdings kontrovers diskutiert (Trautwein & Köller, 2003a). Ein klar positiver Effekt von Hausaufgaben auf die schulische Leistung konnte in einer Zusammenschau unterschiedlichster Studien im deutsch-sprachigen Raum bisher nicht belegt werden (Trautwein, Schnyder, Niggli, Neumann & Lüdtke, 2009). Insbeson-dere im Grundschulalter ist der Link Hausaufgaben – Leistung noch überwiegend ungeklärt, da sich bisher nur wenige Studien dieser Altersstufe gewidmet haben (Roß-bach, 1995). Es besteht allerdings nicht nur Zweifel an der Effektivität von Hausaufgaben bezüglich der Schulleistung, die Hausaufgabenpraxis wurde ebenfalls im Hinblick auf die mit ihr einhergehende Belastung kritisch diskutiert (Spiel, Wagner & Fellner, 2002; Wagner, Hirten lehner, Bacher & Schober, 2010). Müssen Schüler/innen zu viele oder zu schwierige Hausaufgaben erledigen, steigt die Be-lastung durch die außerschulische Arbeit und negative Folgeeffekte sind sehr wahrscheinlich, z. B. das Erleben von negativen Emotionen oder auch die Beeinträchti-gung der Eltern-Kind-Beziehung durch mögliche auftre-tende Konflikte bei der Hausaufgabener ledigung (z. B. bei einer mangelnden Arbeitsbereitschaft des Kinds; Xu & Corno, 1998). Somit können Hausaufgaben nicht nur zu Belastungen auf Schülerseite, sondern auch zu zeit-

lichen und emotionalen Belastungen der Eltern führen (Jäger, Stuck, Jäger-Flor & Riebel, 2010).

Hausaufgaben als Mittel der Lernförderung bzw. Lern-unterstützung sind folglich nur dann zu rechtfertigen, wenn diese tatsächlich zum gewünschten Lernerfolg führen, und dabei auch das Wohlbefinden aller Beteiligten, insbesondere jenes der Schüler/innen, nicht beeinträchtigt wird.

Mit der Bedeutung von Hausaufgaben für die schulische Leistung befasst sich der folgende Beitrag. Nach einer deskriptiven Darstellung der Hausaufgabenpraxis in Lesen (PIRLS) und Mathematik (TIMSS) am Ende der Grund-schulzeit in Österreich wird ein Modell aufgestellt, das mithilfe von Variablen der Hausaufgabenpraxis Teile der schulischen Leistung in Lesen und Mathematik zu erklären versucht.

Die Hausaufgabenpraxis

Im österreichischen Schulorganisationsgesetz (SchOG § 17/2) wird die Vergabe von Hausaufgaben nur grob ge-regelt. Als Ziel von Hausaufgaben wird neben der Erzie-hung zur Selbstständigkeit (durch den Erwerb von Selbst-regulation) die Vertiefung und Wiederholung des Gelernten angeführt. Dabei zählen Hausaufgaben zu den Mitarbeits-leistungen, sie sollen an die Belastbarkeit der Schüler/innen angepasst werden, ihre Erledigung soll ohne fremde Hilfe gelingen und über die Art der Kontrolle dürfen Lehrpersonen frei entscheiden.

Wie sich die Hausaufgabenpraxis auf Grundlage dieser relativ weit gefassten Regelung nun tatsächlich an österrei-chischen Grundschulen gestaltet, darauf soll im folgenden Abschnitt unter Bezugnahme auf Schüler-, Lehrer- und auch Elterneinschätzungen näher eingegangen werden. Diese Darstellung bezieht auch die aktuelle empirische Be-fundlage der Hausaufgabenforschung mit ein.

Die Effektivität von Hausaufgaben für die Leistung der Schüler/innen ist nach wie vor nicht eindeutig geklärt, weshalb diese Beziehung im Fokus des folgenden Beitrags steht. Im ersten Abschnitt wird die Hausaufgabenpraxis in Lesen und Mathematik unter deskriptiven Gesichtspunkten beschrieben. Im zweiten Abschnitt wird ein Modell zur Erklärung bzw. Vorhersage der Mathematik- und Leseleistung durch die Hausaufgabenpraxis geprüft.

Page 116: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

114 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung

Dauer und Häufigkeit von Hausaufgaben in Lesen und Mathematik

Bisherige Studien zeigen auf, dass für die Erzielung eines positiven Effekts der Hausaufgaben auf die Leistung weniger die Dauer der Erledigung, als vielmehr die Regel mäßigkeit der Hausaufgabenvergabe entscheidend ist (z. B. Lipowsky et al., 2004; Trautwein, Köller & Baumert, 2001 für Sekun-darschüler/innen im Fach Mathematik). Die Hausaufga-bendauer steht häufig negativ mit der schulischen Leistung in Verbindung. Dies ist insofern erwartungsgemäß, als zu-meist leistungsschwächere Schüler/innen auch längere Zeit für die Hausaufgabenerledigung benötigen (De Jong et al., 2000; Trautwein, 2007).

In PIRLS und TIMSS wurden sowohl Lehrpersonen als auch Schüler/innen zur Häufigkeit und Dauer der Haus-aufgaben befragt. Abbildung 3.1.1 vergleicht die Angaben der Schüler/innen und der Lehrpersonen zu diesen beiden Merkmalen. Bezüglich der Häufigkeit der Hausaufgaben ge-ben über 80 % der Schüler/innen an, jeden oder fast jeden Tag Hausaufgaben in Mathematik zu erledigen. Ebenso vie-le Schüler/innen haben eine Lehrkraft, die diese Häufigkeit von Hausaufgaben nennt. Etwas weniger häufig kommen Lesehausaufgaben vor, aber auch diese werden mehrmals wöchentlich aufgegeben/erledigt. Nur etwa 1 % der Schü-ler/innen geben an, nie Mathematikhausaufgaben zu bear-beiten. Etwa so viele haben einen Lehrer/eine Lehrerin, der oder die nie Mathematikhausaufgaben vergibt. Hingegen wird ein Lesehausaufgaben-Verzicht von 7,5 % der Schüler/innen berichtet, während nur 0,5 % von einer Lehrkraft un-terrichtet werden, die angibt, nie Lesehausaufgaben zu ver-geben. Diese Diskrepanz in den Antworthäufigkeiten von Schülerinnen und Schülern und Lehrkräften kann mit den vorliegenden Daten nicht geklärt werden. Es geht jedoch sowohl aus den Schülerangaben als auch aus den Lehrkräfte-angaben klar hervor, dass Hausaufgaben einen integralen Bestandteil der schulischen Unterrichtspraxis darstellen.

Während Schüler/innen und Lehrpersonen die Frage nach der Dauer der Hausaufgaben getrennt nach Lesen und Mathematik beantworteten, gaben die Eltern eine gene-relle Einschätzung der gesamten aufgewendeten Zeit für Hausaufgaben pro Tag ab. Der Großteil der Kinder in der 4. Klasse Grundschule benötigt nach Elternangaben zwi-schen 30 und 60 Minuten für die Erledigung der Haus-aufgaben (46,4 %). 33,7 % der Kinder verbringen zwischen einer Viertel- und einer halben Stunde mit Hausaufgaben, weitere 4,6 % benötigen rund eine Viertelstunde. Lediglich 1,4 % der Eltern geben an, dass das Kind keine Hausauf-gaben bekommt. Immerhin 13,8 % der Kinder benötigen täglich über eine Stunde für das Erledigen der Hausauf gaben.

Die getrennte Bearbeitungsdauer von Lese- und Mathema-tikhausaufgaben aus Lehrpersonen- und Schülersicht ist in Abbildung 3.1.2 dargestellt. Hier wird zum einen deutlich, dass die Mathematikhausaufgaben im Schnitt länger dau-ern als die Lesehausaufgaben, und zum anderen, dass die Lehrpersonen die Dauer der Hausaufgaben etwas höher einschätzen als die Schüler/innen. So geben beispielsweise 31,4 % der Schüler/innen an, die Mathematikhausauf-gaben innerhalb von 15 Minuten lösen zu können, wäh-rend im Vergleich „nur“ 6,5 % einen Lehrer/eine Lehrerin haben, der oder die von diesem kurzen Zeitfenster ausgeht. Die höhere Einschätzung der Hausaufgabendauer durch die Lehrpersonen steht im Widerspruch zu bisherigen Befun-den, die tendenziell eher gezeigt haben, dass Lehrpersonen die Dauer der Hausaufgaben unterschätzen, wobei sich diese Vergleichsbefunde überwiegend auf den Sekundarstu-fenbereich beziehen (im Überblick, siehe Spiel et al., 2002)

Die Daten spiegeln demnach eine große zeitliche Streuung im Hinblick auf die Hausaufgabenbearbeitung wider. Dies zeigte sich auch in der von Spiel et al. (2002) durchgeführten Studie an Schülerinnen und Schülern der 3. Klasse Grund-schule, in der sich eine Variation von 0,75 bis 11,25 Stunden Arbeitszeit pro Woche für die Schule (Hausaufgaben- und Übungszeit) aus den Angaben der Drittklässler errechnete.

0 % 20 % 40 % 60 % 80 % 100 %

Häufigkeit der Hausaufgaben

S/S: Lesen 43.9 34.2 14.3 7.5

LP: Lesen 57.5 33.3 8.7

S/S: Mathematik 83.4 13.4

LP: Mathematik 10.888.3

nieweniger als 1-mal die Woche1- bis 2-mal die Wochejeden oder fast jeden Tag

Abbildung 3.1.1: Häufigkeit von Lese- und Mathematikhausaufgaben aus Schüler/innen (S/S)- und Lehrpersonensicht (LP) (PIRLS & TIMSS 2011)

Page 117: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 115

Werden die Häufigkeit und die Dauer der Hausaufgaben nun in einem weiteren Schritt klassenspezifisch betrachtet, d. h., werden die Angaben der Lehrkraft direkt mit den An-gaben der eigenen Schüler/innen – gefasst als Median ihrer Angaben – verglichen, so bestätigt sich das eben berichtete Bild: Die Häufigkeit von Lese hausaufgaben (siehe Abbil-dung 3.1.3) und die Dauer von Mathematikhausaufgaben (siehe Abbildung 3.1.4) wird von Lehrkräften höher einge-schätzt als von ihren eigenen Schüler/innen. Es zeigen sich demnach auch im internen Klassen vergleich Unterschiede in den Einschätzungen.

Ein wesentlicher Faktor, der die Bearbeitungszeit von Haus-aufgaben beeinflusst, ist das Kompetenzniveau der Schüler/innen. Die Daten aus PIRLS und TIMSS belegen, dass Schüler/innen auf den unteren Kompetenzstufen deutlich länger für das Erledigen von Mathematik- und Lesehaus-aufgaben benötigen als Schüler/innen auf den höheren Kompetenzstufen, wodurch sich auch hier die in empi-rischen Studien vielfach belegte negative Beziehung auf Schülerebene zwischen Hausaufgabendauer und Leistungs-stärke bestätigen lässt (im Überblick, siehe z. B. Trautwein & Köller, 2003a). Leistungsschwache Schüler/innen stellen

0 % 20 % 40 % 60 % 80 % 100 %

bis zu 15 Minuten16−30 Minuten31−60 Minutenüber 60 Minuten

Dauer der Hausaufgaben

S/S: Lesen 5.5 23.4 68.4

LP: Lesen 44.8 53.8

S/S: Mathematik 16.7 47.1 31.4

LP: Mathematik 13.3 80.2 6.6

Abbildung 3.1.2: Dauer von Lese- und Mathematikhausaufgaben aus Schüler/innen (S/S)- und Lehrpersonensicht (LP) (PIRLS & TIMSS 2011)

0 % 20 % 40 % 60 % 80 % 100 %

Gegenüberstellung Lehrperson und Klasse (Median): Häufigkeit Hausaufgaben

Lesen 7.4 59.1 33.6

Mathematik 7.9 90.3

Lehrer länger als Klassenmediangleiche EinschätzungLehrer kürzer als Klassenmedian

Abbildung 3.1.3: Einschätzung der Hausaufgabenhäufigkeit aus der Sicht der Klassenlehrperson im Vergleich zu den eigenen Schülerinnen und Schülern (PIRLS & TIMSS 2011)

0 % 20 % 40 % 60 % 80 % 100 %

Lehrer länger als Klassenmediangleiche EinschätzungLehrer kürzer als Klassenmedian

Gegenüberstellung Lehrperson und Klasse (Median): Dauer Hausaufgaben

Mathematik 8.7 20.371.0

Lesen 90.37.9

Abbildung 3.1.4: Einschätzung der Hausaufgabendauer aus der Sicht der Klassenlehrperson im Vergleich zu den eigenen Schülerinnen und Schülern (PIRLS & TIMSS 2011)

Page 118: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

116 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung

somit eine gefährdete Gruppe bezüglich einer zeitlichen Be- und möglicherweise ebenso Überlastung ausgelöst durch die gängige Hausaufgabenpraxis dar. Die Unterschiede sind dabei besonders stark im Bereich Lesen ausgeprägt: 85,5 % der leistungsstarken Schüler/innen geben an, weniger als 15 Minuten für die Lesehausaufgaben zu benötigen, während von dieser kurzen Bearbeitungsdauer lediglich 49,8 % der Risikoschüler/innen berichten (Kompetenzstufe < 1). In Mathematik sind die leistungsschwachen Schüler/innen insbesondere durch eine lange Hausaufgabenzeit von über einer Stunde betroffen (12,7 % im Vergleich zu 0 % der Spitzenschüler/innen). Die exakten Unterschiede in Prozent sind Abbildung 3.1.5 für die Lesehausaufgabendauer und Abbildung 3.1.6 für die Mathematikhausaufgabendauer zu entnehmen.

Unterstützung bei den Hausaufgaben

Entsprechend dem Schulorganisationsgesetz sollten Haus-aufgaben so vergeben werden, dass diese selbstständig von den Schülerinnen und Schülern gelöst werden können. Angaben aus PIRLS und TIMSS 2011 zur häuslichen Unterstützung bei den Hausaufgaben zeigen jedoch klar, dass Hausaufgaben sehr häufig nicht alleine, sondern mit Unterstützung gemacht werden. Diese Unterstützungsleis-tung ist in Mathematik häufiger vorzufinden als in Lesen. Während die Eltern in 43,2 % der Fälle angeben, dass das Kind keine Hilfe bei den Leseaufgaben benötigt, kommen bei den Mathematikhausaufgaben im Vergleich nur 21,7 % der Schüler/innen ohne elterliche Hilfe aus. Die Mutter ist dabei die zentrale Bezugsperson, die am häufigsten um Hilfe gefragt wird: 43 % der Kinder wenden sich bei Leseauf-

0 % 20 % 40 % 60 % 80 % 100 %

bis zu 15 Minuten16−30 Minuten31−60 Minutenüber 60 Minuten

Stufe 4

Stufe 3

Stufe 2

Stufe 1

< Stufe 1

Zeitliche Beanspruchung durch Lesehausaufgaben nach Kompetenz

49.826.813.89.7

55.929.88.75.5

65.525.46.4

76.919.1

85.513.1

0 % 20 % 40 % 60 % 80 % 100 %

bis zu 15 Minuten16−30 Minuten31−60 Minutenüber 60 Minuten

Stufe 4

Stufe 3

Stufe 2

Stufe 1

< Stufe 1

Zeitliche Beanspruchung durch Mathematikhausaufgaben nach Kompetenz

32.450.716.9

33.149.215.4

31.748.016.43.9

28.544.818.48.3

32.836.817.612.7

Abbildung 3.1.6: Schüler/innen unterschiedlicher Kompetenzniveaus in Mathematik und benötigte Zeit für Mathematikhausaufgaben (PIRLS & TIMSS 2011)

Abbildung 3.1.5: Schüler/innen unterschiedlicher Kompetenzniveaus in Lesen und benötigte Zeit für Lesehausaufgaben (PIRLS & TIMSS 2011)

Page 119: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 117

gaben und 52,4 % bei den Mathematikhausaufgaben an die Mutter. Der Vater wird bei den Mathematikhausaufgaben stärker zu Rate gezogen (13 %) als bei den Lesehausauf-gaben (3 %). Neben den Eltern spielen auch institutionelle Nachmittagsbetreuungen eine Rolle bei der Hausaufgaben-unterstützung (5–6 %).

Die Unterstützungsleistung der Eltern ist nicht per se als positiv für die Leistungsentwicklung der Kinder zu beur-teilen. Vielmehr ist deren Effektivität von der Qualität der gewährleisteten Unterstützung abhängig. Studien konn-ten belegen, dass kontrollierendes, „produktorientiertes“ (lösungsorientiertes) und bewertendes Verhalten der Eltern von den Kindern als wenig unterstützend erlebt wird und die Hausaufgabenmotivation und infolge auch die Leistung negativ beeinflussen kann (Cooper, Lindsay & Nye, 2000; Mischo & Haag, 2006; Pomerantz & Eaton, 2001; Pome-rantz, Wang & Ng, 2005; Wild & Gerber, 2007). Dieser negative Effekt kann durch die Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) erklärt werden. Diese postuliert, dass autonome Lernumgebungen, in denen die drei grundlegenden Bedürfnisse nach Autonomie, sozialer Eingebundenheit und Kompetenz erfüllt werden, die Basis für das Entstehen von (Lern-)Motivation und infolge auch für die Leistung bilden.

Den Eltern wurden bei PIRLS und TIMSS sieben Fragen zu ihrem Unterstützungsverhalten gestellt. Diese Verhal-tensweisen werden im Folgenden deskriptiv dargestellt. Ob diese Unterstützungsleistung von den Kindern als (negativ) kontrollierend oder (positiv) begleitend/unterstützend er- lebt wurde, kann aus den vorliegenden Daten jedoch nicht beantwortet werden.

Abbildung 3.1.7 zeigt, dass sich Eltern sehr häufig für die Hausaufgaben der Kinder interessieren und sich um eine ge-wissenhafte Erledigung kümmern. So geben immerhin zwi-schen 70 und 80 % der Eltern an, dass sie täglich oder fast

täglich die Hausaufgabenerledigung kontrollieren. Weiters achten sie darauf, dass sich das Kind Zeit für die Hausauf-gaben nimmt, sowie zeigen ebenso daran Interesse, was das Kind in der Schule macht und was zu Hause für die Schule zu erledigen ist. Etwas weniger häufig werden die Kinder auch tatsächlich bei der Hausaufgabenerledigung unter-stützt (47,3 % geben an, dies täglich/fast täglich zu tun) und am wenigsten oft wird mit dem Kind gemeinsam Lesen oder Mathematik geübt. Die hohe häusliche Unterstützung ist im Allgemeinen bezeichnend für das Grundschulalter, während diese im Sekundarschulalter abnimmt. Gründe hierfür könnten die erhöhte Selbstständigkeit der Schüler/innen oder auch ein Anstieg der Komplexität des Lernstoffs bzw. der Aufgaben sein (siehe z. B. Jäger et al., 2010).

Hausaufgabenpraxis in der Schule

Nicht nur die Qualität der elterlichen Unterstützung spielt eine Rolle für die Effektivität der Hausaufgaben, sondern auch die Qualität der Hausaufgabenpraxis in der Schule. Didaktische Professionalität bezogen auf die Hausaufga-bengestaltung lässt sich entsprechend empirischen Erkennt-nissen durch einen differenzierten Einsatz von Hausauf-gaben im Unterricht verbunden mit einem entsprechenden Monitoring und hoher Kompetenz in der kognitiv aktivie-renden und motivierenden Aufgabenauswahl beschreiben (z. B. Dettmer, Trautwein & Lüdtke, 2009; Hascher & Hofmann, 2011).

In PIRLS und TIMSS liegen Daten zur Individualisierung der Hausaufgabenvergabe und zur Kontrolle der Hausauf-gabenerledigung vor. Die Daten lassen jedoch keine Rück-schlüsse auf die Aufgabenqualität zu.

Hausaufgabenvergabe

In Österreichs Grundschulklassen haben Lehrkräfte eine he-terogene Schülerschaft zu unterrichten. Um dieser Hetero -

0 % 20 % 40 % 60 % 80 % 100 %

nie oder fast nie1- bis 2-mal im Monat1- bis 2-mal die Wochejeden oder fast jeden Tag

Mit meinem Kind Mathematik üben

Mit meinem Kind Lesen üben

Meinem Kind bei Schulaufgaben helfen

Mein Kind fragen, was es in der Schule gemacht hat

Überprüfen, ob die Hausaufgaben gemacht wurden

Darauf achten, dass das Kind sich Zeit für Hausaufgaben nimmt

Besprechen, was für die Schule zu tun ist

Elterliche Unterstützung

77.8 16.6

74.1 11.2 11.2

79.1 11.1 7.5

75.3 20.7

47.3 32.9 10.2 9.6

22.9 34.3 12.9 29.9

20.9 40.3 21.5 17.3

Abbildung 3.1.7: Häusliche Unterstützung bei Hausaufgaben (Angaben der Eltern) (PIRLS & TIMSS 2011)

Page 120: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

118 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung

genität bestmöglich gerecht zu werden und Schüler innen und Schülern eine optimale Förderung zukommen zu las-sen, wird als didaktisches Werkzeug die Individualisierung des Unterrichts und infolge auch die Individualisierung der Hausaufgabenpraxis empfohlen. Nach Grasedieck (2009) kann Individualisierung auf verschiedenen Ebenen ansetzen, z. B. Individualisierung unter Berücksichtigung des Inter-esses, der Lernmuster oder auch des Lerntempos. Bezug-nehmend auf das Lerntempo sollte beispielsweise dem Um-stand Rechnung getragen werden, dass leistungsschwächere Schüler/innen deutlich länger für die Erledigung von Haus-aufgaben brauchen. Daher sollte auch die Länge der Haus-aufgaben entsprechend individualisiert werden. Wesent lich hierbei ist jedoch, dass auch leistungsschwächere Schüler/innen das mit den Hausaufgaben verbundene Lernziel erreichen können.

Diese Form der individualisierten Hausaufgabenvergabe, die die Leistungsstärke der Schüler/innen berücksichtigt, wurde in PIRLS und TIMSS erfasst. Ähnlich, wie die Befunde von

Hascher und Hofmann (2008; 2011) sowie von Schnyder et al. (2008) im Sekundarschulbereich zeigen, berichten auch die Grundschullehrer/innen selten von einer indivi-dualisierten Hausaufgabenvergabe: 75,2 % der Schüler/in-nen in Lesen und 82,3 % der Schüler/innen in Mathematik werden von einer Lehrkraft unterrichtet, welche die gleiche Hausaufgabe für alle Kinder einer Klasse standardmäßig einsetzt. In einzelnen Fällen wird bei der Hausaufgabenver-gabe nach Leistungsstärke differenziert. Leistungsschwache Schüler/innen bekommen dann zumeist weniger Hausauf-gaben, was zu einer zeitlichen Entlastung führen soll, oder andere Aufgaben, um eine möglichst optimale Passung zum Kompetenzniveau zu erzielen. Leistungsschwachen Schüle-rinnen und Schülern mehr Hausaufgaben zu erteilen, wird im schulischen Alltag entsprechend den Angaben der Lehr-kräfte fast nie oder nur sehr selten realisiert. In den Fällen, in denen die Lehrkräfte die individualisierte Hausaufgaben-praxis einsetzen, orientieren sie sich demnach überwiegend am wünschenswerten pädagogischen Förderprinzip (= indi-viduelle Hausaufgabe je nach Leistungsstand; Vermeidung

0 % 20 % 40 % 60 % 80 % 100 %

nie oder fast niemanchmalimmer oder fast immer

Individualisierung der Mathematikhausaufgaben

Die gleiche HA für alle S/S 83.0 14.8

Schwache S/S weniger HA 9.9 59.3 30.8

Schwache S/S mehr HA 8.1 90.9

Schwache S/S eine individuelle HA 9.0 63.5 27.5

0 % 20 % 40 % 60 % 80 % 100 %

nie oder fast niemanchmalimmer oder fast immer

Individualisierung der Lesehausaufgaben

Die gleiche HA für alle S/S 75.5 21.0

Schwache S/S weniger HA 11.2 50.2 38.6

Schwache S/S mehr HA 8.6 88.8

Schwache S/S eine individuelle HA 15.2 49.0 35.7

Abbildung 3.1.9: Häufigkeit der Vergabe von individualisierten Mathematikhausaufgaben in Abhängigkeit vom Leistungsniveau der Schüler/innen (S/S) (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)

Abbildung 3.1.8: Häufigkeit der Vergabe von individualisierten Lesehausaufgaben in Abhängigkeit vom Leistungsniveau der Schüler/innen (S/S) (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)

Page 121: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 119

von Überforderung) (siehe Abbildung 3.1.8 und Abbildung 3.1.9).

Hausaufgabenkontrolle

Es ist davon auszugehen, dass Hausaufgaben, die nicht kon-trolliert werden, entweder keinen Effekt oder womöglich sogar einen negativen Effekt im Hinblick auf die Leistungs-entwicklung der Schüler/innen bewirken, da Fehlkonzepte, Missverständnisse, Fehler oder Schwächen nicht aufgedeckt und daher auch nicht bearbeitet werden können. Die Haus-aufgabenkontrolle ist demnach ein wesentlicher Bestandteil qualitätsvoller Hausaufgabenpraxis. Aber auch in der Schule ist die Hausaufgabenkontrolle nicht per se ein leistungsför-dernder Indikator, sondern sie muss im Hinblick auf ihre Qualität, d. h. auf die Art der Umsetzung diskutiert werden. So konnten bisherige Studien zur Hausaufgabenkontrolle in der Schule – ähnlich wie im Elternhaus – belegen, dass die Wahrnehmung der Hausaufgabenkontrolle durch die Schüler/innen (kontrollierend vs. unterstützend) eine ent-scheidende Rolle spielt, ob sich diese positiv oder negativ für die schulische Leistung erweist (z. B. Trautwein, Niggli, Schnyder & Lüdtke, 2009).

In PIRLS und TIMSS haben die Lehrkräfte Angaben zur Hausaufgabenkontrolle gemacht. Sie wurden zum einen gefragt, ob sie Hausaufgaben auf deren Vollständigkeit kontrollieren, zum anderen, ob sie diese auch korrigieren und rückmelden bzw. in der Klasse besprechen. Die Abbil-dungen 3.1.10 und 3.1.11 illustrieren, dass die Hausauf-gabenkontrolle sehr hoch ausgeprägt ist. Beinahe alle Schü-ler/innen (98,6 % in Mathematik und 89,9 % in Lesen) haben einen Lehrer/eine Lehrerin, der oder die kontrolliert, ob die Hausaufgaben vollständig erledigt wurden. Auch die Hausaufgabenkorrektur und -rückmeldung wird in Mathe-matik fast immer (96,3 %) und in Lesen in den überwie-genden Fällen (75,8 %) vorgenommen. Weniger häufig, aber immer noch regelmäßig werden Hausauf gaben in der Klasse gemeinsam (d. h. ohne Differenzierung) besprochen. Zusammenfassend spiegeln die Daten also ein hohes Haus-aufgabenmonitoring in Österreichs Grundschulklassen wider. Es kann allerdings auch hier keine Aussage darüber getroffen werden, wie dieses Monitoring von den Schülerin-nen und Schülern wahrgenommen wird („kontrollierend“ vs. „unterstützend“).

0 % 20 % 40 % 60 % 80 % 100 %

nie oder fast niemanchmalimmer oder fast immer

Hausaufgabenmonitoring in Lesen

Korrigieren und Rückmeldung geben 76.1 21.2

Hausaufgaben in der Klasse besprechen 64.2 31.6

Kontrollieren, ob Hausaufgaben vollständig erledigt 8.889.9

0 % 20 % 40 % 60 % 80 % 100 %

nie oder fast niemanchmalimmer oder fast immer

Hausaufgabenmonitoring in Mathematik

Korrigieren und Rückmeldung geben 96.3

Hausaufgaben in der Klasse besprechen 53.6 44.3

Kontrollieren, ob Hausaufgaben vollständig erledigt 98.4

Abbildung 3.1.11: Art der Hausaufgabenüberprüfung in Mathematik durch die Lehrkraft (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)

Abbildung 3.1.10: Art der Hausaufgabenüberprüfung in Lesen durch die Lehrkraft (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)

Page 122: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

120 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung

Vorhersage der Lese- und Mathematik-leistung durch die Hausaufgabenpraxis

Bisher wurde die Hausaufgabenpraxis vornehmlich deskrip-tiv behandelt. Im Zuge dieser Analysen wurde der über-wiegende Anteil an Indikatoren, die im folgenden Modell zur Erklärung, wie sehr die Schulleistung von der Hausauf-gabenpraxis beeinflusst wird, bereits erläutert und in den Kontext der aktuellen Befundlage der Hausaufgabenfor-schung gesetzt.

Im folgenden Abschnitt wird ein Modell zur Vorhersage der Leistung in Lesen und Mathematik abgeleitet und berech-net. Dabei wird der Forderung von Trautwein und Kolle-ginnen und Kollegen (z. B. 2009) nach Berücksichtigung der hierarchischen Struktur der Daten Rechnung getragen, indem Mehrebenenmodelle mit Prädiktoren auf Schüler-ebene (Level 1) und Klassenebene (Level 2) berechnet wer-den. Die Intraclasscorrelation beträgt .13 für Lesen und .20 für Mathematik, weshalb es notwendig und sinnvoll erscheint, mehrebenenanalytisch vorzugehen und Indika-toren ebenso auf der Klassenebene zu berücksichtigen.

Modellspezifikation

Die Mehrebenenmodelle sind als Random-Intercept- Modelle spezifiziert. Das bedeutet, dass zu individuellen Einflussfaktoren auf die Lese- bzw. Mathematikleistung (= Level  1: bspw. Lernressourcen im Elternhaus, Ge-schlecht oder Dauer der Hausaufgabenerledigung) ein unterschied licher Grundwert pro Klasse geschätzt wird, der von Faktoren auf Klassenebene abhängt (= Level 2: bspw. Schulstandort, Häufigkeit von Hausübungen in der Klasse oder individualisierender Umgang mit Hausübungen durch die Lehrkraft). Eine mögliche unterschiedliche Bedeutsam-keit der Faktoren der individuellen Ebene in verschiedenen Klassen wurde nicht modelliert.

Die Modelle folgen einem schrittweisen Aufbau, der in Tabelle 3.1.1 dargestellt ist. Modell 1 beinhaltet lediglich Kontrollvariablen auf individueller und Klassenebene, die nach bisherigen Untersuchungen vermutlich einen Ein-fluss auf die Lese- bzw. Mathematikleistung zeigen. In Modell 2 werden Variablen eingeführt, welche sich auf die individuelle Hausaufgabenpraxis und das elterliche Monitoring beziehen. Modell 3 ergänzt die Prädiktoren auf Klassenebene um die durchschnittliche Häufigkeit und Dauer der Hausauf gaben in der Klasse sowie das Monito-ring und den differenzierenden Umgang mit Hausaufgaben durch die Lehrperson.

Die Ergebnisse in Tabelle 3.1.1 beschreiben unstandardi-sierte lineare Koeffizienten (Standardfehler und Signifikanz in Klammern). Diese sind so zu lesen, dass mit der Verände-rung der Prädiktorvariablen um eine Einheit eine geschätzte Veränderung des Lese- oder Mathematikleistungswerts (auf individueller oder Klassenebene) um eine dem Koeffizienten

entsprechende Anzahl an Einheiten einhergeht. Um diese Koeffizienten in Effektstärken interpretieren zu können, ist es notwendig zu beachten, ob es sich um Dummy-Variablen für Gruppenunterschiede handelt bzw. auf welchen Stan-dardabweichungen die stetigen Variablen beruhen. Tabelle 3.1.1 gibt darüber Auskunft.

Fehlende Werte wurden nicht ersetzt, sondern listenweise ausgeschlossen. Im vollständigen Modell 3 mit allen Vari- ablen befinden sich bei PIRLS noch 3600 Fälle (77 % der Stichprobe) und bei TIMSS 3548 Fälle (76 % der Stich-probe). Keine der in den Modellen verwendeten Variablen weist für sich genommen eine relative Häufigkeit an Missings über 10 % auf, sodass von unsystematischen Aus-fällen ausgegangen werden kann.

Die Modelle wurden in MPlus 7 geschätzt, dabei wurde der MLR-Schätzer verwendet, die entsprechenden Gewichte auf individueller und Klassenebene herangezogen und die Berechnung für alle fünf plausible values repliziert (und gemittelt), um exakte Standardfehler berichten zu können.

Ergebnisse der mehrebenenanalytischen Überprüfungen

Tabelle 3.1.2 gibt die Ergebnisse der stufenweise aufgebau-ten Mehrebenenmodelle wieder. Als abhängige Variablen fungierten die Lese- und die Mathematikleistung.

In Modell 1 werden Merkmale kontrolliert, die sich aus der bisherigen Forschung als relevant für die Lese- und Mathe-matikleistung herausgestellt haben (siehe z. B. Trautwein et al., 2002), lediglich die kognitive Grundfähigkeit der Schüler/innen (z. B. Intelligenz) kann auf Grundlage die-ses Datenmaterials nicht kontrolliert werden. Die erfassten Merkmale erklären 26,2 % der Varianz/Streuung in der Leseleistung und 28,9 % der Varianz in der Mathematik-leistung. Auf Individualebene zeigt sich wie erwartet, dass Mädchen die besseren Leserinnen sind, während Buben eine höhere Leistung in Mathematik aufweisen. Des Wei-teren sind die Leistungen in Lesen und Mathematik besser, wenn die Lernressourcen zu Hause höher sind. Motivation und das (fachliche) Selbstkonzept sind eng miteinander ver-bunden (r = 0.46 bei PIRLS und r = 0.55 bei TIMSS), wo-bei die Modellschätzung vor allem dem (fachlichen) Selbst-konzept der Schüler/innen einen positiven Zusammenhang mit den Leistungsergebnissen zuschreibt. Als Indikator für die Deutschkenntnisse wurde die Angabe der Eltern heran-gezogen, ob das Kind bereits vor dem Schuleintritt Deutsch gesprochen hat. Auch hier zeigt sich erwartungsgemäß, dass jene Schüler/innen, die bereits vor Schuleintritt Deutsch sprechen konnten, bessere Leistungen in Lesen und Mathe-matik aufweisen. Auf Level 2 (Klassenebene) wurden Unter-schiede im Hinblick auf die Umgebung des Schul standorts kontrolliert. Die Ergebnisse sprechen für bessere Leistungen in Lesen und Mathematik für Schüler/innen, die Schulen in Kleinstädten oder Dörfern besuchen, im Vergleich zu Schü-

Page 123: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 121

TypModell und

EbeneBezeichnung Herkunft

Std.-Abw. PIRLS (Ö)

Std.-Abw. TIMSS (Ö)

UV

Modell 1 – Level 1

Home Resources for Learning (HRL)

Schülerfragebogen: Internationaler Index Home Resources for Learning (HRL)a

1.52 1.52

TIMSS (Ö) Schülerfragebogen: Der Koeffizient gibt die Veränderung des Schätzwerts für Buben an.

Motivation Schülerfragebogen: Internationaler Index Students Like Reading bzw. Students Like Learning Mathematics

2.16 2.13

Selbstkonzept Schülerfragebogen: Internationaler Index Students Confidence in Reading bzw. Student Confidence with Mathematics

2.17 2.12

Deutsch vor Schule Elternfragebogen: Der Koeffizient gibt die Veränderung des Schätzwerts für Schüler/innen an, die nach Angabe der Eltern bereits vor der Schule Deutsch gesprochen haben.

Modell 1 – Level 2

Schulstandort Schulfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „Großstadt – dicht bevölkert“ an.

Modell 2 – Level 1

Häufigkeit der fach-spezifischen Hausauf-gaben (HA)

Schülerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „jeden Tag oder fast jeden Tag“ an.

Dauer der fachspezifi-schen Hausaufgaben (HA)

Schülerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „15 Minuten oder weniger“ an.

Elterliche Unterstüt-zung und Monitoring

Elternfragebogen: Mittelwertscore aus 5 Itemsb (PIRLS: alpha = .745; TIMSS: alpha = .768). Je höher, desto mehr elter-liche Unterstützung und Monitoring bei den Hausaufgaben.

0.66 0.65

Modell 3 – Level 2

Häufigkeit der Haus-aufgaben im Klassen-durchschnitt

Schülerfragebogen: Median der entsprechenden Frage (siehe Mo-dell 2 – Level 1) pro Klasse; je höher, desto seltener beschäftigen sich die Schüler/innen der Klasse mit Hausaufgaben im Fach.

0.68 0.35

Dauer der Hausaufga-ben im Klassendurch-schnitt

Schülerfragebogen: Median der entsprechenden Frage (siehe Modell 2 – Level 1) pro Klasse; je höher, desto mehr Zeit investieren die Schüler/innen der Klasse in die Hausaufgaben im Fach.

0.35 0.36

Monitoring durch Kontrolle und Rück-meldung zu den Hausaufgaben

Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „immer oder fast immer“ an.

Monitoring durch Dis-kussion der Hausauf-gaben in der Klasse

Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „immer oder fast immer“ an.

Individualisieren-der Umgang mit Hausaufgaben durch Lehrperson

Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts für Lehrer/innen an, die wenigstens „manchmal“ nicht allen Schüler/innen die gleiche Hausaufgabe geben.

AVAlle Modelle Allgemeine Lese- bzw.

Mathematikleistung5 Plausible Values lt. PIRLS-/TIMSS-Manualc 63.38 62.70

a) Siehe http://timss.bc.edu/methods/pdf/T11_G4_G_Scales_HRL.pdf; dieser Index beinhaltet Merkmale der Eltern der Schüler/innen, welche auch für die Bestimmung eines sozioökonomischen Status relevant sind (höchste abgeschlossene Ausbildung der Eltern, höchster beruflicher Status der Eltern), sodass von einer starken Korrelation mit den bekannten – und in PIRLS und TIMSS 2011 nicht verfügbaren – sozioökonomischen Indizes (bspw. ESCS) ausgegangen werden kann. b) Items a, b, c, e und f/g der Frage 9 im Elternfragebogen (siehe https://www.bifie.at/system/files/dl/Elternfragebogen.pdf). c) Martin, M. O. & Mullis, I. V. S. (Eds.). (2012). Methods and procedures in TIMSS and PIRLS 2011. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. Online verfügbar unter: http://timss.bc.edu/methods/index.html

Tabelle 3.1.1: Analysevariablen

Page 124: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

122 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung

lerinnen und Schülern aus einer Großstadt. Zudem zeigen sich Schüler/innen aus entlegen-ländlichen Schulen besser in Mathematik als Schüler/innen aus den Großstädten. Es ist anzunehmen, dass bei diesen Unterschieden weitere ver-mittelnde Faktoren wirksam werden (z. B. die Qualität der häuslichen Förderung).

Modell 2, in dem Merkmale der Hausaufgabenpraxis auf Schülerebene (Level 1) berücksichtigt werden (R2 Lesen = 31,8 %, R2 Mathematik = 33,7 %), ergibt, dass elterliches Unterstützungsverhalten/Monitoring sowohl mit der Lese- als auch der Mathematikleistung negativ in Verbindung steht. D. h., unter Kontrolle der Variablen im ersten Modell zeigt sich, dass die Schulleistung geringer ausgeprägt ist, wenn im Elternhaus bei Hausaufgaben stark geholfen/kontrol-liert wird (siehe auch Cooper, Lindsay & Nye, 2000). Für diesen Befund können nun mehrere Erklärungen greifen. Zum einen könnte der bereits besprochene autonomie- unterdrückende Effekt, der durch kontrollierende Haus-aufgabenunterstützung ausgelöst werden kann, eintreten. Eine weitere Erklärungsmöglichkeit ergibt sich aus dem meist höheren Unterstützungsbedürfnis leistungsschwacher Schüler/innen bei der Hausaufgabenerledigung. Auch diese Denkrichtung würde den negativen Zusammenhang zwischen Leistung und Unterstützung durch die Eltern plausibel erklären und kann empirisch durch Befunde von Wild und Gerber (2007) im Längsschnitt gestützt werden (Klassenstufen 4–7; Mathematik). Diese Studie belegt, dass leistungsschwache Kinder nicht nur häufiger unterstützt werden, sondern dass diese Unterstützungsleistung auch stärker kontrollierend erfolgt. Hier spannt sich der Bogen zum ersten Erklärungsansatz (siehe auch Niggli et al., 2007).

Im Hinblick auf die schulische Hausaufgabenpraxis spiegeln die Daten ein zum Teil konträres Bild bezüglich der Lese- und Mathematikleistung auf Individualebene wider. Im Folgenden soll nur auf die Häufigkeit der Hausaufgaben-vergabe und deren Relation zur Leistung Bezug genommen werden, da zwischen der Dauer der Hausaufgaben und der Leistungsstärke eine wechselseitige Beeinflussung zu vermuten ist. Bezogen auf die Häufigkeit von Hausauf-gaben zeigt sich, dass die Leseleistung der Schüler/innen höher ist, wenn weniger Hausaufgaben zu erledigen sind, während Schüler/innen bessere Leistungen in Mathema-tik erbringen, wenn regelmäßig/häufig Hausaufgaben gegeben werden (z. B. auch Trautwein, 2007 für TIMSS Deutschland). Allerdings gilt ebenso, dass keine Hausauf-gaben in Lesen negativ mit der Leseleistung der Schüler/innen korrelieren – ein Mindestmaß an Lesehausaufgaben scheint demnach auch für die Leseleistung bedeutsam zu sein. Zwischen der Leseleistung und der Regelmäßigkeit von Hausauf gaben liegt folglich ein kurvilinearer Zusam-menhang vor, während sich für die Mathematikleistung ein linearer zeigt. Diese Ergebnisse lassen den Schluss zu, dass sich das beständige Üben von Inhalten durch eine regel-mäßige Hausaufgabenvergabe positiv für die Entwicklung der Mathematikkompetenz erweist. Die Leistungsentwick-

lung in Lesen scheint dahingegen weniger von der Übungs- und Festigungsfunktion der schulischen Hausaufgaben abhängig zu sein, sondern sie unterliegt vermutlich stärker der Selbststeuerung/Selbstregulierung der Schüler/innen. Möglicherweise spielen für die Leseleistung außerschulische Faktoren, wie z. B. der Zugang zu Büchern (Buchbesitz), der sich bereits in PIRLS 2006 als wesent licher Prädiktor für die Leseleistung erwiesen hat (Bergmüller & Böck, 2009), und motivationale Faktoren der Schüler/innen (z. B. deren Lesefreude) eine stärkere Rolle, da sie das (Lesen-)Üben mitbestimmen.

Modell 3 berücksichtigt zusätzlich Merkmale auf Ebene 2, der Klassenebene. Es zeigen sich hier keine weiteren signifi-kanten Effekte. Die Erklärung der Varianz durch das Modell steigt ebenso nur geringfügig an (R2 Lesen = 33,7 %, R2 Mathematik = 34,5 %, das bedeutet eine Varianzsteigerung von knapp 2 Prozentpunkten pro Kompetenzbereich, siehe hierzu auch Wallner-Paschon & Schneider, 2009). Daher ist das Modell 2 zur Erklärung der Lese- und Mathematik-leistung dem Modell 3 vorzuziehen.

Resümee

Der vorliegende Beitrag hat geprüft, inwieweit Hausauf-gaben mit der Schülerleistung in Lesen und Mathematik in Verbindung stehen. Des Weiteren hat er die Hausauf-gabenpraxis in Österreich am Ende der Grundschule be-schreibend dargestellt. Diese Ergebnisse werden im Fol-genden kurz zusammengefasst sowie überlegt, welche praktischen Konsequenzen diese nahelegen.

Im Gegensatz zu den Befunden von PIRLS 2006 (Suchan & Breitfuß-Muhr, 2009), in denen kein Effekt der Hausauf-gabenpraxis auf die Leseleistung aufgezeigt werden konnte, ergaben die in diesem Beitrag berechneten Modelle, ge-stützt auf die PIRLS- und TIMSS-2011-Daten, kleinere Effekte, die jedoch mit einer inkrementellen Varianzauf-klärung von 6 % (nach Kontrolle einiger Drittvariablen) nicht sehr hoch sind. Diese relativ geringe Erklärungskraft stellt allerdings keinen überraschenden Befund dar, da sehr viele unterschiedliche Faktoren die Schulleistung determi-nieren (für ein Rahmenmodell schulischer Leistung siehe z. B. Helmke, Hosenfeld & Schrader, 2002, S. 426). Des Weiteren wurden wesentliche Variablen, welche die Effekti-vität der Hausaufgaben beeinflussen, wie sie beispielsweise im Prozessmodell der Wirkungsweise von Hausaufgaben von Kohler (2011) angeführt werden, bei den Erhebungen in PIRLS und TIMSS nicht berücksichtigt. Dazu zählen beispielsweise das Hausaufgabenverhalten der Schülerinnen und Schüler (z. B. Engagement, Selbstregulation, Motiva-tion, Emotionsmanagement; Trautwein & Köller, 2003b; Xu, 2011) und die Funktionalität bzw. Dysfunktionalität des elterlichen Unterstützungsverhaltens (z. B. Adaptivität; Wild & Gerber, 2007). Auch die Qualität der Hausaufgaben

Page 125: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 123

Variablen PIRLS TIMSS

Level 1 (Schüler-Ebene) Modell 1 Modell 2 Modell 3 Modell 1 Modell 2 Modell 3

– HRL – Geschlecht – Motivation – Selbstkonzept– Deutsch vor Schule

– Häufigkeit HA (vs. „jeden Tag“) * 1- bis 2-mal pro Woche * weniger als einmal pro Woche * nie oder fast nie– Zeit für HA (vs. „< = 15 Min.“) * 16–30 Minuten * 31–60 Minuten * mehr als 60 Minuten

– Elterliche Unterstützung/Monitoring

14.3 (0.8**)–1.07 (2.08)0.28 (0.58)

7.80 (0.58**)12.4 (4.5**)

12.7 (0.7**)–0.76 (2.08)0.51 (0.59)

6.51 (0.60**)11.5 (4.5*)

6.28 (2.59*)11.5 (3.3**)5.23 (4.15)

–4.05 (2.69)–17.3 (4.4**)–28.1 (6.5**)

–17.8 (1.7**)

12.7 (0.7**)–0.36 (2.11)0.54 (0.62)

6.55 (0.61**)12.0 (4.5**)

6.91 (2.73*)11.8 (3.7**)7.22 (4.43)

–4.10 (2.80)–17.2 (4.5**)–27.6 (6.6**)

–18.0 (1.7**)

13.1 (0.7**)4.03 (2.10)–1.21 (0.65)10.2 (0.7**)7.07 (3.87)

11.8 (0.8**)5.41 (2.16*)–0.75 (0.66)9.49 (0.68**)5.54 (4.14)

–7.71 (3.09*)–8.46 (7.49)–22.2 (7.9**)

7.09 (2.24**)11.1 (3.5**)–5.92 (5.07)

–17.4 (1.5**)

11.8 (0.8**)5.07 (2.19*)–0.70 (0.63)9.59 (0.70**)5.71 (4.12)

–6.67 (3.21*)–9.35 (8.25)–23.2 (9.0**)

7.27 (2.34**)11.3 (3.7**)–5.57 (5.15)

–17.3 (1.6**)

Level 2 (Klassen- bzw. Lehrer-Ebene) Modell 1 Modell 2 Modell 3 Modell 1 Modell 2 Modell 3

– Standort (vs. Großstadt): * städt. Randbezirk * mittelgroße Stadt * Kleinstadt/Dorf * entlegen-ländlich

– Häufigkeit HA (Klassenmedian) („je höher, desto seltener“)– Zeit für HA (Klassenmedian) („je höher, desto länger“)

– Monitoring d. Kontrolle und Rückmeldung (vs. „immer“) * manchmal * nie oder fast nie

– Monitoring d. Diskussion (vs. „immer“) * manchmal * nie oder fast nie– Individualisierte Hausaufgaben (wenigstens „manchmal“)

6.16 (4.58)5.01 (5.01)10.8 (4.7*)12.6 (6.5)

7.10 (4.36)6.92 (4.89)14.6 (4.4**)15.9 (5.9**)

5.58 (4.56)4.12 (5.12)11.4 (4.8*)10.1 (6.2)

–2.90 (2.32)

4.73 (5.07)

2.78 (3.66)–5.45 (11.28)

–3.21 (3.39)–9.39 (8.79)

–6.54 (3.60)

4.96 (5.63)–4.97 (6.07)15.2 (5.1**)24.7 (7.2**)

4.49 (5.61)–4.46 (5.98)15.5 (4.9**)25.8 (7.1**)

7.01 (5.67)–3.08 (5.94)16.8 (4.9**)26.3 (6.9**)

–9.77 (7.49)

4.06 (5.35)

9.1 (11.5)[n = 0]

–0.11 (3.61)12.6 (7.8)

–7.02 (4.18)

R2 Ind. LevelR2 Class LevelR2 Total

.279

.062

.262

.331

.125

.318

.335

.200

.326

.306

.179

.289

.355

.207

.337

.357

.258

.345

Anmerkungen: abhängige Variablen sind die Leseleistung (PIRLS) bzw. Mathematikleistung (TIMSS); unstandard. Regressionskoeffizien-ten mit Standardfehlern in Klammer; ** ... p < .01; * ... p < .05; [n = 0] ... unbesetzte Zelle

Tabelle 3.1.2: Ergebnisse der mehrebenenanalytischen Modellprüfung

(z.  B. kognitives Anspruchsniveau; Dettmers et al., 2009) und deren Funktionen (z.  B. Memorieren von Inhalten, Verbesserung von Fähigkeiten etc.) wurden nicht berück-sichtigt. Zukünftige Untersuchungen sollten die Haus-aufgabenpraxis daher deutlich differenzierter im Hinblick auf deren Qualität, Funktion und die sie beeinflussenden Rahmen bedingungen (Schüler- und Kontextmerkmale) er-fassen.

Die Ergebnisse zeigen, dass die überwiegende Mehrheit der Lehrpersonen in Österreichs Grundschulen häufig Haus-aufgaben in Lesen und Mathematik vergibt. Dabei bestätigt sich für Mathematik im Einklang mit bisherigen Befunden das Bild, dass die Regelmäßigkeit von Hausaufgaben im Sinne eines kontinuierlichen Übens wesentlich mit der schulischen Leistungsstärke korreliert. Für Lesen ergibt sich ein anderes Muster: Sehr häufige Lesehausaufgaben (immer/

Page 126: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

124 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung

Literatur

Bergmüller, S. & Böck, M. (2009). Leseeinstellung und Leseverhalten im Einflussbereich von Schule und Familie. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volksschule. Österreichischer Expertenbericht (S. 117–125). Graz: Leykam.

Carroll, J. B. (1963). A model of school learning. Teachers’ College Record, 64, 723–733.

Cooper, H., Lindsay, J. J. & Nye, B. (2000). Homework in the home: How student, family, and parenting-style differences relate to the homework process. Contemporary Educational Psychology, 25 (4), 464–487.

Deci, E. & Ryan, R. (1993). Die Selbstbestimmungstheorie der Motivation und ihre Bedeutung für die Pädagogik. Zeitschrift für Pädagogik, 39, 223–238.

De Jong, R., Westerhof, K. J. & Creemers, B. P. M. (2000). Homework and student math achievement in junior high schools. Educational Research and Evaluation, 72, 278–292.

Dettmers, S., Trautwein, U. & Lüdtke, O. (2009). Eine Frage der Qualität? Die Rolle der Hausaufgabenqualität für Hausaufga-benverhalten und Leistung. Unterrichtswissenschaft, 37 (3), 196–212.

Grasedieck, D. (2008). Welchen Wert haben Hausaufgaben? – Plädoyer für individualisierte Hausaufgaben. Neue Didaktik, 1, 25–40.

fast immer) gehen mit einer geringeren Leseleistung einher, während fehlende Lesehausaufgaben die schlechtesten Lese-leistungen vorhersagen (= kurvilinearer Zusammenhang). Fehlende Hausaufgaben könnten somit das negative Poten-zial besitzen, die Schere zwischen leistungsschwachen und leistungsstarken Schülerinnen und Schülern zu vergrößern und die bereits existente Leistungsheterogenität in den Klassenzimmern zusätzlich zu erhöhen. Aus den Befun-den lässt sich für die konkrete Unterrichtspraxis demnach schlussfolgern, dass regelmäßige Hausaufgaben besonders förderlich für die schulische Leistung zu sein scheinen (z. B. auch Lipowsky et al, 2004; Trautwein, Köller & Baumert, 2001). Die additive Wirkung der Hausaufgabendauer für die unterschiedlichen Fächer ist hierbei zu beachten, damit der zeitliche Aufwand durch die Hausaufgaben pro Tag für Schüler/innen bewältigbar bleibt. Mehrmals wöchentlich – jedoch nicht täglich – Hausaufgaben in den verschiedenen Unterrichtsfächern könnten die Regelmäßigkeit des Übens gewährleisten und die zeitliche Überlastung der Schüler/ innen verhindern (siehe auch Trautwein, Köller & Bau-mert, 2001). Auch eine (in diesem Zusammenhang nicht kontrollierte) integrative Hausaufgabenpraxis („Haus“-Aufgaben in Form von selbstregulierten Übungsmöglich-keiten im regulären Unterricht) wäre eine Möglichkeit, das außerschulische Belastungserleben zu reduzieren (Hascher & Bischof, 2000). Wird nach der Bedeutung von Lese- und Mathematikhausaufgaben für die Entwicklung der Schü-lerleistung gewichtet, so ist insbesondere die regelmäßige Vergabe von Mathematikhausaufgaben von Relevanz, um ausreichend Übungsmöglichkeiten bzw. aktive Lernzeit zu gewährleisten („time-on-task“; Carroll, 1963). Lesegelegen- heiten, in denen das Lesen geübt werden kann, finden

sich dahingegen auch außerschulisch häufiger, weshalb das regelmäßige Üben von Lesen weniger stark an die schu-lische Hausaufgabenpraxis gekoppelt ist. Voraussetzung für das selbstgesteuerte Lesen in der Freizeit ist jedoch die Entwicklung des Leseinteresses und der Zugang zu Lese-gelegenheiten. Beide Faktoren werden in der Regel stark von der Herkunft der Kinder mitbestimmt.

Die Hausaufgaben werden sowohl im Elternhaus als auch in der Schule zum Großteil kontrolliert und besprochen. Demnach ist das Hausaufgabenmonitoring sehr hoch ausge-prägt. Zu Hause übernehmen die Eltern häufig die Rolle des Lernbegleiters, hier insbesondere die Mutter – sowohl in der unterstützenden (z. B. helfen) als auch in der kon-trollierenden (z. B. Hausaufgabenerledigung kontrollieren) Funktion. Ein negativer Zusammenhang konnte zwischen dem elterlichen Monitoring und der schulischen Leistung aufgezeigt werden – d. h., die Hausaufgaben wurden insbe-sondere bei leistungsschwachen Schülerinnen und Schülern stark kontrolliert bzw. deren Erledigung intensiv begleitet. Das Monitoring auf Klassenebene konnte dahingegen nicht signifikant mit der Leistung in Verbindung gebracht werden. Damit das Hausaufgabenmonitoring seine pädago-gische Wirksamkeit im Sinne einer kontinuierlichen Lern-begleitung und -unterstützung entfalten kann, ist darauf zu achten, dass dieses in einer positiv-unterstützenden, angst-freien Atmosphäre stattfindet. Angst, Leistungsdruck und Furcht vor Fehlern könnten beispielsweise reduziert werden, indem Hausaufgaben nicht bewertet werden, und sich die Hausaufgabenerledigung und deren Kontrolle folglich als Lern- und weniger als Leistungssituation gestaltet (Hascher & Hagenauer, 2010).

Page 127: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 125

Hascher, T. & Bischof, F. (2000). Integrierte und traditionelle Hausaufgaben in der Primarschule. Psychologie in Erziehung und Unterricht, 47 (4), 252–265.

Hascher, T. & Hagenauer, G. (2010). Lernen aus Fehlern. In C. Spiel, B. Schober, P. Wagner & R. Reimann (Hrsg.), Bildungs-psychologie (S. 377–381). Göttingen: Hogrefe.

Hascher, T. & Hofmann, F. (2008). Kompetenzbereich Hausaufgaben. In M. Gläser-Zikuda & J. Seifried (Hrsg.), Lehrerexpertise. Analyse und Bedeutung unterrichtlichen Handelns (S. 143–164). Münster: Waxmann.

Hascher, T. & Hofmann, F. (2011). Hausaufgaben aus der Sicht von (angehenden) Lehrerinnen und Lehrern. DDS – Die Deut-sche Schule, 103 (3), 219–234.

Helmke, A., Hosenfeld, I. & Schrader, F.-W. (2002). Unterricht, Mathematikleistung und Lernmotivation. In A. Helmke & R. S. Jäger (Hrsg.), Das Projekt MARKUS. Mathematik-Gesamterhebung Rheinland-Pfalz: Kompetenzen, Unterrichtsmerkmale, Schulkontext (S. 413–480). Landau: Verlag Empirische Pädagogik.

Kohler, B. (2011). Hausaufgaben. Überblick über didaktische Überlegungen und empirische Untersuchungen. DDS – Die Deutsche Schule, 103 (3), 203–218.

Jäger, R. S., Stuck, A., Jäger-Flor, D. & Riebel, J. (2010). Hausaufgaben: Die andere Sicht der Medaille: die Sicht der Eltern. Empirische Pädagogik, 24 (1), 55–77.

Lipowsky, F., Rakoczy, K., Klieme, E., Reusser, K. & Pauli, C. (2004). Hausaufgabenpraxis im Mathematikunterricht – ein Thema für die Unterrichtsqualitätsforschung. In J. Doll & M. Prenzel (Hrsg.), Bildungsqualität von Schule (S. 252–266). Münster: Wax-mann.

Mischo, C. & Haag, L. (2006). Hausaufgaben. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (3. überarb. und erw. Auflage) (S. 226–233). Weinheim: Beltz.

Niggli, A., Trautwein, U., Schnyder, I., Lüdtke, O. & Neumann, M. (2007). Elterliche Unterstützung kann hilfreich sein, aber Einmischung schadet. Psychologie in Erziehung und Unterricht, 54 (1), 1–14.

Pomerantz, E. M. & Eaton, M. M. (2001). Maternal intrusive support in the academic context: transactional socialization pro-cesses. Developmental Psychology, 37 (2), 174–186.

Pomerantz, E. M., Wang, Q. & Ng, F. F.-Y. (2005). Mothers’ affect in the homework context: the importance of staying positive. Developmental Psychology, 41 (2), 414–427.

Roßbach, H.-G. (1995). Hausaufgaben in der Grundschule. DDS – Die Deutsche Schule, 87 (1), 103–112.

Schnyder, I., Niggli, A. & Trautwein, U. (2008). Hausaufgabenqualität im Französischunterricht. Zeitschrift für Pädagogische Psychologie, 22 (3–4), 233–246.

Spiel, C., Wagner, P. & Fellner, G. (2002). Wie lange arbeiten Kinder zu Hause für die Schule? Eine Analyse in Gymnasium und Grundschule. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 34 (3), 125–135.

Trautwein, U. (2007). The homework–achievement relation reconsidered: Differentiating homework time, homework frequency and homework effort. Learning and Instruction, 17, 372–388.

Trautwein, U. & Köller, O. (2003a). The relationship between homework and achievement – still much of a mystery. Educational Psychology Review, 15, 115–145.

Trautwein, U. & Köller, O. (2003b). Was lange währt, wird nicht immer gut. Zur Rolle selbstregulativer Strategien bei der Haus-aufgabenerledigung. Zeitschrift für Pädagogische Psychologie, 17 (3/4), 199–209.

Trautwein, U., Köller, O. & Baumert, J. (2001). Lieber oft als viel: Hausaufgaben und die Entwicklung von Leistung und Inter-esse im Mathematik-Unterricht der 7. Jahrgangsstufe. Zeitschrift für Pädagogik, 47 (5), 703–724.

Page 128: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

126 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung

Trautwein, U., Köller, O., Schmitz, B. & Baumert J. (2002). Do homework assignments enhance achievement? A multilevel analysis in the 7th grade mathematics. Contemporary Educational Psychology, 27, 26–50.

Trautwein, U., Niggli, A., Schnyder, I. & Lüdtke, O. (2009). Between-differences in homework assignments and the development of students’ homework effort, homework emotions, and achievement. Journal of Educational Psychology, 101 (1), 176 –189.

Trautwein, U., Schnyder, I., Niggli, A., Neumann, M. & Lüdtke, O. (2009). Chameleon effects in homework research: The homework-achievement association depends on the measures used and the level of analysis chosen. Contemporary Educa-tional Psychology, 34, 77–88.

Wagner, P., Hirtenlehner, H., Bacher, J. & Schober, B. (2010). Zeitliche Belastung von Schülern durch die häusliche Arbeit für die Schule. Empirische Pädagogik, 24 (1), 6–25.

Wallner-Paschon, C. & Schneider, P. (2009). Lesesozialisation im Elternhaus. In B. Suchań, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volksschule. Österreichischer Expertenbericht (S. 128–146). Graz: Leykam.

Wild, E. & Gerber, J. (2007). Charakteristika und Determinanten der Hausaufgabenpraxis in Deutschland von der vierten zur siebten Klassenstufe. Zeitschrift für Erziehungswissenschaft, 10 (3), 356–380.

Xu, J. (2011). Homework emotion management at the secondary school level: antecedents and homework completion. Teachers College Record, 113 (3), 529–560.

Xu, J. & Corno, L. (1998). Case studies of families doing third-grade homework. Teachers College Record, 100, 402–436.

Page 129: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Innere Differenzierung im Mathematikunterricht 127

3.2 InnereDifferenzierungim Mathematikunterricht

Ursula Schwantner

Einleitung

Innere Differenzierung gilt als ein zentraler Indikator für die Qualität schulischer Prozesse und wird als wichtiger Bestandteil kompetenzorientierten Unterrichts angesehen (Vogtenhuber et al., 2012). Während das Konzept der Kompetenzorientierung vor allem in den letzten 15 Jahren durch international vergleichende Schülerleistungsstudien und die Entwicklung und Einführung von Bildungsstan-dards in der österreichischen Bildungsforschung an Bedeu-tung gewonnen hat, war innere Differenzierung bereits in den 1960er und 70er Jahren Gegenstand pädagogischer Reformbestrebungen. Grundlegend für das Konzept der inneren Differenzierung sind vor allem Erkenntnisse aus dem Bereich der pädagogischen Psychologie (u. a. basierend auf Entwicklungs-, Motivations-, Kognitions-, Persönlich-keits-, Sozial- und Lernpsychologie – insbesondere konst-ruktivistischen Lerntheorien), die darlegen, dass Lernen ein komplexer individueller Prozess ist, der in Abhängigkeit von Lernvoraussetzungen und unter Einfluss verschiedener Faktoren zu unterschiedlichen Ergebnissen führt. Auch jüngere Ansätze wie die Neurodidaktik betonen die Unter-schiedlichkeit der Lernenden und versuchen, zentrale Faktoren für Lehren und Lernen zu identifizieren sowie zu beschreiben, wie Lernen bei jedem Schüler/jeder Schülerin erfolgreich stattfinden kann (z. B. Braun & Meier, 2006; Roth, 2006). Neurodidaktik fokussiert den Lernprozess der Schüler/innen und unterstützt die Selbstorganisation und das selbstständige Erarbeiten von Lerninhalten – im Gegensatz zur vermittlungsorientierten Didaktik, bei der die Lehrperson die grundlegenden Inhalte erschließt, syste-matisiert und für die Schüler/innen aufbereitet. Laut Roth (2006) muss Wissen „... im Gehirn eines jeden Lernenden neu geschaffen werden“ (ebd., S. 49) und kann nicht über-tragen werden. Die selbsttätige Aneignung von Wissen, die Verknüpfung mit Anwendungsbedingungen und deren adäquate und erfolgreiche Bewältigung in unterschiedlichen Anwendungssituationen und Aufgabenfeldern sind auch

Kernbereiche kompetenzorientierten Unterrichts (vgl. Beer & Benischek, 2011). Innere Differenzierung berücksichtigt dabei die kognitiven, motivationalen und emotionalen Lern - voraussetzungen der Schüler/innen und ermöglicht es ihnen dadurch, die Lernprozesse selbst zu gestalten, zu steuern und sich nach besten Möglichkeiten zu entwickeln.

Die individuelle Förderung eines jeden Kinds ist zudem fester Bestandteil im Grundschullehrplan (BGBl. Nr.  134/ 1963 in der Fassung BGBl. II Nr. 290/2008 vom 12. August 2008, S. 7 f.). Auch in der Verordnung zu den Bildungs-standards wird individuelle Förderung explizit gefordert (BGBl.  II, 2009 – Nr. 1, S. 2). Aktuell beschäftigt sich die Initiative SQA (Schulqualität Allgemeinbildung) des BMUKK (n. d.), deren Ziel eine Verankerung von Qua-litätsentwicklung und -sicherung an allgemeinbildenden Schulen ist, mit der „Weiterentwicklung des Lernens und Lehrens in Richtung Individualisierung und Kompetenz-orientierung“ als Rahmenziele für das allgemeinbildende Schulwesen für die Jahre 2012–2016 (BMUKK 2013–14). Die unterschiedlichen Voraussetzungen der Schüler/innen werden dabei als Ansatzpunkte für die Planung der pädago-gischen Qualitätsentwicklung und -sicherung gesehen.

Aufgrund der Wichtigkeit und Notwendigkeit, die dem Thema der inneren Differenzierung beigemessen wird, wurden die PIRLS-TIMSS-2011-Kontextfragebögen in Österreich um Zusatzfragen zur inneren Differenzierung erweitert und die nationale Schwerpunktsetzung zur inneren Differenzierung im Mathematikunterricht aus TIMSS 2007 weitergeführt (vgl. Schwantner, 2010). Somit ist es möglich, die Häufigkeit der Umsetzung bestimmter Differenzierungsmaßnahmen oder das Ausmaß an Lehrer- oder Schülersteuerung im Unterricht zwischen den beiden Erhebungszeitpunkten zu vergleichen.

Der vorliegende Beitrag widmet sich zunächst den Prozess-standards für innere Differenzierung, die beschreiben, was

Konzepte innerer Differenzierung nehmen einen wichtigen Stellenwert bei Reformbestrebungen im Schulsystem ein. Im vorliegenden Abschnitt werden Prozessstandards für innere Differenzierung dargestellt, die den Unterricht von der Planung bis hin zur Leistungsrückmeldung umfassen und die individuellen Lernprozesse der Schüler/innen fokussieren. Anhand von TIMSS-Daten wird analysiert, für wie notwendig Lehrer/innen und Schulleiter/innen innere Differenzie-rung erachten und inwieweit Prozessstandards für innere Differenzierung im Mathematikunterricht in der Volksschule aus Schüler-, Lehrer- und Schulleitersicht umgesetzt werden. Darüber hinaus wird untersucht, ob Unterricht stärker lehrer- oder schülergesteuert durchgeführt wird und wie innere Differenzierung mit Unterrichtssteuerung zusammen-hängt. Die Analysen werden, wo möglich, mit Trendvergleichen zu TIMSS 2007 und Ergebnissen zum Leseunterricht aus PIRLS 2011 ergänzt.

Page 130: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

128 Innere Differenzierung im Mathematikunterricht

innere Differenzierung ist und wodurch sich diese äußert. Danach wird anhand der Daten von TIMSS 2011 analy-siert, für wie notwendig Lehrer/innen und Schulleiter/innen innere Differenzierung im Unterricht allgemein erachten, und inwieweit Prozessstandards für innere Differenzierung im Mathematikunterricht in der Volksschule umgesetzt werden. Abschließend wird dargestellt, inwieweit Unter-richt lehrer- oder schülergesteuert durchgeführt wird und ob es einen Zusammenhang zwischen Unterrichtssteuerung und innerer Differenzierung gibt. Sowohl die Einschätzung der Umsetzung als auch der Unterrichtssteuerung wird zwischen den beiden Erhebungszeitpunkten verglichen. Wo es möglich und sinnvoll ist, fließen auch Ergebnisse zum Leseunterricht aus PIRLS 2011 ein (Details zum Leseunter-richt s. Abschnitt 4.1).

Prozessstandards für innere Differenzierung

Die Prozessstandards für innere Differenzierung stellen Grundelemente eines differenzierten Unterrichts dar und beschreiben Verhaltensweisen von Lehrerinnen und Lehrern sowie Unterrichtsmerkmale, die darauf abzielen, die unterschiedlichen Voraussetzungen der Schüler/innen zu berücksichtigen und darauf einzugehen, sodass sich je-der Schüler/jede Schülerin bestmöglich entfalten kann (Schwantner, 2013, S. 61). Sie wurden von Schwantner (2013) aus dem theoretisch fundierten und empirisch über-prüften Modell der inneren Differenzierung von Herber (1983) abgeleitet 1 und mit zentralen Merkmalen innerer Differenzierung aus der Forschungsliteratur abgestimmt. Dass die darin festgelegten Verhaltensweisen und Unter-richtsmerkmale für innere Differenzierung grundsätzlich als „Standard“ erwünscht sind, zeigt eine Übereinstimmung mit den gesetzlichen Rahmenbedingungen für innere Differenzierung im Lehrplan der Volksschule sowie in der Lehrerausbildung (Schwantner, 2013, S. 44 ff.). Mithilfe der Definition der Prozessstandards für innere Differenzie-rung soll dem Problem begegnet werden, welches Altrichter et al. (2009) aufgrund definitorischer Schwierigkeiten orten und folgendermaßen schildern:

Das Phänomen „Individualisierung im Unterricht“2 kann nur anhand verschiedener konkreter Realisierungsformen – also an verschiedenen Modellen „individualisierten Unter-richts“ – untersucht werden; diese sind „komplex“ in dem Sinn, dass sie sich aus unterschiedlichen Kombinationen verschiedener didaktischer Bausteine (und zwar aus solchen, die die Modellkonstrukteur/inn/en [sic] bewusst geplant haben, als auch aus solchen, die während der Realisierung „extemporierend“ hinzugefügt wurden) zusammensetzen (ebd., S. 345).

Die Prozessstandards bilden somit den Rahmen für die Erfassung im Feld. Sie sind in Anlehnung an wesentliche Phasen von Unterricht in vier Bereiche gegliedert: (1) Planen, (2) Diagnostizieren, (3) Erarbeiten und (4) Rückmelden (Schwantner, 2013, S. 61 ff.). Die Bereiche werden im Folgenden näher erläutert.

Planen und Diagnostizieren

Die Bereiche Planen und Diagnostizieren basieren auf den ersten beiden Schritten des Modells der inneren Differen-zierung von Herber (1983): (1) Festlegung und bildungs-theoretische Begründung von Lernzielen und (2) Erfassung der Lernvoraussetzungen der Schüler/innen im Hinblick auf die Erreichbarkeit der Lernziele. Planen und Diagnos-tizieren sind dabei zwei ineinandergreifende Prozesse, die gemeinsam größtmögliche Adaptivität ermöglichen, indem die kognitiven, motivationalen und emotionalen Lernvor-aussetzungen bestmöglich mit den Lernzielen abgestimmt werden. Dabei betont Herber (1983) sowohl die Erfassung der Lernvoraussetzungen der Schüler/innen als auch die selbstreflexive Feststellung der kognitiven und psychologi-schen Voraussetzungen der Lehrkraft (z. B. die Einschät-zung der eigenen fachwissenschaftlichen Kenntnisse, die Re-flexion über das eigene Lehrverhalten, ob gerne unterrichtet wird etc.). Bei der Planung werden die Kompetenzen, die die Schüler/innen vom fachwissenschaftlichen Standpunkt her (in Anlehnung an den Lehrplan) aufbauen sollen, fest-gelegt und in Fundamentum (Grundkompetenzen für alle Schüler/innen) und Additum (Erweiterungskompetenzen zur Entwicklung und Förderung spezifischer Interessen und Begabungen) gegliedert. Herber schafft dabei durch den Bezug auf den Lehrplan explizit eine curriculare Stabilität, die entscheidend für die formale Zuerkennung von Schul-erfolg ist. Bei der Festlegung der Lernziele werden sowohl die kognitiven als auch die motivationalen Lernvorausset-zungen der Schüler/innen berücksichtigt. Möglichkeiten für Schüler/innen, sich selbst aktiv bei der Planung und Auswahl der Unterrichtsinhalte einzubringen, unterstützen dabei die Passung. Am Beginn eines neuen Stoffgebiets werden die kognitiven Lernvoraussetzungen erfasst, um Fehler und Lernschwierigkeiten, die bereits bei der Planung antizipiert wurden, aufzudecken, um darauf entsprechend zu reagieren, mit dem Ziel, dass alle Schüler/innen über die notwendigen Lernvoraussetzungen für ein neues Stoffgebiet verfügen. Die motivationalen und emotionalen Lernvoraus-setzungen wie Interessen, Leistungsmotivation, Attribuie-rung von Erfolg und Misserfolg, Angst, Freude oder Trauer, bis hin zu gruppendynamischen und soziokulturellen Um-weltbedingungen können anhand regelmäßiger Schüler-beobachtungen und aktiver Einbindung der Schüler/innen ermittelt und – entsprechende Kompetenzen der Lehrer/ innen vorausgesetzt – berücksichtigt werden (Herber, 1983).

1 Eine Kurzbeschreibung des Modells der inneren Differenzierung von Herber (1983) findet sich in Schwantner, 2010, S. 192 f.; eine ausführliche Beschreibung in Schwantner, 2013.

2 Individualisierung im Unterricht wird hier synonym mit innerer Differenzierung verstanden.

Page 131: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Innere Differenzierung im Mathematikunterricht 129

Erarbeiten3

Im Mittelpunkt des Bereichs Erarbeiten steht die Selbst-tätigkeit der Schüler/innen, die dem Ablauf von Erarbeiten, Prüfen und Einüben folgt. Folgende Prozesse sind dabei zentral (Schwantner, 2013, S. 63 f.):

�� Neue Problemstellungen/neue Stoffgebiete werden von den Schülerinnen und Schülern – idealerweise anhand (eigens konzipierter) spezifischer Aufgaben, die die wesentliche Struktur der neuen Problemstellung/eines neuen Stoffgebiets repräsentieren – selbstständig er-arbeitet. Die individuellen, unterschiedlichen Lösungen der Schüler/innen werden gesammelt und besprochen sowie festgestellt, ob alle Schüler/innen die neue Pro-blemstellung auf ihre Weise richtig lösen können. Zu-mindest sollten verschiedene Lösungswege gemeinsam erarbeitet werden, sodass jeder Schüler/jede Schülerin eigene Lösungswege entwickeln kann.�� Hilfestellungen durch die Lehrperson sollen anhand

gezielter, direkter, sachbezogener Hinweise in Bezug auf den jeweiligen Lösungsweg des Schülers/der Schü-lerin erfolgen, sodass das Finden einer eigenständigen Lösung angeregt wird.�� Möglichkeiten zur Selbstkontrolle sollen bereitgestellt

werden, um die Selbststeuerung der Schüler/innen zu fördern.�� Eingesetzte Übungsaufgaben sollen anschaulich und

lebensnah sein, um die Schüler/innen anzusprechen. Aufgaben sollen sowohl für das Fundamentum als auch für das Additum und mit unterschiedlichem Schwierig-keitsgrad bereitgestellt werden.�� Die Schüler/innen wählen eigenverantwortlich unter

den angebotenen Aufgaben.�� Freiräume für selbstbestimmtes Arbeiten werden da-

durch geschaffen, indem die Schüler/innen parallel an unterschiedlichen Aufgaben arbeiten, die Sozialform frei wählen können (anstatt einer ausschließlich von der Lehrkraft vorgegebenen Variation der Sozialform) und auch die Aufgabenreihenfolge selbst wählen können. So kann sich jede/jeder in ihrem/seinem Tempo und nach ihren/seinen Fähigkeiten fortbewegen, während die Lehrkraft individuell angepasste Hilfestellungen geben kann.

Rückmelden

Rückmelden ist insofern ein wesentlicher Bestandteil innerer Differenzierung, als es zwei wichtige Funktionen erfüllt: Zum einen liefert Rückmelden Sachinformationen über das Ausmaß, in dem ein Lernziel erreicht wurde; zum anderen hat jede Rückmeldung auch „affektive Begleit-töne“ (Herber, 1983, S. 72) – im Sinne einer Beurteilung, die die Motivation der Schüler/innen und das Vertrauen in

die eigenen Fähigkeiten beeinflusst. In dieser Hinsicht ist es wichtig, dass Rückmeldung sachbezogen (lernziel- und aufgabenbezogen) und unter Heranziehen individueller Bezugsnormen (und nicht sozialer Bezugsnormen) erfolgt. Auf Basis der individuellen Rückmeldung können ge-meinsam Strategien zur Verbesserung und Korrektur von Misserfolgen erarbeitet werden. Die dabei getroffenen individuellen Zielvereinbarungen stellen realistische Erfolge in Aussicht, die den Schülerinnen und Schülern das Ge-fühl geben, die an sie gestellten Anforderungen bewältigen und sich stetig verbessern zu können (Herber, 1983, S. 102; Schwantner, 2013, S. 64).

Prozessstandards für innere Differenzierung im Rahmen von TIMSS 2011

Die konsequente Umsetzung der Prozessstandards in allen vier Bereichen – von der Planung bis zur Leistungsrück-meldung – ergibt eine Unterrichtskonzeption, die die individuellen Lernprozesse der Schüler/innen und den optimalen Lernerfolg eines jeden Schülers/einer jeden Schülerin fokussiert. Die Erhebung der Umsetzung der Prozess standards in allen vier Bereichen wäre jedoch im Rahmen von TIMSS 2011 zu umfangreich gewesen und musste daher beschränkt werden. Der Schwerpunkt wurde auf den Bereich Erarbeiten gelegt, da die Ermöglichung der selbsttätigen Auseinandersetzung mit dem Lernstoff ein wesentliches Element innerer Differenzierung dar-stellt, das zudem als bedeutsam für kompetenzorientierten Unterricht gilt (s. oben). Darüber hinaus können die Maß-nahmen des Bereichs Erarbeiten, die direkt im Unterricht stattfinden, sowohl durch die Befragung der Lehrer/innen als auch der Schüler/innen erfasst werden. Dazu wurden zwei Skalen zur inneren Differenzierung im Mathematik-unterricht aus TIMSS 2007 in etwas gekürzter Fassung in TIMSS 2011 aufgenommen, wodurch es möglich ist, die Umsetzung zwischen den beiden Erhebungszeitpunkten zu vergleichen. Ebenso für einen Trendvergleich wurde die Frage nach dem Ausmaß an Unterrichtssteuerung (Lehrer- vs. Schülersteuerung) aus TIMSS 2007 übernommen. In Anlehnung an die Erfassung der Wichtigkeitsüberzeu-gungen der Lehrer/innen und Schulleiter/innen gegenüber innerer Differenzierung bei TIMSS 2007 wurde bei TIMSS 2011 der Frage nachgegangen, für wie notwendig Lehrer/innen und Schulleiter/innen generell innere Differenzie-rung erachten.

Anmerkungen zur Interpretation der Ergebnisse zum Themenbereich innere Differenzierung

Bei der Interpretation der Ergebnisse der Schulleiter- und Lehrerbefragung ist es wichtig zu berücksichtigen, dass die

3 Der Bereich Erarbeiten basiert auf den Schritten 3 („Prototyp“) und 4 („Diskrimination“) in Herbers Modell der inneren Differenzierung (Herber, 1983).

Page 132: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

130 Innere Differenzierung im Mathematikunterricht

TIMSS-Stichprobe repräsentativ für die Ziel-Schüler/innen gezogen wurde und daher die Aussagen der Lehrer/innen und Schulleiter/innen auf die Anteile der Schüler/innen bezogen werden.

Auf Lehrerebene ist zudem zu beachten, dass die Analysen zur inneren Differenzierung allgemein und im Mathematik-unterricht auf den Antworten jener Lehrer/innen beruhen, die den Mathematikteil des TIMSS-Fragebogens ausgefüllt haben.

Notwendigkeit innerer Differenzierung aus Lehrer- und Schulleitersicht

Wichtigkeitsüberzeugungen in Bezug auf innere Differen-zierung spielen für die konkrete Umsetzung im Unterricht eine bedeutende Rolle. TIMSS 2007 zeigte, dass Lehrer/ innen häufiger Maßnahmen zur inneren Differenzierung im Mathematikunterricht umsetzen, je wichtiger diese für sie sind (Schwantner, 2013, S. 116 f.). Bei TIMSS 2011 wurden Lehrer/innen und Schulleiter/innen gebeten ein-zuschätzen, inwieweit sie es für notwendig halten, ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen.

Tabelle 3.2.1 zeigt die Einschätzung der Notwendigkeit innerer Differenzierung aus Lehrersicht. Lehrkräfte von mehr als der Hälfte der Schüler/innen (58 %) geben dabei an, dies für sehr notwendig zu erachten, Lehrkräfte von 41 % antworteten mit „notwendig“. Demnach werden fast alle Schüler/innen in der 4. Klasse Volksschule von einer Lehrkraft unterrichtet, die von der Notwendigkeit, ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen, überzeugt ist.

Auch der Zusammenhang zwischen der Einschätzung der Notwendigkeit innerer Differenzierung durch die Lehrer/innen bei TIMSS 2011 und der Umsetzung im Mathema-tikunterricht ist signifikant (r = .24, p = .000), allerdings deutlich geringer als der Zusammenhang zwischen der Wichtigkeitsüberzeugung und der Umsetzung bei TIMSS 2007 (r = .62, p = .000; s. Schwantner, 2013, S. 116). Dies könnte darin begründet sein, dass die Notwendigkeit bei TIMSS 2011 lediglich mit einer Frage erfasst wurde, wo-hingegen die Frage zur Wichtigkeit im Lehrerfragebogen bei TIMSS 2007 aus 14 Einzelitems bestand, die sich zum Großteil mit spezifischen Maßnahmen des Prozessstandard-bereichs Erarbeiten decken (s. Schwantner, 2013, S. 89 f.).

Die Einschätzung der Notwendigkeit, den Unterricht an die individuellen Lernvoraussetzungen der Kinder anzupassen, ist auch aus Sicht der Schulleiter/innen gegeben. Knapp drei Viertel (74 %) der Schüler/innen besucht eine Schule, deren Leiter/in dies als sehr notwendig erachtet, Schulleiter/innen von einem Viertel der Schüler/innen erachten dies als notwendig (s. Tabelle 3.2.2).

Vergleicht man die Antworthäufigkeiten der Lehrer/innen und Schulleiter/innen, so fällt auf, dass Schulleiter/innen es häufiger als sehr notwendig erachten, den Unterricht an die Lernvoraussetzung der Schüler/innen anzupassen, wohin-gegen Lehrer/innen dies häufiger „nur“ als notwendig beur-teilen. Insgesamt ist jedoch klar feststellbar, dass sowohl ein Großteil der Lehrer/innen als auch der Schulleiter/innen es für erforderlich halten, dass im Unterricht auf die Lern-voraussetzungen der einzelnen Schüler/innen eingegangen wird.

Notwendigkeit innerer Differenzierung aus Lehrersichtsehr

notwendignotwendig

wenig notwendig

gar nicht notwendig

Inwieweit halten Sie es für notwendig, Ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen?

58 41 0 0

Angaben in Prozent der Schüler/innen

Tabelle 3.2.1: Notwendigkeit innerer Differenzierung aus Lehrersicht (TIMSS 2011)

Notwendigkeit innerer Differenzierung aus Schulleitersicht sehr

notwendignotwendig

wenig notwendig

gar nicht notwendig

Inwieweit halten Sie es für notwendig, dass die Lehrkräfte Ihrer Schule ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anpassen?

74 25 1 0

Angaben in Prozent der Schüler/innen

Tabelle 3.2.2: Notwendigkeit innerer Differenzierung aus Sicht der Schulleiter/innen (TIMSS 2011)

Page 133: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Innere Differenzierung im Mathematikunterricht 131

Umsetzung innerer Differenzierung im Mathematikunterricht

Im folgenden Abschnitt wird der Frage nachgegangen, wie oft – in Anlehnung an die vorab beschriebenen Prozessstan-dards – spezifische Maßnahmen innerer Differenzierung im Mathematikunterricht in der Volksschule aus Sicht der Schüler/innen und Lehrer/innen umgesetzt werden. Die Ergebnisse können dabei zwischen den zwei Erhebungszeit-punkten TIMSS 2007 und 2011 verglichen werden. Wo es möglich und sinnvoll ist, fließen ergänzend Ergebnisse zum Leseunterricht aus PIRLS 2011 ein. Abschließend wird dargestellt, wie Schulleiter/innen die Umsetzung innerer Differenzierung an ihrer Schule einschätzen.

Umsetzung innerer Differenzierung im Mathematik-unterricht aus Schülersicht

Abbildung 3.2.1 zeigt, wie oft aus Sicht der Schüler/innen Maßnahmen innerer Differenzierung der Prozessstandard-bereiche Erarbeiten und Rückmelden im Mathematikun-terricht vorkommen. Betrachtet man die Verteilung der Antworthäufigkeiten zum Prozessstandardbereich Erarbeiten, fällt auf, dass mehr als die Hälfte der Schüler/innen (61 %) regelmäßig die Gelegenheit bekommen, neue Aufgabenstellungen selbst-ständig zu erarbeiten. In Bezug auf den Umgang mit unter-schiedlichen Lösungswegen ist festzustellen, dass es gängige Praxis ist, dass die Lehrkraft gemeinsam mit den Kindern

verschiedene Lösungswege erarbeitet. Dies ist laut Angabe von 77 % der Schüler/innen regelmäßig der Fall. Dem- gegenüber kommt es seltener vor, dass die Lehrkräfte eigen-ständige Lösungen der Schüler/innen bei einer neuen Auf-gabenstellung besprechen (46 % zumindest in den meisten Stunden). Ein Viertel der Schüler/innen gibt an, dass sie so gut wie nie bei einer neuen Aufgabe gefragt werden, wie sie diese gelöst haben. Maßnahmen, die den Kindern darüber hinaus Freiraum für selbstbestimmtes Arbeiten ermöglichen würden, und die relativ einfach umzusetzen wären, sind die freie Wahl der Sozialform und die freie Wahl der Aufgaben-reihenfolge. Während etwas mehr als die Hälfte der Schüler/innen (54 %) regelmäßig Gelegenheit hat, selbst zu bestim-men, in welcher Reihenfolge Aufgaben bearbeitet werden, kommt die freie Wahl der Sozialform nur sehr selten vor (24 % zumindest in den meisten Stunden). Fast die Hälfte der Kinder gibt an, fast nie aussuchen zu dürfen, ob sie alleine, zu zweit oder in einer kleinen Gruppe arbeiten.

Zum Bereich Rückmelden zeigt das Ergebnis, dass 41 % der Schüler/innen regelmäßig Auskunft über ihren Lernstand bekommen. Fast ein Drittel der Schüler/innen gibt jedoch an, dass die Lehrkraft so gut wie nie mit ihnen bespricht, was sie schon gut können, und was sie noch mehr üben müssen. Für ein weiteres knappes Drittel kommt dies „in einigen Stunden“ vor. Ein sehr ähnliches Ergebnis zeigt dieselbe Frage zum Leseunterricht im Rahmen von PIRLS 20114, wobei die unterschiedlichen Antwortkategorien zu beachten sind (s. Abbildung 3.2.2).

Abbildung 4.3.1: Umsetzung innerer Differenzierung aus Schülersicht (TIMSS 2011)

in den meisten Stunden nie oder fast niein jeder Stunde in einigen Stunden

Bei einer neuen Aufgabe fragt mich die Lehrerin, auf welche Weise ich sie gelöst habe.

Die Lehrerin erarbeitet mit uns verschiedene Wege, wie man eine Aufgabe lösen kann.

Ich darf mir aussuchen, ob ich alleine, zu zweit oder in einer kleinen Gruppe arbeite.

Rückmelden

Die Lehrerin bepricht mit mir, was ich bereits gut kann und was ich noch mehr üben muss.

0% 20 60 80 10040

Erarbeiten

Bei einer neuen Aufgabe darf ich selber probieren, wie das funktioniert.

Wenn mehrere Übungen zu machen sind, darf ich mir aussu-chen, in welcher Reihenfolge ich sie mache (auf einem Arbeitsblatt, im Mathematikbuch).

30 24 1431

43 20 434

12 27 4912

29 24 2325

21 29 2920

22 28 2524

Abbildung 3.2.1 Umsetzung innerer Differenzierung aus Schülersicht (TIMSS 2011)

4 Die Angaben beziehen sich auf die 4670 Schüler/innen, die den Lese-Teil des PIRLS-TIMSS-2011-Schülerfragebogens ausgefüllt haben.

Page 134: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

132 Innere Differenzierung im Mathematikunterricht

Abbildung 3.2.2 Rückmeldung zum Lesen aus Schülersicht (PIRLS 2011)

Umsetzung innerer Differenzierung im Mathematik- unterricht aus Schülersicht im Trend

Die etwas ausführlichere Befragung der Schüler/innen zur Umsetzung der Prozessstandards zur inneren Diffe-renzierung im Mathematikunterricht bei TIMSS 2007 zeigte, dass jene Maßnahmen, die den Schülerinnen und Schülern selbstständiges Arbeiten und Freiräume ermög-lichen, im Vergleich zu Maßnahmen, die eine Führung durch die Lehrperson beinhalten, eher selten vorkommen (Schwantner, 2013, S. 92). Bei TIMSS 2011 lässt sich bei allen sechs Items, die auf Freiräume für selbstbestimmtes Arbeiten f okussieren, eine leichte Zunahme bei den beiden Kategorien „in jeder Stunde“ und „in den meisten Stunden“ bei gleichzeitiger leichter Abnahme bei den beiden „negati-ven“ Kategorien feststellen. So ist der Anteil an 10-Jährigen, die „in jeder Stunde“ eine neue Aufgabenstellung selbst erarbeiten dürfen, um acht Prozentpunkte gestiegen. Etwas größer ist auch der Anteil an 10-Jährigen, die zumindest „in den meisten Stunden“ nach ihrem individuellen Lösungs-weg gefragt werden sowie die Sozialform oder die Aufga-benreihenfolge frei wählen dürfen. Ebenso höher ist der Anteil jener Schüler/innen, die angeben, zumindest „in den meisten Stunden“ Rückmeldung über ihren Leistungsstand zu erhalten. Das Erarbeiten verschiedener Lösungswege ge-meinsam mit der Lehrkraft ist hingegen von 2007 auf 2011 etwas zurückgegangen (Schwantner, 2013, S. 94 f.). Dem-nach zeigt sich eine leichte Tendenz, dass Maßnahmen, die eine selbsttätige Auseinandersetzung mit dem Lehrstoff ermöglichen und Freiräume schaffen, häufiger umgesetzt werden. Auch ein Mittelwertvergleich über die sechs kor-respondierenden Items aus TIMSS 2007 und TIMSS 2011 zeigt, dass die Schüler/innen im Jahr 2011 insgesamt häufiger innere Differenzierung erleben als die Schüler/ innen im Jahr 2007 (t = 3.13, p = .000; s. Tabelle 3.2.3). Aufgrund der zugewiesenen Codes für die Ausprägungen (Wert 1 für „in jeder Stunde“ und Wert „4“ für „nie oder fast nie“), bedeutet der geringere Mittelwert im Erhebungs-jahr 2011, dass innere Differenzierung häufiger umgesetzt wird.

Umsetzung innerer Differenzierung im Mathematik-unterricht aus Lehrersicht

Abbildung 3.2.3 zeigt, wie oft nach Angaben der Lehrer/in-nen Differenzierungsmaßnahmen, die den beiden Prozess-standardbereichen Diagnostizieren und Erarbeiten zuge-ordnet sind, im Mathematikunterricht umgesetzt werden. Da bei den Lehrerangaben eine deutliche Tendenz zu den mittleren Antwortkategorien festzustellen ist, wurden die zwei Antwortkategorien, die eine regelmäßige Umsetzung repräsentieren, zu „zumindest in den meisten Stunden“ zusammengefasst, und die beiden Antwortkategorien, die eine weniger regelmäßige Umsetzung repräsentieren, zu „maximal in einigen Stunden“5.

Im Hinblick auf das Diagnostizieren scheint das Erfassen des Vorwissens der Schüler/innen in Bezug auf ein neues Stoffgebiet ein regelmäßiger Bestandteil des Unterrichts zu sein. Mehr als die Hälfte der Schüler/innen werden von einer Lehrkraft unterrichtet, die dies regelmäßig durchführt. Im Hinblick auf lösungswegbezogenes Erarbeiten fällt auf, dass jene Maßnahme am häufigsten zu beobachten ist, die indirekt am meisten Lenkung durch die Lehrkraft erfordert, nämlich das gemeinsame Erarbeiten verschiedener Lösungs-wege. Etwas weniger häufig kommt es vor, dass Lehrer/in-nen den Lösungsweg einzelner Schüler/innen besprechen. Nur ein Viertel der Schüler/innen erhält nach Angaben der Lehrer/innen zumindest in den meisten Stunden Ge-legenheit, eine neue Aufgabenstellung selbst zu erarbeiten, gegenüber 75 %, die dazu maximal in einigen Stunden Ge-legenheit bekommen.

Betrachtet man die strukturellen Maßnahmen zur Schaf-fung von Freiräumen, so wird die freie Wahl der Aufgaben-reihenfolge deutlich öfter und regelmäßiger umgesetzt als die freie Wahl der Sozialform, die nur bei einem Viertel der Schüler/innen regelmäßig umgesetzt wird. Interessant ist, dass sich Schüler/innen im Leseunterricht öfter selbst aus-suchen dürfen, ob sie allein, zu zweit oder in einer kleinen Gruppe arbeiten möchten (40 % zumindest in den meisten Stunden vs. 60 % maximal in einigen Stunden).

0% 20 40 60 80 100%

Meine Lehrerin bespricht mit mir, was ich beim Lesen bereits gut kann und was ich noch mehr üben muss.

Abbildung 4.3.2: Rückmeldung zum Lesen aus Schülersicht (PIRLS 2011)

jeden Tag oder fast jeden Tag

1- bis 2-mal pro Woche

1- bis 2-mal pro Monatnie oder fast nie

22 322324

MW SE

2007 2.54 0.01

2011 2.47 0.02 t-Wert

DIFF 0.07 0.02 3.13

Tabelle 3.2.3: Mittelwertvergleich der Items zur Umsetzung innerer Differenzierung aus Schülersicht zwischen

TIMSS 2007 und TIMSS 2011

5 Die vier Antwortkategorien lauten gleich wie im Schülerfragebogen: in jeder Stunde/in den meisten Stunden/in einigen Stunden/nie oder fast nie.

Page 135: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Innere Differenzierung im Mathematikunterricht 133

Das Ergebnis weist darauf hin, dass im (Mathematik-)Unterricht Maßnahmen vorrangig umgesetzt werden, die eine Lenkung durch die Lehrkraft und ein gemeinsames Vorgehen der Schüler/innen involvieren. Eine ergänzende Frage, die aus dem internationalen PIRLS-Fragebogen-teil auf nationaler Ebene auch für Mathematik eingesetzt wurde, zeigt, dass 86 % der Schüler/innen von einer Lehr-kraft unterrichtet werden, die angibt, die ganze Klasse oft gemeinsam in Mathematik zu unterrichten (s. Abbildung 3.2.4). Im Gegensatz dazu geben Lehrkräfte von weniger als einem Viertel der Kinder an, individuell abgestimmten Mathematikunterricht zu geben. Beim Lesen wird der Unterricht etwas häufiger individuell abgestimmt: gut ein Drittel der Kinder erhält nach Angaben der Lehrer/innen zumindest oft individuell abgestimmten Unterricht, jedoch berichten auch hier Lehrer/innen von 54 % der Kinder, die ganze Klasse oft gemeinsam zu unterrichten (s. Abbildung 3.2.4).

Umsetzung innerer Differenzierung im Mathematik- unterricht aus Lehrersicht im Trend

Beim Vergleich der Ergebnisse zur Umsetzung innerer Differenzierung aus Lehrersicht zwischen den beiden Erhebungszeitpunkten TIMSS 2007 und TIMSS 2011 ist im Gegensatz zur Schülersicht, aus der im Mittel eine leichte Zunahme an innerer Differenzierung hervorgeht, ein leichter Rückgang zu verzeichnen. Am stärksten ist dieser bei der Maßnahme, die Schüler/innen eine neue Aufgabenstellung selbst erarbeiten zu lassen. Setzten diese Maßnahme im Jahr 2007 Lehrer/innen von 34 % der Kinder in den meisten Stunden um, machten dies im Jahr 2011 20 %. Der Rückgang bei den restlichen Maßnahmen be-trägt zwischen minus neun Prozentpunkten (das Vorwissen der Schüler/innen erfassen) und minus 4 Prozentpunkten (den Lösungsweg einzelner Schüler/innen besprechen). Auch der Mittelwertvergleich über die sechs korrespon-

Abbildung 3.2.3: Umsetzung innerer Differenzierung im Mathematikunterricht aus Sicht der Lehrer/innen (TIMSS 2011)

Abbildung 3.2.4: Gemeinsamer Unterricht versus Individualisierung im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011)

Abbildung 4.3.3: Umsetzung innerer Differenzierung im Mathematikunterricht aus Sicht der Lehrer/innen (TIMSS 2011)

zumindest in den meisten Stunden maximal in einigen Stunden

Angaben in Prozent der Schüler/innen

Erarbeiten

0% 20 60 80 10040

Diagnostizieren

Das Vorwissen der Schüler/innen in Bezug auf ein neues Stoffgebiet erfassen

Verschiedene Lösungswege für eine Aufgabenstellung mit den Schüler/innen erarbeiten

Den Lösungsweg einzelner Schüler/innen zu einer Fragestellung besprechen

Die Schüler/innen eine neue Aufgabenstellung selbst erarbeiten lassen

Die Schüler/innen aussuchen lassen, ob sie alleine, zu zweit oder in einer kleinen Gruppe arbeiten

Die Schüler/innen aussuchen lassen, in welcher Reihenfolge sie Aufgabestellungen/Übungen bearbeiten (z. B. im Lehrbuch, auf einem Arbeitsblatt)

54 46

50 50

45 55

25 75

49 51

25 75

Abbildung 4.3.4: Gemeinsamer Unterricht versus Individualisierung im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011)

mindestens oft maximal manchmal

Angaben in Prozent der Schüler/innen

Mathematikunterricht Leseunterricht

(TIMSS 2011) (PIRLS 2011)

0% 20 60 80 10040 0 20 60 80 10040

Ich unterrichte die ganze Klasse gemeinsam in Mathematik/Lesen

Ich gebe individuell abgestimmten Mathematikunterricht/Leseunterricht

54 46

35 65

86 14

21 79

Page 136: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

134 Innere Differenzierung im Mathematikunterricht

dierenden Items aus TIMSS 2007 und TIMSS 2011 zur Umsetzung aus Lehrersicht zeigt eine signifikante Verände-rung zwischen den beiden Erhebungszeitpunkten (t= 4.23, p= .000; s. Tabelle 3.2.4). Da aufgrund der Zuordnung der Codes zu den Antwortkategorien (1 = „in jeder Stunde“, 4 = „nie oder fast nie“) ein geringerer Mittelwert eine höhere Umsetzungshäufigkeit anzeigt, wurde bei TIMSS 2007 aus Sicht der Lehrer/innen insgesamt häufiger diffe-renziert als im Jahr 2011.

MW SE

2007 2.44 0.03

2011 2.57 0.03 t-Wert

DIFF 0.13 0.03 4.23

Tabelle 3.2.4: Mittelwertvergleich der Items zur Umsetzung aus Lehrersicht zwischen TIMSS 2007 und TIMSS 2011

Übereinstimmung der Lehrer- und Schülersicht bei der Umsetzung innerer Differenzierung

Das Ergebnis, dass innere Differenzierung aus Sicht der Lehrer/innen insgesamt abgenommen hat, aber aus Sicht der Schüler/innen häufiger vorkommt, kann zu einem großen Teil durch die geringe Übereinstimmung zwischen Lehrer- und Schülerangaben generell und zum anderen mit den spezifischen Entwicklungen der einzelnen Maßnahmen erklärt werden. Berechnet man das Übereinstimmungs-maß6 zwischen den fünf korrespondierenden Items aus Lehrer- und Schülerfragebogen zur Umsetzung innerer Differenzierung, so zeigt sich, dass die Übereinstimmung bei beiden Erhebungszeitpunkten7 nur gering ist. Die Kappa- Werte liegen je nach Maßnahme zwischen –.008 und .135.

Eine mögliche Erklärung dafür könnte das unterschied-liche Antwortverhalten von Lehrkräften und Schülerinnen/Schülern sein. So tendieren Lehrer/innen bei ihren Anga-ben zu den mittleren beiden Antwortkategorien, während die Schülerangaben mehr über alle vier Antwortkategorien verteilt sind.

Zwei der fünf Maßnahmen wurden bei beiden Erhebun-gen von den Kindern deutlich öfter angegeben als von den Lehrkräften: eine neue Aufgabenstellung selbst erarbeiten sowie verschiedene Lösungswege gemeinsam mit der Lehr-person erarbeiten. Die drei weiteren Maßnahmen werden hingegen von den Lehrkräften öfter und von den Kindern

seltener angegeben. So berichten 49 % der Schüler/innen, dass sie die Sozialform nie oder fast nie frei wählen dürfen, wohingegen die Lehrer/innen von nur 16 % der Kinder an-geben, dies nie oder fast nie zu erlauben. 23 % der Schüler/innen geben an, dass sie sich nie oder fast nie die Reihen-folge der zu bearbeitenden Aufgaben aussuchen dürfen, was von Lehrkräften von nur 7 % der Kinder bestätigt wird. Ähnlich starke Unterschiede zeigen sich auch bei der Be-sprechung individueller Lösungswege. Hier gibt immerhin gut ein Viertel der Kinder an, dass dies nie oder fast nie vor-kommt, während die Lehrkräfte in dieser Antwortkategorie rund 3 % der Kinder repräsentieren.

Betrachtet man die unterschiedliche Entwicklung der Ant-worthäufigkeiten nach Maßnahmen, so fällt dies bei der Maßnahme, Schüler/innen eine neue Aufgabenstellung selbst erarbeiten lassen, am stärksten ins Gewicht: 2011 gibt es bei dieser Maßnahme aus Lehrersicht den stärksten Rückgang (minus 16 Prozentpunkte), während 2011 mehr Schüler/innen angeben, dass dies in jeder Stunde vorkommt (plus 8 Prozentpunkte). Zudem ist bei allen Maßnahmen aus Schülersicht ein leichtes Plus ersichtlich, während aus Lehrersicht bei allen Maßnahmen ein leichter Rückgang festzustellen ist. Einzige Ausnahme ist das Erarbeiten ver-schiedener Lösungswege für eine neue Aufgabenstellung mit den Schülerinnen und Schülern, das sowohl aus Lehrer- als auch aus Schülersicht insgesamt weniger oft umgesetzt wird.

Umsetzung innerer Differenzierung aus Schulleitersicht

Auch die Schulleiter/innen wurden bei TIMSS 2011 um ihre Einschätzung gebeten, inwieweit an ihrer Schule in-dividualisierter Unterricht stattfindet. Abbildung 3.2.5 zeigt, dass mehr als drei Viertel (79 %) der Schüler/innen eine Schule besuchen, deren Leiter/in davon ausgeht, dass Lehrer/ innen den Unterricht an die individuellen Lernvor-

6 Als Maß für die Berechnung der Übereinstimmung zwischen der Umsetzungshäufigkeit aus Lehrer- und Schülersicht wurde Cohens Kappa für verbun-dene Stichproben verwendet. Kappa liegt zwischen –1 und +1. Werte nahe 1 zeigen eine hohe Übereinstimmung in den Aussagen, nahe 0 keine Über-einstimmung und Werte nahe –1 eine hohe Diskrepanz.

7 Für TIMSS 2007 vgl. Schwantner, 2010, S. 199.

Abbildung 3.2.5: Umsetzung innerer Differenzierung im Volksschulunterricht (TIMSS 2011)

0 % 20 40 60 80 100 %

Inwieweit passen die Lehrkräfte Ihrer Schule den Unterricht tatsächlich an die individuellen Lernvoraussetzungen der

Schüler/innen an?

in jeder oder fast jeder Klasse

in ungefähr der Hälfte der Klassen

Angaben in Prozent der Schüler/innen; Werte unter 1 % nicht eingetragen

in einigen Klassenin keiner Klasse

16 579

Page 137: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Innere Differenzierung im Mathematikunterricht 135

aussetzungen der Schüler/innen anpassen. 16 % gehen da-von aus, dass dies in ca. der Hälfte der Klassen umgesetzt wird, 5 % in einigen Klassen. Die Erwartungen der Schul-leiter/innen an die Umsetzung innerer Differenzierung sind damit durchaus hoch.

Unterrichtssteuerung

Im Folgenden wird das Ausmaß an Lehrer- und Schüler-steuerung im Unterricht dargestellt und analysiert, ob diffe-renzierter Unterricht mehr lehrer- oder schülergesteuert ist.

Differenzierter Unterricht, der auf den Lernprozess der Schüler/innen fokussiert und selbstständiges Arbeiten er-möglicht, setzt eine gute Balance aus Lehrer- und Schüler-steuerung voraus. Bezugnehmend auf die zu Beginn definier-ten Prozessstandards findet Lenkung durch die Lehrkraft im differenzierten Unterricht vor allem auf Basis der Festlegung und Gliederung der Lernziele in Fundamentum und Addi-tum – in Abstimmung mit den kognitiven und motivatio-nalen Lernvoraussetzungen der Schüler/innen – statt. Laut Herber (1983) ist es dabei wichtig, die Schüler/innen aktiv in die Planung einzubeziehen. Der Prozessstandardbereich Erarbeiten ist hingegen durchgehend von der Selbsttätigkeit der Schüler/innen gekennzeichnet, wobei die Lehrkraft mit gezielten Hilfestellungen und bereitgestellten Arbeitsauf-gaben den Lernprozess unterstützt. Eine adäquate Rückmel-dung wiederum gibt den Kindern Informationen darüber, was sie bereits gut können und wo noch Lernbedarf ist.

Im Rahmen von TIMSS 2011 und 2007 wurden die Leh-rer/innen gebeten, auf einer sechsstufigen Skala die Art der Unterrichtssteuerung einzuschätzen (1 = lehrergesteuert, 6 = schülergesteuert). Im Fragebogen wurde mit „lehrer-gesteuert“ ein Unterricht beschrieben, der ein fixes Lern-programm für alle Schüler/innen gleichermaßen vorsieht und dabei keine Wahlmöglichkeiten bietet und bei dem die ganze Klasse gemeinsam von Teilziel zu Teilziel geht. Als „schülergesteuert“ wurde ein Unterricht beschrieben, bei dem die Schüler/innen aus einem Angebot frei wählen

können, wie z. B. Themen, Materialien, die Sozialform oder das individuelle Lerntempo.

Abbildung 3.2.6 zeigt das Ausmaß an Lehrer- bzw. Schüler-steuerung im österreichischen Mathematikunterricht bei TIMSS 2011. Es zeigt sich, dass Mathematikunterricht in der Volksschule eher lehrergesteuert durchgeführt wird (69 % in den Kate-gorien 1–3). Knapp ein Drittel der Schüler/innen wird von einer Lehrkraft unterrichtet, die mehr zu Schülersteuerung tendiert. Vergleicht man – im Sinne einer ausgewogenen Balance aus Lehrer- und Schülersteuerung auf Basis der Prozessstandards – nur die beiden mittleren Antwortkate-gorien (3 und 4), so ist auch hier die deutliche Mehrheit auf Seiten der Lehrersteuerung ersichtlich (26 % gegenüber 11 % Schülersteuerung). Die Berechnungen wurden auch mit den PIRLS-Daten zum Leseunterricht durchgeführt und zeigen ein übereinstimmendes Ergebnis.

Unterrichtssteuerung in Mathematik im Trend

Da die Unterrichtssteuerung sowohl bei TIMSS 2007 als auch bei TIMSS 2011 erhoben wurde, können die Ergeb-nisse zwischen den beiden Erhebungszeitpunkten ver glichen werden. Dabei zeigen sich nur sehr kleine Veränderungen in den Antwortverteilungen über die sechs Stufen, die durch zufällige Schwankungen bedingt und statistisch unbedeu-tend sind. Auch der Mittelwertvergleich8 (s. Tabelle 3.2.5) zeigt keine statistisch signifikante Veränderung.

MW SE

2007 2.44 0.03

2011 2.57 0.03 t-Wert

DIFF 0.13 0.03 4.23

0 20 40 60 80 100

Lehrersteuerung

Angaben in Prozent der Schüler/innen

Schülersteuerung

Lehrer- vs. Schülersteuerung im Mathematikunterricht in Österreich

Wert 1: stark lehrergesteuert Wert 2 Wert 3 Wert 5 Wert 6: stark schülergesteuertWert 4

Abbildung 4.3.5: Lehrer- vs. Schülersteuerung im Mathematikunterricht in Österreich (TIMSS 2011)

43 9 2205 21

Abbildung 3.2.6: Lehrer- vs. Schülersteuerung im Mathematikunterricht in Österreich (TIMSS 2011)

8 Auf der sechsstufigen Skala steht 1 für „lehrergesteuert“ und 6 für „schülergesteuert“. Je höher der Mittelwert ist, desto mehr Schülersteuerung liegt vor.

Tabelle 3.2.5: Mittelwertvergleich der Unterrichtssteuerung aus Lehrersicht zwischen TIMSS 2007 und TIMSS 2011

Page 138: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

136 Innere Differenzierung im Mathematikunterricht

Unterrichtssteuerung und innere Differenzierung

Im Folgenden wird analysiert, wie sich der Zusammenhang zwischen innerer Differenzierung und Unterrichtssteuerung im Mathematikunterricht gestaltet.

Sowohl bei TIMSS 2011 als auch bei TIMSS 2007 zeigt sich – nach der oben vorgenommenen Definition erwar-tungskonform –, dass eine höhere Umsetzungshäufigkeit von innerer Differenzierung im Mathematikunterricht mit einer stärkeren Schülersteuerung einhergeht9. Der Zusam-menhang ist dabei bei TIMSS 2007 um einiges stärker (r  =  –.44, p = .000) als bei TIMSS 2011 (r = –.28, p = .000). Dies lässt sich zum Großteil dadurch begründen, dass die Skala zur Umsetzung innerer Differenzierung aus Lehrersicht bei TIMSS 2007 insgesamt 14 Items umfasste, von denen bei TIMSS 2011 nur sechs eingesetzt wurden10.

Selbstständiges Arbeiten im Mathematik- und Leseunterricht

Ergänzend zur Frage nach der Unterrichtssteuerung sind auch die Ergebnisse auf die Frage, wie oft Schüler/innen selbstständig arbeiten11, interessant. Dabei wurde unter-schieden, ob die Kinder nach einem festgelegten Plan/ einer festgelegten Zielvorgabe arbeiten oder selbstständig auf ein selbst gewähltes Ziel hinarbeiten. Wie vorab beschrieben, sind im Sinne der Prozessstandards beides adäquate Möglichkeiten, je nachdem, zu welchem Zeitpunkt (z. B. während der Planung oder der Erarbeitung) und wie die Lenkung erfolgt (z. B. durch Festlegung und Kommunika-tion der Fundamentums- und Additumsziele, gezielte Hilfe-stellungen bei individuellen Lösungsmöglichkeiten etc.).

Abbildung 3.2.7 zeigt die Ergebnisse zur Frage nach den Zielvorgaben bei selbstständigem Arbeiten getrennt für den Mathematik- und den Leseunterricht. Laut Angaben der Lehrer/innen ist dabei die überwiegende Form des selbst-ständigen Arbeitens durch einen festgelegten Plan oder eine festgelegte Zielvorgabe gelenkt. Gelegenheit, auf ein selbst gewähltes Ziel hinzuarbeiten, bieten Lehrkräfte im Mathe-matikunterricht von 17 %, im Leseunterricht von mehr als einem Drittel der Schüler/innen regelmäßig. Insgesamt kommen im Leseunterricht beide Formen des selbstständi-gen Arbeitens etwas häufiger vor. Abgesehen von den Zielvorgaben, die dem Prozessstan-dardbereich Planen zugeschrieben werden können, ist für das selbstständige Arbeiten wichtig, dass auch die Prozess-standards der Bereiche Diagnose, Erarbeiten und Rück-meldung umgesetzt werden. Nur über die Vernetzung aller vier Bereiche wird sichergestellt, dass (a) alle Schüler/innen über die kognitiven Voraussetzungen (z. B. Vorwissen) ver-fügen, um die Anforderungen selbstständig bewältigen zu können, (b) es adäquate Aufgaben gibt, die das selbststän-dige Erarbeiten eines Stoffgebiets durch die Schüler/innen unterstützen, (c) individuelle Lösungswege ermöglicht und besprochen werden, (d) genügend Freiräume geschaffen werden (z. B. freie Wahl der Sozialform, Selbstkontrolle), (e) die Schüler/innen über ihren Lernstand informiert sind (z. B. regelmäßiges sachbezogenes Feedback, das sich am individuellen Referenzrahmen orientiert) und ihren Lernprozess zunehmend eigenständig und selbstbestimmt gestalten können.

9 Aufgrund der vergebenen Codes für die Antwortkategorien (1 = „in jeder Stunde“ und 4 = „nie oder fast nie“) bei der Frage nach der Umsetzung innerer Differenzierung bedeuten geringere Werte eine höhere Umsetzungshäufigkeit. Bei der Unterrichtssteuerung zeigen höhere Werte eine stärkere Schüler-steuerung an. Demnach bedeutet das negative Vorzeichen bei der Korrelation, dass niedrigere Werte bei der inneren Differenzierung (höhere Umset-zungshäufigkeit) mit höheren Werten bei der Steuerung (mehr Schülersteuerung) einhergehen, bzw. höhere Werte bei der inneren Differenzierung (ge-ringere Umsetzungshäufigkeit) mit niedrigeren Werten bei der Unterrichtssteuerung (mehr Lehrersteuerung).

10 Bei TIMSS 2007 wurde der Faktor zur Umsetzung innerer Differenzierung aus Lehrersicht aus 14 Items gebildet. Der Faktor klärt 34 % der Varianz auf und die Reliabilität beträgt .85 (Cronbachs Alpha). Bei TIMSS 2011 wurde der Faktor zur Umsetzung innerer Differenzierung aus Lehrersicht aus sechs Items gebildet. Der Faktor klärt 43 % der Varianz auf. Die Reliabilität beträgt .72 (Cronbachs Alpha). Bei beiden Faktoren entsprechen aufgrund der vergebenen Codes für die Antwortkategorien (1 = „in jeder Stunde“; 4 = „nie oder fast nie“) niedrigere Werte einer höheren Umsetzungshäufigkeit.

11 Diese Frage war Teil des internationalen PIRLS-Lehrerfragebogens und wurde auf nationaler Ebene auch für TIMSS (nur für den Mathematikunterricht) übernommen.

Abbildung 4.3.7: Selbstständiges Arbeiten im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011)

mindestens oft maximal manchmal

Mathematikunterricht Leseunterricht

(TIMSS 2011) (PIRLS 2011)

0% 20 60 80 10040 0 20 60 80 10040

Die Schüler/innen arbeiten selbstständig nach einem festgelegten Plan oder einer Zielvorgabe.

Die Schüler/innen arbeiten selbstständig auf ein selbst gewähltes Ziel hin.

Angaben in Prozent der Schüler/innen

65 35

35 65

59 41

17 83

Abbildung 3.2.7: Selbstständiges Arbeiten im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011)

Page 139: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Innere Differenzierung im Mathematikunterricht 137

Resümee

Die vorliegenden Ergebnisse zum Mathematikunterricht bei TIMSS 2011 zeigen, dass innere Differenzierung aus Sicht der Lehrer/innen und Schulleiter/innen als notwendig erachtet wird. Die Erwartungen der Schulleiter/innen an die Umsetzung innerer Differenzierung sind dabei durch-aus hoch. So gehen Schulleiter/innen überwiegend davon aus, dass Lehrer/innen den Unterricht an die individuellen Lernvoraussetzungen der Schüler/innen anpassen.

Hinsichtlich der Umsetzung innerer Differenzierung im Mathematikunterricht in der vierten Klasse Volksschu-le geben die Ergebnisse der Schüler- und Lehrerbefra-gung einen guten Überblick. Generell ist zur Umsetzung der Prozessstandards anzumerken, dass es schwierig ist, ein einheitliches Maß dafür festzulegen, ab welcher Um-setzungshäufigkeit ein Prozessstandard als „erfüllt“ gilt. So wird beispielsweise das Vorwissen der Schüler/innen in Bezug auf ein neues Stoffgebiet wohl immer erfasst, bevor ein neues Stoffgebiet begonnen wird. Eine neue Aufgabenstellung wird nur so oft selbstständig erarbei-tet werden, wie es auch eine neue Aufgabenstellung gibt. Unter der Annahme, dass die Prozessstandards ein um-fassendes Unterrichtskonzept repräsentieren, sollten je-doch alle Maßnahmen zumindest in den meisten Stunden vorkommen. Darauf bezogen zeigen die Ergebnisse zur Umsetzung der inneren Differenzierung, dass zentrale Pro-zessstandards der Bereiche Erarbeiten und Rückmelden  – eine selbsttätige Auseinandersetzung mit dem Lernstoff (z. B. selbstständiges Erarbeiten einer neuen Aufgabenstel-lung, eigenständige Lösungswege besprechen), Freiräume für selbstbestimmtes Arbeiten (z. B. durch die freie Wahl der Sozialform) und eine regelmäßige systematische Leis-tungsrückmeldung – noch nicht hinreichend erfüllt sind.

Zudem wird die überwiegende Mehrheit der Schüler/in-nen in Mathematik von einer Lehrkraft unterrichtet, die angibt, die ganze Klasse meistens gemeinsam zu unter-richten. Schüler/ innen, die laut Angaben der Lehrer/innen individuell abgestimmten Unterricht erhalten, sind dem - gegenüber – sowohl im Mathematik- als auch im Lese-unterricht  – in der Minderzahl. Dies deckt sich mit den Angaben der Volksschullehrerbefragung im Rahmen der Bildungsstandard-Baseline-Testung in der vierten Klasse im Jahr 2010 in Österreich. Auch hier zeigt sich, dass die Mehrheit der Kinder in der Gesamtgruppe unterrichtet wird, wenngleich diese Unterrichtsform laut Angaben der Autorinnen und Autoren zugunsten angeleiteter Kleingrup-pen-, Partner- und Einzelarbeit zurückgeht (Vogtenhuber et al., 2012, S. 80).

Auffallend ist das Ergebnis, dass innere Differenzierung zwischen den zwei Erhebungszeitpunkten TIMSS 2007 und 2011 aus Sicht der Schüler/innen zugenommen hat, wohingegen diese aus Lehrersicht etwas zurückgegangen ist. Aus Schülerperspektive ist dabei vor allem in Bezug auf

Maß nahmen, die Freiräume schaffen und selbstständiges Arbeiten ermöglichen, eine positive Entwicklung festzu-stellen. Die divergierende Entwicklung aus Schüler- und Lehrersicht kann zum Großteil durch generelle Divergenzen in den Schüler- und Lehrerangaben erklärt werden. Dazu ist kritisch anzumerken, dass es sich bei beiden um subjektive Einschätzungen handelt, die nicht überprüft wurden bzw. im Rahmen der vorliegenden Untersuchung auch nicht überprüft werden konnten (z. B. anhand von Verhaltensbe-obachtungen). Vor allem bei der Selbstauskunft der Lehrer/innen über die Häufigkeit der Umsetzung (aber auch bei der Einschätzung der Wichtigkeit von innerer Differen-zierung und der Vorbereitung auf innere Differenzierung) kann nicht ausgeschlossen werden, dass diese einer sozial erwünschten Bewertung unterliegt. Die in den Ergebnis-sen ersichtliche Tendenz im Antwortverhalten der Lehrer/innen zu den mittleren Antwortkategorien unterstützt diese Annahme. Eine Möglichkeit, das Ausmaß sozial erwünschen Antwortverhaltens zu kontrollieren, würde die Einbindung begleitender Dokumentenanalysen (z. B. klas-senweise Durchsicht der angebotenen Aufgaben und der Unterrichtspläne) in die Erhebung bieten.

Hinsichtlich Unterrichtssteuerung konnte festgestellt wer-den, dass diese überwiegend von der Lehrkraft ausgeht, obgleich in der Anregung der Selbststeuerung und Selbst-tätigkeit der Schüler/innen ein großes Potenzial für mehr innere Differenzierung liegt, indem die Schüler/innen zunehmend zu Expertinnen und Experten ihres eigenen Lernprozesses werden. Diesbezüglich konnte auch keine Weitere ntwicklung im Vergleich zur Erhebung im Jahr 2007 festgestellt werden. Bezüglich Lenkung bei selbst-ständigem Arbeiten zeigt sich, dass dies überwiegend durch einen festgelegten Plan oder eine festlegte Zielvorgabe durch die Lehrkraft geschieht. Gelegenheit, auf ein selbst-gewähltes Ziel hinzuarbeiten, gibt es nur für sehr wenige Schüler/innen. Dieses Ergebnis entspricht jenem der Volks-schullehrerbefragung im Rahmen der Bildungsstandard-Baseline- Testung 2010: Laut Angaben der Lehrer/innen kommen auch hier Maßnahmen wie das selbstständige Arbeiten nach einer Zielvorgabe (z. B. Wochenplan) viel häufiger vor, als dass die Schüler/innen aus einer Auswahl von Lernzielen eines wählen, auf das sie selbstständig hin-arbeiten (Vogtenhuber et al., 2012, S. 81).

Insgesamt zeigen die Ergebnisse, dass innere Differenzie-rung – bezogen auf die Prozessstandards – noch nicht hin-reichend umgesetzt wird. Aufgrund der Begrenztheit der Fragebogenerhebung ist es jedoch schwierig festzustellen, inwieweit innere Differenzierung überhaupt als Gesamt-konzept – von der Planung und Vorbereitung, über die Diagnose und das Erarbeiten bis hin zur Leistungsrück-meldung – realisiert wird. Die vorliegenden Daten geben vielmehr Auskunft über die Umsetzungshäufigkeit verschie-dener Maßnahmen. In diesem Zusammenhang kommen auch Bohl, Batzel & Richey (2012) nach Sichtung diverser Forschungsbefunde aus Deutschland zum Thema Binnen-

Page 140: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

138 Innere Differenzierung im Mathematikunterricht

differenzierung zu dem Schluss: „Die Forschungslage macht deutlich, dass innerhalb einer gewissen methodischen Viel-falt – zumeist aus der Perspektive befragter Lehrkräfte  – durchaus differenziert wird. Inwiefern Differenzierungs-maßnahmen in den realen Mikroprozessen des Unterrichts (z. B. Aufgaben) realisiert werden, kann derzeit nicht um-fassend geklärt werden“ (S. 54). In dieser Hinsicht geben die Befragungen über die Prozessstandards der inneren Differenzierung im Mathematikunterricht bei TIMSS 2007

und TIMSS 2011 zumindest einen guten Überblick über den Ist-Stand der inneren Differenzierung in der Volks-schule. Für eine zuverlässigere und validere Erfassung im Sinne einer Umsetzung der Prozessstandards als umfassende Unterrichtskonzeption wären zuzüglich zur Befragung der Lehrer/innen und Schüler/innen systematische Unterrichts-beobachtungen, ergänzt durch Dokumentenanalysen, not-wendig.

Literatur

AltrichterH.,TrautmannM.,WischerB.,SommerauerS.&Doppler,B. (2009).Unterrichten inheterogenenGruppen:DasQualitätspotenzialvonIndividualisierung,DifferenzierungundKlassenschülerzahl.InW.Specht(Hrsg.),Nationaler Bildungsbe-richt Österreich 2009. Band 2. Fokussierte Analysen bildungspolitischer Schwerpunktthemen(341–360).Graz:Leykam.

Beer,R.&Benischek,I.(2011).AspektekompetenzorientiertenLernensundLehrens.InBIFIE(Hrsg.),Kompetenzorientierter Unterricht in Theorie und Praxis(5–28).Graz:Leykam

BMUKK(n.d.).SQA–SchulqualitätAllgemeinbildungdesBMUKK.Zugriffam27.08.2013unterhttp://www.bmukk.gv.at/schulen/schubf/se/sqa.xml

BMUKK (2013–14). Rundschreiben des Bundesministeriums für Unterricht, Kunst und Kultur Rundschreiben: 2013–14 ;BMUKK-20.300/0080-I/4/2013 ;SQA–SchulqualitätAllgemeinbildung:Richtlinien für dasSchuljahr 2013/14. Zugriff am 02.09.2013unterhttp://www.bmukk.gv.at/ministerium/rs/2013_14.xml

Bohl,T.,Batzel,A.&Richey,P.(2012).Öffnung–Differenzierung–Individualisierung–Adaptivität.Charakteristika,didaktischeImplikationenundForschungsbefundeverwandterUnterrichtskonzeptezumUmgangmitHeterogenität.InT.Bohl,M.Bönsch,M.Trautmann&B.Wischer (Hrsg.),Binnendifferenzierung. Teil 1: Didaktische Grundlagen und Forschungsergebnisse zur Binnendifferenzierung im Unterricht(40–69).ImmenhausenbeiKassel:Prolog-Verlag.

Herber,H.-J.(1983).Innere Differenzierung im Unterricht.Stuttgart:Kohlhammer.

Schwantner, U. (2010). Differenzierende Maßnahmen im Mathematikunterricht. In B. Suchan, S. Wallner-Paschon & C.Schreiner(Hrsg.),TIMSS 2007. Mathematik & Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht(192–206).Graz:Leykam.

Schwantner,U.(2013).EntwicklungvonProzessstandardsfürinnereDifferenzierungundderenÜberprüfungimMathematik-unterrichtinder4.Schulstufe.UnveröffentlichteDissertation:UniversitätSalzburg

Vogtenhuber,S.,Lassnigg,L.,Bruneforth,M.,Gumpoldsberger,H.,Toferer,B.,Schmich,J.,Schwantner,U.,Bergmüller,S.&Eder,F.(2012).IndikatorenC:Prozesse.InM.Bruneforth&L.Lassnigg(Hrsg.),Nationaler Bildungsbericht Österreich 2012, Band 1: Das Schulsystem im Spiegel von Daten und Indikatoren(61–110).Graz:Leykam.

Page 141: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Kommentar zu: Innere Differenzierung im Mathematikunterricht 139

Zur gegenwärtigen Dynamik im Kontext dieser Thematik

In der gegenwärtigen schulpädagogischen und didakti-schen Diskussion, die großflächig betrachtet durch Begriffe wie Bildungsstandards, teilstandardisierte Reifeprüfung oder SQA1 beeinflusst wird, haben didaktische Desiderate wie „Kompetenzorientierung im Unterricht“ (vgl. Beer & Benischek, 2011; Paechter, 2012) oder Prinzipien wie „innere Differenzierung im Unterricht“ (vgl. Altrichter et al., 2009) bisweilen keinen „leichten Stand“: Sehr schnell wähnen sich Lehrpersonen – wie einschlägige Erfahrungen des Autors aus zahlreichen Fortbildungssituationen zeigen – in einer antinomischen Situation: Die Perspektive, dass Ab-schlussprüfungen (zum Teil) zentral gesteuert und standar-disiert ablaufen, löst bei manchen Lehrpersonen Ängste und Befürchtungen aus; so sind Lehrpersonen bisweilen verunsi-chert, ob ihre Schülerinnen und Schüler bei starker Indivi-dualisierung des Unterrichts (d. h. wenn ihre individuellen Interessen, ihre persönlich bevorzugten Arbeitsformen etc. im Unterricht im Vordergrund stehen) den Anforderungen von (auch) external gesteuerten Prüfungssettings gewach-sen sind. Die Kompetenz, beide Entwicklungen (nationales Monitoring, Standardisierung sowie Externalisierung einer-seits und Kompetenzorientierung s owie Differenzierung im Unterricht andererseits) komplementär zu begreifen (vgl. Hofmann, 2011; Racherbäumer & Kühn, 2013) und damit als Lehrperson handlungsfähig zu bleiben, ist derzeit als ein wichtiges Fortbildungsthema zu betrachten, weil Lehrper-sonen hier eigenen Angaben zufolge Unterstützungsbedarf haben.

Im Kontext des hiesigen Kommentars stellt sich freilich die Frage, in welchem Ausmaß auch Lehrpersonen der Volks-schule von dieser widersprüchlichen Dynamik betroffen sind; die Tatsache, dass Bildungsstandard-Überprüfungen

jeweils gegen Ende der 4. Schulstufe stattfinden, mag aber die einleitenden Überlegungen auch für diese Zielgruppe als relevant erscheinen lassen2; eine mögliche Konsequenz im Hinblick auf das Antwortverhalten in Befragungen zum Thema „innere Differenzierung“ könnte darin bestehen, dass sich Lehrpersonen durch die derzeitige Entwicklung in ihrer Bereitschaft zur Umsetzung von Maßnahmen innerer Differenzierung gebremst fühlen.

Interpretation einiger Diskrepanzergebnisse vor dem Hintergrund der gegenwärtigen Dynamik

Zur Diskrepanz zwischen Lehrer- und Schülereinschätzungen

U. Schwantner widmet in ihrem Beitrag der Frage der Über-einstimmung der Lehrer- und Schülersicht bei der Umset-zung innerer Differenzierung breiten Raum: Sie kommt zum Ergebnis, dass Schüler/innen ein positiveres Bild im Hinblick auf die Häufigkeit der Realisierung von Maßnah-men innerer Differenzierung zeichnen als die Lehrpersonen; ein detaillierter Blick zeigt dabei, dass diese Diskrepanz insbesondere bei der Frage nach der Vielfalt von möglichen Lösungswegen („verschiedene Lösungswege gemeinsam mit der Lehrperson erarbeiten“) und bei der Frage nach dem Ausmaß an Eigenständigkeit bei der Lösungsfindung („eine neue Aufgabenstellung selbst erarbeiten“) existiert. Vor dem Hintergrund der einleitend geäußerten Dynamik könnte diese Diskrepanz folgendermaßen interpretiert werden: Die Ängste von Lehrpersonen, ihre Schüler/innen würden bei der Überprüfung der Bildungsstandards schlecht ab-schneiden, zeitigen die didaktische Konsequenz, dass Viel-falt zurückgefahren wird, weil Lehrpersonen befürchten

Kommentarzu3.2:InnereDifferenzierungimMathematikunterrichtFranz Hofmann

In diesem Kommentar wird der Befund zum Status quo innerer Differenzierung im Mathematikunterricht in der Volks-schule vor dem Hintergrund gegenwärtiger bildungspolitischer Trends beleuchtet; angesichts der Tatsache, dass manche Lehrpersonen diese Trends (Standardisierung und Zentralisierung vs. Appell zur Individualisierung) als nur schwer vereinbar erachten, wird darüber reflektiert, in welchem Ausmaß sich daraus resultierende Unsicherheiten in den Daten spiegeln. Weiterführende Überlegungen betreffen die Frage, welche forschungsmethodischen Implikationen sich für ähn-liche zukünftige Vorhaben ableiten lassen, damit ein qualitätsvoller Befund zur Frage der tatsächlichen Unterrichtsqua-lität in österreichischen Klassenzimmern erstellt werden kann.

1 Vgl. die entsprechende ministerielle Website zu „Schulqualität Allgemeinbildung“ (SQA) unter http://www.sqa.at/ (Zugriff vom 14.10.2013).2 Zudem sei an dieser Stelle angemerkt, dass die Lehrpersonen in der 4. Klasse Volksschule auch an der Entscheidung bezüglich der weiteren Schullaufbahn

ihrer Schülerinnen und Schüler beteiligt sind (im Hinblick auf die mögliche Zuerkennung der AHS-Reife; vgl. Eder & Thonhauser, 2006).

Page 142: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

140 Kommentar zu: Innere Differenzierung im Mathematikunterricht

könnten, dass bestimmte Schüler/innen dadurch verwirrt werden und deshalb einheitlich klar auf der Tafel demons-trierte Lösungswege zu bevorzugen seien; eine weitere Konsequenz kann darin gesehen werden, dass die betref-fenden Lehrpersonen weniger auf Eigenständigkeit setzen, weil eine solche ja im Klassen plenum zu einer großen Viel-falt an Lösungsvorschlägen führen würde, folgte man der Empfehlung von Herber, dass die Lehrperson unkommen-tiert Lösungsvorschläge an der Tafel sammeln und erst in weiterer Folge – ohne Bezug auf die jeweiligen Urheber/innen des Lösungsvorschlags – unter Qualitätsdimensionen miteinander vergleichen sollte (vgl. Herber, 1983). Zu dieser Interpretation würde auch ein weiteres, allerdings umgekehrt gerichtetes Diskrepanzergebnis passen: Die befragten Schüler/innen berichten in geringerem Ausmaß als die Lehrpersonen, die Reihenfolge in der Aufgabenbe-arbeitung selbst bestimmen zu dürfen oder die Sozialform frei wählen zu dürfen; diese didaktischen Konzessionen sind  – im Vergleich zur im Unterricht zugelassenen Viel-falt an Denkwegen – aus der Perspektive der Lehrperson als weniger risikoreich anzusehen. Ein weiterer Diskrepanzbe-fund, dass nämlich Schüler/innen vergleichsweise seltener be-richten, ihre Lehrpersonen würden Lösungswege individuell mit ihnen besprechen, könnte sich so auch erklären lassen (wo-bei bei dieser Erklärung den Schülerinnen und Schülern die realitätsgerechteren Antworten zuzuschreiben wären): Wenn die Ermöglichung individueller Vielfalt von Lehrpersonen zugunsten eines plenarartigen Erarbeitens von (exemplari-schen) Lösungen zurückgenommen wird, braucht es auch nicht mehr (so) viel Zeit zur Besprechung individuell gene-rierter Lösungen, weil es davon immer weniger gibt. Eine Bestätigung erfährt diese Interpretation durch die von U. Schwantner berichteten Ergebnisse zur Frage, in welchem Ausmaß die befragten Volksschullehrer/innen „lehrer-“ oder aber „schülergesteuert“ unterrichten, wobei das Ergeb-nis für den Mathematikunterricht zu zwei Dritteln in die erst genannte Richtung geht; der für den Zeitraum zwischen 2007 und 2011 errechnete Trend zeigt hier übrigens keine statistisch bedeutsamen Veränderungen.

Diskrepanz zwischen Ideal und Realität bei Erziehungszielen

So kann mit einem Blick auf die hohe Wertschätzung, die Lehrpersonen für die Notwendigkeit innerer Differen-zierung im Unterricht empfinden (alle Befragten halten es Schwantner zufolge für sehr notwendig oder zumindest notwendig, ihren Unterricht an die Voraussetzungen der Schüler/innen zu adaptieren [99 %]), festgehalten werden, dass es im Hinblick auf dieses didaktische Prinzip auch eine

intrapersonale Diskrepanz gibt, wie eine Synopse mit den von den Lehrpersonen berichteten Unterrichtsaktivitäten zeigt: Hier ist man von 99 %-Angaben, eine einschlägige Maßnahme „zumindest in den meisten Stunden“ zu rea-lisieren, sehr weit entfernt; die Zustimmungsraten liegen da in einem Spektrum zwischen 54 % und 25 %. Auch dieser Befund ist nicht neu, wenn man ihn in einen Kon-text zu Erziehungszielbefragungen – insbesondere im Zu-sammenhang mit der Dualität zwischen Heteronomie- und Autonomiezielen – setzt (vgl. Patry & Hofmann, 1998): Lehrpersonen können sich sehr für Autonomieziele begeistern; wenn es aber um deren Realisierung in einer bestimmten Klasse an einem bestimmten Tag in einem bestimmten Unterrichtsfach geht, tauchen viele Gründe auf, atmosphärisch (d. h. im Hinblick auf die Interaktions-qualität, auf die Genese der Regeln des Zusammenlebens3) oder didaktisch (d. h. bezogen auf Freiheitsgrade bei den Lernschritten) doch nicht zu viel davon zu „gewähren“, weil damit auch unerwünschte Wirkungen verbunden sein könnten, für deren Management Lehrpersonen ihre dies-bezüglichen Kompetenzen als (noch) zu wenig elaboriert einschätzen (vgl. Hofmann & Patry, 1999).

Kommentar zu den Ergebnissen vor dem Hintergrund der gewählten Forschungs-methode

Die hier zu kommentierenden Ergebnisse wurden sowohl auf Lehrpersonen- als auch auf Schüler-Ebene durch die Verwendung von Fragebögen generiert. Diese forschungs-methodische Entscheidung gibt Anlass zu folgen den kom-mentierenden Überlegungen:

�� Die Verwendung von Fragebögen bedeutet eine Beschrän-kung auf Selbstauskünfte, die mit Konsequenzen auf der Ebene der Datenqualität (insbesondere der Validität) ver-bunden ist: U. Schwantner merkt selbst an einer Stelle an, insbesondere die Lehrpersonen- Daten seien mit Ver-weis auf das Phänomen der sozialen Erwünschtheit mit Vorsicht zu interpretieren; diese Bedenken sind ernst zu nehmen. Zur Kontrolle der Wirkkraft dieses Phänomens hätten Unterrichts beobachtungen (also die Erhebung von Prozessmerk malen) Aufschluss dahingehend bringen können, in welcher Relation die berichteten Aktivitäts-frequenzen zum Prinzip der inneren Differenzierung zu tatsäch lichem Lehrerverhalten im Unterricht stehen (s. Ka-pitel 3. 2, Resümee); freilich ist anzumerken, dass solche Prozess analysen zeitlich aufwändig und daher teuer sind.

3 Eine Lehrperson hat im Kontext eines Schulentwicklungsprozesses, als es darum ging, ob mit jedem ersten Jahrgang die Regeln des Zusammenlebens neu ausverhandelt werden sollen oder das im ersten Jahr dieses Entwicklungsprozesses mit dem damaligen ersten Jahrgang generierte Regelwerk den nachfolgenden ersten Jahrgängen als Standardregelwerk ausgehändigt werden soll, gemeint: „Man braucht doch das Rad [der Schul- und Klassenord-nung] nicht jedes Jahr neu zu erfinden.“ Im Hinblick auf die Selbstverpflichtung macht es aber einen Unterschied, ob der Aushandlungsprozess statt-gefunden hat oder ob die Schüler/innen mit einem „Fremdprodukt“ konfrontiert und verpflichtet werden, es einzuhalten. Dann wird in aller Regel nur mehr der Sanktionskatalog besprochen.

Page 143: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Kommentar zu: Innere Differenzierung im Mathematikunterricht 141

�� Aus Forschungsarbeiten, die sich mit der Frage beschäf-tigen, in welchem Ausmaß implizite Motive didaktisches Handeln beeinflussen (vgl. Brunner, 2008), weiß man, dass Lehrpersonen, die sich unter einem Leistungsdruck oder als in Wettbewerbssituationen stehend empfinden (vgl. etwa den Druck, der bei einzelnen Lehrpersonen durch die Tatsache, dass „ihre“ Klasse zu Bildungsstan-dards überprüft wird, entstehen kann), geschlossenen Unterricht (mit weniger Rücksichtnahme auf indivi-duelle Bedürfnisse wie Fragen, Verstehensprobleme etc.) bevorzugen; das Gleiche gilt für Lehrpersonen, die sich ohnmächtig fühlen (etwa angesichts der einleitend beschriebenen antinomisch empfundenen bildungs-politischen Erwartungen, denen sie grundsätzlich im Sinne sorgfältigen Agierens ja entsprechen wollen): Auch solche Lehrpersonen bevor zugen geschlossenen Unterricht in der soeben kurz illustrierten Variante (vgl. zu diesem Aspekt ausführlicher Hofmann, 2011, S. 54). Es stellt sich in diesem Zusammenhang freilich die Frage, wie es um die Selbststeuerungsfähigkeiten von Lehr personen bestellt ist, die sie in die Lage versetzen würden, eigene Vorstellungen trotz bildungspolitischen „Gegenwinds“ im Klassenzimmer zu realisieren, (vgl. Kuhl, 2004); diese Fähigkeiten werden ja auch in Kompetenzprofilen, die Lehrpersonen grundsätzlich aufweisen sollen, an namhafter Stelle genannt (vgl. etwa Kunter et al., 2011). Eigene noch nicht publi-zierte Daten geben Anlass zur Vermutung, dass auch die Einschätzung der Ausprägung dieser Kompetenz von der gewählten Forschungsmethode abhängt: Folgt man den Daten, die durch die Verwendung operanter Instrumente (vgl. etwa den Operanten Multi-Motiv-test; Kuhl, 2013) generiert wurden, kommt man zum Ergebnis, dass die Selbststeuerungsfähigkeiten von Lehrpersonen (hier aber nicht auf Volks- oder allge-meinbildende Pflichtschule bezogen) vergleichsweise wenig ausgeprägt sind; legt man Lehrpersonen Frage-bögen vor, in denen Selbststeuerung auf die Subkons-trukte Selbstregulation, Selbstkontrolle, Willens- und Handlungsbahnung und Selbstzugang operationalisiert ist (vgl. Fuhrmann & Kuhl, 1998), zeigen die Ergeb-nisse, dass im Durchschnitt gute bis sehr gute Selbst-steuerungsfähigkeiten vorliegen. In dieser Richtung sind weitere Forschungsarbeiten notwendig und im Gange.

Resümee

Innere Differenzierung im Unterricht ist insbesondere aus schulpädagogischer Perspektive betrachtet ein in seiner Be-deutung (und wohl auch in seiner Realisierung) kaum zu unterschätzendes didaktisches Prinzip. Es ist zu begrüßen, dass empirisch darauf der Blick gerichtet wird und – wie U. Schwantner das praktiziert hat – dazu theoriengestützt Instrumente entwickelt und eingesetzt werden, um die Ver-breitung entsprechender Praktiken abschätzen zu können;

positiv ist anzumerken, dass nicht nur Lehrpersonen, sondern auch deren Schüler/innen um ihre Einschätzung gebeten wurden; auf dieser Altersstufe ist bezogen auf die Schüler/innen noch nicht davon auszugehen, dass deren Angaben etwa durch Phänomene sozialer Erwünschtheit (oder anderer Verzerrungseffekte) beeinträchtigt wären.

Aus dem Ergebnis wird deutlich, dass das Prinzip der inneren Differenzierung von Lehr- und Leitungspersonen hoch geschätzt wird und dass die Lehrpersonen durch-aus geeignete Strategien kennen und anwenden, um es zu realisieren. Freilich wird aus der Befundlage auch deut-lich, dass die Gewährung „großer“ Freiräume für Schüler/innen (Eigenständigkeit in der Bearbeitung, keine Ein-schränkungen im Hinblick auf die Lösungsfindung, son-dern Ermutigung zur Findung eigener Lösungsansätze) hinter der Gewährung risikoärmerer didaktischer Freiräu-me (Aufgabenreihenfolge festlegen etc.) zurückbleibt. Als eine Erklärung für diesen Befund wird auf die gegenwär-tige bildungspolitische Strategie verwiesen, Lehrpersonen mehr Autonomie im Prozess zu gewähren (vgl. sämtliche Diskussionen um schulautonome Möglichkeiten; Schratz & Hartmann, 2009), gleichzeitig aber stärkere Output-Maßnahmen zu etablieren. Freilich kann das Lehrperso-nen, die eher gewissenhaft und sorgfältig agieren wollen, schnell unter Druck bringen, was zur Konsequenz hat, dass diese  – bei gering ausgeprägten Selbststeuerungsfähigkei-ten – im Unterricht eher auf Fremdsteuerung setzen; diese Vorgehensweise ist aber wiederum mit Maßnahmen der Individualisierung und inneren Differenzierung nur schwer vereinbar.

Page 144: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

142 Kommentar zu: Innere Differenzierung im Mathematikunterricht

Literatur

Altrichter,H.,Trautmann,M.,Wischer,B.,Sommerauer,S.&Doppler,B.(2009).UnterrichteninheterogenenGruppen:DasQualitätspotenzialvonIndividualisierung,DifferenzierungundKlassenschülerzahl.InW.Specht(Hrsg.),Fokussierte Analysen bildungspolitischer Schwerpunktthemen(NationalerBildungsberichtÖsterreich2009/hrsg.vonWernerSpecht,S.341–360).Graz:Leykam.

Beer,R.&Benischek,I.(2011).AspektekompetenzorientiertenLehrensundLernens.InBIFIE(Hrsg.),Kompetenzorientierter Unterricht in Theorie und Praxis. [Information für Lehrer/innen](S.5–28).Graz:Leykam.

Braun,A.K.&Meier,M.(2006).WieGehirnelaufenlernen,oder:Frühübtsich,wereinMeisterwerdenwill.InU.Herrmann(Hrsg.),Neurodidaktik, 97–110.Weinheim:Beltz.

Brunner,J.(2008).MotivstrebenvonLehrerInnen,dieoffenen,vs.LehrerInnen,diefrontalenUnterrichtmachen.Masterarbeit,Universität.Salzburg.

Eder,F.,&Thonhauser,J.(2006).Bildungsaspirationen,NotenundBerechtigungenamÜbergangvonderVolksschulezurSekundarstufeI.Erziehung und Unterricht, 156 (3–4), 275–294.

Fuhrmann,A.&Kuhl,J.(1998).Maintainingahealthydiet:Effectsofpersonalityandself-rewardversusself-punishmentoncommitmenttoandenactmentofself-chosenandassignedgoals.Psychology and Health, 13,651–686.

Hofmann, F. (2011). Bildungsstandards und Individualisierung – einWiderspruch?Unterschiedliche Reaktionsmuster vonLehrpersonen–einHypothesengenerierenderBeitrag.InF.Hofmann,D.Martinek&U.Schwantner(Hrsg.), Binnendifferen-zierter Unterricht und Bildungsstandards – (k)ein Widerspruch? (ÖsterreichischeBeiträgezurBildungsforschung.7,S.47–62).Wien:LitVerl.

Hofmann,F.&Patry,J.-L.(1999).DasErziehungszielAutonomieinderUnterrichtspraxis.Psychologie in Erziehung und Unter-richt, 46, 126–135.

Herber,H.-J.(1983).Innere Differenzierung im Unterricht. Stuttgart:VerlagW.Kohlhammer.

Kuhl,J.(2004).WasbedeutetSelbststeuerungundwiekannmansieentwickeln? Personalführung, 37 (4),30–39.

Kuhl,J.(2013). Auswertungsmanual für den Operanten Multi-Motiv-Test OMT(Vollst.rev.Fassung).IMPART-Test-Manuale:Bd.2.Münster:Sonderpunkt-Verl.

Kunter,M.,Baumert,J.,Blum,W.,Klusmann,U.,Krauss,S.&Neubrand,M.(Hrsg.).(2011).Professionelle Kompetenz von Lehrkräften: Ergebnisse des Forschungsprogramms COACTIV.Münsteru.a:Waxmann.

Paechter, M. (Hrsg.). (2012).Handbuch kompetenzorientierter Unterricht: Handlungskompetenz, Schülerorientierung, Bil-dungsstandards, Unterrichtsentwicklung. Weinheim:Beltz.

Patry,J.-L.&Hofmann,F.(1998).ErziehungszielAutonomie–AnspruchundWirklichkeit.Psychologie in Erziehung und Un-terricht, 45, 53–66.

Racherbäumer,K.&Kühn,S.M.(2013).ZentralePrüfungenundindividuelleFörderung:Gegensatz,oderzweiSeitendersel-benMedaille?Zeitschrift für Bildungsforschung, 3(1),27–45.

Roth,G.(2006).MöglichkeitenundGrenzenvonWissensvermittlungundWissenserwerb.ErklärungsansätzeausLernpsy-chologieundHirnforschung.InR.Caspary(Hrsg.),Lernen und Gehirn. Der Weg zu einer neuen Pädagogoik,54–69.FreiburgimBreisgau:HerderVerlag.

Schratz,M.&Hartmann,M. (2009).Schulautonomie inÖsterreich:BilanzundPerspektiven füreineeigenverantwortlicheSchule.InW.Specht(Hrsg.),Fokussierte Analysen bildungspolitischer Schwerpunktthemen(NationalerBildungsberichtÖs-terreich2009,S.323–340).Graz:Leykam.

Page 145: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Anhang

Page 146: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 147: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Anhangstabellen 145

Perzentile 95.–5. Perzentil

Effekt-stärkeLand MW (SE) 5. 25. 50. 75. 95.

AUT 529 (2.0) 418 487 533 573 626 209

BEL (fr) 506 (2.9) 391 466 509 551 606 215 0.36

BGR 532 (4.1) 382 482 541 589 652 270 0.04

CZE 545 (2.2) 434 509 550 587 639 205 0.27

DEU 541 (2.2) 425 499 544 586 646 221 0.19

DNK 554 (1.7) 438 514 559 599 652 215 0.39

ESP 513 (2.3) 393 469 518 561 618 225 0.24

FIN 568 (1.9) 458 528 571 611 668 209 0.61

FRA 520 (2.6) 401 475 524 568 626 225 0.13

GBR (E) 552 (2.6) 404 500 558 609 678 274 0.31

GBR (N) 558 (2.4) 422 512 564 610 673 251 0.42

HUN 539 (2.9) 397 493 545 594 656 259 0.15

IRL 552 (2.3) 417 506 555 603 665 248 0.33

ITA 541 (2.2) 427 500 544 586 645 218 0.19

LTU 528 (2.0) 412 487 532 574 630 218 0.01

MLT 477 (1.4) 303 412 487 546 620 317 0.63

NLD 546 (1.9) 454 510 548 583 631 178 0.29

POL 526 (2.1) 397 480 531 576 637 240 0.05

PRT 541 (2.6) 425 499 546 586 643 218 0.19

ROU 502 (4.3) 336 445 512 567 634 298 0.35

SVK 535 (2.8) 408 495 541 582 638 230 0.09

SVN 530 (2.0) 405 487 535 579 637 232 0.02

SWE 542 (2.1) 426 502 545 585 643 217 0.20

Anhangstabelle A.1: Lese-Gesamtskala – EU-Teilnehmerländer (PIRLS 2011)

Anmerkungen: MW = Mittelwert; SE = StandardfehlerEffektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmer-lands mit Österreich

Anhangstabellen

Page 148: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

146 Anhangstabellen

Perzentile 95.–5. Perzentil

Effekt-stärkeLand MW (SE) 5. 25. 50. 75. 95.

AUT 508 (2.6) 401 466 511 552 606 204

BEL (fl) 549 (1.9) 450 509 550 590 645 195 0.67

CZE 511 (2.4) 387 467 514 560 621 234 0.04

DEU 528 (2.2) 420 488 530 570 626 206 0.31

DNK 537 (2.6) 413 493 541 585 646 233 0.43

ESP 482 (2.9) 362 435 486 532 593 230 0.39

FIN 545 (2.3) 430 501 549 592 654 224 0.57

GBR (E) 542 (3.5) 385 483 549 605 677 292 0.44

GBR (N) 562 (2.9) 411 511 567 622 693 282 0.72

HUN 515 (3.4) 352 462 523 577 650 297 0.09

IRL 527 (2.6) 390 479 533 580 648 258 0.27

ITA 508 (2.6) 386 461 510 557 622 236 0.01

LTU 534 (2.4) 405 486 537 585 650 244 0.37

MLT 496 (1.3) 357 446 502 549 613 256 0.18

NLD 540 (1.7) 449 505 543 577 623 174 0.55

POL 481 (2.2) 352 435 485 531 595 243 0.40

PRT 532 (3.4) 417 488 534 578 642 225 0.36

ROU 482 (5.8) 287 416 494 557 636 349 0.30

SVK 507 (3.8) 365 460 513 561 626 261 0.02

SVN 513 (2.2) 395 468 517 561 619 223 0.07

SWE 504 (2.0) 388 462 507 549 610 222 0.07

Anhangstabelle A.2: Mathematik-Gesamtskala – EU-Teilnehmerländer (TIMSS 2011)

Anmerkungen: MW = Mittelwert; SE = StandardfehlerEffektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmer-lands mit Österreich

Page 149: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Anhangstabellen 147

Perzentile 95.–5. Perzentil

Effekt-stärkeLand MW (SE) 5. 25. 50. 75. 95.

AUT 532 (2.8) 408 485 535 581 640 231

BEL (fl) 509 (2.0) 411 471 511 548 600 189 0.36

CZE 536 (2.5) 412 491 539 586 648 236 0.07

DEU 528 (2.9) 406 482 532 577 636 230 0.05

DNK 528 (2.8) 401 483 531 578 640 239 0.05

ESP 505 (3.0) 378 458 509 556 620 242 0.37

FIN 570 (2.6) 456 529 574 615 674 217 0.56

GBR (E) 529 (2.9) 384 476 535 586 653 269 0.04

GBR (N) 517 (2.6) 388 473 522 566 625 237 0.21

HUN 534 (3.7) 377 484 542 594 662 285 0.04

IRL 516 (3.4) 379 466 521 571 637 257 0.21

ITA 524 (2.7) 397 477 527 573 641 243 0.11

LTU 515 (2.4) 397 471 518 561 620 223 0.24

MLT 446 (1.9) 271 384 453 514 594 324 1.01

NLD 531 (2.2) 439 497 534 568 613 174 0.01

POL 505 (2.6) 369 455 509 558 627 258 0.36

PRT 522 (3.9) 397 476 524 571 637 239 0.14

ROU 505 (5.9) 302 444 517 580 659 357 0.29

SVK 532 (3.8) 390 486 539 586 648 257 0.00

SVN 520 (2.7) 388 474 525 572 636 248 0.15

SWE 533 (2.7) 403 486 539 586 648 245 0.03

Anhangstabelle A 3: Naturwissenschaft-Gesamtskala – EU-Teilnehmerländer (TIMSS 2011)

Anmerkungen: MW = Mittelwert; SE = StandardfehlerEffektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmer-lands mit Österreich

Page 150: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

148 Anhangstabellen

Land

Lese

n (P

IRLS

200

1)Le

sen

(PIR

LS 2

006)

Lese

n (P

IRLS

201

1)

MW

(SE

)B

uben

Mäd

chen

Ge-

schl

echt

er-

diff

eren

zM

W (S

E)

Bub

enM

ädch

enG

e-sc

hlec

hter

-d

iffer

enz

MW

(SE

)B

uben

Mäd

chen

Ge-

schl

echt

er-

diff

eren

z

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)

AU

T53

8(2

.2)

533

(2.6

)54

3(2

.3)

–10

(2.3

)52

9(2

.0)

525

(2.3

)53

3(2

.2)

–8(2

.3)

DE

U53

9(1

.9)

533

(2.5

)54

5(2

.2)

–13

(2.7

)54

8(2

.2)

544

(2.5

)55

1(2

.5)

–7(2

.6)

541

(2.2

)53

7(2

.7)

545

(2.3

)–8

(2.5

)

SG

P52

8(5

.2)

516

(5.7

)54

0(5

.3)

–24

(4.1

)55

8(2

.9)

550

(3.3

)56

7(3

.1)

–17

(2.9

)56

7(3

.3)

559

(3.6

)57

6(3

.5)

–17

(2.6

)

SV

N50

2(2

.0)

491

(2.4

)51

2(2

.5)

–22

(2.8

)52

2(2

.1)

512

(2.7

)53

2(2

.1)

–19

(2.5

)53

0(2

.0)

523

(2.7

)53

9(2

.2)

–16

(3.1

)

Anha

ngsta

belle

A.4

Mitt

elwer

te u

nd G

eschl

echt

erdi

ffere

nzen

im T

rend

(PIR

LS 2

001,

200

6 &

201

1; T

IMSS

199

5, 2

007

& 2

011)

A

nmer

kung

: MW

= M

ittel

wer

t; S

E =

Sta

ndar

dfeh

ler

Land

Mat

hem

atik

(TIM

SS

199

5)M

athe

mat

ik (T

IMS

S 2

007)

Mat

hem

atik

(TIM

SS

201

1)

MW

(SE

)B

uben

Mäd

chen

Ge-

schl

echt

er-

diff

eren

zM

W (S

E)

Bub

enM

ädch

enG

e-sc

hlec

hter

-d

iffer

enz

MW

(SE

)B

uben

Mäd

chen

Ge-

schl

echt

er-

diff

eren

z

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)

AU

T53

1(3

.2)

536

(3.2

)52

5(4

.5)

10(4

.2)

505

(2.0

)51

2(2

.3)

498

(2.5

)14

(2.6

)50

8(2

.6)

513

(3.3

)50

4(2

.7)

9(2

.8)

DE

U52

5(2

.3)

531

(2.5

)51

9(2

.5)

12(2

.1)

528

(2.2

)53

2(2

.6)

523

(2.7

)8

(2.7

)

SG

P59

0(4

.6)

586

(5.0

)59

5(5

.5)

–9(5

.0)

599

(3.7

)59

6(4

.1)

603

(3.8

)–6

(2.7

)60

6(3

.2)

604

(3.5

)60

8(3

.6)

–4(3

.0)

SV

N46

2(3

.4)

466

(3.9

)45

7(3

.9)

9(3

.7)

502

(1.8

)50

4(2

.1)

499

(2.4

)5

(2.6

)51

3(2

.2)

518

(3.1

)50

8(2

.2)

10(3

.2)

Land

Nat

urw

isse

nsch

aft

(TIM

SS

199

5)N

atur

wis

sens

chaf

t (T

IMS

S 2

007)

Nat

urw

isse

nsch

aft

(TIM

SS

201

1)

MW

(SE

)B

uben

Mäd

chen

Ge-

schl

echt

er-

diff

eren

zM

W (S

E)

Bub

enM

ädch

enG

e-sc

hlec

hter

-d

iffer

enz

MW

(SE

)B

uben

Mäd

chen

Ge-

schl

echt

er-

diff

eren

z

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)M

W(S

E)

MW

(SE

)

AU

T53

8(3

.9)

545

(4.1

)53

0(4

.8)

15(4

.2)

526

(2.5

)53

2(2

.9)

519

(2.7

)13

(2.6

)53

2(2

.8)

538

(3.6

)52

5(2

.8)

12(2

.9)

DE

U52

8(2

.4)

535

(2.9

)52

0(2

.6)

15(2

.7)

528

(2.9

)53

4(3

.2)

522

(3.0

)12

(2.5

)

SG

P52

3(5

.1)

526

(5.9

)52

1(5

.6)

5(5

.4)

587

(4.1

)58

7(4

.4)

587

(4.3

)0

(3.0

)53

8(3

.4)

585

(3.7

)58

1(3

.7)

4(2

.7)

SV

N46

4(3

.4)

470

(4.1

)45

8(3

.8)

12(4

.0)

518

(1.9

)51

8(2

.4)

518

(2.4

)0

(2.8

)52

0(2

.7)

523

(3.4

)51

7(2

.8)

6(3

.2)

Page 151: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Anhangstabellen 149

Anhangstabelle A.5: Anteile der Schüler/innen mit Migrationshintergrund im Zeitverlauf (PISA 2000, 2003, 2006, 2009, 2012; PIRLS 2006, 2011)

Altersgruppe 15-/16-Jährige4. Schulstufe (10-Jährige)

Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011

Geburtsjahrgang1 1984 1987 1990 1993 1996 1996 2001

Anteil an der Population (%)2

Schüler/innen mit Migrationshintergrund

11.0 13.0 13.2 15.2 16.5 16.6 18.8

2. Generation 4.1 4.1 5.3 10.5 10.9 12.8 13.9

1. Generation 7.0 9.2 7.9 4.8 5.6 3.9 4.9

Anteil an Schülerinnen/Schülern mit Migrationshintergrund (%)

Eltern in Exjugoslawien geboren3

m 45.6 37.2 36.8 40.7 38.2 34.2

Eltern in der Türkei geboren m 25.5 27.6 26.0 22.5 24.9 21.6

Anderes Land oder gemischte Herkunft

m 28.9 35.2 37.2 36.8 36.9 44.2

1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren.

2 Population bei PIRLS sind Schüler/innen der 4. Schulstufe; Population bei PISA sind Schüler/innen eines bestimmten Geburtsjahrgangs, die zum Testzeitpunkt 15/16 Jahre alt sind.

3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien.

m = Daten nicht erhoben

Altersgruppe 15-/16-Jährige4. Schulstufe (10-Jährige)

Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011

Geburtsjahrgang1 1984 1987 1990 1993 1996 1996 2001

Lesekompetenz2 MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE)

Schüler/innen ohne Migrationshintergrund

502 (2.8) 501 (3.8) 499 (3.4) 482 (2.9) 499 (2.7) 547 (1.9) 537 (1.7)

Schüler/innen mit Migrationshintergrund

409 (7.2) 426 (8.1) 438 (13.9) 414 (6.2) 449 (5.7) 498 (3.4) 495 (3.6)

2. Generation 429 (10.6) 428 (13.5) 420 (18.8) 427 (6.0) 451 (5.9) 500 (3.9) 493 (3.5)

1. Generation 398 (8.9) 425 (8.0) 451 (12.6) 384 (10.3) 443 (9.4) 489 (6.4) 500 (7.3)

Eltern in Exjugoslawien geboren3

m 433 (9.1) 449 (10.4) 419 (7.5) 439 (7.5) 504 (5.3) 498 (4.8)

Eltern in der Türkei geboren

m 372 (16.4) 369 (24.2) 372 (8.0) 412 (9.4) 461 (5.2) 465 (5.2)

Anderes Land oder gemischte Herkunft

m 462 (11.3) 481 (9.9) 438 (8.4) 481 (8.7) 522 (5.3) 512 (4.6)

1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren.

2 Eingetragen sind Mittelwerte der jeweiligen Leseleistungsskala. Standardfehler stehen in Klammern.

3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien.

m = Daten nicht erhoben

Page 152: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

150 Anhangstabellen

Anhangstabelle A.6: Lesekompetenz der Schüler/innen mit Migrationshintergrund im Zeitverlauf (PISA 2000, 2003, 2006, 2009, 2012; PIRLS 2006, 2011)

Altersgruppe 15-/16-Jährige4. Schulstufe (10-Jährige)

Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011

Geburtsjahrgang1 1984 1987 1990 1993 1996 1996 2001

Anteil an der Population (%)2

Schüler/innen mit Migrationshintergrund

11.0 13.0 13.2 15.2 16.5 16.6 18.8

2. Generation 4.1 4.1 5.3 10.5 10.9 12.8 13.9

1. Generation 7.0 9.2 7.9 4.8 5.6 3.9 4.9

Anteil an Schülerinnen/Schülern mit Migrationshintergrund (%)

Eltern in Exjugoslawien geboren3

m 45.6 37.2 36.8 40.7 38.2 34.2

Eltern in der Türkei geboren m 25.5 27.6 26.0 22.5 24.9 21.6

Anderes Land oder gemischte Herkunft

m 28.9 35.2 37.2 36.8 36.9 44.2

1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren.

2 Population bei PIRLS sind Schüler/innen der 4. Schulstufe; Population bei PISA sind Schüler/innen eines bestimmten Geburtsjahrgangs, die zum Testzeitpunkt 15/16 Jahre alt sind.

3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien.

m = Daten nicht erhoben

Altersgruppe 15-/16-Jährige4. Schulstufe (10-Jährige)

Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011

Geburtsjahrgang1 1984 1987 1990 1993 1996 1996 2001

Lesekompetenz2 MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE)

Schüler/innen ohne Migrationshintergrund

502 (2.8) 501 (3.8) 499 (3.4) 482 (2.9) 499 (2.7) 547 (1.9) 537 (1.7)

Schüler/innen mit Migrationshintergrund

409 (7.2) 426 (8.1) 438 (13.9) 414 (6.2) 449 (5.7) 498 (3.4) 495 (3.6)

2. Generation 429 (10.6) 428 (13.5) 420 (18.8) 427 (6.0) 451 (5.9) 500 (3.9) 493 (3.5)

1. Generation 398 (8.9) 425 (8.0) 451 (12.6) 384 (10.3) 443 (9.4) 489 (6.4) 500 (7.3)

Eltern in Exjugoslawien geboren3

m 433 (9.1) 449 (10.4) 419 (7.5) 439 (7.5) 504 (5.3) 498 (4.8)

Eltern in der Türkei geboren

m 372 (16.4) 369 (24.2) 372 (8.0) 412 (9.4) 461 (5.2) 465 (5.2)

Anderes Land oder gemischte Herkunft

m 462 (11.3) 481 (9.9) 438 (8.4) 481 (8.7) 522 (5.3) 512 (4.6)

1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren.

2 Eingetragen sind Mittelwerte der jeweiligen Leseleistungsskala. Standardfehler stehen in Klammern.

3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien.

m = Daten nicht erhoben

Page 153: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Autorenverzeichnis 151

AutorenverzeichnisDr. Karl Blüml Ehemaliger Landesschulinspektor für allgemeinbildende höhere Schulen; SOKO-Lesen am Stadtschulrat für Wien.

Sandra Filzmoser, MA Ehemaliger Junior Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.

Dipl.-Päd. Anna Glaeser, MA Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.

Dr. Gerda Hagenauer Oberassistentin am Institut für Erziehungswissenschaft der Universität Bern; Abteilung für Schul- und Unterrichtsforschung.

Dr. Barbara Herzog-Punzenberger Leiterin des Arbeitsbereichs Migration & Bildung an der Johannes-Kepler-Universität Linz, Institut für Pädagogik und Psychologie.

AO Univ.-Prof. Dr. Franz Hofmann Leiter der Abteilung Bildungswissenschaft, Schulforschung und Schulpraxis an der Universität Salzburg; School of Education.

Mag. Konrad Oberwimmer Wissenschaftlicher Mitarbeiter am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.

Dipl.-Math. Alexander Robitzsch Measurement Statistician am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.

Dr. Silvia Salchegger Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.

Univ.-Prof. Dr. Christine Schmid Fachbereichsleiterin an der Universität Salzburg; Fachbereich Erziehungswissenschaft.

Dr. Ursula Schwantner Research Fellow beim Australian Council for Educational Research.

Dr. Birgit Suchań Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments; Projektleiterin PISA; Lektorin an der Universität Salzburg am Fachbereich Erziehungswissenschaft.

Mag. Christina Wallner-Paschon Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments; Projektleiterin PIRLS; Lektorin an der Universität Salzburg am Fachbereich Erziehungswissenschaft.

Page 154: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 155: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie
Page 156: PIRLS & TIMSS 2011 - Bundesinstitut für Bildungsforschung ... · Claudia Schreiner PIRLS & TIMSS 2011. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) ... wie

Leykam [email protected]

ISBN 978-3-7011-8002-8

www.bifie.at