1 Hintergrund

Im Zuge der bildungspolitischen Reaktionen auf das schlechte Abschneiden der Schülerinnen und Schüler in Deutschland in der ersten PISA-Erhebung 2000 wurde auch der Auf- und Ausbau des Ganztags als Unterstützungsprogramm forciert (KMK 2002; Kuhlmann und Tillmann 2009). Welche Erwartungen mit dem Ganztag verknüpft sind, welche theoretischen Annahmen ihm zugeschrieben werden und inwiefern sich diese empirisch bestätigen, ist Gegenstand des Beitrags. Dabei wird der Fokus auf die Effekte von ganztägiger Bildung und Betreuung auf die Schülerleistung und die Kompensation von Benachteiligung gelegt. Nachfolgend werden wir zunächst programmatische Zuschreibungen an Ganztagsschulen und theoretische Annahmen hinter den an sie gerichteten Erwartungen referieren, um danach den empirischen Forschungsstand zu den Wirkungen von Ganztagschule auf die Leistungen von Schülerinnen und Schülern, und im Hinblick auf die Kompensation von Benachteiligung darzustellen.

1.1 Programmatische Zuschreibungen und theoretische Überlegungen

In dem bildungspolitischen Diskurs um die Konsequenzen aus den Befunden rezendenter Schulleistungsstudien wurde mit dem Start des „Investivprogramms Zukunft Bildung und Betreuung“ (IZBB) auch der Ausbau von Ganztagschulen und die Entwicklung von ganztagsschulischen Förderkonzepten forciert. Im Rahmen dieses Programms stellte die Bundesregierung vier Milliarden Euro für den Auf- und Ausbau der Ganztagsinfrastruktur (2003 bis 2009) zur Verfügung, ergänzend investieren die Bundesländer finanzielle Eigenleistungen von ca. 400 Millionen Euro in Konzeptentwicklungen und Zusammenführungen des Modells Ganztagsschule mit anderen Reformprojekten (vgl. BMBF 2009). Diese hohen Fördersummen implizieren bereits die substanziellen sozial- und bildungspolitischen Hoffnungen, die mit Ganztagsschulen verknüpft sind. Die Begründungslinien für ihre Einführung heben vor allem auf sich ändernde Bildungsaufgaben im Zuge komplexer werdender gesellschaftlicher Anforderungen ab. Dies bezieht sich auf ein Verständnis von Ganztagsschulen, die einen Beitrag zur Sicherstellung der soziokulturellen Infrastruktur leisten sollen (z. B. der Vereinbarkeit von Familie und Beruf entgegenkommen); die zur Stärkung der sozialerzieherischen Funktion von Schule (z. B. die Schaffung von Angeboten für die Praxis von Partizipation und Demokratielernen) und zur Verbesserung von Schulqualität beitragen soll (z. B. die Entwicklung einer Lernkultur, die die Differenzierung von Lernarrangements im Unterricht stärkt) und die auf die Wahrung der Bildungschancen aller Kinder und Jugendlichen abhebt (z. B. die Intensivierung der Förderung vor allem auch der Lernschwächeren) (vgl. Radisch und Klieme 2004; Holtappels 2006, 2009). Anhand der bildungspolitischen Begründungslinien, die sich im Wesentlichen aus sozial-, arbeitsmarkt- und bildungsspezifischen Argumenten zusammensetzen (vgl. Appel 2004) wird ersichtlich, dass die Leistung von Ganztagsschule eng mit gesellschaftlichen Bedürfnissen verknüpft wird, für die Ganztagsschulen nicht die einzige, aber eine adäquate Problemlösung darstellen soll. Allerdings stellt Ganztagsschule kein reines „Vollzug-Instrument“ (Ipfling 2005, S. 300) für die Bearbeitung gesellschaftlicher Entwicklungen dar. Bildungstheoretisch wird vielmehr argumentiert, dass Ganztagsschule in einem Wechselverhältnis zu den gesamtgesellschaftlichen Entwicklungen steht, indem sie einerseits Angebote zur Bearbeitung gesellschaftlicher Problemlagen schafft, andererseits aber auch vor dem Hintergrund ihrer Zielsetzung als Schule, nämlich die Mündigkeit des Subjekts zu befördern (vgl. Klafki 1991), sich kritisch daran orientieren muss, dass ihre Angebote pädagogische Ansprüche erfüllen, Einzelschule also auch selbst Initiator ihrer eigenen pädagogischen Gestaltung ist.

Sowohl die bildungstheoretischen, als auch schultheoretischen Auseinandersetzungen mit der Ganztagsschule beschreiben diese in erster Linie funktional als über die generell beschriebenen Funktionen von Schule (Halbtagsschule) hinausgehend. Dabei soll Ganztagsschule gleichwohl „Schule“ bleiben (vgl. Rekus 2005); also die auf Teilhabe an Gesellschaft bezogenen Funktionen von Schule erfüllen (Integration, Allokation, Qualifikation und Enkulturation, vgl. Fend 2006). Durch neu gewonnene Zeitkapazitäten im Vergleich zur Halbtagsbeschulung besteht eine spezifische theoretische Annahme nun darin, dass durch eine effiziente Umorganisation von Schule, die diesen neuen Gestaltungsrahmen nutzt, konkreten gesellschaftlichen Interessenlagen begegnet werden kann (vgl. Rekus 2005). Gemeint ist hierbei u. a. die Möglichkeit, durch Ganztagsschule verstärkt lebensweltliche Bezüge zu berücksichtigen: Indem sie beispielsweise die Übernahme der Hausaufgabenbetreuung professionell übernimmt und damit die Eltern als „Nicht-Profis“ entlastet, weist sie einen familienergänzenden Charakter auf und bedient gleichzeitig ein arbeitsmarktspezifisches Interesse, nämlich die verbesserte Vereinbarkeit von Familie und Beruf. Eine kompensatorische Wirkung wird der Ganztagsschule zudem im Hinblick auf Familien mit nicht hinreichenden Erziehungskompetenzen zugeschrieben, wenn sie Erziehungshilfen anbietet (vgl. Scholz und Reh 2009).

Neuere Arbeiten versuchen sich in der gerechtigkeitstheoretisch fundierten Beschreibung von Ganztagsschule, wonach der Ganztagsschule aus einer systemorientierten Perspektive heraus so genannte „Integrationskraft“ zugesprochen wird, indem sie zusätzliche zeitliche Möglichkeitsräume für die soziale Integration von Kindern bietet. Hier wird die Annahme plausibilisiert, dass im Zuge des Ganztags nicht allein schulisch geprüfte Fähigkeiten weiterentwickelt werden, sondern auch Fähigkeiten kultureller und politischer Teilhabe und so persönliche Kontakte und Freundschaften im Raum ganztägiger Bildung eine neue und umfänglichere Bedeutung für das Erfahren von (gerechtigkeitstheoretisch bedeutsamen) Anerkennungsprozessen erhalten können (vgl. Berkemeyer et al. 2012; Berkemeyer und Manitius 2013).

In schul-, bildungs- und gerechtigkeitstheoretischen, sowie pädagogischen Argumentationslinien wird das Verhältnis von Ganztagsschulen zur Gesellschaft diskutiert. Dabei wird das Beziehungsgeflecht zwischen Ganztagsschule und konkreten gesellschaftlichen Teilbereichen (wie z. B. Familie, Arbeitsmarkt, Freizeit) modelliert, und die Funktionen und Leistungen von Ganztagsschule erörtert. Gleichzeitig lässt sich aber aus allen genannten theoretischen Richtungen argumentieren, dass Ganztagsschule letztlich auch Schule ist und somit auch die klassischen Funktionen von Schule erfüllen muss: Mit Blick etwa auf die Qualifikationsfunktion, womit auch die Leistungen von Schülerinnen und Schülern einbezogen sind, ist es hier vor allem die Bildungspolitik, die diesbezüglich Hoffnungen und Erwartungen artikuliert, dass explizit Ganztagsschule einen Beitrag zur Verbesserung der Kompetenzen von Kindern und Jugendlichen erbringt (Ahnen 2005; Schavan 2005) Es wird argumentiert, dass Ganztagsschulen potenziell mehr Lernzeit zur Verfügung steht und damit auch größere Gestaltungsmöglichkeiten, um Leistungen der Schülerinnen und Schüler zu verbessern. Von dem längeren Verbleib im schulischen Kontext sollen zudem auch Schülerinnen und Schüler mit Migrationshintergrund profitieren, da sie mehr Zeit in einem deutschsprachigen Umfeld verbringen (vgl. Merkens und Schründer-Lenzen 2010).

Mit Blick auf die konkreten Wirkungen von Ganztagsschule finden sich in den entsprechenden theoretisch-konzeptionellen Arbeiten vorwiegend Wirkungsmodelle von Ganztagsschule, in denen in Kontext-, Input-, Prozess-, und Outputdimensionen zur Ganztagsschule ihre Ergebnisqualität als eine Outputvariable verortet wird (vgl. Fischer et al. 2011). Diese Modellierung entspricht üblichen Effektivitätsvorstellungen zur Schule (vgl. Stufflebeam 1972; Creemers et al. 2000; Creemers und Kyriakides 2008). Die Erweiterung des Bildungsmodells zur Ganztagsschule hinsichtlich des Outputs erfolgt nun, indem neben den Wirkungen auf Schülerebene (Leistung) auch zusätzlich noch erzieherische Wirkungen hinsichtlich etwa der Entwicklung von sozialen Kompetenzen betont werden (vgl. Fischer et al. 2011). In seinen Arbeiten zu einem umfassenderen Wirkungsmodell von Ganztagsschule kommt Radisch (2009) zu dem Schluss, dass ganztagsschulische Wirkung sich nicht allein über das zeitliche „Mehr“ gegenüber Halbtagsschule ausmachen lässt, sondern vielmehr in Wirkungsmodellen von Ganztagsschule stärker Umfeldfaktoren, die Angebotsstrukturen und -gestaltung und ihre Rolle auf ausdifferenzierte Wirkungen (fachleistungsbezogen, fachübergreifend, fachunabhängig) einzubeziehen sind. Folglich werden hier auch explizit andere Wirkungsbereiche, als ausschließlich die Fachleistung betont.

Gleichwohl ist sowohl in den bildungspolitischen Erwartungen, als auch den bisherigen theoretisch-konzeptionellen Ansätzen zum schulischen Ganztag die Annahme zu entnehmen, „dass Ganztagsschulen einen konkreten und keinesfalls nur programmatischen Kontext bieten, in dem sich eine neue individualisierende sowie Bildung und Erziehung zusammenführende Praxis etablieren kann“, (Maykus et al. 2011, S. 128) wobei die Auswirkung von Ganztagsschule auf Schülerleistung ein expliziter Wirkungsbereich sein soll. Was nun tatsächlich Leistungen und Wirkungen von Ganztagsschulen sind, ist inzwischen Gegenstand vielzähliger Forschung.

1.2 Forschung zu den Effekten von Ganztagsschule

Im Rahmen der Forschung zu ganztägiger Bildung und Betreuung wurde mittlerweile eine Reihe von Forschungsarbeiten vorgelegt. Der empirische Nachweis für den Beitrag von deutschen Ganztagsschulen zur Verbesserung der Leistungen von Schülerinnen und Schüler auf Grundlage repräsentativer Daten steht bislang jedoch weitgehend aus. Kleinere Studien finden jedoch Hinweise auf einen entsprechenden Effekt der Ganztagsschule.

Insgesamt hat sich mittlerweile eine über mehrere Institute getragene breite Forschungslandschaft entwickelt, die differenzierte Erkenntnisse zum schulischen Ganztag bereithält (z. B. Fischer et al. 2011; Steiner 2011; Stecher et al. 2011; Rauschenbach et al. 2012; Züchner und Fischer 2014; Willems und Holtappels 2014).

Mit Fokus auf die Wirkungen von Ganztagsschule im Hinblick auf eine Verbesserung der Schülerleistungen und ganztagsschulischer Kompensationsleistungen − bezüglich der Benachteiligung von Kindern und Jugendlichen − stellt sich die Forschungslage jedoch nicht eindeutig dar: In querschnittlichen Untersuchungen haben bisherige Vergleiche der Fachleistungen von Schülerinnen und Schülern an Halb- und Ganztagsschulen keine Wirkungen der Ganztagsschule nachweisen können. Radisch et al. finden in ihren Analysen der IGLU-Daten von 2001 für den Primarbereich keinen signifikanten Unterschied in den Kompetenzen von Halb- und Ganztagsschülern (vgl. Radisch et al. 2006). Mittels Daten aus IGLU 2006 konnten Holtappels et al. (2010) zwar ein besseres Abschneiden in der Leseleistung bei Schülern ohne intensive Teilnahme an Ganztagsangeboten ermitteln, dieser Befund wurde jedoch insbesondere über Selektionseffekte erklärt (Ganztagsteilnahme als remediales Förderinstrument innerhalb von Schulen). Sichtbar wurde in dieser Untersuchung, dass der Ganztag offenbar verstärkt von Kindern aus benachteiligten Elternhäusern genutzt wird. Neuere Untersuchungen aus den letzten StEG-Daten zeigen jedoch insgesamt ein differentes Bild hinsichtlich der sozialen Selektivität in der Ganztagsteilnahme: Demnach bestehen vor allem im Grundschulbereich herkunftsspezifische Differenzen; insbesondere wird der Ganztag frequentiert von Kindern, die nicht aus „Kernfamilien“ stammen, wo also kein Elternteil Hausfrau oder Hausmann ist (vgl. Steiner 2011).

Um längsschnittlich generierte Befunde zum Ganztag zu betrachten, erscheint der Rückgriff auf die größte Studie zum Ganztag, StEG, naheliegend. Diese sah aber bislang keine Erhebung von Leistungsdaten vor und weist auch kein Kontrollgruppendesign auf. Allerdings wurde in StEG die Entwicklung des Notenerwerbs analysiert. Die Autoren stellten fest, dass eine häufigere Teilnahme (mehrere Tage die Woche) am Ganztag eine förderliche Entwicklung auf die Schulnoten hat (vgl. Kuhn und Fischer 2011). Auch findet sich ein schwächerer Zusammenhang zwischen der sozialen Herkunft und der Mathematiknote an gebundenen Ganztagsschulen (Züchner und Fischer 2014). Problematisch bleibt jedoch die Messung der schulischen Performanz über Schulnoten, was eher als gering valide einzuschätzen ist und keine Aussage darüber erlaubt, ob hinter einer positiven Notenentwicklung auch ein Kompetenzzuwachs steht.

Für die Betrachtung des Kompetenzerwerbs an Ganztagsschulen in längsschnittlichen Designs liegen bislang nur wenige Befunde aus kleineren Studien vor. Für den Grundschulbereich lassen sich im Vergleich der Leseleistung von einer nicht repräsentativen Stichprobe Berliner Halbtags- und offenen Ganztagsschulen zwar höhere Kompetenzwerte der Schülerinnen und Schüler mit Ganztagsteilnahme finden, allerdings handelt es sich nach Einschätzung der Autoren hierbei um eine positiv selektierte Gruppe, die bereits zum ersten Messzeitpunkt (Ende des ersten Schuljahres) eine höhere Lesefähigkeit aufweisen (vgl. Bellin und Tamke 2010). Für Schweizer Ganztagsgrundschulen untersuchte Schüpbach (2014) ebenfalls längsschnittlich angelegt die Leistungsentwicklung von ganz- und halbtägig beschulten Kindern. Während zum ersten Messzeitpunkt (Ende des ersten Schuljahres) keine Unterschiede in der Leseleistung zu finden waren, zeigte sich ein höherer Zuwachs in der Entwicklung der Leistung der Kinder im Ganztag am Ende des dritten Schuljahres. Es wurde außerdem der Frage nachgegangen, ob der Ganztag kompensatorische Effekte hat. Dies zeigte sich jedoch nicht; es fanden sich keine Effekte des Ganztags auf die Kopplung des Zusammenhangs von sozialer Herkunft und Schulleistung (Schüpbach 2014). Insgesamt handelt es sich in dieser Studie um eine Stichprobe mit überproportional hohem Anteil an Kindern aus Elternhäusern mit hohem sozioökonomischen Hintergrund.

Insbesondere fokussiert auf den Erwerb sprachlicher Kompetenzen von Kindern mit Migrationshintergrund, fragen Reinders et al. (2011) danach, ob Ganztagsschule hier eine bessere Förderung leistet. Die Autoren finden keinen signifikanten Unterschied in der Leseleistung von Halbtags- und Ganztagsschülern. Ebenso zeigten sich keine Auswirkungen von konkret implementierten Sprachförderangeboten auf die Leseleistung. Jedoch scheint die Zusammensetzung der Schülerschaft ab einem Migrationsanteil von über 70 % einen negativen Effekt auf die Veränderungen der Leseleistung der Schülerinnen und Schüler zu haben. Auch hier kommen die verantwortlichen Forscher zu Einschränkungen hinsichtlich der Aussagekraft ihrer Befunde, da sich Selektionseffekte durch die Freiwilligkeit in der Studienteilnahme ergaben.

Wenn Variablen wie der Migrationshintergrund und auch die soziale Lage statistisch kontrolliert würden, ließe sich dann immer noch ein Unterschied zwischen Ganztags- und Halbtagsschulen feststellen? Untersuchungen der IGLU Studie 2006 zeigen, dass bei Kontrolle der Schulkomposition in Bezug auf den sozioökonomischem Hintergrund, den Anteil an Migranten sowie den durchschnittlichen kognitiven Fähigkeiten (Kognitiver Fähigkeitstest, KFT) keine Unterschiede mehr zwischen Ganztags- und Halbtagsschülerinnen und -schülern erkennbar sind (vgl. Holtappels et al. 2010). Die Aufnahme des KFTs als Kontrollvariable auf Schulebene kann allerdings auch kritisch betrachtet werden, da Schule nicht nur Fähigkeiten in einzelnen Domänen bzw. Fächern beeinflusst, sondern auch kognitive Fähigkeiten im Allgemeinen.

2 Fragestellungen der Studie

Vor dem Hintergrund der hohen Erwartungen, die an Ganztagsschulen gerichtet werden, ist es erstaunlich, dass zu den Effekten ganztägiger Bildung und Betreuung auf Schülerleistungen kaum Forschungsbefunde vorliegen. Die Leitfragen der vorliegenden Arbeit schließen an dieses Forschungsdesiderat an und fragen nach den Effekten der Organisationsform auf das Leistungsniveau, sowie auf herkunftsbedingte Disparitäten innerhalb der Schule. Folgende Teilfragen werden separat für die Grundschule und für weiterführende Schulen in den Domänen Lesen, Mathematik und Naturwissenschaften untersucht:

  • Hat die Organisationsform Ganztag vs. Halbtag einen Effekt auf das Leistungsniveau von Schulen?

  • Hat die Organisationsform einen Effekt auf die Kopplung zwischen sozioökonomischem Hintergrund und Schülerleistung in Schulen, sowie innerschulische Leistungsunterschiede zwischen Kindern mit und ohne Migrationshintergrund?

Um unser Untersuchungsdesign zu beschreiben, scheint es zunächst sinnvoll zwischen Analysen auf Individual- oder Organisationsebene zu unterscheiden. Diese Unterscheidung ist sowohl inhaltlich wie auch methodisch bedeutsam. Aus inhaltlicher Perspektive handelt es sich um eine bedeutsame Unterscheidung, da im Rahmen der ganztätigen Bildung und Betreuung nicht alle Angebote verpflichtend sind. Eine der Grundideen von Ganztagsschule ist es, individuelle Fördermöglichkeiten zu schaffen und Wahlmöglichkeiten zu bieten. In Analysen auf Individualebene kann nun der Frage nachgegangen werden, welche spezifischen Effekte die von Schülerinnen und Schülern genutzten Ganztagsangebote haben. Dabei können auch bestimmte Qualitätsmerkmale betrachtet werden, die in der Schulrealität kaum implementiert sind. In diesem Kontext sei darauf verwiesen, dass die zusätzlichen Zeitbudgets an Ganztagsschulen ganz unterschiedliche genutzt werden können. Demnach sind Studien zu den Effekten spezifischer Qualitätsmerkmale keinesfalls uninteressant, vielmehr können sie wichtige Erkenntnisse zur Weiterentwicklung von Ganztagsschulen liefern. Gleichzeitig können Studien zu einzelnen Qualitätsmerkmalen keine Antwort auf die Frage geben, welchen Gesamteffekt der Ausbau von Ganztagsschulen in der Realität hat. In der vorliegenden Studie interessieren wir uns (im Kontext des massiven Ausbaus von Ganztagsschulen) genau für diese Frage. Letztlich ist das IZBB ein Reformprogramm, das auf Schulebene ansetzt. Daher schätzen wir den Gesamteffekt auf Schulebene.

Die Wahl der Analyseebene ist auch aus methodischer Sicht bedeutsam, denn die Identifikation der Effekte des Ganztags auf Organisationsebene hat den Vorteil, dass Selektionsprozesse auf Individualeben qua Design umgangen werden. In der Regel werden innerhalb von Schulen insbesondere leistungsschwache Schülerinnen und Schüler gezielt gefördert, es liegen aber selten differenzierte Informationen dazu vor, wie einzelne Schülerinnen und Schüler individuell gefördert werden. Wenn man diesen Selektionsprozess nicht berücksichtigen kann, wird der Effekt von Ganztag unterschätzt. Analysen auf Aggregatebene umgehen solche Selektionsmechanismen innerhalb der Schulen. Allerdings können auf Schulebene andere Selektionsprobleme auftreten und die Analysen verzerren, wenn etwa insbesondere in sozialen Brennpunkten (als gezielte Interventionsmaßnahme) Halbtagsschulen in Ganztagsschulen umgewandelt werden (vgl. Kuhlmann und Timmann 2009). Stuart (2007) diskutiert in diesem Kontext die Möglichkeit mithilfe des Propensity Score Matschings (PSM) vergleichbarer Schulen auszuwählen, die sich in Bezug auf andere Kovariaten nicht voneinander unterscheiden. Aufgrund früherer Forschungsbefunde und theoretischer Erwägungen berücksichtigen wir als Kovariaten die Schülerkomposition in den Schulen, das Bundesland und in der Sekundarstufe zudem die Schulform (vgl. Abschn. 3.5. Analyseplan).

3 Anlage und methodisches Vorgehen

3.1 Daten

Für unsere Analysen nutzen wir repräsentative Daten aus der deutschen Beteiligung an drei großflächig angelegten Schulleistungsstudien, die 2006 und 2007 in Deutschland durchgeführt wurden: In TIMSS 2007 und IGLU 2006 wurden Kinder der vierten Jahrgangsstufe getestet und in PISA-E 2006Footnote 1 die 15-jährigen Jugendlichen (Bos et al. 2007, 2008; Prenzel et al. 2008). Neben den Leistungstests wurden den Schülerinnen und Schülern, sowie deren Eltern zusätzliche Hintergrundfragebögen vorgelegt. Die Stichprobe von TIMSS 2007 umfasst 5200 Schülerinnen und Schüler aus 247 Schulen, an IGLU 2006 nahmen 7899 Schülerinnen und Schülern aus 405 Schulen teil und die PISA 2006-E Stichprobe basiert auf 33.809 15-jährigen aus insgesamt 1460 Schulen.

3.2 Variablen auf Individualebene

Schülerleistung.

Die Schülerinnen und Schüler wurden in IGLU im Lesen, in TIMSS in Mathematik und Naturwissenschaften und in PISA in allen drei Domänen getestet. Für die Schülerleistung wurden jeweils fünf Plausible Values geschätzt.

Sozioökonomischer Status und Migrationshintergrund.

Der sozioökonomische Status der Schülerinnen und Schüler wurde mithilfe des HISEI (Highest International Socio-Economic Index of Occupational Status) im Elternhaus erfasst (Ganzeboom et al. 1992), in dem Berufe in Bezug auf das notwendige Ausbildungsniveau und das typische Einkommen klassifiziert werden. Von den Rohwerten wurde 40 abgezogen, sodass ein transformierter Wert von 0 einem HISEI von 40 (= z. B. Verkäufer) entspricht; die Transformation macht die Analysen inhaltlich besser interpretierbar. Als Indikator für den Migrationshintergrund verwenden wir das Geburtsland der Eltern. Die Referenzkategorie sind Kinder, von denen beide Eltern in Deutschland geboren wurden. Wir unterscheiden zudem zwischen Kindern, von denen ein Elternteil, oder beide Elternteile im Ausland geboren wurden.

3.3 Variablen auf Schulebene

Organisationsform.

In der vorliegenden Studie verwenden wir die KMK-Definition von Ganztagsschulen und definieren eine Schule als Ganztagsschule, wenn die Schülerinnen und Schüler verpflichtend an mindestens drei Tagen pro Woche am Ganztagsbetrieb teilnehmen. Diese Information wurde in allen drei Studien bei den Schulleitungen erfragt. An TIMSS nehmen 52 Ganztagsschulen teil (insgesamt 247 Schulen), bei IGLU 2006 sind es 80 Ganztagsschulen (insgesamt 405 Schulen) und bei PISA 2006-E 294 Ganztagsschulen (insgesamt 1460 Schulen). Gleichzeitig sei darauf verwiesen, dass sich hinter dieser Minimaldefinition eine gewisse Heterogenität verbirgt, denn es gibt beispielsweise viele offene, aber nur wenige vollgebunden Ganztagsgrundschulen (vgl. Tab. 1). In den von uns berücksichtigten Stichproben nehmen auch nicht alle Schülerinnen und Schüler an speziellen Förderangeboten teil. In der Grundschule nehmen jeweils etwa 30 % der Schülerinnen und Schüler an Hausaufgabenhilfen teil; die Teilnahmequote an Fördergruppen ist ähnlich hoch. Letztlich sei noch darauf verwiesen, dass ein gewisser Anteil der Schulen erst vor wenigen Jahren den Ganztagsbetrieb aufgenommen hat. Wir zählen diese Schulen trotzdem zu den Ganztagsschulen, da die Schülerinnen und Schüler zumindest in der vierten Klasse eine Ganztagsschule besucht haben.Footnote 2

Tab. 1 Ausgewählte Merkmale des Ganztagsbetriebs

Schulkomposition.

Um die Schülerkomposition an den einzelnen Schulen möglichst umfassend zu beschreiben, greifen wir auf eine ganze Reihe von Merkmalen zurück, die sich im Rahmen der Ungleichheits- und Schuleffektivitätsforschung als erklärungsstarke Prädiktoren für Leistungsunterschiede gezeigt haben. Hierzu gehören soziale, kulturelle und ökonomische Kapitalien der Kinder; das Geschlecht, Migrationshintergrund und Sprache, sowie der Besuch frühkindlicher Bildungseinrichtungen (vgl. Bourdieu 1983; Wagemaker 1996; Shonkoff und Phillips 2000; Stanat und Kunter 2001; Baumert et al. 2006; Esser 2006; Konsortium Bildungsberichterstattung 2006; Cunha und Heckman 2007). Diese Indikatoren wurden bei den Kindern oder deren Eltern erfragt.

Schulform und Bundesland.

Während der Stichprobenziehung wurde in allen Studien das Bundesland vermerkt. Zusätzlich wurde in der Sekundarstufenstudie PISA zusätzlich der Schultyp vermerkt (Hauptschule, Realschule, Gymnasium, Integrierte Gesamtschule, Schulen mit mehreren Bildungsgängen, Berufliche Schule).

Vorleistung.

Des Weiteren liegen in IGLU und PISA Informationen über das Leistungsniveau der Schülerschaft vor der Einschulung bzw. vor dem Wechsel in die Sekundarstufe I vor. In IGLU wurden den Eltern fünf Fragen vorgelegt, in denen danach gefragt wurde, ob die Kinder bereits vor der Einschulung einzelne Buchstaben, Wörter oder sogar Sätze lesen und schreiben konnten. In PISA wurde erfasst, ob die Kinder nach der Grundschule eine Übergangsempfehlung für das Gymnasium erhalten haben. In TIMSS liegen keine vergleichbaren Informationen vor. Wenngleich die Elterneinschätzung und die Übergangsempfehlung messfehlerbehaftet sind, so bieten sie zumindest einen Proxy für die Vorleistung. Beispielweise finden Maaz und Nagy (2009) Korrelationen in Höhe von r > 0,50 zwischen Gymnasialempfehlung und Schülerleistung (in Mathematik und Naturwissenschaften) am Ende der Grundschule. Für die retrospektiv eingeschätzte vorschulische kindliche Fähigkeit liegen keine Informationen zu Zusammenhängen mit standardisierten Tests vor. Allerdings berichten Gustafsson et al. (2013), dass vorschulische kindliche Fähigkeiten nach Kontrolle von elterlicher Bildung und Büchern im Elternhaus in Deutschland einen geringen, aber signifikanten Effekt auf die Leseleistungen am Ende der Grundschule haben (standardisierter Pfadkoeffizient: .16).

Um die Schulkomposition zu beschreiben, wurden die Angaben der Kinder und Eltern pro Schule aggregiert. Bei kategorialen Variablen wurden zunächst Dummyvariablen gebildet und in einem zweiten Schritt der Mittelwert für die Schulen berechnet (= Anteile); für kontinuierliche Variablen wurde direkt der Mittelwert pro Schule berechnet. Tab. 2 bietet eine Übersicht, welche Variablen in den drei Studien verfügbar sind.Footnote 3

Tab. 2 Übersicht über die verwendeten Variablen

3.4 Fehlende Daten

Einige Schulleiterinnen und -leiter haben keine Angaben zur Organisationsform der Schule gemacht bzw. den Schulfragebogen überhaupt nicht ausgefüllt. Diese Schulen wurden aus den Analysen ausgeschlossen. Fehlende Angaben einzelner Schülerinnen und Schüler oder ihrer Eltern wurden mit dem R-Paket MICE imputiert (Van Buuren und Groothuis-Oudshoorn 2009). Neben den oben beschriebenen Variablen zur Schulkomposition wurden auch die Leistungsscores der Schülerinnen und Schüler in das Imputationsmodell aufgenommen. Anhand der vollständigen Datensätze wurden die Daten der Individualebene wie zuvor beschrieben aggregiert, um die Schulkomposition zu beschreiben.

3.5 Analysestrategie

Um den Effekt der Organisationsform auf Schülerleistung zu schätzen, müssen Kompetenzen an Halb- und Ganztagsschulen beobachtet werden. Dies kann am besten im Rahmen von Mehrebenenmodellen beschrieben werden. In Modell (1) hängt die Leistung y von Schüler i aus Schule s von seinem Migrationsstatus und sozioökonomischen Hintergrund ab. Mit dem Parameter β0s schätzen wir die Leistung einer Schülerin oder eines Schülers mit einem HISEI von 40 (s. 3.2.2. zur Transformation) und ohne Migrationshintergrund, mit β1s schätzen wir, um wie viel Punkte die Leistung steigt, wenn der HISEI um einen Punkt steigt, β2s bzw. β3s beschreiben den Leistungsunterschied zwischen Kindern ohne Migrationshintergrund und Kindern von denen ein Elternteil bzw. beide Eltern im Ausland geboren wurden.

$$ {{y}_{is}}={{\beta }_{0s}}+{{\beta }_{1s}}HISE{{I}_{is}}+{{\beta }_{2s}}Mig{{1}_{is}}+{{\beta }_{3s}}Mig{{2}_{is}}+{{e}_{is}} $$
(1)

Um den Effekt der Organisationsform zu untersuchen, modellieren wir β0s, β1s, β2s und β3s als abhängige Variablen auf Schulebene und regressieren sie auf die Organisationsform. Die Variable GT beschreibt die Organisationsform und ist 0, wenn die Schule eine Halbtagsschule ist und 1, wenn es sich um eine Ganztagsschule handelt:

$$ {{\beta }_{0s}}={{\gamma }_{00}}+{{\gamma }_{01}}G{{T}_{s}}+{{u}_{0}} $$
(2)
$$ {{\beta }_{1s}}={{\gamma }_{10}}+{{\gamma }_{11}}G{{T}_{s}}+{{u}_{1}} $$
(3)
$$ {{\beta }_{2s}}={{\gamma }_{20}}+{{\gamma }_{21}}G{{T}_{s}}+{{u}_{2}} $$
(4)
$$ {{\beta }_{3s}}={{\gamma }_{30}}+{{\gamma }_{31}}G{{T}_{s}}+{{u}_{3}} $$
(5)

Die vier β-Koeffizienten in Formel (1) können durch die Terme ersetzt, die in den Formeln (2)–(5) auf der linken Seite stehen:

$$ {{y}_{is}}={{\gamma }_{00}}+{{\gamma }_{01}}G{{T}_{s}}+{{\gamma }_{10}}HISE{{I}_{is}}+{{\gamma }_{11}}HISE{{I}_{is}}*G{{T}_{s}}+{{\gamma }_{20}}Mig{{1}_{is}}+{{\gamma }_{21}}Mig{{1}_{is}}*G{{T}_{s}}+{{\gamma }_{30}}Mig{{2}_{is}}+{{\gamma }_{31}}Mig{{2}_{is}}*G{{T}_{s}}+{{u}_{0}}+{{u}_{1}}HISE{{I}_{is}}+{{u}_{2}}Mig\_{{1}_{is}}+{{u}_{3}}Mig\_{{2}_{is}}+{{e}_{is}} $$
(6)

Zur Beantwortung unserer ersten Forschungsfrage schätzen wir mit γ01 den Unterschied im Leistungsniveau zwischen Halb- und Ganztagsschulen. Zur Beantwortung der Fragen, ob an Ganztagsschulen die Kopplung zwischen Schulleistung und sozialer Herkunft bzw. Migrationshintergrund geringer ist, als an Halbtagsschulen, betrachten wir mit γ11, γ21 und γ31 drei Interaktionseffekte zwischen Organisationsform und Schülerherkunft.

Die kritische Voraussetzung, damit mithilfe von Modell (6) tatsächlich Effekte der Organisationform identifiziert werden können, ist, dass sich Halb- und Ganztagsschulen nicht in Bezug auf anderen Prädiktoren der Schülerleistung unterscheiden dürfen. Mit anderen Worten muss die Organisationsform mit den Fehlertermen u0, u1, u2 und u3 unkorreliert sein. Es liegt nahe zu fragen, ob diese Annahme haltbar ist, denn im Rahmen der Bildungsforschung sind Selektionseffekte wohlbekannt. Typischerweise finden sich vergleichsweise viele Kinder aus privilegierten Elternhäusern in Einrichtungen der frühkindliche Bildung, besuchen Reformschulen oder wechseln häufiger auf das Gymnasium (z. B. Watermann et al. 2005; Baumert et al. 2009; Schlotter und Wößmann 2010). Auch im Rahmen der Forschung zur Teilnahme am Ganztag deuten erste Forschungserkenntnisse darauf hin, dass der Schülerhintergrund mit der Teilnahme am Ganztag korrespondiert (vgl. Holtappels et al. 2010). Des Weiteren verläuft die Umwandlung in Ganztagsschulen unterschiedlichen schnell in den einzelnen Bundesländern (Kuhlmann und Tillmann 2009).

Um trotz der beschriebenen potenziellen Konfundierungen von Organisationsform, Region und Schülerkomposition mit Modell (6) die Effekte der Organisationsform zu identifizieren, matchen wir zunächst Halb- und Ganztagsschulen. Hierzu nutzen wir den Propensity Score Matching (PSM)-Ansatz (Rosenbaum und Rubin 1983; Becker 2011). Die Grundidee hierbei ist, zwei Gruppen zu bilden, die sich ausschließlich anhand des untersuchten Treatments (hier: Organisationsform) unterscheiden, nicht aber in Bezug auf andere Prädiktoren der Schülerleistung. Hierzu müssen alle potenziellen Prädiktoren benannt, erfasst und im Rahmen der Konditionierung mithilfe des PSM verwendet werden.

Das Matching verläuft in zwei Schritten. In einem ersten Schritt wird ein logistisches Regressionsmodell geschätzt, in dem wir das Treatment (Organisationsform) auf die Variablen zur Schulkomposition, die Region und den Schultyp regressieren. Die Regressionsparameter geben darüber Auskunft, inwiefern sich Halb- und Ganztagsschulen in Bezug auf die Schulkomposition, das Bundesland und die Schulform unterscheiden. Anhand der Parameterschätzungen kann für alle Schulen ein sogenannter Propensity Score berechnet werden, hierfür wird für jede Schule ein Summenscore aus den Variablen zur Schulkomposition, Bundesland und Schulformen gebildet, wobei die Variablen mit den Regressionsparametern gewichtet werden. Im zweiten Schritt bietet die Verteilung der Propensity Scores den Ausgangspunkt, wenn zwei Gruppen von Ganz- und Halbtagsschulen gematcht werden, die sich möglichst ähnlich sind. In der Literatur werden eine Reihe von Algorithmen diskutiert, wie vergleichbare Gruppen gebildet werden. Wir verwenden in der vorliegenden Studie den Optimal Matching Algorithmus (Hansen und Olson Klopfer 2006).Footnote 4

Zunächst führen wir das Propensity Score Matching durch, wobei in IGLU, TIMSS und PISA auf die in den jeweiligen Studien verfügbaren Informationen zurückgegriffen wurde (vgl. Tab. 2). Danach schätzen wir separat für Primar- und Sekundarstufe sowie im Lesen, in Mathematik und in Naturwissenschaften fünf Mehrebenenmodelle mit jeweils einem anderen Plausible Value. Danach werden die Schätzungen nach den Regeln von Rubin (1987) für die unterschiedlichen Domänen und Studien zusammengefasst. Das Matching erfolgt mit dem R-Paket MatchIt (Ho et al. 2011) und die Mehrebenenmodelle werden mit Mplus geschätzt (Muthén und Muthén 19982010).

4 Ergebnisse

4.1 Ergebnisse der Konditionierung

Ein Vergleich von Halb- und Ganztagsschulen ist nur dann zulässig, wenn sich die Schulen beider Organisationsformen nicht in Bezug auf andere Prädiktoren der Schülerleistung unterscheiden. In den Abb. 1, 2 und 3 finden sich die Ergebnisse des Propensity Score Matchings für die drei von uns betrachteten Stichproben. Während in den Zeilen die verwendeten Variablen zur Schulkomposition angeführt werden, zeigen die Punkte und Kreuze Unterschiede zwischen den Halb- und Ganztagsschulen vor bzw. nach dem Matching an. Bei stetigen Variablen sind standardisierte Mittelwertunterschiede (standardisiert an der Standardabweichung der Treatmentgruppe = Ganztagsschulen) und bei diskreten Variablen Anteile angegeben. Je geringer die Unterschiede zwischen den beiden Gruppen sind, desto näher sind die Punkte bzw. Kreuze an der Vertikalen über der Null. Die gestrichelten Linien links und rechts sind die die Grenzen, ab wo der Unterschied größer als 10 % oder 0,1 Standardabweichungen (SD) ist. Im Folgenden bezeichnen wir Unterschiede außerhalb dieses Korridors als substanziell und betrachten geringere Unterschiede als vernachlässigbar. In der Forschungsliteratur variieren Empfehlungen für vernachlässigbare Unterschiede zwischen konservativen Empfehlungen von 3–5 % und liberale von bis zu 0,25 einer Standardabweichung (vgl. Becker 2011). Da wir in den vorliegenden Analysen auf Schulebene matchen, ist die Stichprobengröße naturgemäß kleiner als beim Matching auf Individualebene und es ist schwieriger in kleineren Stichproben zwei ausbalancierte Gruppen zu finden. Vor diesem Hintergrund interpretieren wird die von uns vorgeschlagenen Grenzen (10 %/ 0,1 SD) als relativ konservativ, obwohl wir über den in der Literatur genannten Untergrenzen bleiben.Footnote 5

Abb. 1
figure 1

Ergebnisse des Propensity Score Matchings – IGLU 2006

Abb. 2
figure 2

Ergebnisse des Propensity Score Matchings – TIMSS 2007

Abb. 3
figure 3

Ergebnisse des Propensity Score Matchings – PISA-E 2006

Ein Vergleich beider Organisationsformen vor dem Matching (in den Abb. Kreise) deckt auf, dass die Schülerkomposition an Halb- und Ganztagsschulen insgesamt relativ ausgeglichen ist. Dieser Befund ist für die weitere Interpretation unserer Analysen von Bedeutung, denn wenn mithilfe von Beobachtungsdaten Programmeffekte geschätzt werden, so wird zwischen dem Average Treatment Effects (ATE) und dem Average Treatment Effect on the Treated (ATT) unterschieden. Diese Unterscheidung folgt der Überlegung, dass Programme oder Maßnahmen differenzielle Effekte für bestimmte Schülergruppen haben können. In Experimenten werden ATEs für die betrachtete Population geschätzt, wenn aber eine selbstselektierte Teilnehmergruppe an einer Maßnahme teilnimmt und qua Matching eine Vergleichsgruppe gebildet wird, so wird der ATT geschätzt. Da zwischen Halb- und Ganztagsschulen keine größeren Unterschiede beobachtet werden, fallen ATE und ATT – zumindest annähernd – zusammen und wir halten es für gerechtfertigt, die Ergebnisse unserer Analysen auf die gesamte Population deutscher Schulen zu verallgemeinern.

Halb- und Ganztagsschulen unterscheiden sich in einer Reihe von Schulmerkmalen voneinander. In IGLU lassen sich in Bezug auf den HISEI und der Haushaltseinkommen substanzielle Unterschiede (10 % < bzw. 0,1 SD <) beobachten und in TIMSS beim Haushaltseinkommen, der Familiensprache, den zuhause verfügbaren Büchern, sowie bei den Besuchen kultureller Veranstaltungen. In der PISA-Stichprobe werden bei den Variablen zur Schulkomposition keine Unterschiede von größer als 10 % bzw. 0,1 SD beobachtet, allerdings ist der Anteil von Ganztagsschulen bei den Gesamtschulen deutlich erhöht und bei den Realschulen deutlich niedriger. In Bezug auf die Bundesländer sind in PIRLS und PISA alle Länder relativ ausgeglichen, aber in der TIMSS-Stichprobe werden größere Unterschiede beobachtet.

Nach dem Matching (in den Abb. Kreuze) sind auch in der TIMSS-Stichprobe in etwa gleich viele Bundesländer in den beiden Gruppen von Halb- und Ganztagsschulen. In PISA werden keine substanziellen Schulformunterschiede mehr beobachtet. Die Verteilung der Variablen zur Schulkomposition ist nach dem Matching insgesamt gut ausbalanciert, sodass bei Vergleichen zwischen Halb- und Ganztagsschulen Verzerrungen durch die Schulform, die Bundesländer sowie die beobachteten Variablen zur Schulkomposition weitgehend ausgeschlossen werden können. Bei einer genaueren Betrachtung gibt es in IGLU, TIMSS und PISA jeweils noch zwei Variablen, bei denen sich Halb- und Ganztagsschulen nach dem Matching noch um mehr als 0,1 SD unterscheiden. Aus diesem Grund schätzen wir zusätzlich zu dem in Abschn. 3.5. beschriebenen Modell auch noch einmal zusätzlich Modelle, bei denen wir die jeweiligen unbalancierten Schulmerkmale als Kontrollvariablen aufnehmen. Das heißt, wir regressieren die Koeffizienten β0s, β1s, β2s und β3s (vgl. 2–5) nicht nur auf die Organisationsform, sondern bspw. in IGLU zusätzlich auf die vorschulische Kompetenzen und den Besuch kultureller Veranstaltungen. Die gematchten Datensätze sind die Grundlage für die Mehrebenenanalysen.

4.2 Ergebnisse der Mehrebenenanalysen

Die Ergebnisse der Schätzungen der Random Slope-Mehrebenenmodelle sind in Tab. 3 zusammengefasst. In der Primar- und der Sekundarstufe wurden separat für die Kompetenzdomänen Lesen, Mathematik und Naturwissenschaften (NaWi) sechs Modelle geschätzt, dabei steht der Intercept für die mittlere Leistung eines Kindes ohne Migrationshintergrund, mit einem HISEI von 40, das eine Halbtagsschule besucht. Die Regressionsgewichte für die beiden Migrationsvariablen (Mig1 = ein Elternteil im Ausland geboren/Mig2 = beide Eltern im Ausland geboren) und den HISEI sind Indikatoren für die Bildungsungleichheit.

Tab. 3 Ergebnisse der Mehrebenenanalysen

Um zu untersuchen, ob die Organisationsform einen Effekt auf die Schülerleistung hat, betrachten wir für das Leistungsniveau den Parameter GT und für die Bildungsungleichheit die Interaktion zwischen der Organisationsform und die Herkunftsvariablen (GT*Mig1, GT*Mig2, GT*HISEI).

Als erstes Ergebnis unserer Analysen betrachten wir die sechs Schätzungen des Parameters GT, welche zwischen −1,76 (Modell 2) und −9,25 (Modell 6) liegen. Somit beobachten wir in allen von uns betrachteten Stichproben an Ganztagsschulen ein geringeres Leistungsniveau als an Halbtagsschulen. Allerdings unterscheidet sich keine der Parameterschätzungen signifikant von null, damit bieten unsere Analysen keine empirische Evidenz dafür, dass die Organisationsform der Schule einen Effekt auf das Leistungsniveau hat.

In Bezug auf herkunftsbedingte Disparitäten in der Leistung von Schülerinnen und Schülern an Halb- und Ganztagsschulen betrachten wir in den sechs Modellschätzungen jeweils drei Interaktionseffekte zwischen Organisationsform und Schülerhintergrund. In den Modellen (1–5) unterscheidet sich keiner der Interaktionseffekte signifikant von null. Auch in Modell (6) unterscheiden sich zwei der drei Parameter nicht signifikant von null. Die einzige Ausnahme bildet der Parameter GT*Mig2. Wenn Schülerinnen und Schüler eine Halbtagsschule besuchen und beide Eltern im Ausland geboren sind, so schneiden sie um 63,22 Punkte schlechter ab als Kinder, deren Eltern beide in Deutschland geboren wurden. An Ganztagsschulen ist dieser Abstand um 13,00 Punkte geringer und dieser Unterschied ist statistisch signifikant. Würde man nur diesen einen Parameter betrachten, so könnte man vermuten, dass Migranten an Ganztagsschulen besser gefördert werden, als an Halbtagsschulen. Vor dem Hintergrund, dass 17 von 18 Parametern nicht signifikant werden, schlagen wir vor, diesen Befund mit großer Zurückhaltung zu interpretieren. In der Zusammenschau bieten die Analysen unseres Erachtens höchstens schwache Evidenz dafür, dass die Organisationsform in einem Teilwirkungsbereich Einfluss auf die Bildungsungleichheit hat.

4.3 Ergänzende Analysen

Die Tatsache, dass nach dem Propensity Score Matching in allen drei Datensätzen jeweils zwei Variablen in den Halb- und Ganztagsschulen noch nicht ausbalanciert waren, legt weitere Analysen nahe, um möglichst faire Vergleiche zwischen Halb- und Ganztagsschulen zu ermöglichen. In einer Reihe weiterer Mehrebenenanalysen haben wir daher die jeweiligen beiden unbalancierten Variablen als Kontrollvariablen in die Modelle aufgenommen, bei denen die standardisierten Mittelwertunterschiede nach dem Matching den Schwellenwert von 0.10 SD bzw. 10 % erreichen.

Man kann auch noch strengere Kriterien an die Vergleichbarkeit von Halb- und Ganztagsschulen anlegen, hierbei ist allerdings zu beachten, dass durch die zusätzliche Aufnahme jeder weiteren Kontrollvariable vier zusätzliche Modellparameter geschätzt werden müssen (einen für den Intercept und drei für die Slopes). Aufgrund der auf Schulebene vergleichsweise geringen Stichprobengröße, kann dies dazu führen, dass etwaige Effekte nicht mehr inferenzstatistisch abgesichert werden können. Folglich muss zwischen möglichst strengen Kriterien und sparsamen Modellen abgewogen werden. Vor diesem Hintergrund wurden in weiteren Analysen nicht alle, sondern nur die Variablen als Kontrollvariablen aufgenommen, bei denen die standardisierten Mittelwertunterschiede, nach dem Matching, den von Caliendo und Kopeinig (2008) vorgeschlagenen (strengen) Schwellenwert von 0.03 SD bzw. 3 % überschreiten. Dies trifft bei IGLU auf sechs, bei TIMSS auf sieben und bei PISA auf acht Kovariaten zu.

Die Ergebnisse dieser Analysen sind in Tab. 4 und 5 dargestellt.Footnote 6 Wiederum bestätigt sich der Befund der vorangegangenen Analysen: Im Leistungsniveau an Halb- und Ganztagsschulen können keine signifikanten Unterschiede beobachtet werden. Und auch in Bezug auf Bildungsungleichheit bietet sich ein unverändertes Bild. Es können wiederum (mit einer einzigen Ausnahme in Tab. 4 und zwei in Tab. 5) keine signifikanten Unterschiede in der Kopplung zwischen Herkunft und Leistung beobachtet werden.

Tab. 4 Ergebnisse der Mehrebenenanalysen mit Kontrollvariablen (standardisierte Mittelwertunterschiede > 0,10 SD bzw. > 10 %)
Tab. 5 Ergebnisse der Mehrebenenanalysen mit Kontrollvariablen (standardisierte Mittelwertunterschiede > 0.03 SD bzw. > 3 %)

5 Zusammenfassung und Diskussion

In unserer Studie betrachteten wir die Primar- und die Sekundarstufe, sowie Kompetenzen in den Domänen Lesen, Mathematik und Naturwissenschaften. Neben dem Leistungsniveau analysierten wir Bildungsungleichheit an Halb- und Ganztagsschulen. Unsere Analysen beruhen auf repräsentativen Stichproben aus drei großflächig angelegten Schulleistungsstudien. Zusammenfassend bieten die Ergebnisse so gut wie keine empirische Evidenz dafür, dass die Organisationsform von Schule einen Effekt auf die Schülerleistung hat. Trotz des erweiterten Zeitbudgets ist das Leistungsniveau an Ganztagsschulen nicht höher und die Bildungsungleichheit nicht geringer als an Halbtagsschulen.

Diese Ergebnisse müssen vor dem Hintergrund betrachtet werden, dass mit dem Ausbau von Ganztagsschulen vielfältige Ziele verfolgt werden. Neben ebenso wichtigen Aspekten, wie der Förderung der Vereinbarkeit von Familie und Beruf oder der sozialen Entwicklung, sind Schülerkompetenzen nur ein Kriterium, wenn nach den Effekten von ganztägiger Bildung und Betreuung gefragt wird. Des Weiteren sind Rückschlüsse auf die Effekte bestimmter Maßnahmen und Programme mit Beobachtungsstudien eine methodologische Herausforderung. Die kritische Annahme der vorliegenden Analysen ist, dass es mithilfe des Propensity Score Matchings gelungen ist, zwei Gruppen von Halb- und Ganztagsschulen zu bilden, die sich nicht in Bezug auf andere Prädiktoren von Schülerleistung unterscheiden (conditional independence assumption). Wie plausibel ist diese Annahme? In den von uns verwendeten Schulleistungsstudien können wir auf ein ausführliches Repertoire an Informationen zu unterschiedlichen Merkmalen zur Schulkomposition zurückgreifen. Interessanterweise werden bereits vor dem Matching kaum systematische Unterschiede zwischen Halb- und Ganztagsschulen beobachtet. Das Matching verringert die beobachteten Differenzen weiter. Des Weiteren liegen in IGLU und PISA Informationen zur Vorleistung vor. Wenngleich die Elterneinschätzung (IGLU) und die Übergangsempfehlung (PISA) sicherlich messfehlerbehaftet sind, bieten diese Informationen durchaus die Möglichkeit ein rudimentäres Value Added Modell zu schätzen und somit auch den Einfluss unbeobachteter konfundierter Variablen zu kontrollieren.

Trotz dieser Einschränkungen drängt sich die Frage auf, inwiefern der Ausbau von Ganztagsschulen als Reformmaßnahme wirkt. Dabei stellt sich weniger die Frage, ob ganztägige Bildung und Betreuung wirken könnte, sondern ob sie in der gegenwärtigen Ausgestaltung wirkt. In der vorliegenden Untersuchung haben wir keine Modellprogramme (bzw. Modellschulen) untersucht, sondern gegenwärtige Veränderungen und Entwicklungen in ganz Deutschland betrachtet. Hierbei gilt es zu beachten, dass als die von uns verwendeten Daten erhoben wurde, ein Großteil der Ganztagsschulen erst kürzlich von einer Halb- in eine Ganztagsschulen umgewandelt wurden (vgl. Höhmann et al. 2007). Dabei muss kritisch angemerkt werden, dass Fördermittel vor allem in Räumlichkeiten (z. B. Mensen) investiert wurden. Wenngleich eine entsprechende Infrastruktur wohl als notwendige Bedingung für den Ganztagsbetrieb gelten kann, so gibt es gleichzeitig weitere Gelingens-Bedingungen. Beispielweise scheint es zumindest plausibel, dass das zusätzliche pädagogische Personal eine fundierte akademische Ausbildung benötigt, damit Schülerinnen und Schüler tatsächlich besser lernen. Forschungsbefunde deuten darauf hin, dass dies oftmals nicht der Fall ist (Höhmann et al. 2007). Insofern halten wir es für naiv zu schlussfolgern, dass Ganztagsschulen nicht wirken können. Vielmehr interpretieren wir unsere Ergebnisse dahingehend, dass die gegenwärtige organisatorische, pädagogische oder personelle Ausgestaltung ganztägiger Bildung und Betreuung in der aktuellen Form nicht zu den erhofften Effekten hinsichtlich einer Verbesserung von fachlichen Schülerkompetenzen führt.

Schlussendlich weisen wir auf einen nach wie vor existenten Forschungsbedarf hin. Wenn in der Begleitforschung zum milliardenschweren „Investitionsprogramm Zukunft Bildung und Betreuung“ darauf verzichtet wird, Tests in den zentralen Kompetenzdomänen durchzuführen und das bisherige Studiendesign keine Vergleichsgruppe von Halbtagsschulen vorsieht, so sind die Motive hierfür kaum wissenschaftlicher Natur. Mit Sorge beobachten wir auch, dass mittlerweile darauf verzichtet wird, die Stichproben internationaler Schulleistungsstudien zu erweitern. Die sogenannten Ländervergleiche im Rahmen der Überprüfung der Erreichung der Bildungsstandards bieten hierfür kaum einen Ersatz, da im Rahmen dieser Untersuchungen nur einige wenige individuelle Schülerinformationen erhoben werden, nicht aber Schulmerkmale, wie etwa die Organisationsform. Zur Verdeutlichung: unsere Kritik soll nicht als Kritik am Ausbau von Ganztagsschulen verstanden werden. Vor dem Hintergrund unserer Befunde muss jedoch über die Qualität und die Art und Weise des Ausbaus nachgedacht werden. Hierbei allein den Schulen die Verantwortung zu geben, mag bildungspolitisch vorstellbar sein, aus wissenschaftlicher Perspektive scheint es allerdings geboten, unter Berücksichtigung der Mehrebenenstruktur des Schulsystems über Ausbauwege, sowie Qualitätssicherungs- und -entwicklungsmaßnahmen nachzudenken.