1 Einleitung

Pädagogisches und auf die Kernanforderung des Unterrichtens bezogenes Wissen gilt heute übereinstimmend als zentraler Bereich des professionellen Wissens von Lehrerinnen und Lehrern (Shulman 1987; Bromme 1992; Terhart 1993) sowie als eine zentrale kognitive Komponente ihrer professionellen Kompetenz (Baumert und Kunter 2006; Kunter et al. 2011). Neben rein fachlichen Anforderungen im Lehrerberuf (z. B. Strukturierung der Inhalte eines Faches) stehen Lehrkräfte vor zentralen Anforderungen, die, auch wenn sie teilweise fachspezifisch ausgestaltet werden müssen, für sämtliche Fächer relativ gleichförmig sind (z. B. Klassenführung). Für die erfolgreiche Bewältigung solcher Anforderungen wird ein pädagogisches Wissen vorausgesetzt (z. B. Shulman 1987; Bromme 1992; Voss et al. 2014). Im Rahmen der Lehrerbildung sollen angehende Lehrkräfte pädagogisches Wissen erwerben und somit auf den Lehrerberuf vorbereitet werden (z. B. Terhart 2012).

Während pädagogisches Wissen von angehenden wie berufstätigen Lehrkräften als Gegenstand empirischer Untersuchungen lange Zeit wenig Beachtung fand (Blömeke 2004; Baumert und Kunter 2006), ist in der jüngsten Zeit eine deutliche Zunahme an Forschungsansätzen zur standardisierten Erfassung bzw. Kompetenzmessung zu beobachten. So wurde – u. a. – international-vergleichend das pädagogische Wissen von angehenden Lehrkräften im Rahmen der IEA-Studie Teacher Education and Development Study – Learning to Teach Mathematics (TEDS-M) untersucht. Dafür wurden im Jahr 2008 in 17 Ländern weltweit das fachliche und das fachdidaktische Wissen sowie – ergänzend in den drei Teilnehmerländern Deutschland, USA und Taiwan – das pädagogische Wissen angehender Mathematiklehrkräfte für die Primarstufe und die Sekundarstufe I am Ende ihrer Ausbildung getestet (Blömeke et al. 2010a, b). TEDS-M stellt bislang die größte international angelegte und mit repräsentativen Länderstichproben arbeitende Studie zur Lehrerausbildung dar. Sie liefert, ähnlich wie die großen Schulleistungsstudien (z. B. PISA), präzise Informationen zu Ergebnissen der Lehrerausbildung eines Landes, versehen mit Referenzwerten aus dem internationalen Vergleich. Allerdings stellt sie, wie die großen Schulleistungsstudien meist auch, nur eine Momentaufnahme dar, da mit Querschnittstichproben angehender Lehrkräfte am Ende ihrer Ausbildung gearbeitet wird. So können Aussagen über die Wirksamkeit der unterschiedlichen institutionellen Lehr-Lernprozesse kaum getroffen werden, ein Defizit der empirischen Lehrerbildungsforschung, das schon lange moniert wird (z. B. Schaefers 2002; Terhart 2012).

An dieser Problemstellung setzt die Studie Entwicklung von berufsspezifischer Motivation und pädagogischem Wissen in der Lehrerausbildung (EMW) an, eine in den drei deutschsprachigen Ländern Deutschland, Österreich und der Schweiz laufende Längsschnittuntersuchung.Footnote 1 Mit ihr werden Studierende von bis zu 31 Universitäten bzw. Pädagogischen Hochschulen, die im Wintersemester 2011/2012 ein Lehramtsstudium aufnahmen, im Turnus von zwei Jahren zu ihrem pädagogischen Wissen mithilfe des in TEDS-M entwickelten Erhebungsinstruments getestet. In diesem Beitrag werden auf der Basis eines Teildatensatzes der EMW-Studie drei Fragestellungen untersucht. Erstens wird gefragt, ob es in den beiden Teilnehmerländern Deutschland und Österreich zu einem Zuwachs an pädagogischem Wissen über die im Rahmen der EMW-Studie bisher durchgeführten zwei Messzeitpunkte (d. h. innerhalb der ersten beiden Ausbildungsjahre) kommt. Zweitens wird nach differenziellen Entwicklungen im pädagogischen Wissen in Abhängigkeit der beiden Länder gefragt. Dafür wird, TEDS-M und den Studien im Kontext von TEDS-M folgend, der Test zur Erfassung von pädagogischem Wissen in drei Dimensionen bzw. Subskalen kognitiver Anforderungen unterteilt, die bei der Bearbeitung der Testaufgaben an die angehenden Lehrkräfte gestellt werden (vgl. Abschn. 2.2). Angesichts der Variation in der organisatorisch-curricularen Gestaltung des Theorie-Praxis-Bezugs (z. B. Gewichtung, Verzahnung) der beiden Ausbildungssysteme in Deutschland und Österreich sowie der daraus resultierenden Unterschiede in den dargebotenen Lerngelegenheiten (vgl. Abschn. 3) werden Länderunterschiede im Zuwachs konzeptuell-analytischen Wissens sowie im Zuwachs von eher handlungsnahem pädagogischem Wissen erwartet. Da jedoch die Unterscheidung der beiden Ausbildungskontexte nur einen distalen Prädiktor für die Variation in der organisatorisch-curricularen Gestaltung des Theorie-Praxis-Bezugs darstellt, wird drittens mithilfe von Mehrebenenanalysen nach dem Einfluss von lernprozessbezogenen Tätigkeiten in schulpraktischen Lerngelegenheiten als proximale Prädiktoren gefragt. Dies geschieht mit dem Ziel, die Abhängigkeit des pädagogischen Wissens von bereichsspezifischen Lerngelegenheiten zu belegen und somit ein Argument für die Validität des getesteten pädagogischen Wissens zu liefern. Darüber hinaus erscheinen solche Analysen mit Daten aus zwei Ländern wichtig, da die jeweilige Lehrerausbildung in Deutschland und Österreich mit sehr ähnlichen Problemlagen und Fragestellungen konfrontiert ist (vgl. Stadelmann und Rhyn 2011) und ein Vergleich der beiden Ausbildungskontexte neue Erkenntnisse für aktuelle Reformdiskurse erbringen kann.

2 Forschung zum Erwerb von pädagogischem Wissen

2.1 Konzeptualisierung von pädagogischem Wissen

Mit den einflussreichen theoretischen Arbeiten von Shulman (1987, S. 8) zur heuristischen Unterteilung von berufsspezifischem Lehrerwissen, d. h. dem „professionellen Wissen“ von Lehrkräften (Bromme 1992), kann pädagogisches Wissen (general pedagogical knowledge) zunächst verstanden werden als „knowledge, with special reference to those broad principles and strategies of classroom management and organization that appear to transcend subject matter“, wobei entscheidend sein dürfte, dass bei Shulman (1987) wie auch heute (vgl. Baumert und Kunter 2006; Baumert et al. 2010; Tatto et al. 2012) dieses Wissen von verschiedenen anderen Komponenten des professionellen Wissens abgegrenzt wird, insbesondere vom Fachwissen (content knowledge) und vom fachdidaktischen Wissen (pedagogical content knowledge). Während sich fachliches und fachdidaktisches Wissen eindeutig auf das zu unterrichtende Fach beziehen, ist pädagogisches Wissen losgelöst vom jeweiligen Fach. Fachdidaktisches Wissen kann als Ergebnis einer Transformation von fachlichem und pädagogischem Wissen zu einer neuen Kategorie des Lehrerwissens verstanden werden, wenn man Shulmans (1987, S. 8) Vorstellung von fachdidaktischem Wissen als „that special amalgam of content and pedagogy“ folgt. Demnach sind von diesen drei Wissensbereichen das fachliche und das pädagogische Wissen besonders weit voneinander entfernt.

Aktuelle kompetenztheoretische Ansätze schließen hier an, wenn diese Trias als drei wesentliche kognitive Komponenten professioneller Kompetenz von Lehrkräften konzeptualisiert wird (Baumert und Kunter 2006). Mit der Kompetenzorientierung (Weinert 2001) geraten Anforderungen in den Blick, die an Lehrkräfte in ihrem Beruf gestellt werden. In diesem Sinne wird auch in der vorliegenden Studie „professionelle Kompetenz“ von Lehrkräften als die erfolgreiche Bewältigung zentraler Anforderungen definiert, die typisch für den Lehrerberuf sind. Im Speziellen fokussieren wir dabei auf das pädagogische Wissen, und zwar als kognitive Leistungsdisposition, die die erfolgreiche Bewältigung spezifischer Anforderungen (z. B. Klassenführung) wahrscheinlich macht (zuletzt Blömeke et al. 2015).

Ansätze zur definitorischen Klärung von pädagogischem Wissen und seiner Binnenstruktur weisen auf unterschiedliche Differenzierungen hin. Inhaltlich betrachtet werden etwa in einer von Baumert und Kunter (2006, S. 485) vorgelegten Übersicht vier Themen (Konzeptuelles bildungswissenschaftliches Grundlagenwissen, Allgemeindidaktisches Konzeptions- und Planungswissen, Unterrichtsführung und Orchestrierung von Lerngelegenheiten, Fachübergreifende Prinzipien des Diagnostizierens, Prüfens und Bewertens) mit Unteraspekten gelistet, welche verdeutlichen, dass pädagogisches Wissen auf Anforderungen des Unterrichtens (z. B. effektive Klassenführung) bezogen werden kann, aber auch über unterrichtliche Fragen hinausgeht (z. B. historische Grundlagen von Schule; vgl. auch bereits Terhart 1993). Hingewiesen wird ferner auf das Spannungsverhältnis von pädagogischem Wissen zwischen einer „disziplinbezogenen Betrachtung, die vom fächerübergreifenden bzw. erziehungs- und bildungswissenschaftlichen Curriculum der Lehrerbildung ausgeht, und einer anforderungsbezogenen Betrachtung, welche die typischen Herausforderungen des Lehrerberufs im Blick hat“ (König 2014, S. 620). Schließlich wird diskutiert, dass pädagogisches Wissen von Lehrkräften in unterschiedlichen Qualitäten und Formen auftreten und von Bedeutung sein könne (vgl. zuletzt Neuweg 2014). Zentral ist die Unterscheidung in deklaratives Wissen („Wissen, dass…“) und prozedurales Wissen („Wissen, wie…“), wobei letzteres jene Form darstellt, die besonders handlungsrelevant ist, während das ausschließliche Vorliegen deklarativen Wissens Schwierigkeiten bei der Umsetzung von Wissen in die Praxis mit sich führen kann (Gruber und Renkl 2000; Anderson et al. 2001). Prozedurales Wissen ist dadurch gekennzeichnet, dass es situations- und ablauforientiert organisiert ist („Handlungsschemata“). Das heißt in Bezug auf Lehrpersonen, dass sie Unterricht schrittweise anhand typischer Abfolgen wahrnehmen, planen und durchführen (Aebli 1983; Putnam 1987). Ein weiteres Begriffspaar ist das „praktische Wissen“, also jenes Wissen, das „the proximal guide for a good deal of a teacher’s classroom behavior“ darstellt (Berliner 2004, S. 206), und das theoretisch-formale Wissen, welches vor allem im Rahmen einer universitären Lehramtsausbildung schwerpunktartig erworben werden dürfte (Fenstermacher 1994; Baumert und Kunter 2006). Im nachfolgenden Abschn. 2.2 werden diese Begriffe beispielhaft auf die Messung von pädagogischem Wissen in der vorliegenden Studie bezogen.

In den vergangenen Jahren ist, gerade im deutschsprachigen Raum, ein deutlicher Zuwachs an Forschung zur standardisierten Erfassung von pädagogischem Wissen zu verzeichnen (u. a. Baer et al. 2007; Blömeke et al. 2008; Schulte et al. 2008; König und Blömeke 2009a; Voss et al. 2011; Kunina-Habenicht et al. 2013). Der vorliegende Beitrag bezieht sich auf die Arbeiten, die im Kontext von TEDS-M in den vergangenen Jahren entstanden sind und baut auf diese auf, u. a. da das im Rahmen von TEDS-M entwickelte Testinstrument zur Erfassung von pädagogischem Wissen auch in der hier in Rede stehenden EMW-Studie zum Einsatz gelangt.

2.2 Messung von pädagogischem Wissen in der vorliegenden Studie

Zur empirischen Untersuchung dieses Wissensbereichs liegt mit dem TEDS-M Instrument ein standardisierter Papier-Bleistift-Test vor, dessen Konzeption und Operationalisierung sich mittlerweile in verschiedenen empirischen Studien der nationalen und internationalen Lehrerbildungsforschung bewährt hat und selbst unter Kritikern deutliche Anerkennung findet (Lüders 2012).Footnote 2 Unterrichtliche Herausforderungen, wie sie mit der Forschung zur Unterrichtsqualität beschrieben werden können, stellen dabei den Ausgangspunkt für die inhaltliche Differenzierung des Testinstruments dar. Entsprechend kompetenztheoretischer Vorstellungen wird dann nach dem Wissen gefragt, welches nötig ist, um diese Anforderungen erfolgreich zu bewältigen. Der im Kontext von TEDS-M entwickelte Ansatz von König und Blömeke (2009a, S. 504) greift auf empirisch nachgewiesene Basisdimensionen von Unterrichtsqualität zurück und verknüpft diese mit Modellen der Allgemeinen Didaktik zu folgenden Inhaltsdimensionen pädagogischen Wissens: Umgang mit Heterogenität, Strukturierung von Unterricht, Klassenführung, Motivierung, Leistungsbeurteilung. Diese Dimensionen werden jeweils über mehrere komplexe Testaufgaben operationalisiert, die entsprechende unterrichtliche Herausforderungen zum Gegenstand haben (vgl. Abb. 1).

Quer zu diesen fünf berufsbezogenen Inhaltsbereichen weist das Testinstrument eine kognitionsbezogene Struktur auf (Abb. 2): Zur Unterscheidung verschiedener Qualitäten kognitiver Anforderungen, die bei der Bearbeitung der Testaufgaben an die angehenden Lehrkräfte gestellt werden, wurde die von Anderson und Krathwohl (2001) revidierte und erweiterte Bloomsche Taxonomie kognitiver Prozesse aufgegriffen und auf die Testaufgaben bezogen. Im Fokus stehen dabei drei Dimensionen kognitiver Prozesse:

  1. 1.

    Erinnern. Zur Bearbeitung von Testaufgaben, die diesem kognitiven Prozess zugeordnet werden (vgl. als Beispiel Abb. 3), wird Wissen benötigt, das in Erinnerung gerufen werden muss (z. B. Lehrbuchwissen und bzw. oder Erfahrungswissen). Zur Bearbeitung werden kognitive Prozesse benötigt wie das Nennen bzw. Erkennen. Testaufgaben dieses Typs fordern bei der Befragung angehende Lehrer auf, ein Beispiel für eine Definition zu geben, eine Aufzählung von Elementen eines Phänomens, Begriffs oder Konzepts vorzunehmen oder einen Begriff oder ein Konzept zu erkennen oder zu identifizieren.

  2. 2.

    Verstehen/Analysieren. Zur Bearbeitung dieser Testaufgaben (vgl. als Beispiel Abb. 4) wird Wissen benötigt, das in Erinnerung gerufen werden muss (z. B. Lehrbuchwissen und bzw. oder Erfahrungswissen), aber darüber hinaus auch mit einer Problemstellung in Verbindung gebracht werden muss. Zur Bearbeitung werden kognitive Prozesse benötigt wie das Erklären bzw. Vergleichen. Bei der Bearbeitung der Testaufgaben dieser Dimension wird den angehenden Lehrpersonen abverlangt, einen Sachverhalt, ein Konzept, einen Aspekt zu charakterisieren oder zu erklären, einen Begriff oder ein Konzept auszuwählen und damit eine Erklärung zu liefern oder einen Sachverhalt, eine Situation, eine Falldarstellung, einen oder mehrere Begriffe zu vergleichen, zu kategorisieren, zu ordnen oder zu interpretieren.

  3. 3.

    Kreieren/Generieren von Handlungsoptionen. Zur Bearbeitung der Aufgaben, die dieser Dimension zugeordnet werden (als Beispiele vgl. Abb. 5 und 6), wird wiederum Wissen benötigt, das in Erinnerung gerufen werden muss (z. B. Lehrbuchwissen und bzw. oder Erfahrungswissen) und darüber hinaus zumindest ansatzweise auch mit einer Problemstellung und einer typischen Situation in Verbindung gebracht werden muss. Im Gegensatz zur vorherigen Dimension des Verstehens und Analysierens wird den Befragten für die Bearbeitung jedoch abverlangt, Handlungsoptionen zu entwickeln und zu formulieren, die ihnen für die Bewältigung einer typischen Situation zur Verfügung stehen, d. h. praktisches Wissen und Können, das als propositionale mentale Repräsentation beschrieben werden kann, darzulegen.

Diese Unterscheidung zielt darauf ab, soweit es im Rahmen einer Papier-Bleistift-Testung überhaupt möglich ist, spezifischen Anforderungen bei der Kompetenzmessung gerecht zu werden: Lehrkräfte müssen einen Großteil ihrer Arbeitszeit ausgehend von unterrichtlichen Situationen zukunftsorientiert und zielgerichtet planen und Handlungsoptionen entwerfen. Mit dem Testkonzept wird angenommen, dass Lehrpersonen Testaufgaben der dritten Anforderung des Kreierens bzw. Generierens von Handlungsoptionen erfolgreicher bearbeiten können, wenn sie ihr deklaratives Wissen über Unterricht vor dem Hintergrund eigener Unterrichtserfahrungen bereits hinreichend reflektieren konnten.

Abb. 1
figure 1

Inhalte des Tests zum pädagogischen Wissen (König und Blömeke 2009a, S. 504)

Abb. 2
figure 2

Inhaltsdimensionen und kognitive Prozesse als Testdesign-Matrix

Die Konstruktvalidität des Tests konnte zum einen über die Prüfung der theoretisch angenommenen dimensionalen Struktur im Rahmen der Analysen von TEDS-M nachgewiesen werden (Blömeke et al. 2010a, b). Zum anderen gelang der Nachweis der Konstruktrepräsentation über die Vorhersage von Item-Schwierigkeiten (König 2009). Konvergente und diskriminante Validität (Campbell und Fiske 1959) konnte für den Test vor allem anhand folgender Befunde belegt werden: Diskriminante Validität wurde u. a. erwartet gegenüber dem fachlichen Wissen und der Abiturnote, konvergente Validität hingegen gegenüber dem fachdidaktischen Wissen. Bestätigen ließen sich diese Annahmen dahingehend, dass das so gemessene pädagogische Wissen schwächer korreliert ist mit Fachwissen als mit fachdidaktischem Wissen bei angehenden Lehrkräften der Fächer Mathematik, Deutsch und Englisch (Blömeke et al. 2010a, b, 2011). Auch ist pädagogisches Wissen nur schwach mit der Abiturnote korreliert (König und Seifert 2012). Prognostische Validität zeigt sich bei berufstätigen Lehrkräften in Form positiver Korrelationen mit den Einschätzungen zur Unterrichtsqualität der von diesen Lehrkräften unterrichteten Schülerinnen und Schülern (Pflanzl et al. 2013). Angesichts dieser verschiedenen Befunde zur Validität des TEDS-M Instruments zur Erfassung von pädagogischem Wissen setzt dieser Beitrag einen Fokus auf eine Untersuchung der Veränderung des pädagogischen Wissens im Rahmen der Lehrerausbildung unterschiedlicher Ausbildungskontexte.

International wurde der Test im Rahmen der TEDS-M-Studie eingesetzt, um in einem Dreiländer-Vergleich den jeweiligen Wissensstand angehender Lehrkräfte am Ende ihrer Ausbildung in Deutschland, den USA und Taiwan abzuschätzen (Blömeke et al. 2010a, b). Mit den Ergebnissen werden spezifische Stärken und Schwächen der beteiligten Systeme abgebildet, etwa eine relative Stärke der US-amerikanischen angehenden Lehrkräfte im Bereich des Kreierens/Generierens von Handlungsoptionen, die bei angehenden Lehrkräften in Deutschland nicht gegeben war (bei Betrachtung der ipsativen Werte). In weiterführenden Studien mit österreichischen Stichproben (König und Blömeke 2009b; Hopf 2012) konnte gezeigt werden, dass der Test auch für den dortigen Kontext der Lehrerausbildung curricular valide ist, ohne dass sprachliche Anpassungen nötig gewesen wären.

2.3 Erwerb von pädagogischem Wissen

Empirische Erkenntnisse zur Entwicklung von Lehrerwissen stammen aus der Forschung zur Lehrerexpertise (u. a. Bromme 1992), mit der Entwicklungsstadien vom Novizen zum Experten beschrieben werden (Neuweg 1999; Berliner 2004). Zwar beziehen sich die Stadien vorwiegend auf den beruflichen Werdegang, ein Transfer auf die Lehrerausbildung ist jedoch möglich (Sabers et al. 1991): Lehramtsstudierende am Anfang ihrer Ausbildung sind „Novizen“ (novice), die erst im Verlauf ihrer Ausbildung professionelles Wissen und Handlungserfahrungen erwerben, sodass sie das Stadium des „Fortgeschrittenen Anfängers“ (advanced beginner) als das zweite von fünf Stadien mit dem Abschluss der zweiten Phase erreichen bzw. durchlaufen. Nach Berliner (2004) beginnt der (angehende) Lehrer auf dieser zweiten Stufe mit der Aneignung von „praktischem Wissen“ (vgl. Abschn. 2.1). Wesentlicher Fokus liegt auf der zunehmenden Kontext- und Situationseinbettung des professionellen Wissens. (Quasi-)längsschnittliche Untersuchungen zum Erwerb und zur Veränderung des pädagogischen Wissens von angehenden Lehrkräften während der Zeit ihrer Ausbildung (u. a. Baer et al. 2007; Blömeke et al. 2008; Schulte et al. 2008; Voss und Kunter 2011), belegen, dass im Verlauf der Lehrerausbildung trotz aller Kritik durchaus eine substanzielle Zunahme im pädagogischen Wissen bei angehenden Lehrkräften erfolgt. Im Sinne der Expertiseforschung kann man annehmen, dass sich damit angehende Lehrkräfte vom Stadium des „Novizen“ hin zum Stadium des „Fortgeschrittenen Anfängers“ bewegen.

Diese Annahme wird auch durch empirische Befunde aus TEDS-M und der Studie Längsschnittliche Erhebung pädagogischer Kompetenzen von Lehramtsstudierenden (LEK) gestützt und differenziert. König und Seifert (2012) konnten im Rahmen der LEK-Studie anhand einer Längsschnittstichprobe von 261 Lehramtsstudierenden von vier unterschiedlichen deutschen Universitäten zeigen, dass zwischen dem ersten und dem vierten Ausbildungssemester der Erwerb von pädagogischem Wissen schwerpunktartig im Bereich des deklarativen Wissens liegt – und zwar bei allen vier in die LEK-Studie einbezogenen Universitäten auf ähnliche Weise. Lehramtsstudierende erwerben in dieser Zeit pädagogisches Wissen, das sie also in der Testsituation „Erinnern“ bzw. „Verstehen/Analysieren“ können. Handlungsnahes Wissen, operationalisiert über die kognitive Anforderung des „Kreierens/Generierens von Handlungsoptionen“, wird dagegen im Zeitraum der ersten zwei Jahre der universitären Lehrerausbildung nur geringfügig erworben. Vergleichende Analysen mithilfe der TEDS-M Daten zeigen jedoch, dass Referendare kurz vor dem zweiten Staatsexamen im Vergleich mit den Studierenden des vierten Ausbildungssemesters nicht nur insgesamt über mehr pädagogisches Wissen verfügen, sondern ihnen insbesondere im Bereich des handlungsnahen Wissens überlegen sind (König 2013). Dies lässt sich mit den spezifischen Lerngelegenheiten der beiden Ausbildungsphasen, ihren theoretisch-formalen bzw. praktischen Akzentuierungen, gut erklären. Das Ergebnis liefert aber auch Hinweise, dass sich bei den angehenden Lehrkräften die in der Expertiseforschung beschriebene zunehmende Verknüpfung ihres Wissens mit Unterrichtserfahrungen (Berliner 2004) im Verlauf der Lehrerausbildung vollzieht.

Mit nur vier Standorten eines Landes (Deutschland) ist allerdings auch die Aussagekraft der LEK-Studie begrenzt. Ihr Stichprobenumfang ist zu gering, um institutionelle Variation und Wirkungen in mehrebenenanalytischen Regressionsmodellen stabil schätzen zu können. Dies sowie der über die beiden Messzeitpunkte der LEK-Studie an allen Standorten anzutreffende statistisch signifikante sowie praktisch bedeutsame Wissenszuwachs gibt Anlass, ein stark vergrößertes Design mit mehr Standorten und Teilnehmerländern anzuwenden, wie es mit der hier in Rede stehenden EMW-Studie umgesetzt wird.

3 Vergleichende Untersuchung des Erwerbs von pädagogischem Wissen

3.1 Forschung zur Lehrerbildung im internationalen Vergleich

Die international-vergleichende, empirische Forschung zur Wirksamkeit der Lehrerbildung ist eine neue Erscheinung der empirischen Bildungsforschung (Klieme 2012). Ihre Funktion ist es, besondere Leistungen eines Systems und seine Wirksamkeit unter Berücksichtigung der personellen, strukturellen, inhaltlichen sowie weiterer Bedingungen im systematischen Vergleich zu identifizieren (Blömeke 2011). Mit der Erforschung von Wirksamkeit der Lehrerbildung ist insbesondere das Ziel verbunden, mit „stichhaltigen Daten (…) Inhalte, Methoden und Prozesse“ der Lehrerbildung darauf hin zu prüfen, ob „die gesetzten Ziele, nämlich die Ausbildung guter Lehrerinnen und Lehrer“, auch erreicht werden (Hascher 2011, S. 419). Die Wirksamkeitsforschung „soll systematisch prüfen, was gemeinhin als selbstverständlich bezüglich der Effekte oder Nicht-Effekte angenommen wird. Insofern unterscheidet sie sich klar von der Kritik der Lehrerbildung, die vor allem auf Meinungen und subjektiven Mängelzuschreibungen beruht“ (ebd.). Allerdings wird ein Mangel an international-vergleichenden Studien zum Lehrerberuf und zur Lehrerbildung beklagt (Blömeke 2011), eingeschlossen Vergleiche im deutschsprachigen Raum (Bosse et al. 2012). Narrativen Vergleichen von Strukturmerkmalen auf der Systemebene (u. a. Eurydice 2004; OECD 2005, 2009; Schleicher 2011) steht eine deutlich geringere Zahl von empirischen Studien gegenüber, in denen auf der Individualebene Daten mittels Fragebögen und Tests erhoben werden. Insbesondere die längsschnittliche Messung pädagogischen Wissens, welche Aussagen zur Wirksamkeit erlaubt, stellt in der international-vergleichenden Lehrerbildungsforschung „einen defizitären Forschungsbereich dar“ (Blömeke 2011, S. 346). Vor diesem Hintergrund begegnet also die hier in Rede stehende EMW-Studie – als eine in unterschiedlichen Ausbildungskontexten stattfindende Längsschnittuntersuchung mit Fokus auf das pädagogische Wissen als Element der sich während der Ausbildung entwickelnden professionellen Kompetenz zukünftiger Lehrpersonen – dieser ergänzungsbedürftigen Forschungslage (zu Limitierungen vgl. Abschn. 7.2).

3.2 Vergleich der Ausbildungskontexte Deutschland und Österreich

Die zwei im vorliegenden Beitrag einbezogenen deutschsprachigen Länder Deutschland und Österreich bieten als unterschiedliche Kontexte der Lehrerausbildung ein besonders großes Potenzial: Zum einen lassen sich die Probleme, die sich bei einer empirischen Vergleichsstudie etwa mit Blick auf die Konstruktvalidität und die empirische Validität der Erhebungsinstrumente ergeben (vgl. Blömeke und Paine 2008; Blömeke 2011; Klieme 2012), angesichts der gemeinsamen Sprache und der ähnlichen kulturellen Konnotationen mit einem vertretbaren Forschungsaufwand lösen. Zum anderen ist die Lehrerbildung in Deutschland und Österreich strukturell von sehr unterschiedlicher Prägung (vgl. Mayr und Neuweg 2009; Stadelmann und Rhyn 2011; Bosse et al. 2012), sodass man über Vergleichsanalysen zu ihrer Wirksamkeit im pädagogischen Bereich neue und wichtige Erkenntnisse für aktuelle, auch drängende Reformfragen der Lehrerbildung gewinnen kann.

Insbesondere die Variation in der organisatorisch-curricularen Gestaltung des Theorie-Praxis-Bezugs (z. B. Gewichtung, Verzahnung) bietet ein erhebliches Forschungspotenzial, ist es doch ein Thema, das die aktuellen Reformdebatten zur deutschen Lehrerbildung bestimmt (u. a. Expertenkommission 2007; Czerwenka 2011) und schon seit Jahrzehnten strittig diskutiert wird, ohne dass – von zahlreichen Studierenden-Umfragen einmal abgesehen – eine empirische Datenbasis vorliegen würde, die die tatsächliche Wirksamkeit des vielfach geforderten Praxisbezugs auf relevante Ergebnisvariablen wie das zu erwerbende professionelle Wissen der angehenden Lehrkräfte belegen könnte (vgl. Hascher 2011; Clift und Brady 2005). Die Varianz in der Gestaltung von Lerngelegenheiten, die mit einem Vergleich der deutschen und der österreichischen Lehrerausbildung auf ihre Wirksamkeit hin untersucht werden kann, erlaubt hier wichtige, bislang nicht geleistete Analysen in Bezug auf die Anbahnung von praktischem Wissen bei Lehramtsstudierenden (u. a. Berliner 2004; Gruber und Rehrl 2005; Clift und Brady 2005).

Kernmerkmal der bisherigen österreichischen Lehrerbildung (im Vergleich zur deutschen – hier bis auf Baden-Württemberg) ist die landesweite „Spaltung“ (Messner und Posch 2010, S. 177) in Universitäten und Pädagogische Hochschulen (PHs). Während die universitäre Ausbildung für das „Lehramt für Höhere Schulen“ in Österreich der Gymnasiallehrerausbildung in Deutschland strukturähnlich ist (u. a. universitäre Verankerung, zweiphasige Ausbildung, fachliche Schwerpunktsetzung, Schulform des anspruchsvollsten Bildungsgangs im mehrgliedrigen Sekundarschulsystem), unterscheiden sich die Ausbildungsgänge der PHs in Österreich für die Lehrkräfte der sog. „Pflichtschulen“ (u. a. Volksschule, Hauptschule, Sonderschule) deutlich zu den vergleichbaren Ausbildungsgängen in Deutschland (d. h. Grundschule, Haupt-/Realschullehramt, Sonderpädagogik usw.). Österreich gehört bislang zu den letzten europäischen Ländern, in denen die Lehrerbildung für die aufgeführten Pflichtschullehrämter akademisiert wurde (vgl. Hopmann 2008). Jedoch erreichen die PHs auch bisher vermutlich nicht das akademische Niveau der Lehrerbildung anderer Länder oder jenes der PHs in Baden-Württemberg: Das österreichische PH-Studium beschränkt sich bislang auf ein sechssemestriges Bachelorstudium, enthält von Beginn an kontinuierlich Praktika (wöchentliche Praxistage, Blockpraktika) und mündet direkt in den Berufseinstieg (vgl. Mayr und Neuweg 2009; Bosse et al. 2012).Footnote 3

3.3 Einfluss schulpraktischer Lerngelegenheiten auf den Erwerb pädagogischen Wissens

Modellhafte Vorstellungen zur empirischen Untersuchung der Bedingungen von professioneller Kompetenz im Sinne einer Wirksamkeit der Lehrerausbildung betonen die Bedeutung von Prozessmerkmalen zur Beschreibung der Lehr-Lern-Arrangements, die angehende Lehrkräfte unter der Zielperspektive durchlaufen, berufsrelevantes Wissen und Können zu erwerben und aufzubauen (Blömeke 2011). Der dafür in der empirischen Lehrerbildungsforschung verwendete Begriff der „Lerngelegenheiten“ – international opportunities to learn – bezieht sich auf institutionelle Ausbildungsangebote, von denen angenommen wird, dass sie zum Erwerb professioneller Kompetenzen einen Beitrag leisten (Tatto et al. 2008). Die Erhebung von Lerngelegenheiten und die differenzierte Analyse ihres Zusammenhangs zu Lernergebnissen bieten demnach wesentliche Einblicke in die Effektivität von Curricula und Möglichkeiten ihrer Qualitätssicherung.

Verschiedene Studien der empirischen Lehrerausbildungsforschung haben sich der Herausforderung gestellt, Lerngelegenheiten in standardisierter Form zu erfassen (vgl. z. B. Blömeke et al. 2010a, b), doch nur wenige dieser Untersuchungen haben dabei Lerngelegenheiten im erziehungswissenschaftlichen bzw. pädagogischen Studium über die einzelne Institution hinweg vergleichend erfasst (König et al. 2014). Fast keine Analyse existiert zur Erklärung des Erwerbs von pädagogischem Wissen durch schulpraktische Lerngelegenheiten. Für diese würden jedoch zumindest zwei Gründe sprechen (vgl. Blömeke 2011): Zum einen ließe sich belegen, wie stark das pädagogische Wissen in Abhängigkeit spezifischer Lerngelegenheiten anwächst. Zum anderen wäre die Abhängigkeit des Wissenserwerbs von Lerngelegenheiten der Lehrerbildung auch ein Beleg für die curriculare Validität des getesteten Wissens.

4 Fragestellungen und Hypothesen

Im Folgenden werden drei Fragen bearbeitet, um den Erwerb von pädagogischem Wissen bei angehenden Lehrkräften in Deutschland und Österreich zu untersuchen:

  1. 1.

    Kann mit dem Instrument bei deutschen und österreichischen Lehramtsstudierenden ein Wissenszuwachs über zwei Messzeitpunkte (1. und 5. Ausbildungssemester) abgebildet werden?

Vermutet wird ein statistisch signifikanter Wissenszuwachs mit großer praktischer Bedeutsamkeit vom ersten zum zweiten Messzeitpunkt für beide Länderstichproben (H1), da zum einen der Test als curricular valide in Bezug auf die beiden Ausbildungskontexte erachtet wird und zum anderen von der Ausbildung in beiden Ländern Lernwirksamkeit angenommen wird. Diese Vermutung baut auf bisherigen mit dem Instrument erzielten und in den Abschn. 2.2 und 2.3 dargestellten Ergebnissen auf.

  1. 2.

    Ist der Erwerb abhängig von strukturell divergierenden, inhaltlich unterschiedlich entwickelten und ausgerichteten Ausbildungssystemen?

Angesichts der Variation in der organisatorisch-curricularen Gestaltung des Theorie-Praxis-Bezugs der beiden Ausbildungskontexte (Abschn. 3.2) werden Unterschiede im konzeptuell-analytischen sowie im handlungsnahen pädagogischen Wissenszuwachs erwartet. Wie in Abschn. 2.3 erläutert, zeigt die LEK-Studie für eine Längsschnittstichprobe von Lehramtsstudierenden in Deutschland, dass diese zwischen ihrem 1. und 4. Semester pädagogisches Wissen erwerben, dass dabei jedoch primär konzeptuell-analytisches und nur geringfügig handlungsnahes Wissen erworben wird, wobei der Erwerb handlungspraktischen Wissens jedoch durch schulpraktische Lerngelegenheiten unterstützt werden kann. Eine Stärke der universitär geprägten Ausbildungskontexte, wie sie in Deutschland (einschließlich der Pädagogischen Hochschulen, die sich ähnlich wie die deutschen Universitäten von der zweiten Ausbildungsphase abgrenzen) vorliegen, dürfte somit im Vergleich mit den Pädagogischen Hochschulen in Österreich in einer curricularen Schwerpunktlegung auf den Erwerb konzeptuell-analytischen Wissens im Bereich der Pädagogik sein. Wir vermuten daher differenzielle Wissenszuwächse in den Subskalen des Tests „Erinnern“ und „Verstehen/Analysieren“ (Abb. 2) zugunsten aller Studiengänge in Deutschland (H2a). Im Gegensatz dazu dürfte handlungsnahes pädagogisches Wissen in solchen Kontexten schwerpunktartig gelehrt und erworben werden, in denen von Anfang an die Nähe zum professionell-praktischen Diskurs betont wird und seminaristische Lehre mit schulpraktischem Training eng verflochten ist. Dies ist insbesondere in den an österreichischen Pädagogischen Hochschulen angebotenen Lehramtsstudiengängen der Fall. Wir vermuten daher differenzielle Wissenszuwächse in der Subskala des Tests „Kreieren/Generieren von Handlungsoptionen“ zugunsten der Studiengänge an Pädagogischen Hochschulen in Österreich (H2b).

  1. 3.

    Korrespondiert die mit Frage (2) angenommene differenzielle Höhe des Zuwachses pädagogischen Wissens mit entsprechenden Unterschiedenen in den von den Studierenden wahrgenommenen Lerngelegenheiten?

Da Ausbildungssysteme und Studiengänge nur distale Indikatoren darstellen, werden ergänzend auch Skalen zur Erfassung von schulpraktischen Lerngelegenheiten (Selbstberichte der Studierenden) als proximale Indikatoren für die Variation in der organisatorisch-curricularen Gestaltung des Theorie-Praxis-Bezugs einbezogen. Wir vermuten, dass der Umfang gemachter Erfahrungen, die im Rahmen von schulpraktischen Lerngelegenheiten gesammelt werden konnten (wie die Planung, Durchführung und Analyse von pädagogischen Handlungssituationen, das Beziehen von Theorien auf praktische Situationen), die Veränderung der differenziellen Wissenszuwächse in der Subskala des Tests „Kreieren/Generieren von Handlungsoptionen“ zusätzlich erklären können (H3).

Längsschnittstudien wie die EMW-Studie haben verschiedene Einbußen hinsichtlich der Qualität ihrer Stichprobe in Kauf zu nehmen (detailliert Abschn. 5.1). Um die dargelegten Hypothesen dennoch untersuchen zu können, werden daher individuelle Eingangsvoraussetzungen (z. B. Schulabschlussnoten) kontrolliert. Die Auswahl dieser Kontrollvariablen geschieht auch auf der Basis von Analysen der LEK-Studie zu individuellen Eingangsvoraussetzungen von Lehramtsstudierenden, die für den Erwerb ihres pädagogischen Wissens ausschlaggebend sein können.

5 Untersuchungsmethode

5.1 Stichprobe

Für die Bearbeitung unserer Fragestellungen verwenden wir im Folgenden einen Teildatensatz der EMW-Studie, und zwar angehende Lehrkräfte aus Deutschland und Österreich, die zu beiden Messzeitpunkten im Wintersemester 2011/12 (1. Semester) und im Wintersemester 2013/14 (5. Semester) teilnahmen und einem der vier in Tab. 1 gelisteten Lehramtstypen der KMK (2009) zugeordnet werden konnten. Die vier Typen wurden ausgewählt, weil sie die für die nachfolgenden Analysen nötige Vergleichbarkeit aufweisen. Der Teildatensatz enthält insgesamt 33 Studiengänge in den 18 Standorten, wobei ein Studiengang eines Standortes im Durchschnitt von rund 44 Studierenden vertreten ist.

Zum ersten Messzeitpunkt der EMW-Studie wurden in Deutschland 18 Hochschulen aus neun Bundesländern einbezogen. Diese Hochschulen repräsentieren die weiteren, jeweils nicht einbezogenen Hochschulen dieser Bundesländer gut bzw. stellen im Einzelfall eine Vollerhebung auf Hochschulebene dar. In Nordrhein-Westfalen als einem dieser neun Länder wurde eine Zufallsstichprobe von Universitäten gezogen, in den übrigen Ländern wurde aus forschungsökonomischen Gründen die Auswahl der Universitäten letztlich verknüpft mit der Zusage eines Kooperationspartners vor Ort, um die Datenerhebung zu unterstützen.Footnote 4 Die – zum ersten Messzeitpunkt – einbezogenen Bundesländer decken die Vielfalt der in Deutschland institutionalisierten Lehrerausbildung hinreichend ab (vertreten sind neue und alte Länder, Länder des südlichen, nord-westlichen und östlichen Bundesgebietes), allerdings ist kein Stadtstaat Teil der Länderstichprobe. In Österreich wurden zum ersten Messzeitpunkt neun Pädagogische Hochschulen und zwei Universitäten einbezogen, die ein repräsentatives Abbild der dortigen 22 Standorte mit Lehramtsausbildung (14 Pädagogische Hochschulen, acht Universitäten) darstellen. Auch hier war die Auswahl der elf Standorte aus forschungsökonomischen Gründen bedingt durch die Zusage einer Kooperation vor Ort, welche die Durchführung der Datenerhebung durch Projektpartner einschloss. Auf Individualebene konnten aus den 18 Universitäten in Deutschland 4402 Lehramtsstudierende an der EMW-Studie teilnehmen (Ausschöpfungsquote: 31,7 %), während in Österreich 1585 von den elf Standorten teilnehmen konnten (Ausschöpfungsquote: 49,8 %).

Vor Durchführung des zweiten Messzeitpunktes wurden die Kooperationspartner der einzelnen Standorte um ihre Einschätzung zur Erreichbarkeit der Studierenden ihres Standortes gebeten. An einigen Standorten wurde die Erreichbarkeit bereits im Vorfeld als praktisch nicht realisierbar eingeschätzt, sodass angesichts einer zu erwartenden sehr geringen Rücklaufquote diese Standorte ausgeschlossen werden mussten. Letztlich konnten zehn Standorte in Deutschland sowie acht in Österreich (sieben Pädagogische Hochschulen und eine Universität) wieder einbezogen werden. Auf institutioneller Ebene beträgt der Rücklauf des zweiten Messzeitpunktes demnach 56 % in Deutschland und 73 % in Österreich. Innerhalb der Standorte wurden Lehramtsstudierende entweder über Kontaktdaten (E-Mail-Adressen), welche sie beim ersten Messzeitpunkt zur Kontaktierung für Folgestudien hinterlassen hatten, zu einer erneuten Teilnahme eingeladen oder über Lehrveranstaltungen, die insbesondere für Lehramtsstudierende im 5. Ausbildungssemester vorgesehen waren, erreicht. Der tatsächliche Rücklauf konnte jedoch nur auf der Basis jener Studierenden berechnet werden, bei denen die Verknüpfung der Fragebögen des ersten und zweiten Messzeitpunktes über einen von ihnen – zu beiden Zeitpunkten – zu generierenden anonymisierten Code möglich war. Bezogen auf die Teilnehmer des ersten Messzeitpunkts innerhalb der Standorte beträgt die so ermittelte Rücklaufquote 27 % in Deutschland und 59 % in Österreich.

Tab. 1 Verteilung des hier verwendeten Teildatensatzes der EMW-Längsschnittstichproben von Studierenden und Hochschulen auf die Lehramtstypen der KMK (2009) sowie österreichische Bezeichnung in Klammern

Angesichts des Stichprobenausfalls wurde eine Drop-out Analyse durchgeführt, in der auf der Basis der Stichprobe des ersten Messzeitpunktes die Teilnahme (kodiert als 1, Nichtteilnahme kodiert als 0) am zweiten Messzeitpunkt vorhergesagt wurde. Einbezogen wurden die Hintergrundvariablen Alter und Geschlecht, die Leistungsvariablen Schulabschlussnote und Score im Pädagogischen Wissen sowie Berufsmotivationsskalen. Für die deutsche Stichprobe tendieren die Prädiktoren gegen Null (alle |β| < 0,05) und sind nicht statistisch signifikant. Für die österreichische Stichprobe zeigen sich kleine Zusammenhänge hinsichtlich des Alters (− 0,13), des Geschlechts (− 0,09), der Schulabschlussnote (− 0,08), des pädagogischen Wissens (0,10) und der beruflichen Motivation, Lehramt als Verlegenheitslösung anzustreben (0,10). Die Ergebnisse der Drop-out Analyse weisen somit nicht auf eine Verzerrung der Stichproben hin, wie es anhand des Stichprobenausfalls insbesondere für die deutsche Stichprobe hätte erwartet werden können. Angesichts der Einschränkungen bei der Datenerhebung handelt es sich bei unserer Längsschnittstichprobe jedoch um eine Gelegenheitsstichprobe, die – ähnlich wie beim ersten Messzeitpunkt – zwar die Heterogenität der Lehrerbildung in beiden Ländern hinreichend abdeckt, jedoch nicht als repräsentativ für die beiden Länder bezeichnet werden kann (zu weiteren Einschränkungen vgl. Abschn. 7).

5.2 Instrumente

5.2.1 Testung des pädagogischen Wissens

Das pädagogische Wissen der angehenden Lehrkräfte wurde zu beiden Zeitpunkten mit dem Testinstrument erfasst, das im Rahmen der internationalen Vergleichsstudie TEDS-M entwickelt worden war (Abschn. 2.2). Zum zweiten Messzeitpunkt unserer Studie wurde das Instrument in voller Länge wie in TEDS-M eingesetzt. Abbildung 3 enthält eine Beispiel-Aufgabe der Inhaltsdimension „Leistungsbeurteilung“ und der kognitiven Anforderung „Erinnern“. Abbildung 4 ist eine Beispiel-Aufgabe zu entnehmen, die der Inhaltsdimension „Motivierung“ und der kognitiven Anforderung des „Verstehens/Analysierens“ zugeordnet wird. Abbildung 5 und 6 enthalten Beispiel-Aufgaben der kognitiven Anforderung des „Kreierens/Generierens von Handlungsoptionen“. Angesichts des komplexen Aufbaus können aus einzelnen Testaufgaben mehrere dichotome Testitems resultieren, die anschließend Eingang in die Skalierungsanalysen finden. Die Kodierung der Antworten auf die offenen Testfragen wurde mithilfe der Kodieranleitungen aus TEDS-M von trainierten Kodierern durchgeführt (Ergebnisse der Übereinstimmungsanalyse bei Doppelkodierungen in der EMW-Studie: durchschnittliches Kappa = 0,8).

Anhand von vertiefenden Skalierungsanalysen auf der Basis der LEK- und TEDS-M-Daten konnte eine Kurzfassung des Tests entwickelt werden, die etwa die Hälfte aller Testaufgaben enthält, bei der jedoch sämtliche Zellen der Testdesign-Matrix abgedeckt sind (König und Blömeke 2010). Diese Testversion wurde aus forschungsökonomischen Gründen zum ersten Messzeitpunkt der EMW-Studie eingesetzt und sie erwies sich zum ersten Messzeitpunkt als reliabel. Mit dem vollständigen Test ist eine multidimensionale Skalierung der inhaltlichen Dimensionen und kognitiven Anforderungen möglich, die sich bei sehr großen Stichproben außerdem mithilfe der Skalierung im Ansatz virtueller Fälle (Rost 1996) und hinreichend vieler Anker-Items auch auf den ersten Messzeitpunkt übertragen lässt, selbst wenn zu diesem Zeitpunkt lediglich die Kurzfassung des Tests eingesetzt wurde (vgl. Wu et al. 1997).

Abb. 3
figure 3

Testaufgabe zur Erfassung von Wissen zur Leistungsbeurteilung mit der kognitiven Anforderung „Erinnern“ sowie korrekte Lösung (1 Punkt) (König und Blömeke 2009a)

Abb. 4
figure 4

Testaufgabe zur Erfassung von Wissen über Motivation mit der kognitiven Anforderung „Verstehen/Analysieren“ (jeweils 1 Punkt pro richtiger Antwort) (König und Blömeke 2009a)

Abb. 5
figure 5

Testaufgabe zur Erfassung von Wissen zur beruflichen Anforderung Umgang mit Heterogenität mit der kognitiven Anforderung „Kreieren/Generieren von Handlungsoptionen“ (Antwortkasten in verkleinerter Darstellung) sowie Originalantworten mit Punktvergabe (König und Blömeke 2009a)

Abb. 6
figure 6

Testaufgabe zur Erfassung von Wissen zur Strukturierung von Unterricht mit der kognitiven Anforderung „kreieren/generieren von Handlungsoptionen“ (König und Blömeke 2009a)

5.2.2 Kontrollvariablen

Neben Alter und Geschlecht wurden die Abiturnote (Deutschland) bzw. die Abschlussnoten der höheren Schule in den Fächern Deutsch, Mathematik und Englisch (Österreich) der Studierenden erfragt. Abiturnote bzw. ein Durchschnittswert der drei Abschlussnoten werden als genereller Indikator für allgemeine kognitive Grundfähigkeiten einbezogen. Die soziale Herkunft der Studierenden wurde in der EMW-Studie erfasst, indem die Studierenden den elterlichen Berufsstaus (International Socio-Economic Index of Occupational Status (ISEI), Ganzeboom et al. 1992) angeben sollten, wobei nachfolgend der in der Familie höchste Status (HISEI) in die Analysen einbezogen wird.

5.2.3 Skalen zur Erfassung der lernprozessbezogenen Tätigkeiten in schulpraktischen Lerngelegenheiten

Verwendet wird ein im Rahmen der EMW-Studie entwickeltes und zum zweiten Messzeitpunkt eingesetztes Instrument zur Erfassung von lernprozessbezogenen Tätigkeiten in schulpraktischen Lerngelegenheiten. Es besteht aus insgesamt 74 Items, die sich zu fünf Skalen zusammenfassen lassen: Komplexität über forschungsmethodische Zugänge erkunden, pädagogische Handlungssituationen planen, pädagogische Handlungssituationen durchführen, Theorien auf Situationen beziehen, mit Situationen analytisch-reflexiv umgehen. Die Items besitzen ein dichotomes Antwortformat (ja/nein) und wurden im Fragebogen mit der Frage eingeleitet: „Haben Sie in Ihrer bisherigen Schulpraxis/in Ihren bisherigen Schulpraktika die folgenden Tätigkeiten durchgeführt?“ Die einzelnen Dimensionen werden jeweils mit rund zehn Items gemessen, allein die Durchführung von pädagogischen Handlungssituationen wird über deutlich mehr Items erfasst, um ein besonders breites Spektrum pädagogischen Handelns abzubilden (vgl. Tab. 2). Die Skalen sind geeignet, um Varianz zwischen den Ländern abzubilden (vgl. die Mittelwerte und die Effektstärke η2 der Ländervarianz in Tab. 3).Footnote 5

Tab. 2 Beispiel-Items zur Messung von Dimensionen schulpraktischer Tätigkeiten bei angehenden Lehrkräften (König et al. 2014, S. 14) und Reliabilität der Skalen (Cronbachs Alpha)
Tab. 3 Deskriptive Kennwerte (Mittelwert, Standardfehler des Mittelwerts und Standardabweichung) für die Skalen zur Erfassung von lernprozessbezogenen Tätigkeiten in schulpraktischen Lerngelegenheiten (gegliedert nach Land) sowie Ländervarianz (η2)

5.3 Skalierung des Wissenstests

Die Skalierung des Wissenstest erfolgte zunächst getrennt für jeden Messzeitpunkt. Die Skalierung des Tests zum ersten Messzeitpunkt ist in König und Rothland (2013) dokumentiert. Die Skalierung des zweiten Messzeitpunktes folgte dem Vorgehen der LEK-Studie. Dabei mussten von den im TEDS-M Testinstrument enthaltenen Aufgaben einzelne Aufgaben bzw. die daraus resultierenden Items ausgeschlossen werden. Die in der LEK-Studie vorgenommene Skalierung des Tests bewährte sich letztlich auch für die Skalierung des zweiten Messzeitpunktes in der EMW-Studie. Insgesamt kommen 42 Items beim ersten und 79 Items beim zweiten Messzeitpunkt zum Einsatz. Die 42 Items des ersten Messzeitpunktes können gleichzeitig als Ankeritems zur Verknüpfung von beiden Messungen verwendet werden.

Für die hier vorzustellenden Analysen wurden in einem weiteren Schritt die Testdaten des ersten und zweiten Messzeitpunktes im Ansatz virtueller Fälle (Rost 1996) zunächst in einem eindimensionalen, dann in einem dreidimensionalen Modell skaliert. Entsprechend der grafischen Veranschaulichung in Abb. 7 wurde dabei die Passung eines Modells, das eine eindimensionale Struktur, und die Passung eines Modells, das zwischen drei Dimensionen kognitiver Anforderungen unterscheidet, mithilfe der Software Conquest IRT-skaliert und geschätzt (Wu et al. 1997). Conquest weist jedem Item aufgrund seiner empirischen Häufigkeit („Lösungsquote“) einen Itemparameter („Schwierigkeitsparameter“) und jeder befragten Person entsprechend des gezeigten Antwortverhaltens einen Parameter auf der latenten Variable Theta zu („Fähigkeitsparameter“); mit dem mehrdimensionalen Random Coefficient Multinomial Logit-Modell, das ebenfalls in Conquest implementiert ist, können mehrere latente Variablen gleichzeitig berücksichtigt werden, deren Zusammenhänge messfehlerbereinigt ausgegeben werden (Rost 1996; Wu und Adams 2006).

Für die Überprüfung der internen Konsistenz der drei Dimensionen ziehen wir die Expected A Posteriori Schätzung (EAP-Schätzung; de Ayala 1995) heran, die eine unverzerrte Beschreibung der Population liefert und die mehrdimensionale Modellstruktur berücksichtigt (Wu et al. 1997). Das eindimensionale Modell zeigt mit einem Wert von 0,84 eine gute Reliabilität (Theta-Varianz 0,71). Die Item-Fit-Statistiken verdeutlichen, dass die Item-Schwierigkeitswerte über einen Range von mehr als vier Logits streuen (von − 2,36 bis 2,28). Item-Diskriminationswerte liegen durchschnittlich bei 0,34, der Weighted Mean Square jedes Items fällt in einen akzeptablen Bereich zwischen 0,81 und 1,16, lediglich ein Item weist einen Wert von größer 1,20 auf.Footnote 6

Die drei Dimensionen des differenzierten Modells besitzen aufgrund der geringeren Item-Anzahl unterschiedlich hohe Reliabilitäten: „Erinnern“: 0,67, Dimension „Verstehen/Analysieren“: 0,82, Dimension „Kreieren/Generieren von Handlungsoptionen“: 0,59 (jeweils vergleichbar mit Cronbachs Alpha), sie liegen somit in einem akzeptablen bis guten Bereich. Einen wichtigen Einblick erlauben die korrelativen Befunde der drei Dimensionen. Der höchste Zusammenhang (0,59) besteht zwischen der Dimension „Erinnern“ und der Dimension „Verstehen/Analysieren“, während die Dimension „Kreieren/Generieren von Handlungsoptionen“ weniger hoch mit den beiden anderen Dimensionen zusammenhängt (0,46 mit dem „Erinnern“, 0,43 mit dem „Verstehen/Analysieren“).

Im Anschluss an diese Modellprüfung werden die durch die Skalierung ermittelten Leistungswerte (ein Gesamtscore, je ein Score für die drei Dimensionen kognitiver Anforderungen) in den nachfolgenden Analysen genutzt. Hierfür werden die Personenparameter aus der EAP-Schätzung verwendet. Diese werden für den Gesamtscore und für die drei Scores kognitiver Anforderungen getrennt im Ansatz virtueller Fälle auf einen Mittelwert von 50 und eine Standardabweichung von 10 transformiert. Anschließend erfolgt die Datenanalyse auf manifester Ebene mithilfe des Softwarepakets Mplus (Muthén und Muthén 19962006), welches u. a. Mehrebenenanalysen sowie einen adäquaten Umgang mit fehlenden Werten ermöglicht. In den nachfolgenden Analysen werden fehlende Werte mithilfe der Methode der full-information-maximum-likelihood modellbasiert geschätzt, d. h. der Behandlung fehlender Werte wird dadurch Rechnung getragen, dass Analyse- und Imputationsmodell identisch sind (vgl. Lüdtke et al. 2007).

Abb. 7
figure 7

Schematische Darstellung des eindimensionalen Modells pädagogischen Wissens (links) und des dreidimensionalen Modells kognitiver Anforderungen (rechts)

6 Ergebnisse

6.1 Veränderung des pädagogischen Wissens

Bereits die in Tab. 4 dargestellten Mittelwerte verdeutlichen, dass es in beiden Ausbildungskontexten zu einem Zuwachs an Wissen kommt. Die Differenz der Gesamtscores in beiden Ländern liegt jeweils bei rund zehn Punkten und erreicht damit die Größe einer Standardabweichung. Tabelle 5 (obere Hälfte) sind ferner Kennwerte von mithilfe der Software Mplus durchgeführten Regressionsanalysen zu entnehmen, in denen das pädagogische Wissen der Lehramtsstudierenden im Ansatz virtueller Fälle und auf manifester Ebene als Kriteriumsvariable, der Messzeitpunkt als unabhängige Variable spezifiziert wurden. Im Falle der Differenzierung des pädagogischen Wissens in Subskalen wurden sämtliche Subskalen eines Modells als abhängige Variablen in einer Regressionsanalyse spezifiziert und der Effekt des Messzeitpunktes simultan auf diese Subskalen geschätzt.Footnote 7 Ergänzend wurden die Regressionsmodelle auch unter Einschluss der Kontrollvariablen berechnet (Tab. 5, untere Hälfte). Da unter Einbezug der Kontrollvariablen die Effekte des Messzeitpunktes nicht geschmälert werden, beziehen wir uns nachfolgend auf die Ergebnisse der oberen Hälfte in Tab. 5.

Der Messzeitpunkt als Prädiktor zur Erklärung des Gesamtscores in der Regressionsanalyse ist statistisch signifikant und von großer praktischer Bedeutsamkeit: 24 % der Varianz in der deutschen und 27 % der Varianz in der österreichischen Stichprobe können durch den Zeitpunkt erklärt werden. Auch die Subskalen der kognitiven Anforderungen können durch den Messzeitpunkt statistisch signifikant vorhergesagt werden – doch hier zeigen sich Unterschiede nach Subskala, die auf unterschiedliche Schwerpunkte des Wissenserwerbs schließen lassen. Im Bereich des „Erinnerns“ sowie im Bereich des „Verstehens/Analysierens“ lassen sich sowohl für die deutsche Stichprobe (Varianzaufklärung 26 bzw. 27 %) als auch für die österreichische Stichprobe (Varianzaufklärung 26 bzw. 29 %) Unterschiede durch den Zeitpunkt jeweils mit großer praktischer Bedeutsamkeit erklären. Es zeigen sich keine Unterschiede zugunsten der deutschen Studierenden. Dagegen fällt der Mittelwertunterschied im Bereich des „Kreierens/Generierens von Handlungsoptionen“ für die deutsche Stichprobe deutlich kleiner aus (4 % der Varianz im pädagogischen Wissen können durch den Messzeitpunkt erklärt werden) als für die österreichische Stichprobe (12 % erklärte Varianz). Die deutschen Studierenden weisen innerhalb ihrer ersten beiden Studienjahre einen statistisch signifikant geringeren Wissenszuwachs auf als die österreichischen, wie ein Vergleich der unterschiedlich hohen Anteile erklärter Varianz verdeutlicht (t = 3,58, p < 0,001). Die erreichten Mittelwerte zum zweiten Messzeitpunkt sind bei den österreichischen Studierenden statistisch signifikant höher als bei den deutschen (t = − 5,66, p ≤ 0,001), während sie sich zum ersten Messzeitpunkt nicht statistisch signifikant unterscheiden (t = − 0,09, n. s.).

Tab. 4 Deskriptive Kennwerte (Mittelwert, Standardfehler des Mittelwerts und Standardabweichung) für das pädagogische Wissen (Gesamtscore und Subdimensionen kognitiver Anforderungen), gegliedert nach Messzeitpunkt und Land
Tab. 5 Regression des pädagogischen Wissens auf den Messzeitpunkt (Multi-Gruppen-Analyse für die Länder, Schätzung in Mplus unter Berücksichtigung des Ortes/Studiengangs als Stratifikationskriterien)

6.2 Befunde aus Mehrebenenanalysen

Zur weiteren Bearbeitung unserer Fragestellungen beziehen wir Eingangsvoraussetzungen als Kontrollvariablen und die Skalen zur Erfassung von lernprozessbezogenen Tätigkeiten in schulpraktischen Lerngelegenheiten als proximale Prädiktoren zur Erklärung der Veränderung im pädagogischen Wissen ein. Hierfür spezifizieren wir Zwei-Ebenen-Modelle mit den Lehramtsstudierenden auf der ersten Ebene (Individualdatenebene) und ihrem Studiengang innerhalb ihrer Hochschule als zweite Ebene (Institutionenebene). Auf der Individualebene kontrollieren wir die jeweilige Kriteriumsvariable zum ersten Messzeitpunkt, Geschlecht, Alter, Schulabschlussnote und den höchsten in der Familie vorhandenen Erwerbsstatus (HISEI). Auf der Institutionenebene kontrollieren wir die Studiengänge als Dummy-Variablen (Referenz: Gymnasiallehramt bzw. Lehramt für höhere Schulen) und fügen das Land als Prädiktor ein.

Wie in Tab. 6 anhand der Befunde aus den vier Modellen für den Gesamtscore sowie die drei Scores kognitiver Anforderungen ersichtlich ist, wird bei Kontrolle von individuellen Eingangsvoraussetzungen sowie der Studiengänge der Länderprädiktor nicht signifikant – mit Ausnahme des vierten Modells mit dem „Kreieren/Generieren von Handlungsoptionen“ als abhängige Variable. Mit β = 0,37 (p ≤ 0,05) hat der österreichische Ausbildungskontext einen Einfluss auf den Wissenszuwachs in diesem Bereich pädagogischen Wissens, während bei den beiden anderen Scores kognitiver Anforderungen kein überzufälliger Länderunterschied auf die Wissensveränderung festgestellt werden kann.

Tab. 6 Befunde aus Mehrebenenanalysen zum pädagogischen Wissen (standardisierte Regressionskoeffizienten und Standardfehler)

Um zu prüfen, ob die Länderunterschiede im Wissenszuwachs im Bereich „Kreieren/Generieren von Handlungsoptionen“ auf Unterschiede in den schulpraktischen Lerngelegenheiten zurückgeführt werden können, wurden – ausgehend vom vierten Modell (M4) in Tab. 6 – zunächst auf der Individualebene schrittweise die fünf Skalen lernprozessbezogener Tätigkeiten in schulpraktischen Lerngelegenheiten eingeführt (Tab. 7).Footnote 8 Da sie am Gesamtmittelwert zentriert sind, enthalten sie nicht nur Varianzanteile der Individual- sondern auch der Institutionenebene (Bryk und Raudenbush 1992). Mit ihrer Einführung ist der Länderprädiktor nicht mehr statistisch signifikant.Footnote 9 Demnach lassen sich bereits mit den am Gesamtmittelwert zentrierten Prädiktoren lernprozessbezogener Tätigkeiten in schulpraktischen Lerngelegenheiten Veränderung im Bereich des „Kreierens/Generierens von Handlungsoptionen“ erklären. Die Veränderungseffekte sind statistisch signifikant, allerdings nur für die drei Skalen „Pädagogische Handlungssituationen durchführen“, „Theorien auf Situationen beziehen“ und „Mit Situationen analytisch-reflexiv umgehen“ auch von praktischer Bedeutsamkeit (β ≥ 0,1). Studierende, die über umfangreichere schulpraktische Erfahrungen in diesen Bereichen berichten, zeigen einen stärkeren Wissenszuwachs im Bereich des „Kreierens/Generierens von Handlungsoptionen“ bei der Testung pädagogischen Wissens.

Tab. 7 Befunde aus Mehrebenenanalysen zum pädagogischen Wissen im Bereich des „Kreierens/Generierens von Handlungssituationen“ (standardisierte Regressionskoeffizienten und Standardfehler)

7 Zusammenfassung und Diskussion

7.1 Zusammenfassung und Diskussion

Der vorliegende Beitrag hatte zum Ziel, am Beispiel der beiden Ausbildungskontexte Deutschland und Österreich Annahmen zum Erwerb von pädagogischem Wissen im Rahmen der Lehrerausbildung zu formulieren. Solche Vergleichsanalysen sind wichtig, da sich die beiden deutschsprachigen Länder mit analogen oder identischen Problemlagen und Fragestellungen konfrontiert sehen (vgl. Stadelmann und Rhyn 2011). Für das verwendete Instrument zur Erfassung von pädagogischem Wissen, welches ursprünglich für internationale Vergleichsanalysen im Rahmen von TEDS-M entwickelt worden war, wurde curriculare Validität in Bezug auf die beiden hier einbezogenen Ausbildungskontexte angenommen. Die Ergebnisse bestätigen diese sowie die vermutete Lernwirksamkeit der deutschen und österreichischen Lehrerausbildung mit Blick auf das getestete pädagogische Wissen: In beiden Ausbildungskontexten ist ein statistisch signifikanter Wissenszuwachs bei Lehramtsstudierenden zwischen ihrem ersten und fünften Ausbildungssemester feststellbar, was die Hypothese zur ersten Fragestellung (H1) bestätigt und bisherige Ergebnisse aus Längsschnittstudien zum Erwerb von pädagogischem Wissen repliziert, insbesondere aus der LEK-Studie. Ferner zeigen sich höhere Zuwächse im Bereich des handlungsnahen Wissens (Dimension „Kreieren/Generieren von Handlungsoptionen“) bei österreichischen Studierenden im Vergleich zu den deutschen. Die unterschiedlich hohen Zuwächse können auf die unterschiedlichen schulpraktischen Lerngelegenheiten zurückgeführt werden, welche ihrerseits laut Angabe der Studierenden umfangreicher in Österreich sind als in Deutschland (vgl. Tab. 3). Dieses Ergebnis bestätigt damit unsere Hypothesen, dass mit dem österreichischen Lehrerbildungssystem (H2b) sowie ferner mithilfe proximaler Prädiktoren zur Erfassung der schulpraktischen Lerngelegenheiten (H3) der unterschiedlich hohe Wissenszuwachs im Bereich des „Kreierens/Generierens von Handlungsoptionen“ erklärt werden kann. Nicht belegen hingegen ließ sich die Vermutung (H2a), dass Lehramtsstudierende in Deutschland aufgrund des stärker akademisch geprägten Studiums im Bereich des konzeptuell-analytischen Wissens (Dimensionen „Erinnern“ und „Verstehen/Analysieren“) zu einem höheren Wissenszuwachs gelangten als österreichische Studierende. In unseren Stichproben gelangen sowohl die deutschen als auch die österreichischen Studierenden zu ähnlich hohen Wissenszuwächsen.

Die hier durchgeführten Analyseergebnisse können als wichtiger Beitrag zur Frage nach (fehlender) Wirksamkeit der Lehrerbildung gesehen werden, die sich gerade in den deutschsprachigen Ländern seit Jahren wiederkehrend stellt (u. a. Oser und Oelkers 2001; Blömeke 2004; Terhart 2012). Insbesondere die Kohärenz zwischen den beiden Ausbildungsorten Hochschule und Schulpraxis wird – bereits für die ersten Semester der Lehramtsausbildung an Universitäten bzw. Pädagogischen Hochschulen – als wichtige Voraussetzung für eine gelingende Verknüpfung zwischen Theorie und Praxis gesehen (KMK 2005). Unsere Ergebnisse deuten darauf hin, dass eine solche Kohärenz in Österreich eher gegeben ist als in Deutschland, jedenfalls mit Blick auf die Einschätzung der Studierenden, Theorien auf praktische Situationen beziehen zu können (Tab. 3) bzw. mit Blick auf die Veränderungswirkung dieser lernprozessbezogenen Dimension auf das handlungsnahe pädagogische Wissen (Tab. 7, M4). Dies lässt sich weiterführend im Zusammenhang betrachten mit Ergebnissen, die bereits in TEDS-M für die Situation angehender Mathematiklehrkräfte in Deutschland erbracht wurden, welche nämlich ihre Ausbildung im internationalen Vergleich besonders wenig kohärent erlebten (Hsieh et al. 2011).

Neben unterschiedlichen Ausbildungskontexten dürfte es außerdem auf der Individualebene angehender Lehrkräfte zu erheblichen Unterschieden in der Wahrnehmung schulpraktischer Lerngelegenheiten bzw. in der konkreten Nutzung durch die Studierenden kommen. Speziell im bildungswissenschaftlichen Begleitstudium (Lohmann et al. 2011) und in Schulpraktika (König 2012) besteht innerhalb von Ausbildungsgängen und Standorten Wahlfreiheit für Studierende. Professionstheoretische, sich in der curricularen Gestaltung niederschlagende Vorstellungen zur Lehrerbildung, z. B. als ein berufsbiographischer (Terhart 2011), „auf die Selbstverantwortung der Studierenden gerichteter Prozess“ (Messner und Posch 2010, S. 185), können die individualisierte Nutzung von Lerngelegenheiten durch die Studierenden zusätzlich verstärken. Auch dies kann als Erklärung für die aufgetretenen Zusammenhänge zwischen Lerngelegenheiten und Wissenszuwachs (Tab. 7) herangezogen werden.

Schließlich verdeutlichen die Ergebnisse, dass eine Differenzierung des pädagogischen Wissens in handlungsnahes und konzeptuell-analytisches von Bedeutung ist, um Lern- und Ausbildungsprozesse angehender Lehrkräfte sowie Wirkungsweisen von Ausbildungsprogrammen und ihren Charakteristika genauer beschreiben und analysieren zu können. Die alleinige Verwendung eines Gesamtscores pädagogischen Wissens in der vorliegenden Studie hätte von einer solchen Differenzierung abstrahiert. Ebenfalls stellt sich die Frage, ob Tests, die zum Beispiel aus forschungsökonomischen Gründen hauptsächlich geschlossene Testaufgaben einsetzen und auf die Verwendung von aufwändigen offenen Testaufgabenformaten (s. Abb. 5 und 6) verzichten, sensitiv für die besonderen Wirkungen von schulpraktischen Lerngelegenheiten in der Lehrerausbildung sind. Wiederholt wurde in den vergangenen Jahren verlangt, Testungen von Lehrerwissen stärker an ihrem Handeln in der Praxis zu orientieren (Shavelson 2010; Blömeke et al. 2015). Auch wenn weitere Möglichkeiten der Kompetenzmessung bestehen und derzeit genutzt werden (z. B. videobasierte Tests) scheint doch die Arbeit mit offenen und komplexen Testfragen im Rahmen eines Papier-Bleistift-Tests eine möglicher Weg zu sein, dieser Forderung zu begegnen.

7.2 Limitierungen

Als zentrale Limitierung unserer Studie ist die eingeschränkte Stichprobenqualität zu nennen, vor allem fehlende Repräsentativität für das jeweilige Land, aber auch eine niedrige Rücklaufquote in Deutschland zum zweiten Messzeitpunkt. Sollte entgegen den Ergebnissen unserer Drop-out Analyse doch eine positive Auslese an Studierenden vorliegen, könnte dies Varianz einschränken, d. h. möglicherweise wird das Niveau pädagogischen Wissens zum zweiten Messzeitpunkt in der deutschen Stichprobe überschätzt. Der Wissenszuwachs wäre demnach geringer als die hier erbrachten Ergebnisse zeigen. Da jedoch die Zuwächse in Österreich nicht geringer, sondern eher höher ausfallen, kann angenommen werden, dass mit einer höheren Stichprobenqualität die hier angetroffenen Unterschiede nicht geringer, sondern vermutlich sogar größer (zugunsten Österreichs) sein dürften. Dies ist als offene Frage für zukünftige Studien zu verstehen, denen es gelingt, eine Qualität von Länderstichproben nach den in TEDS-M vorliegenden Standards der IEA zu erreichen. Allerdings können die hier erzielten Ergebnisse dadurch etwas abgesichert werden, da sie die Ergebnisse der LEK-Studie relativ präzise replizieren, wenn auch für deutlich mehr Standorte. Im Falle der österreichischen Stichprobe konnte ebenfalls das Ergebnis aus einem früheren, quasi-längsschnittlichen Vergleich von König und Blömeke (2009b) nun anhand einer echten Längsschnittstichprobe mit mehreren Standorten repliziert werden, da der Leistungszuwachs in der vorliegenden Studie ähnlich hoch ausfällt wie der in der früheren Studie berichtete Mittelwertunterschied zwischen Studierenden des ersten und fünften Semesters.

Ferner ist die Erfassung von Lerngelegenheiten kritisch zu diskutieren, auch wenn mit dem verwendeten Instrument eine Verbesserung gegenüber früheren Instrumenten erzielt worden sein dürfte. Dies betrifft einerseits die Schwierigkeit, Inhalte einzelner Items unterschiedlicher Dimensionen besonders eindeutig voneinander abzugrenzen, andererseits neben einer Quantifizierung von Lerngelegenheiten auch ihrem multidimensionalen Charakter gerecht zu werden. Zumindest mit Blick auf die erste der fünf Skalen (Komplexität über forschungsmethodische Zugänge erkunden) wäre zukünftig eine extensivere Erfassung sinnvoll, um zu differenzierten Aussagen etwa zu den verschiedenen Formen forschenden Lernens (vgl. Schneider und Wildt 2009) zu gelangen.

7.3 Ausblick auf zukünftige Forschung

Die vorliegende Fragestellung zielte auf die Untersuchung des Wissenszuwachses in unterschiedlichen Ausbildungskontexten. Die in unserer Untersuchung für schulpraktische Lerngelegenheiten berichtete Variation sollte mithilfe weiterer Merkmale der Lehrerausbildungssysteme analysiert werden. Im Rahmen der EMW-Studie werden zahlreiche Maße zum intendierten und implementierten Curriculum erfasst, sodass weiterführende Analysen zum Einfluss konkreter Merkmale auf die Veränderung des pädagogischen Wissens durchgeführt werden. Weitere individuelle Eingangsvoraussetzungen (z. B. motivationale Merkmale) werden ebenfalls geprüft. Während in der vorliegenden Studie nur zwei Messzeitpunkte berücksichtigt werden konnten, stellt sich die Frage nach Verlaufsanalysen mit weiteren Messzeitpunkten. Hierfür wird im Herbst 2015 ein dritter Messzeitpunkt anvisiert. Während sich Lehramtsstudierende in Deutschland zu diesem Zeitpunkt im Master-Studium befinden, verfügt die Vergleichsstichprobe in Österreich über bis zu einem Jahr Berufserfahrung als voll berufstätige Lehrkraft. Inwieweit sich die hier beobachtbaren differenziellen Entwicklungen im handlungsnahen pädagogischen Wissen fortsetzen, ist eine Frage, die für die Gestaltung der Lehrerbildung, insbesondere mit Blick auf neue schulpraktische Bestandteile wie etwa das Praxissemester an deutschen Hochschulen, wichtige Implikationen birgt und somit zukünftig unter vergleichender Perspektive nicht nur von der EMW-Studie bearbeitet werden dürfte.