1 Einleitung

Die Qualität der Lehrerbildung und die damit einhergehende Frage der Professionalisierung von Lehrkräften wird derzeit in der nationalen und internationalen empirischen Bildungsforschung intensiv erforscht (Blömeke et al. 2004; Cochran-Smith und Zeichner 2005; Darling-Hammond 2000; Darling-Hammond et al. 2002; Terhart et al. 2011; Zlatkin-Troitschanskaia et al. 2009). Die Lehrerbildung in Deutschland ist in zwei getrennte, aufeinander folgende Phasen strukturiert. Es besteht weitgehend ein Konsens darüber, dass die universitäre Lehrerbildung analytisch-konzeptuell angelegt sei und durch die Vermittlung von berufsfeldbezogenem Wissen zu einem begrifflichen Verständnis des Berufsfeldes und der Berufstätigkeit führen soll. Die zweite praxisorientierte Phase findet im Vorbereitungsdienst (Referendariat) statt. Ihre zentrale Aufgabe ist es, die praktische Arbeit der angehenden Lehrkräfte an den Schulen zu begleiten und Handlungssicherheit zu schaffen. Hierbei steht die Vermittlung der praxisbezogenen Inhalte und das Erlangen der Fähigkeit zur Reflexion über die eigene unterrichtsbezogene Praxis im Vordergrund (s. Beutel et al. 2006; Ministerium für Innovation, Wissenschaft, Forschung und Technologie des Landes Nordrhein-Westfalen 2007; Terhart 2004).

Aktuelle Ansätze zur Professionalität im Lehrerberuf gehen davon aus, dass die Fähigkeit, qualitativ hochwertige Bildungsarbeit zu leisten, weniger eine Konsequenz von individueller Begabung als vielmehr das Ergebnis eines professionellen Entwicklungsprozesses ist (Baumert und Kunter 2006; Terhart 2001). Dabei besteht Konsens darüber, dass das professionsspezifische Wissen einen wichtigen Aspekt der professionellen Lehrerkompetenz darstellt. Eine wichtige Gelegenheit für den Aufbau dieser Kenntnisse stellt das universitäre Lehramtsstudium dar (Cochran-Smith und Zeichner 2005; Terhart 2006).

In Deutschland befindet sich die universitäre Lehrerbildung seit ca. 10 Jahren in einem grundlegenden Veränderungsprozess, der von der Umstellung auf Bachelor- und Masterstudiengänge im Zuge des Bologna-Prozesses und von der Umstellung von der Input- zur Output-Steuerung gekennzeichnet ist (Bauer et al. 2011). Das zeigt sich u. a. in der zunehmenden Orientierung auf Kompetenzen und Standards in der Lehrerbildung. So liegt mit der gemeinsamen Verabschiedung der Standards für die bildungswissenschaftlichen Anteile der Lehrerbildung von der Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (KMK) ein erster umfassender Ansatz vor, länderübergreifend Ziele und Wirkungserwartungen festzulegen (KMK 2004). Die Standards orientieren sich dabei überwiegend an Kompetenzen und nicht an curricularen Studieninhalten. Auf die Bedeutung der Standards sowie der Kompetenzmodelle im Rahmen der Lehrerbildung wird später ausführlicher eingegangen.

Die Struktur der universitären Lehrerbildung lässt sich anhand der etablierten Unterscheidung zwischen Fachwissen, fachdidaktischem und allgemein-pädagogischem Wissen nach Shulman (1986) beschreiben. Dabei stellen bildungswissenschaftliche Studienanteile neben den Fach- und fachdidaktischen Studienanteilen einen verbindlichen Bestandteil der universitären Lehrerbildung dar. In Abgrenzung zu Fachstudien bzw. fachdidaktischen Studien verwenden wir den Begriff „Bildungswissenschaften“ zur Bezeichnung der fachunspezifischen universitären Lehrerbildung mit den Themenschwerpunkten Erziehung und Bildung, Schule und Unterricht sowie Lernen und Sozialisation. Andere gängige Bezeichnungen für diese Studienanteile sind z. B. „erziehungswissenschaftliches Begleitstudium“ oder „Grundwissenschaften“. Hinsichtlich der praktischen Relevanz der bildungswissenschaftlichen Studienanteile lassen sich – im Sinne von Aeblis „Denken als Ordnen des Tuns“ (2001) – mindestens vier Dimensionen unterscheiden: Erstens sollen bildungswissenschaftliche Studienanteile im Lehramtsstudium zur begrifflichen Ordnung des Feldes und des professionellen Handelns beitragen. Zweitens sollen sie praktisches Handeln vorbereiten oder es anleiten. Drittens sollen sie zu einer gemeinsamen Fachsprache der Pädagogen als Voraussetzung professioneller Kommunikation und Reflexion beitragen. Schließlich sollen sie die Anschlussfähigkeit der (angehenden) Lehrkräfte an den wissenschaftlichen Diskurs über Lehren und Lernen sichern (Aebli 2001).

Die Lehrangebote der Bildungswissenschaften werden überwiegend von den Disziplinen Erziehungswissenschaft, Psychologie und Soziologie bereitgestellt (Rothland und Terhart 2010) und zum Teil auch von Philosophie und Politikwissenschaft. Vertreter(innen) dieser Disziplinen haben die Aufgabe, zusammenwirkend übergreifende relevante bildungswissenschaftliche Inhalte zu vermitteln. Dies stellt in der Praxis oft eine Herausforderung dar, da die beteiligten Disziplinen teilweise unterschiedliche theoretische und forschungsmethodische Traditionen verfolgen. Einer verlässlichen Bereitstellung eines Lehrangebots zu grundlegenden pädagogisch relevanten Themen steht oftmals der stark ausgeprägte Wahlcharakter der bildungswissenschaftlichen Studieninhalte im Wege (für die deutschsprachige Schweiz vgl. die Curriculum-Analyse von Krattenmacher et al. 2010; für Nordrhein-Westfalen vgl. Terhart et al. 2010). Aufgrund der hohen Wahlfreiheit seitens der Studierenden bei der Zusammenstellung der Veranstaltungen bestehen berechtigte Zweifel, ob bei der derzeitigen Organisation der bildungswissenschaftlichen Studien überhaupt von einem „eigenständigen genuinen Studiengang gesprochen werden kann“ (Terhart et al. 2010, S. 8).

Im universitären Lehramtsstudium werden wichtige theoretische Grundlagen für das Referendariat gelegt. Jedoch wird die Abstimmung zwischen erster und zweiter Phase seitens der (angehenden) Lehrkräfte (Steltmann 1986) wie auch seitens der Seminarleiter(innen) kritisiert (Ministerium für Innovation, Wissenschaft, Forschung und Technologie des Landes Nordrhein-Westfalen 2007).

Wie in den nächsten Abschnitten näher ausgeführt werden wird, besteht derzeit eine erhebliche Unsicherheit darüber, ob ein Konsens zwischen Vertreter(inne)n universitärer Fachdisziplinen und Phasen der Lehrerbildung bezüglich relevanter bildungswissenschaftlicher universitärer Themen erzielt werden kann. Diese Frage wurde in der hier beschriebenen Delphi-Studie mit Vertreter(inne)n aus der ersten und zweiten Phase der Lehrerbildung empirisch geprüft. Die Expert(inn)en bewerteten in einem mehrstufigen Verfahren die Bedeutung bildungswissenschaftlicher Themen für die universitäre Lehrerbildung bzw. für die Bewältigung des späteren Lehrerberufs. Auf den Ergebnissen dieser Bewertungen basiert die anschließende explorative Identifikation relevanter bildungswissenschaftlicher Inhalte im Lehramtsstudium.

2 Theoretischer Hintergrund

2.1 Bedeutung von Kompetenzmodellen und Rahmencurricula in der Lehrerbildung

Kompetenzmodelle und Rahmencurricula formulieren explizite Vorgaben an die bildungswissenschaftlichen Studienanteile der Lehrerbildung. Dabei sind die Kompetenzmodelle meist umfassender formuliert als die Rahmencurricula und erheben den Anspruch, die Struktur der mentalen Wissensrepräsentation abzubilden. Im Kontext der universitären Lehrerbildung werden Kompetenzen als „kontextspezifische kognitive Leistungsdispositionen verstanden, die sich funktional auf Situationen und Anforderungen in bestimmten Domänen beziehen“ (Klieme und Hartig 2008, S. 17). In der vorliegenden Arbeit steht das theoretische fachunspezifische bildungswissenschaftliche Wissen im Fokus, das sich spezifisch auf das Berufsfeld „Lehrer“ bezieht. In Einklang mit anderen Kompetenzmodellen gehen wir davon aus, dass es sich um Wissen handelt, dessen Aufbau maßgeblich von den angebotenen Lerngelegenheiten (z. B. in der Universität) sowie deren individuellen Nutzung seitens der Studierenden beeinflusst wird (Blömeke et al. 2010; Cochran-Smith und Zeichner 2005; Kunter et al. 2011a). Im Gegensatz zu Kompetenzmodellen, die die vorhandenen mentalen Repräsentationen widerspiegeln, versuchen die Rahmencurricula, die Struktur der Domäne thematisch zu definieren, indem zentrale Inhalte oder Studieneinheiten identifiziert werden. Sie beschreiben somit vorwiegend die Struktur der Lerngelegenheiten. Dabei versuchen sie meist Korrespondenz zum Berufsfeld herzustellen und argumentieren somit ebenfalls mit impliziten Wirkungsannahmen, entfalten aber keine Theorie der mentalen Wissensrepräsentation, wie dies in den Kompetenzmodellen der Fall ist.

Die vorliegenden normativen Kompetenzmodelle und Rahmencurricula für die bildungswissenschaftliche Lehrerbildung sind das Ergebnis eines Fachdiskurses, der unterschiedlich formalisiert wurde. Im Falle der KMK-Standards handelt es sich um eine Rekonstruktion des Fachdiskurses einer Arbeitsgruppe (KMK 2004) und im Falle der Oser-Standards um eine Quasi-Delphi-Studie (Oser und Oelkers 2001). Hinsichtlich der übergeordneten thematischen Struktur gibt es in beiden Entwürfen unterschiedliche Abgrenzungen, insgesamt liegt jedoch eine hohe Übereinstimmung vor. Dies gilt auch für die Rahmencurricula für Psychologie und Erziehungswissenschaft (vgl. Abschn. 2.4.1 und 2.4.2).

In dieser Arbeit wird die Überzeugung vertreten, dass für eine empirisch gehaltvolle operationalisierte Definition von Kompetenzen und deren Überprüfung sowohl eine thematische Strukturierung der Domäne als auch eine Vorstellung von den Lerngelegenheitsstrukturen des Wissenserwerbs notwendig ist. Eine hinreichende, hochschulübergreifende Stabilität der thematischen Struktur der Domäne und der Gelegenheitsstrukturen des Wissensaufbaus ist erforderlich, damit ein standortübergreifendes und nicht nur lokal gültiges Kompetenzmodell entwickelt und geprüft werden kann.

2.2 Kritik an bildungswissenschaftlichen Studienanteilen

Bildungswissenschaftliche Studienanteile stellen wichtige Lerngelegenheiten für den Aufbau der professionellen Lehrerkompetenz bereit. Vor dem Hintergrund der hohen normativen Erwartungen an diese Studienanteile steht die diesbezügliche Vermittlungsleistung der Universitäten vielfach in der Kritik. Die Kritik kommt sowohl von den Absolvent(inn)en der Studiengänge als auch von den Ausbilder(inne)n der zweiten Phase und lässt sich im Wesentlichen auf drei Punkte zusammenfassen.

Erstens wird in Bezug auf die aktuellen Studienangebote vielfach kritisiert, dass die normativen Vorgaben nicht im intendierten (beabsichtigten) bzw. implementierten (umgesetzten) Curriculum der Universitäten abgebildet sind. So zeigen Terhart et al. (2010), dass an vielen Standorten nicht alle KMK-Standards abgedeckt werden und dass vielerorts Studienangebote thematisch heterogen und zum Teil lückenhaft sind. Ein weiterer wesentlicher Kritikpunkt in Bezug auf das Studienangebot betrifft den ungenügenden Berufsfeldbezug in den bildungswissenschaftlichen Studienanteilen und somit deren mangelnde Domänenspezifität. Damit verbunden ist auch der kontinuierlich artikulierte Wunsch seitens der Absolvent(inn)en und (angehenden) Lehrkräfte, bereits im Studium deutlich mehr praxisbezogenes Wissen und entsprechende Fertigkeiten zu erwerben. Darüber hinaus wird den bildungswissenschaftlichen Anteilen des Studiums häufig auch eine geringe Qualität der Lehrveranstaltungen, mangelnde Systematik und nicht selten Beliebigkeit bzw. mangelnde Kumulativität der vermittelten Studieninhalte zugeschrieben (Lersch 2006; Merzyn 2002; Oesterreich 1987; Steltmann 1986; Ulich 1996). Diese Kritik geht mit der Vermutung einher, dass zwischen den Vertreter(inne)n der verschiedenen Domänen und Phasen der Lehrerbildung kein professioneller Konsens bzgl. der relevanten zu vermittelnden Inhalte vorliegt.

Zweitens ist das Verhältnis von fachwissenschaftlichen, fachdidaktischen und bildungswissenschaftlichen Anteilen im Studium nicht einheitlich geregelt. Deshalb schwankt der Anteil der bildungswissenschaftlichen Studien am Lehramtsstudium – je nach Bundesland und angestrebtem Lehramt – zwischen 5 und 20 % (für NRW s. Terhart et al. 2010). In den Analysen der PaLea-Studie (Bauer et al. 2010) von zwölf Universitäten (aus verschiedenen Bundesländern) wurde ebenfalls eine erhebliche Variabilität im Umfang der bildungswissenschaftlichen Studienanteile für das Gymnasiallehramt festgestellt (Bauer et al. 2012; vgl. dazu auch Abschn. 2.5).

Drittens wird die hohe Wahlfreiheit in den bildungswissenschaftlichen Studienanteilen kritisiert, die dazu führt, dass das Wahlverhalten bei der Veranstaltungsbelegung (und somit die Nutzung der zur Verfügung stehenden Angebote bzw. Lerngelegenheiten) seitens der Studierenden idiosynkratisch ist, d. h. dass diese dazu tendieren, den Stundenplan und nicht den kumulativen Kompetenzerwerb zu optimieren (Terhart et al. 2010). Diese große Wahlfreiheit der Veranstaltungen steht oftmals einem kumulativen, aufeinander aufbauenden Wissenserwerb im Lehramtsstudium im Wege (s. a. Lohmann et al. 2011).

Wenngleich die oben genannten Kritikpunkte die subjektive Wahrnehmung der Studierenden und Lehrkräfte vermutlich korrekt widerspiegeln, müssen dabei folgende theoretische und methodische Aspekte berücksichtigt werden, die mit den Selbstberichten aus Befragungen von Studierenden oder Lehrkräften assoziiert sind. Erstens implizieren Befragungen von Studierenden zur Relevanz verschiedener bildungswissenschaftlicher Themen für die zukünftige Arbeit an der Schule bzw. für die Vorbereitung auf den Lehrerberuf (z. B. Jäger und Behrens 1994), dass Studierende über eine hohe Expertise bezüglich der Lehrerbildung verfügen. Diese Annahme kann kritisch diskutiert werden, da die geäußerte Kritik seitens der Studierenden und (angehenden) Lehrkräfte zeigt, dass sie von der ersten Phase häufig die Vermittlung jener Kompetenzen erwarten, die erst in der zweiten Phase der Lehrerbildung im Vordergrund stehen. Ferner wird diese Bewertung durch die wahrgenommene Qualität der besuchten Lehrveranstaltungen beeinflusst. Zweitens werden in anderen Studien Studierende und/oder Lehrkräfte gebeten, ihre Kenntnisse oder ihre Fähigkeiten im Umgang mit verschiedenen Situationen einzuschätzen (z. B. Lersch 2006). In solchen Untersuchungen kann jedoch nur schwer berücksichtigt werden, inwiefern die Befragten dazu neigen, sozial erwünscht zu antworten. Zudem bleibt hierbei unklar, welche Bezugsnorm die Befragten bei ihrer Einschätzung heranziehen. So können die Befragten ihre Leistungen entweder mit anderen Personen vergleichen (interpersoneller Vergleich) oder bewerten, in welchem Kompetenzbereich sie selbst besser oder schlechter sind als in einem anderen (intrapersoneller Vergleich). Drittens kann beispielsweise bei Befragungen, in denen angehende oder erfahrene Lehrkräfte retrospektiv die Stärken und Schwächen des Lehramtsstudiums sowie die Bedeutung verschiedener Themenkomplexe aus dem Studium für ihre Arbeit an der Schule einschätzen (z. B. Oesterreich 1987; Steltmann 1986), der Einfluss von Erinnerungseffekten nicht ausgeschlossen werden. Diese Herausforderungen machen deutlich, dass Befragungen von Betroffenen nur begrenzt zur Beantwortung der Frage geeignet sind, welche Aspekte des bildungswissenschaftlichen Wissens besonders relevant für die spätere Bewältigung im Lehrerberuf sind.

Die genannten Kritikpunkte veranschaulichen, dass sich für das Lehramtsstudium deutliche Unterschiede zwischen den Universitäten sowohl innerhalb eines Bundeslandes als auch zwischen den Bundesländern zeigen. Durch die geringe Verbindlichkeit der Studieninhalte ist die Vergleichbarkeit des Studiums nicht gewährleistet. Eine höhere Vergleichbarkeit der bildungswissenschaftlichen Studienanteile ist jedoch aus drei Gründen erstrebenswert: Erstens erleichtert eine stärkere Vereinheitlichung der Studiengänge an verschiedenen Universitäten bzw. in verschiedenen Bundesländern die Anerkennung verschiedener Abschlüsse und den Wechsel des Studienortes. Zweitens kann nur so die Sicherung der Mindeststandards gewährleistet werden, d. h. die Überprüfung, ob die in den KMK-Standards geforderten Kenntnisse tatsächlich an den Universitäten vermittelt werden. Drittens ermöglicht eine höhere Vergleichbarkeit der Studienabschlüsse eine bessere Anschlussfähigkeit an das Referendariat, welches auf den Kenntnissen aufbaut, die an der Universität vermittelt werden.

Im Zusammenhang mit der mangelnden Vergleichbarkeit werden auch Vorwürfe über fehlende Erfolgskontrollen und Qualitätssicherung der universitären Lehre geäußert, so dass i. d. R. unklar bleibt, über welches Wissen die Studierenden am Ende der Lehramtsstudiums tatsächlich verfügen (für einen Überblick über die Kritik der Lehrerbildung vgl. Merzyn 2002; Ministerium für Innovation, Wissenschaft, Forschung und Technologie des Landes Nordrhein-Westfalen 2007).

Bemerkenswert ist jedoch, dass trotz dieser schwerwiegenden Kritik die grundsätzliche Bedeutsamkeit der Bildungswissenschaften nicht infrage gestellt wird. So zeigen empirische Studien, dass Studierende und (angehende) Lehrkräfte diesen Studienanteilen eine hohe Wichtigkeit zuschreiben (s. z. B. Lersch 2003).

2.3 Erfassung des pädagogisch-psychologischen Wissens mit standardisierten Testverfahren

Eine Möglichkeit, die mit dem Selbstbericht verbundenen methodischen Probleme zu vermeiden, bietet der Einsatz von standardisierten Leistungstests. In den letzten Jahren wurden unter anderem im Rahmen der Studien COACTIV (Kunter et al. 2011b) und TEDS-M (Tatto und Senk 2011) mehrere standardisierte Testverfahren zur Erfassung des allgemeinen pädagogisch-psychologischen Wissens entwickelt (König und Blömeke 2010; Seifert et al. 2009; Voss und Kunter 2011; Voss et al. 2011). In diesen Verfahren werden verschiedene theoretische Konzeptionen des pädagogisch-psychologischen Wissens vorgeschlagen. Pädagogisch-psychologisches Wissen ist ein wesentlicher Bestandteil des bildungswissenschaftlichen Wissens, umfasst jedoch ein vergleichsweise enges Themenspektrum. Beispielsweise fokussiert der Test von Voss et al. (2011) auf unmittelbar unterrichtsrelevante Wissensbestände, die primär pädagogisch-psychologisch fundiert sind (s. a. Voss und Kunter 2011). Die Autoren unterschieden hierbei zwischen Wissen über effektive Klassenführung, Unterrichtsmethoden, Leistungsbeurteilung, individuelle Lernprozesse sowie individuelle Besonderheiten von Schüler(inne)n. Ähnlich strukturiert ist auch der Test von König und Blömeke (2010), der zwischen folgenden Dimensionen unterscheidet: Strukturierung von Unterricht, Motivierung, Umgang mit Heterogenität, Klassenführung und Leistungsbeurteilung.

Die Studien, in denen die genannten Tests zum Einsatz gekommen sind (s. a. König und Seifert 2012), sind wertvoll, da sie belegen, dass zwischen (angehenden) Lehrkräften systematische Unterschiede im Wissen bestehen. Diese interindividuellen Wissensunterschiede variieren in Abhängigkeit vom gewählten Lehramtszugang und vom Fortschritt des Studiums und weisen auf die zentrale Rolle hin, die der universitären Phase der Lehrerbildung beim Aufbau der Wissensgrundlagen zukommt (Baer et al. 2011; Blömeke und König 2011; Kleickmann und Anders 2011; König 2010; Kunter et al. 2011a). Schließlich belegen die in der COACTIV-R-Studie berichteten positive Zusammenhänge zwischen pädagogisch-psychologischem Wissen und verschiedenen Aspekten der von den Schüler(inne)n eingeschätzten Unterrichtsqualität, dass pädagogisch-psychologisches Wissen der Lehrkräfte ein entscheidender Faktor für erfolgreiches praktisches Handeln ist (Voss und Kunter 2011; Voss et al. 2011).

Diese Studien sind jedoch aus zwei Gründen nur bedingt zur empirischen Prüfung der Struktur des bildungswissenschaftlichen Wissens geeignet: Zum einen werden nur jene Aspekte des universitären Wissens untersucht, die einen unmittelbaren Bezug zum Unterrichtsgeschehen haben, z. B. das Erfragen von Strategien zur Vermeidung oder Lösung von Disziplinproblemen. Zum anderen wird beispielsweise bei Voss et al. (2011) das Wissen in einer praxisnahen Form erfasst, die über universitäre Wissensinhalte hinausgeht, z. B. durch videobasierte Beobachtungen und Analysen von konkreten Klassensituationen. Unberücksichtigt bleibt bei diesen Studien einerseits die bildungstheoretische und bildungshistorische Einbettung der begrifflichen Erfassung von Unterricht und andererseits das gesamte Repertoire an Planungswissen, das die Allgemeine Didaktik mit ihren ordnenden Begriffsgerüsten zur Verfügung stellt. Gänzlich unbearbeitet sind bislang die Wissenskomponenten, die sich auf Systemfunktionen und Schulorganisation beziehen sowie auf die typischen Beratungs- und Konsultationsaufgaben von Lehrkräften innerhalb und außerhalb der Schule. Eine Analyse der Vorgaben in den KMK-Standards für Lehrerbildung zeigt bezüglich der theoretischen Ausbildungsabschnitte, dass diese Inhalte relevante Aspekte des bildungswissenschaftlichen Wissens darstellen. Die Anforderungen an die universitäre Phase werden darin hauptsächlich in Form von Kenntnissen formuliert, die sich neben den unterrichtsbezogenen Themen sowohl auf Erziehung-, Kommunikations- und Bildungstheorien als auch auf Grundlagen und Strukturen des Bildungssystems beziehen.

2.4 Forschungsstand zu zentralen Aspekten des bildungswissenschaftlichen Wissens

Wie bereits beschrieben, beinhalten bildungswissenschaftliche Studienanteile Themen aus unterschiedlichen Disziplinen, insbesondere aus Erziehungswissenschaft, Psychologie und Soziologie. Die Frage jedoch, welche Themen relevant für die Lehrerbildung sind, wird fast ausschließlich innerhalb der verschiedenen Disziplinen diskutiert. Um die Breite des bildungswissenschaftlichen Wissens angemessen abdecken zu können, wird im Folgenden zunächst eine Übersicht über bisherige Arbeiten aus Disziplinen gegeben, die an der Vermittlung des bildungswissenschaftlichen Wissens beteiligt sind.

2.4.1 Rolle der Erziehungswissenschaft in der Lehrerbildung

Traditionell gilt die Erziehungswissenschaft in der deutschsprachigen Literatur als die Bezugswissenschaft für Lehrerbildung (für einen historischen Abriss der Erziehungswissenschaft s. Merzyn 2002). Im Zuge der Verwissenschaftlichung des Lehramtsstudiums seit den 60er-Jahren wurde in der Literatur hauptsächlich die Berufsfeld- versus Wissenschaftsorientierung der Erziehungswissenschaft diskutiert sowie die Frage nach der Verschränkung zwischen Theorie und Praxis (s. z. B. Keuffer 2003; Mägdefrau und Schumacher 2001; Prondczynsky 2001). Vor ca. 10 Jahren wurde eine intensive Diskussion bezüglich eines Kerncurriculums für Erziehungswissenschaft geführt (s. z. B. Prondczynsky 1999; Vogel 1999; Wigger 2010). Die Deutsche Gesellschaft für Erziehungswissenschaft (DGfE) hat 2008 ein gemeinsames Kerncurriculum für das Studium der Erziehungswissenschaft im Rahmen des Lehramtsstudiums vorgeschlagen, in dem ein „gemeinsamer Kern an Studieninhalten“ festgeschrieben wird (DGfE 2008). Das DGfE-Kerncurriculum ist in Studieneinheiten gegliedert, die teils sehr heterogene – und über verschiedene Studieneinheiten hinweg – überlappende Themen abdecken. Als zentrale Themen werden u. a. genannt: Geschichte und Theorie der Erziehung und Bildung; qualitative und quantitative Forschungsmethoden; Bildungspolitik, Bildungsrecht und Bildungsorganisation; Entwicklung, Sozialisation, Lernen und Kompetenzanforderungen in pädagogischen Arbeitsfeldern.

Krattenmacher et al. (2010) haben eine umfassende Dokumentenanalyse der Modulbeschreibungen aller Lehrerbildungsinstitute in der deutschsprachigen Schweiz durchgeführt und ermittelten zentrale erziehungswissenschaftliche und didaktische Inhalte. Sie unterscheiden folgende Bereiche: Unterrichtsorientierung; Soziologie und Erziehung; Einführung in Erziehung/Pädagogik; Pädagogische Psychologie; Prinzipien der Instruktion/des Unterrichts; Klassenführung; Philosophie der Erziehung; Beurteilung und Messtheorien; erziehungswissenschaftliche Forschungsmethoden; Geschichte der Pädagogik und der Erziehungssysteme sowie Unterrichtsmedien und ihre Umsetzung. Die Besonderheit dieser Dokumentenanalyse besteht darin, dass eine deutliche Konkretisierung dieser Bereiche vorgenommen wurde, indem für alle Bereiche spezifische relevante Themen definiert wurden. Auffällig sind jedoch zum einen starke inhaltliche Überlappungen zwischen den Bereichen (z. B. für die Bereiche Unterrichtsorientierung, Prinzipien der Instruktion/des Unterrichts sowie Unterrichtsmedien und ihre Umsetzung) und zum anderen der variierende Differenzierungsgrad der einzelnen Bereiche. So ist der Bereich Klassenführung sehr eng definiert, während der Bereich Pädagogische Psychologie inhaltlich sehr heterogen ist. Einschränkend muss ergänzt werden, dass die Ergebnisse dieser Dokumentenanalyse zunächst nur für die deutschsprachige Schweiz gelten, in der das Lehrerbildungssystem einphasig strukturiert ist.

2.4.2 Rolle der (pädagogischen) Psychologie in der Lehrerbildung

Die Rolle der pädagogischen Psychologie für die Lehrerbildung wird national und international intensiv diskutiert (Anderson et al. 1995; Patrick et al. 2011; Peterson et al. 1990; Ruthemann 2004; Woolfolk Hoy 2000). Die deutschsprachige Diskussion um die Rolle der Psychologie in der Lehrerbildung thematisiert vorwiegend die Frage nach dem Spannungsverhältnis zwischen der Berufsfeld- und Wissenschaftsorientierung (Deutsche Gesellschaft für Psychologie s. DGPs 2008; Ruthemann 2004). Eine systematische Übersicht über relevante psychologische Themen findet sich in den Empfehlungen der Deutschen Gesellschaft für Psychologie für ein Rahmencurriculum der Psychologie in den Lehramtsstudiengängen (DGPs 2008). In diesen Empfehlungen werden vier curriculare Bereiche definiert: Lernen und Lehren; Entwicklung und Erziehung in sozialen Kontexten; Pädagogisch-psychologische Diagnostik und Evaluation sowie Intervention und Beratung. Innerhalb dieser vier curricularen Bereiche werden jeweils konkrete relevante Themen formuliert. Im Bereich „Lernen und Lehren“ z. B. wird zunächst zwischen kognitiven Grundlagen, motivationalen und emotionalen Voraussetzungen und sozialen und unterrichtlichen Bedingungen des Lernens und Lehrens unterschieden. Jeder dieser Aspekte wird zusätzlich durch konkrete Themen spezifiziert (beispielsweise „Wissenserwerb und Transfer“ als zentrales Thema für den Teilaspekt kognitiven Grundlagen). Analog dazu wird auch für die übrigen curricularen Bereiche ein breites Spektrum an insgesamt 64 konkreten relevanten Themen aufgespannt, zu deren Vermittlung die pädagogische Psychologie im Rahmen des Lehramtsstudiums beitragen kann.

2.4.3 Rolle der Soziologie in der Lehrerbildung

Bezüglich der Stellung der Soziologie in der Lehrerbildung bestehen in Deutschland große Unterschiede sowohl zwischen den Bundesländern als auch zwischen den Universitäten innerhalb der einzelnen Bundesländer (Oehler 2001). Nur verhältnismäßig wenige Arbeiten befassen sich mit der Bedeutung der Bildungssoziologie in der Lehrerbildung (Bernart 2007; Oehler 2001; Reid und Parker 1995; Schmeiser 2007). In den meisten Fällen handelt es sich um theoretische argumentative Aufsätze, die nicht empirisch untermauert werden (beispielsweise Kuehn 1983; Schmeiser 2007; Winkler 1981). Eine Ausnahme bilden die Befragungen und Dokumentenanalysen von Oehler (2001) über die wahrgenommene Rolle der Bildungssoziologie in der Lehrerbildung in Deutschland. Diese Analysen der Prüfungsordnungen ergaben, dass Soziologie an mehreren Universitäten nicht als Wahlfach zur Verfügung steht (Oehler 2001). Zu zentralen Themen in der Lehrerbildung, zu denen Bildungssoziologie beitragen kann, werden gezählt: soziokulturelle Heterogenität und Ungerechtigkeit; Methoden der empirischen Forschung; Professionalisierung des Lehrerhandelns; gesellschaftliche Entwicklung und sozialer Wandel (Krattenmacher et al. 2010; Oehler 2001; Schmeiser 2007).

2.4.4 Fazit zum Forschungsstand

Dieser kurze Abriss des aktuellen Forschungsstandes bezüglich der bildungswissenschaftlichen Themen in den Disziplinen Erziehungswissenschaft, Psychologie und Soziologie illustriert einige gravierende Mängel. Erstens wird anhand des breiten Themenspektrums der erziehungswissenschaftlichen Themen die Problematik des Begriffs „Erziehungswissenschaft“ deutlich. Offensichtlich umfasst dieser Begriff auch typische psychologische und soziologische Themen, sodass eine klare thematische bzw. inhaltliche Abgrenzung zwischen den Disziplinen selten möglich ist. Zweitens wird die Diskussion über relevante Themen i. d. R. nur innerhalb einer Disziplin geführt und ist meist theoretischer und nicht empirischer Natur. Drittens sind die vorliegenden Dokumentenanalysen von Modulhandbüchern und Prüfungsordnungen zwar hilfreich, da sie wertvolle Hinweise über den aktuellen Stand der Lehrerbildung liefern; sie sagen jedoch nichts darüber aus, welche weiteren Themen möglicherweise ebenfalls relevant sein könnten. Schließlich sind bei den meisten Studien die vorgegebenen Inhaltsbereiche so allgemein formuliert, dass offen bleibt, welche konkreten Themen diese Inhaltsbereiche umfassen (z. B. Lernprozesse, Schulorganisation).

Derzeit liegen keine Studien vor, die die Gesamtheit der relevanten bildungswissenschaftlichen Themen abdecken. Wilson et al. (2002, S. 193) schreiben in diesem Zusammenhang:

We found no research that directly assesses what teachers learn in their pedagogical preparation and then evaluates the relationship of that pedagogical knowledge to student learning or teacher behavior. […] Conducting research about pedagogical preparation is complicated. Pedagogical preparation means many things: instructional methods, learning theories, educational measurement and testing, educational psychology, sociology, and history.

2.5 Abstimmung zwischen der ersten und zweiten Phase der Lehrerbildung

In den KMK-Standards wird eine deutliche Trennung zwischen den Standards für die theoretischen und praktischen Ausbildungsabschnitte vorgenommen, die unterschiedliche Zielsetzungen der beiden Phasen widerspiegeln. Die Ergebnisse einer Umfrage von Reintjes (2006) zeigen, dass die Mehrheit der befragten Seminarleiter(innen) vom universitären Lehramtsstudium die Vermittlung von Basiswissen in folgenden Bereichen erwartet: Erziehungs- und Bildungstheorien, Entwicklungs- und Lerntheorien sowie Unterrichtskonzepte und didaktische Theorien und Modelle. Seitens der Seminarleiter(innen) werden im erziehungswissenschaftlichen Bereich deutliche Defizite der tatsächlichen Vorbildung gesehen: Nur 12 % der Referendar(inn)e(n) verfügen nach Ansicht der Seminarleiter(innen) über eine überdurchschnittliche Vorbildung, als zufriedenstellend werden die Kenntnisse von knapp 30 % der Referendar(inn)e(n) erachtet. Über 55 % werden dagegen ungenügende oder begrenzte Vorkenntnisse bescheinigt. Besonders geringe Kenntnisse seien im Bereich „Institutionen und Organisationsformen des Bildungswesens“ zu verzeichnen. Diese Ergebnisse verdeutlichen Schwachstellen bzgl. der Abstimmung zwischen den beiden Phasen der Lehrerbildung. Daher wird von vielen Expert(inn)en die Einführung verbindlicher Kerncurricula gewünscht, die die inhaltliche Anschlussfähigkeit zwischen den Phasen der Lehrerbildung ermöglichen (Beutel et al. 2006; Ministerium für Innovation, Wissenschaft, Forschung und Technologie des Landes Nordrhein-Westfalen 2007).

Derzeit liegt also weder eine anerkannte Theorie über die Struktur des bildungswissenschaftlichen Wissens vor noch besteht ein Konsens darüber, welche bildungswissenschaftlichen Themen für die universitäre Lehrerbildung besonders relevant sind. Erschwerend kommt hinzu, dass aktuell für die Bildungswissenschaften – im Vergleich zu den Fachwissenschaften inklusive Fachdidaktik – nur ein sehr begrenzter Anteil der Studienzeit vorgesehen ist. Wie hier in einem anderen Zusammenhang bereits erwähnt wurde, zeigen die Analysen von Terhart et al. (2010), dass in NRW der Studienanteil für die Bildungswissenschaften je nach Universität zwischen 5 und 20 % beträgt (Terhart et al. 2010). In der aktuellen Analyse für zwölf Universitäten aus der PaLea-Studie (Bauer et al. 2010) betrug der Umfang des Workloads der bildungswissenschaftlichen Studienanteile für das Gymnasiallehramt durchschnittlich 37,3 Credit Points (CP) und variierte zwischen 18 und 45 CP. Im Vergleich dazu sind für jede der zwei zu studierenden Fachwissenschaften im Durchschnitt 86 bzw. 88 CP veranschlagt (Bauer et al. 2012). Damit stehen einer großen und unübersichtlichen Menge an potenziell relevanten bildungswissenschaftlichen Themen, die im Studium behandelt werden können, stark begrenzte Studienzeitvorgaben für die Bildungswissenschaften gegenüber. Da die Themen bisher nur innerhalb der bildungswissenschaftlichen Fachdisziplinen isoliert voneinander betrachtet werden, ist es auf Grundlage bisheriger Studien schwer zu beurteilen, a) wie stark die Überschneidungen zwischen den Disziplinen in Bezug auf die vermittelten Themen tatsächlich sind und b) ob es Themenbereiche gibt, die vor dem Hintergrund der begrenzten für die Bildungswissenschaften vorgesehenen Studienzeit für die spätere Berufspraxis eine besonders hohe Priorität haben.

Czerwenka und Nölle (2011) plädieren für eine Änderung der Forschungsperspektiven in der Lehrerforschung. Sie schlagen Delphi-Studien als eine geeignete Methode zur „Identifizierung einer zentralen Wissensbasis für die erste Phase der Lehrerbildung vor“. Sie argumentieren, dass „diese Basis […] eine notwendige, aber nicht hinreichende Bedingung für die Ausbildung der Kompetenzen und Standards“ ist (S. 374). Dieser Ansatz wurde in der vorliegenden Delphi-Studie verfolgt, in der Experten aus verschiedenen Disziplinen und Phasen der Lehrerbildung die Wichtigkeit einer großen Anzahl an bildungswissenschaftlichen Themen beurteilt haben mit dem Ziel, einen disziplin- und phasenübergreifenden Konsens zu erzielen.

2.6 Merkmale der Delphi-Methode

Bei einer Delphi-Studie handelt es sich um eine spezielle, meist anonymisierte Form der Expertenbefragung, bei der bewusst auf eine Interaktion zwischen den Expert(inn)en verzichtet wird (Häder 2002; Linstone und Turoff 1975). Durch die Anonymisierung ist den Teilnehmer(inne)n nicht bekannt, welche weiteren Expert(inn)en sich an der Delphi-Studie beteiligen. Zudem erfolgt die Delphi-Befragung iterativ in mehreren Runden. Dabei werden die Ergebnisse aus der jeweils vorangegangenen Runde aufbereitet und den Teilnehmer(inne)n in der nachfolgenden Runde mit dem Ziel zurückgemeldet, zu einem stärkeren Gruppenkonsens zu gelangen (für eine ausführliche Beschreibung der Delphi-Technik vgl. Clayton 1997).

Ein Vorteil der Delphi-Methode besteht darin, dass durch die ausbleibende Interaktion der Expert(inn)en die unerwünschten negativen Effekte der direkten Gruppenarbeit (beispielsweise Minoritäten- und Majoritäteneinfluss, Konformitätsdruck) reduziert werden (Martorella 1991; Rowe et al. 1991). Der durch die Expertengruppe erreichte Konsens basiert auf wohl durchdachten Überzeugungen, da die Teilnehmer(innen) im Delphi-Prozess dazu aufgefordert werden, ihre Entscheidungen anhand der zurückgemeldeten Gruppenergebnisse aus der Vorrunde zu reflektieren. Schließlich ermöglicht die Delphi-Methode eine ökonomische Befragung von Expert(inn)en, die sich an verschiedenen geografischen Orten befinden (Murry Jr. und Hammons 1995).

In der Forschung zum Lehrerberuf und zur Lehrerbildung ist die Delphi-Methode u. a. in folgenden Projekten eingesetzt worden.

  1. 1.

    Oser und Oelkers (2001) haben zur Vorbereitung einer Absolventenbefragung über den Grad der Erreichung von Standards am Ende der Lehrerbildung in Anlehnung an die Delphi-Methodik eine dreistufige Expertendiskussion und -befragung durchgeführt. Diese führte zu 88 Standards für die Lehrerbildung, geordnet nach zwölf Standardgruppen.

  2. 2.

    Sahin (2010) ist mithilfe der Delphi-Methode der Frage nachgegangen, inwiefern der Lehrerberuf in der Primarstufe als eine Profession wahrgenommen wird.

  3. 3.

    Koster et al. (2005) haben eine Delphi-Studie zu den Anforderungen an Lehrerausbilder(innen) durchgeführt und konnten fünf Inhalts- bzw. vier Kompetenzbereiche identifizieren.

Die angeführten Studien zeigen, dass mithilfe der Delphi-Methode unter Einbezug von Expert(inn)en ein Konsens zu verschiedenen relevanten Fragen der Lehrerbildung erzielt werden kann.

3 Ziele und Fragestellungen

Im Rahmen des Projekts „Bildungswissenschaftliches Wissen und der Erwerb professioneller Kompetenz in der Lehramtsausbildung (BilWiss)“ (Terhart et al. 2012)Footnote 1 wurden in einer Delphi-Studie folgende Forschungsfragen untersucht:

  1. 1.

    Können sich Expert(inn)en aus verschiedenen Fachdisziplinen, die an der universitären Lehrerbildung beteiligt sind, vor dem Hintergrund des stark begrenzten Studienumfangs in den Bildungswissenschaften auf eine begrenzte Anzahl relevanter bildungswissenschaftlicher Themen einigen?

  2. 2.

    Kann diesbezüglich auch ein Konsens zwischen den Expert(inn)en aus der ersten und zweiten Phase der Lehrerbildung erzielt werden?

  3. 3.

    Welche bildungswissenschaftlichen Themen werden von der Mehrheit der Expert(inn)en aus beiden Phasen der Lehrerbildung als besonders relevant für die universitäre Lehrerbildung und die praktische Bewältigung des Berufs bewertet?

Zur Beantwortung dieser Fragen wurde im ersten Schritt eine thematische Rekonstruktion der bildungswissenschaftlichen Inhalte durch Dokumentenanalysen (Modulhandbücher, Lehreinheiten, Veranstaltungen, Lehrbücher) und eine Ordnung der potenziell relevanten Themen nach der Struktur von übergeordneten Inhaltsbereichen (im Sinne von Lerngelegenheiten) vorgenommen. Das Ergebnis dieses Prozesses war eine Themenliste, geordnet nach ermittelten Inhaltsbereichen. Eine alternative „bottom-up“-Vorgehensweise wäre gewesen, relevante Themen von den Expert(inn)en zu sammeln und diese dann im zweiten Schritt übergeordneten Bereichen zuzuordnen. Die von uns gewählte „top-down“-Vorgehensweise, d. h. die Extraktion von Themen aus vorliegenden Dokumenten und Lehrbüchern und Vorlage derselben, erschien uns für die Fragestellungen der vorliegenden Studie jedoch zweckdienlicher. Im zweiten Schritt wurden zur Validierung der Ausschöpfung der berücksichtigten Themen Expertenurteile eingeholt, mit der Möglichkeit weitere fehlende Themen zu nennen. Die Prüfung der Relevanz der identifizierten Themen erfolgte in drei Delphi-Runden unter Einbezug von Vertreter(innen) aus der ersten und zweiten Phase der Lehrerbildung.

Konkret wurde in der ersten Delphi-Runde untersucht, wie heterogen die Bewertungen bzgl. einer Vielzahl von bildungswissenschaftlichen Themen zwischen den Vertreter(inn)en aus verschiedenen Disziplinen und Phasen der Lehrerbildung sind. In der zweiten und dritten Delphi-Runde stand die Frage im Mittelpunkt, ob – angesichts der begrenzten vorgesehenen Studienanteile für die Bildungswissenschaften – ein Konsens zwischen diesen Expertengruppen erzielt werden kann. Sofern ein Konsens zwischen Vertreter(inne)n verschiedener Disziplinen und Phasen in der dritten Runde erzielt werden konnte, wurde im letzten Schritt, basierend auf Expertenbewertungen, ein Versuch unternommen, aus einer vorgegebenen Themenvielfalt diejenigen zentralen bildungswissenschaftlichen Themen zu systematisieren, die im Rahmen der bildungswissenschaftlichen Studien in der universitären Lehrerbildung vermittelt werden sollten.

Den Ansatzpunkt für die Entwicklung dieser Themenübersicht bildete dabei bewusst nicht die Beschreibung der Inhalte auf der Basis der an der Lehrerbildung beteiligten Disziplinen, sondern die Identifikation jener teils disziplinübergreifenden bildungswissenschaftlichen Themenkomplexe, die potentiell für die zukünftige Reflexion und Berufsausübung relevant sind. Die in der Delphi-Studie vorgelegte systematische Themenaufstellung berücksichtigt somit zum einen die wesentlichen spezifischen Inhalte aus den Fachdisziplinen und deckt zum anderen wesentliche Überschneidungspunkte zwischen den Disziplinen ab (s. Abschn. 4.2). In die Erarbeitung dieser Systematik wurden auch Urteile von Ausbilder(inne)n in der zweiten Phase der Lehrerbildung einbezogen.

4 Methoden

4.1 Stichprobe

Die Delphi-Studie wurde in NRW durchgeführt, da in diesem Bundesland zum Zeitpunkt der Befragung eine „natürliche“ experimentelle Variation bestand, derart, dass die eine Hälfte der lehrerbildenden Universitäten sich an einem Modellversuch zur konsekutiven Lehrerbildung (Bachelor-Master-System) beteiligte, während die andere Hälfte noch nach dem herkömmlichen grundständigen System ausbildete (Lohmann et al. 2011). Die Expertengruppe setzte sich zusammen aus Vertreter(inne)n der ersten und zweiten Phase der Lehrerbildung. 36 Universitätsprofessor(inn)en aus den Disziplinen Erziehungswissenschaft, Psychologie und Soziologie stellten die Expertengruppe der ersten Phase (davon 13 weiblich). Die zweiten Ausbildungsphase wurde von 13 Expert(inn)en vertreten (davon sieben weiblich). Die Verteilung der universitären Disziplinen im Panel bildet die Beteiligung der Disziplinen an der universitären Lehrerbildung ab. So ist der Expertenanteil aus der Erziehungswissenschaft mit 21 Personen am höchsten, während die Psychologie mit zwölf und die Soziologie mit drei Vertreter(inne)n repräsentiert waren. Innerhalb der Erziehungswissenschaft wurde zusätzlich darauf geachtet, dass alle relevanten Teilgebiete der Erziehungswissenschaft (Grundschulpädagogik, Didaktik etc.) vertreten sind. In Tab. 1 ist eine detaillierte Aufschlüsselung der Zusammensetzung der Expertengruppe dargestellt.

Ein entscheidendes Kriterium bei der Auswahl der Prof.(inn)en war langjährige Erfahrung und hohes Engagement in der Lehrerbildung. Einige Teilnehmer(innen) wurden durch einschlägige Expert(inn)en mit maßgeblichen Publikationen auf dem Gebiet der Lehrerbildung benannt, während andere Prof.(inn)en durch systematische Internetrecherchen der Webseiten der relevanten Universitäten in NRW rekrutiert wurden. Für die Teilnahme an der Studie erhielten die Expert(inn)en ein Honorar. Die rekrutierten Prof.(inne)n waren im Mittel 16,9 Jahre in der Lehrerbildung tätig (SD = 8,99 Jahre; Min = 5 Jahre; Max = 35 Jahre). Um die Repräsentativität der Expertenstichprobe für NRW zu gewährleisten, wurden Expert(inn)en aus allen Universitäten in NRW rekrutiert, die an der Lehrerbildung beteiligt sind (mit Ausnahme der Deutschen Sporthochschule Köln). Aus jeder Universität nahmen zwei bis fünf Vertreter(innen) an der Befragung teil. Bei mehreren Vertreter(inne)n aus einer Universität wurde darauf geachtet, Expert(inn)en aus verschiedenen Disziplinen zu gewinnen.

Expert(inn)en aus der zweiten Phase der Lehrerbildung wurden vom Ministerium für Schule und Weiterbildung des Landes NRW mit der Teilnahme an der Studie beauftragt. Unter den 13 Seminarleiter(inne)n betrug die mittlere Dauer der ausschließlichen Lehrtätigkeit an der Schule 9,3 Jahre (SD = 6,6 Jahre; Min = 1 Jahre; Max = 24 Jahre). Vier Seminarleiter(innen) hatten einen Grundschullehramtszugang erworben; drei einen Lehramtszugang an Haupt-, Real- und Gesamtschulen (HRGe); fünf hatten einen Lehramtszugang an Gymnasien und Gesamtschulen (GyGe); für eine Person lagen keine Angaben vor. Die mittlere Dauer der Tätigkeit in der Lehrerbildung bei den Seminarleiter(inne)n betrug 20,7 Jahre (SD = 9,3 Jahre; Min = 6 Jahr; Max = 36 Jahre). Den Teilnehmer(innen) war bekannt, welche Expert(inn)en an der Studie teilnahmen, während die Antworten der Einzelnen nicht transparent gemacht wurden.

Tab. 1 Zusammensetzung des Expertenpanels

4.2 Themenauswahl für die Delphi-Studie

Zunächst wurde vom Forschungsteam eine Vorstrukturierung potenziell relevanter Inhalte der Bildungswissenschaften vorgenommen. Wichtige Grundlagen hierfür bildeten die bildungswissenschaftlichen Standards der KMK (2004), die Empfehlungen der DGfE (2008) und der DGPs (2008) für die Rahmencurricula sowie die Analyse der auf die Bildungswissenschaften im Lehramtsstudium bezogenen Studienordnungen und Modulhandbücher an allen Universitäten in NRW (s. Terhart et al. 2010). Auf Basis dieser Analysen wurden neun, zum Teil disziplinübergreifende Inhaltsbereiche definiert, die mit einem übergeordneten Schlagwort benannt sind, um die potenziell relevanten Inhalte pragmatisch vorzustrukturieren. Im Anschluss daran wurden für die Inhaltsbereiche relevante Themen identifiziert, die auf einem mittleren Abstraktionsniveau formuliert wurden. Die Identifikation dieser Themen erfolgte durch die Sichtung von Modulhandbüchern sowie einschlägigen erziehungswissenschaftlichen, psychologischen und soziologischen Lehrbüchern. Insgesamt wurden 213 bildungswissenschaftliche, potenziell für den Lehrerberuf bedeutsame Themen formuliert und den neun Inhaltsbereichen zugeordnet. Bei der Formulierung der meisten Themen wurden in Klammern erklärende Beispiele für aufgeführte Theorien oder Methoden genannt. Ein Beispiel für ein Thema aus dem Bereich „Unterricht“ ist „Methodische Formen des Unterrichts (z. B. direct instruction, problemorientierter Ansatz)“. Ein Thema aus dem Bereich „Bildungstheorie“ lautet z. B. „Ethik pädagogischer Berufe (Leitbilder, offizielle Berufsethiken, Standards der Berufsausübung etc.)“.

Die Anzahl der Themen verteilt sich folgendermaßen auf die neun Inhaltsbereiche (vgl. auch Tab. 2):

  • Unterricht (61 Themen)

  • Lehrerberuf (29 Themen)

  • Bildungssystem und Schulorganisation (26 Themen)

  • Bildungstheorie und Bildungsgeschichte (30 Themen)

  • Entwicklungsprozesse (13 Themen)

  • Lernprozesse (17 Themen)

  • Sozialisationsprozesse (12 Themen)

  • Heterogenität und soziale Konflikte (12 Themen)

  • Diagnostik und Evaluation (13 Themen)

Bei dieser Zusammenstellung handelt es sich um ein vorläufiges Inventar zentraler Themen des bildungswissenschaftlichen Studienanteils. Da das Unterrichten die primäre Aufgabe der Lehrkraft darstellt (Rothland und Terhart 2007), wurden für den Inhaltsbereich „Unterricht“ doppelt bis viermal so viele Themen vorgegeben wie für andere Bereiche, um eine feinere Differenzierung zu erzielen.

Um sicherzustellen, dass möglichst alle relevanten Themen berücksichtigt wurden, hatten die Teilnehmenden die Möglichkeit, weitere Themen zu nennen, die sie als Expert(inn)en für die Lehrerausbildung als notwendig erachteten. Dass in der ersten Delphi-Runde keine zusätzlichen Themen ergänzt wurden, kann als ein deutlicher Hinweis interpretiert werden, dass die Auswahl der vorgegebenen Themen erschöpfend gewesen ist.

4.3 Erste Delphi-Runde

In der ersten Delphi-Runde hatten die Expert(inn)en die Aufgabe, die Relevanz für jedes der 213 Themen einzuschätzen im Hinblick auf folgende vier Antwortdimensionen: a) den bildungswissenschaftlichen Fachbezug, b) das Verständnis des Berufsbilds „Lehrer(in)“, c) die Reflexion des Handelns als Lehrkraft sowie d) das praktische Handeln als Lehrkraft. Neben der Handlungsrelevanz wurde in dieser Initialrunde explizit berücksichtigt, dass eine wesentliche Aufgabe der Universität u. a. darin besteht, wissenschaftliches Verständnis für die Disziplin zu vermitteln. Mit dem Fokus auf diesen „bildungswissenschaftlichen Fachbezug“ soll die Wichtigkeit des jeweiligen Themenbereiches für den Anschluss an die jeweilige Disziplin beurteilt werden. Die Bewertung bzgl. der vier oben genannten Aspekte erfolgte auf einer 3-stufigen Skala (1-verzichtbar; 2-nützlich; 3-unverzichtbar). Abbildung 1 stellt einen Fragebogenausschnitt für alle drei Runden dar, am Beispiel des Inhaltsbereichs „Lernprozesse“.

Abb. 1
figure 1

Auszug aus den Fragebögen in der ersten (a), zweiten (b) und dritten (c) Delphi-Runde

4.4 Zweite Delphi-Runde

Während in der ersten Runde die Wichtigkeit aller Themen eingeschätzt wurde, hatten die zweite und die dritte Runden die Reduktion der vorgegebenen Themen zum Ziel. Die zweite Runde unterschied sich von der ersten in zwei wesentlichen Punkten. Zum einen wurde die Fragestellung dahingehend modifiziert, dass die Expert(inn)en eine bestimmte vorgegebene Anzahl an Themen in jedem Inhaltsbereich auswählen sollten. Zum anderen sollten die Themen nun hinsichtlich zweier Aspekte ausgewählt werden: a) „Relevanz für die universitäre Lehrerbildung“ und b) „Relevanz für die praktische Bewältigung der Lehrertätigkeit“. Diese Aspekte wurden in zwei verschiedenen Teilen des Fragebogens bewertet. Im ersten Teil des Fragebogens sollten Themen ausgewählt werden, die zentrale Kerninhalte darstellen und sich im Rahmen eines bestimmten Umfangs an CP in der universitären Lehrerbildung behandeln lassen.Footnote 2 Die Einführung dieser realistischen Rahmenbedingung motivierte die Expert(inn)en dazu, bei ihrer Bewertung der Relevanz der Themen den eng begrenzten Umfang der bildungswissenschaftlichen Studien zu berücksichtigen und klar zu priorisieren. Im zweiten Teil sollte eine vorgegebene Anzahl an Themen hinsichtlich ihrer Relevanz für die praktische Bewältigung der Lehrertätigkeit ausgewählt werden (s. Abb. 1). In Tab. 2 ist dargestellt, a) wie viele Themen für die einzelnen Inhaltsbereiche vorgegeben waren und b) wie viele Themen in der zweiten (und dritten) Delphi-Runde pro Inhaltsbereich ausgewählt werden sollten.

Tab. 2 Übersicht über die Anzahl der auszuwählenden Themen je Inhaltsbereich

Als Rückmeldung wurden die Expert(inn)en zu jedem Thema darüber informiert, wie das Thema für die universitäre Lehrerbildung bzw. für die praktische Bewältigung der Lehrertätigkeit durchschnittlich in der Vorrunde bewertet worden war. Diese Bewertungen wurden wie folgt ermittelt: Der Wert für die Beurteilung der Themen hinsichtlich der „Relevanz für die universitäre Lehrerbildung“ wurde berechnet als durchschnittliche Bewertung des jeweiligen Themas über alle vier Aspekte des Lehrerberufs in der ersten Runde hinweg. Der Wert für die Bewertung hinsichtlich der „Relevanz für die praktische Bewältigung der Lehrertätigkeit“ ergab sich aus dem Mittelwert für die Aspekte „Reflexion des Handelns als Lehrkraft“ und „praktisches Handeln als Lehrkraft“. Die rückgemeldete Berechnung der Ergebnisse aus der ersten Runde erfolgte getrennt für Universitätsprofessor(inn)en und Seminarleiter(innen). Zur Verdeutlichung der Relevanz wurden die Themen in absteigender Reihenfolge der Bewertung aus der ersten Runde dargeboten.

4.5 Dritte Delphi-Runde

Die dritte Delphi-Runde wurde analog zur zweiten durchgeführt mit dem Ziel, einen Konsens zwischen den Expert(inn)en der ersten und zweiten Phase zu erzielen. Der Fragebogen entsprach im Wesentlichen dem aus der zweiten Runde mit dem Unterschied, dass in dieser Runde angegeben wurde, welcher Prozentsatz des Expertenpanels das jeweilige Thema in der zweiten Runde ausgewählt hatte. Die Expert(inn)en erhielten zudem eine individuelle Rückmeldung, ob sie das jeweilige Thema zuvor selbst gewählt hatten oder nicht, um durch die Erinnerung die reflektierte Auseinandersetzung zu unterstützen (s. Abb. 1). Die Ergebnisse für die Expert(inn)en aus den beiden Lehrerbildungsphasen wurden im Gegensatz zur vorangegangenen Runde nicht separat, sondern als zusammengefasste Werte zurückgemeldet. Die Darbietungsreihenfolge der Themen ergab sich aus der Priorisierung der Themen in der gesamten Expertengruppe. Auch in dieser Runde wurden die Themen in Bezug auf die Relevanz für die universitäre Lehrerbildung bzw. für die praktische Bewältigung der Lehrertätigkeit getrennt gewählt.

4.6 Messung der Übereinstimmung

Die Übereinstimmung zwischen den Expert(inn)en wurde in der ersten Runde anhand des „Average Deviation Index“ beurteilt (Burke und Dunlap 2002; Burke et al. 1999). Die Berechnung des ADM-Index basiert auf den Abweichungen der einzelnen Beurteiler(innen) vom Gruppenmittelwert und stellt die mittlere Abweichung einer Gruppe von Urteiler(inne)n vom Mittelwert des jeweiligen Themas dar (s. a. Lüdtke et al. 2006). Von einer praktisch bedeutsamen Übereinstimmung in einer Gruppe wird gesprochen, wenn der empirisch ermittelte ADM-Wert kleiner als die kritische Grenze von A/6 ist, wobei A die Anzahl der Wahlmöglichkeiten symbolisiert. Für die erste Delphi-Runde bedeutet dies konkret, dass ADM-Werte kleiner oder gleich 3/6 = 0,50 für eine akzeptable Übereinstimmung zwischen den Expert(inn)en sprechen.

Die Übereinstimmung in der zweiten und dritten Runde wurde aufgrund des nominalen Datenniveaus mittels des verallgemeinerten Fleiss’ Kappa Indexes für mehrere Beurteiler(innen) berechnet (Fleiss 1971). Die Bewertung der Güte bzw. der Signifikanz der Übereinstimmung erfolgt anhand eines z-Wertes, in dessen Berechnungsvorschrift die erwartete Zufalls- und die beobachtete Übereinstimmung zueinander in Bezug gesetzt werden.

5 Ergebnisse

In diesem Abschnitt werden die zentralen Ergebnisse der Delphi-Studie vorgestellt. Vorweg sollen zwei wesentliche Befunde hervorgehoben werden. Wie bereits vorweggenommen, ist ein wesentliches Ergebnis, dass von den Expert(inn)en keine Themen ergänzt wurden. Dieser Befund spricht dafür, dass die vorgegebene Themenliste erschöpfend war. Ein weiteres bemerkenswertes Ergebnis ist, dass in der ersten Delphi-Runde nahezu alle der 213 vorgegebenen Themen mit „nützlich“ oder „unverzichtbar“ bewertet wurden (s. Tab. 4Footnote 3). Dieses Ergebnis verdeutlicht die hohe Bedeutung, die den bildungswissenschaftlichen Studienteilen zugeschrieben wird.

Im folgenden Abschnitt wird der Vergleich zwischen den Disziplinen innerhalb der universitären Lehrerbildung thematisiert. Anschließend steht der Vergleich der beiden Phasen der Lehrerbildung im Vordergrund. Auf der Grundlage dieser Ergebnisse wird abschließend ein Versuch unternommen, relevante bildungswissenschaftliche Themen zu identifizieren.

5.1 Vergleich zwischen den an der universitären Lehrerbildung beteiligten Disziplinen

In Tab. 3 sind die durchschnittlichen Bewertungen der ersten Delphi-Runde für alle Inhaltsbereiche für die Expert(inn)en aus verschiedenen Disziplinen dargestellt. Die Erziehungswissenschaftler(innen) schätzen im Mittel die Themen etwas höher ein als die Psycholog(inn)en und Soziolog(inn)en. Die mittleren Bewertungen der Inhaltsbereiche – im Durchschnitt über alle Themen – unterscheiden sich in der MANOVA-Analyse (Overall-Test F(18,50) = 3,216; p = 0,001) statistisch signifikant zwischen den universitären Fachdisziplinen für folgende vier Inhaltsbereiche: „Bildungstheorie“ (F(2) = 6,657; p = 0,004), „Entwicklungsprozesse“ (F(2) = 3,876; p = 0,031), „Heterogenität“ (F(2) = 9,297; p = 0,001) und „Sozialisationsprozesse“ (F(2) = 6,809; p = 0,003). Für die übrigen fünf Inhaltsbereiche zeigen sich keine statistisch signifikanten Unterschiede zwischen den Disziplinen.

Tab. 3 Mittlere Bewertung der Themen in den Inhaltsbereichen und ADM für die Urteilerübereinstimmung in der ersten Delphi-Runde

Um deutlicher nachvollziehen zu können, wodurch die Unterschiede in den durchschnittlichen Bewertungen der Inhaltsbereiche zustande kommen, wurde eine MANOVA für alle 213 Themen berechnet. Dabei war der Overall-Test für MANOVA (mit Korrektur für Mehrfachtestung) nicht signifikant (F(54,4) = 0,686; p = 0,772). Signifikante Unterschiede zwischen den Disziplinen wurden unter Berücksichtigung der Bonferroni-Korrektur nur für 26 von 213 Themen (12,2 %) gefunden. Sie spiegeln weniger inhaltliche Profile wider, sondern sind im Wesentlichen der Tatsache geschuldet, dass Erziehungswissenschaftler(innen) insgesamt dazu tendieren, alle Themen etwas höher zu bewerten als Vertreter(innen) der Psychologie und Soziologie. 23 dieser Themen werden von dieser Expertengruppe höher bewertet als von Prof.(inn)en anderer Disziplinen. Neun dieser 23 Themen gehören zum Bereich „Bildungstheorie“, welcher hauptsächlich typische erziehungswissenschaftliche Themen beinhaltet. Die erste Ausnahme in diesem Bewertungsmuster stellt das Thema „Wissenstransfer“ im Bereich „Lernprozesse“ dar, welches von den Erziehungswissenschaftler(inne)n signifikant niedriger bewertet wird als von den anderen Gruppen. Die zweite Ausnahme bilden die Themen „Pädagogische Professionalität“ und „Leistungs- und Verhaltensbeurteilung“, welche von den Soziolog(inn)en deutlich geringer eingeschätzt werden als von den beiden anderen Expertengruppen.

Zur Ermittlung der Übereinstimmung in der Gesamtgruppe bzw. in den Teilgruppen wurde der ADM-Index berechnet (s. Tab. 3). Werte kleiner oder gleich 0,50 indizieren eine ausreichend hohe Übereinstimmung. Über alle Themen hinweg gelangten die Expert(inn)en der universitären Phase zu einer zufriedenstellenden Übereinstimmung (ADM = 0,50). Der Befund, dass die Übereinstimmung in kleineren Gruppen (beispielsweise für die Gruppe der drei Soziolog(inn)en) höher ist als in größeren Gruppen (etwa für die Gruppe der 20 Erziehungswissenschaftler(innen), stimmt mit Ergebnissen aus weiteren Studien zum ADM-Index überein (vgl. Burke und Dunlap 2002; Lohse-Bossenz et al. im Druck). Die Ergebnisse verdeutlichen weiterhin, dass für einzelne Inhaltsbereiche, wie z. B. „Bildungstheorie“, eine höhere Übereinstimmung vorliegt als für andere, wie z. B. „Entwicklungsprozesse“. Da die Übereinstimmung zwischen den universitären Disziplinen hinreichend hoch ist und die gefundenen Unterschiede hauptsächlich durch die allgemeine Tendenz seitens der Erziehungswissenschaftler zu positiverer Einschätzung zustande kommen, wurden die Ergebnisse in der zweiten und dritten Delphi-Runde für alle Vertreter(innen) der ersten Phase zusammengefasst.

5.2 Vergleich der ersten und zweiten Phase der Lehrerbildung

5.2.1 Erste Delphi-Runde

Betrachtet man die durchschnittlichen Bewertungen der Expert(inn)en aus den beiden Lehrerbildungsphasen für alle Inhaltsbereiche in der MANOVA-Analyse (Overall-Test F(9,38) = 3,494; p = 0,003), so zeigen sich signifikante Unterschiede nur für zwei Inhaltsbereiche: Lernprozesse und Heterogenität, wobei diese beiden Bereiche von den Seminarleiter(inne)n signifikant höher bewertet werden als von den Prof.(inn)en. Bezüglich der Beurteilerübereinstimmung fällt auf, dass Seminarleiter(innen) eine höhere Übereinstimmung (und damit einen kleineren ADM-Wert) aufweisen als Universitätsprofessor(inn)en, was vermutlich auf die homogenere Stichprobenzusammensetzung für die zweite Phase zurückzuführen ist.

In Tab. 4 sind die mittleren Bewertungen aus der ersten Runde für alle 213 Themen in allen neun Inhaltbereichen separat für die Expert(inn)en der beiden Lehrerbildungsphasen dargestellt. Die Themen werden von den Prof.(inn)en und Seminarleiter(inn)en überwiegend ähnlich beurteilt, es treten aber auch einige Unterschiede auf. In der MANOVA für alle 213 Themen zeigen sich im Overall-Test (mit Korrektur für Mehrfachtestung) keine signifikanten Unterschiede zwischen der ersten und zweiten Phase (F(39,1) = 1,219; p = 0,629). Im Zwischensubjekttest treten signifikante Unterschiede für lediglich 33 der 213 Themen auf (15,5 %). Auffällig hierbei ist, dass 14 der 33 Themen dem Bereich „Unterricht“ zugeordnet sind und dass alle diese Themen mit einer Ausnahme („Forschung zu Unterrichtsmethoden“) von den Seminarleiter(inne)n höher bewertet werden als von den Prof.(inn)en. In den Ergebnissen zeigt sich insgesamt der Trend, dass bildungsorganisatorische Themen wie „Organisationsmodelle“ und andere eher theoretische Themen wie „Geschichtliche Entwicklung des Lehrerberufs“ oder „Entwicklung der Erziehungswissenschaft als wissenschaftliche Disziplin“ von Prof.(inn)en bedeutsamer eingeschätzt werden. Stark unterrichtsbezogene Themen aus den Bereichen „Heterogenität“ und „Unterricht“ hingegen (beispielsweise „Heterogenität bzgl. des sozialen Hintergrunds“ oder „Lehrpläne/fachbezogene Bildungsstandards“) werden von Seminarleiter(innen)n höher bewertet. Diese Unterschiede spiegeln vermutlich den stärker ausgerichteten Fokus der Seminarleiter(innen) auf die praxisbezogenen Inhalte der Lehrerbildung wider.

Fazit:

Bereits in der ersten Delphi-Runde lag eine gute Übereinstimmung zwischen den Expert(inn)en beider Phasen vor. Viele der genannten Themen wurden als relevant eingeschätzt und erste Tendenzen wurden sichtbar, welchen Themen eine besonders hohe Relevanz zugesprochen wird. Es erscheint jedoch unrealistisch, dass alle diese Themen in der Praxis vermittelt werden können, berücksichtigt man die verbindlichen Leistungspunktvorgaben für das bildungswissenschaftliche Studium im Rahmen des Lehramtsstudiums. Daher wurde in der zweiten und dritten Delphi-Runde eine Reduktion dieser Themen bzw. Priorisierung der Themen unter der Berücksichtigung der realen Zeitbeschränkungen angestrebt.

5.2.2 Zweite Delphi-Runde

In Tab. 4 (s. Anmerkung 3) sind die Ergebnisse der zweiten Runde für die Themenauswahl für alle 213 Themen in allen neun Inhaltbereichen für beide Antwortdimensionen dargestellt – separat für Prof.(inn)en und Seminarleiter(innen). Aufgeführt sind die prozentualen Wahlhäufigkeiten, d. h. von wie viel Prozent der Expert(inn)en dieses Thema gewählt wurde.

Über alle Themen hinweg ist eine klare Gesamttendenz erkennbar: Das betrifft die Schwerpunktsetzung bestimmter Themen (z. B. „Sozialformen des Unterrichts“ im Inhaltsbereich „Unterricht“) als auch das Nichtwählen bestimmter Themen (z. B. „Gesellschaftsentwicklung und Schulsystemwandel“ im Inhaltsbereich „Bildungstheorie“). Für einige Themen traten jedoch Unterschiede zwischen der Bedeutung für das universitäre Studium und der Bedeutung für die Praxis auf. Bestimmte Themen wurden nur hinsichtlich der Relevanz für die universitäre Bildung ausgewählt (z. B. „Struktur des Bildungssystems“ aus dem Inhaltsbereich „Bildungssystem“), während andere Themen nur hinsichtlich der Relevanz für die Praxis gewählt wurden (z. B. „Techniken des Stressmanagements“ aus dem Inhaltsbereich „Lehrerberuf“).

Die Wahlhäufigkeiten für die Mehrheit der Themen waren für die Prof.(inn)en und Seminarleiter(innen) ähnlich. Signifikante Unterschiede zwischen erster und zweiter Phase traten nur für 49 von 426 möglichen Themenwahlhäufigkeiten (11,5 %) in den Chi-Quadrat-Tests für einzelne Themen auf. So wurden theoretische Themen wie „Modelle der Lehrer-Schüler-Interaktion“, „Forschung zu Unterrichtsmethoden“, „Unterricht als soziale Situation (Sozialpsychologie des Unterrichts)“ oder „Deskriptive Statistik“ von den Prof.(inn)en deutlich häufiger gewählt als von den Seminarleiter(inne)n. Andere – stärker praxisbezogene – Themen wie „Beratung von Schülern (und Eltern)“, „Leistung und Leistungsprinzip an der Schule“, „Selbstevaluation/Fremdevaluation des Unterrichts“ oder „Gesprächsführung und Fragenformate“ wurden hingegen häufiger von Seminarleiter(inne)n gewählt. Diese Unterschiede verdeutlichen den stärker theoretisch ausgerichteten Blick der Universitätsprofessor(inn)en auf die Inhalte der universitären Lehrerbildung. In der Tab. 4 sind alle Themenwahlhäufigkeiten gekennzeichnet, die sich zwischen den beiden Phasen signifikant unterscheiden. Für einen Konsens über alle 213 Themen in der gesamten Expertengruppe spricht auch der Fleiss‘ Kappa Index, der sowohl für die Relevanz des universitären Studiums (K = 0,338; z = 168,83; p < 0,001) als auch für die Praxis (K = 0.375; z = 187.17; p < 0,001) statistisch signifikant ist.

Fazit:

Trotz vereinzelter Unterschiede liegt bezüglich der Mehrheit der Themen ein vergleichbares Antwortverhalten vor, das auf einen Konsens zwischen den beiden Phasen hindeutet. Daher wurden den Expert(inn)in in der letzten Delphi-Runde die über die beiden Phasen gemittelten Bewertungen zurückgemeldet mit dem Ziel, in der dritten Runde einen phasenübergreifenden Konsens zu erzielen.

5.2.3 Dritte Delphi-Runde

Tabelle 4 zeigt die Auswahlhäufigkeiten in der dritten Runde für alle 213 Themen – getrennt für die Antwortdimensionen „Relevanz für die universitäre Lehrerbildung“ und „praktische Bewältigung der Lehrertätigkeit“. Ein wesentliches Ergebnis der dritten Runde war die zunehmende Konsensbildung innerhalb des Expertenpanels, die sich folgendermaßen äußerte: Themen, die in der zweiten Runde von vielen Expert(inn)en ausgewählt wurden, erhielten in der dritten Runde eine noch deutlichere Mehrheit der Panelmitglieder (z. B. „Neue Steuerung/Educational Governance“ im Inhaltsbereich „Bildungssystem und Schulorganisation“). Themen mit seltener Nennung in der zweiten Runde wurden in der dritten Runde noch seltener gewählt (z. B. „Wissenstransfer“ im Inhaltsbereich „Lernprozesse“).

In dieser letzten Delphi-Runde traten signifikante Unterschiede zwischen erster und zweiter Phase nur noch für 29 von 426 Themen (6,8 %) in den Chi-Quadrat-Tests für einzelne Themen auf. Unterschiede zwischen den Phasen blieben bestehen für eher theoretische Themen wie „Theorien und Forschungsansätze zum Lehrerberuf“ und „Unterricht als soziale Situation“, die von Prof.(inn)en häufiger gewählt werden. Eher praxisbezogenen Themen wie „Regeln und Routinen des Unterrichts/Schullebens“, “Balancierung von Lern- und Leistungssituationen“ und „Leistung und Leistungsprinzip in der Schule“ hingegen wurden erneut signifikant häufiger von den Seminarleiter(inne)n gewählt. In Tab. 4 sind alle Themenwahlhäufigkeiten gekennzeichnet, die sich zwischen den beiden Phasen signifikant unterscheiden. Die zunehmende Konsensbildung zeigte sich auch in der Erhöhung des Fleiss‘ Kappa Indexes von der zweiten zur dritten Runde sowohl bzgl. der Relevanz für das universitäre Studium (K = 0.454; z = 217.99; p < 0,001) als auch für die Praxis (K = 0,524; z = 251,4; p < 0,001).

Fazit:

Trotz kleinerer Abweichungen weist das Wahlverhalten beider Expertengruppen sehr ähnliche Tendenzen auf. Die Ergebnisse der letzten Delphi-Runde verdeutlichen, dass Vertreter(innen) verschiedener Phase und Disziplinen der Lehrerbildung bzgl. relevanter bildungswissenschaftlicher Themen zu ähnlichen Urteilen kommen und dass somit ein weitgehender Konsens zwischen den befragten Expert(inn)en erzielt werden konnte.

5.3 Identifikation der relevanten Themen

Ziel der Delphi-Studie war es, eine Auswahl an Themen zu treffen, bei denen sich die Mehrheit der Expert(inn)en einig ist, dass diese – unter Berücksichtigung zeitlicher Restriktionen in der Praxis – von zentraler Bedeutung für die universitäre Lehrerbildung sind. Diese Themenauswahl wurde anhand der Ergebnisse der dritten Delphi-Runde vorgenommen. Dabei wurde explorativ vorgegangen und ermittelt, welche Themen von mehr als 50 % der Expert(inn)en gewählt wurden.

Die vorläufige Identifikation relevanter Themen erfolgte folgendermaßen: Ein Thema wurde als relevant erachtet, wenn es auf einer der beiden Beantwortungsdimensionen („Relevanz für die universitäre Lehrerbildung“ oder „praktische Bewältigung der Lehrertätigkeit“) in der dritten Delphi-Runde von der Mehrheit der Expert(inn)en (mehr als 50 %) ausgewählt worden war. Auf der Basis dieser explorativen Regel wurden 104 aus den insgesamt 213 bildungswissenschaftlichen Themen als relevant eingestuft werden. (Tab. 2 zeigt, wie viele Themen aus den neun Inhaltsbereichen in die explorativ ermittelte Themenzusammenstellung eingingen.) So war die Mehrheit der Expert(inn)en sich z. B. einig, dass angehende Lehrkräfte Kenntnisse über „Kennzeichen lernwirksamen Unterrichts“, „Methodische Formen des Unterrichts“ und „Bezugssysteme des Beurteilens“ genauso besitzen sollten wie Wissen über „Lernmotivation“, „Modelllernen“ und „Wissenserwerb“. Themen wie „Geschichte der Schule und der Lehrerberufe“, „Schulrelevantes Verfassungsrecht“ und „Vormoderne und moderne Bildungstheorien“ wurden in der ersten Runde zwar als prinzipiell nützlich bewertet, sie wurden jedoch in den darauffolgenden Runden – angesichts der begrenzten zeitlichen Vorgaben im Rahmen des Lehramtsstudiums – deutlich seltener gewählt. Das spricht dafür, dass diese Themen als weniger zentral und unter bestimmten Umständen als verzichtbar angesehen werden. Abbildung 2 veranschaulicht diese vorläufig ermittelte Themenauswahl.

Abb. 2
figure 2

Übersicht über die finalen bildungswissenschaftlichen Themen

Auch wenn diese Themenzusammenstellung auf einem mehr oder weniger willkürlich gewählten Cut-Off-Wert der 50 %igen Wahlhäufigkeiten basiert, würden die Ergebnisse für die meisten Inhaltsbereiche sehr ähnlich aussehen, wenn man andere Schwellenwerte (beispielsweise 40 oder 60 %) wählen würde, da – wie in Tab. 4 zu sehen ist – die Unterschiede in den Wahlhäufigkeiten zwischen den in die Zusammenstellung aufgenommenen und ausgeschlossenen Themen i. d. R. recht groß sind. Das gilt vor allem für die Bereiche „Bildungssystem und Bildungsorganisation“, „Bildungstheorie“ und „Sozialisationsprozesse“, während die Unterschiede in den Wahlhäufigkeiten insbesondere für den Bereich „Unterricht“ zugegebenermaßen weniger trennscharf sind.

6 Diskussion und Ausblick

6.1 Zusammenfassung und Einordnung der Ergebnisse

In der vorliegenden Delphi-Studie wurden drei zentrale Forschungsfragen verfolgt. Erstens wurde untersucht, ob sich die Expert(inn)en aus verschiedenen Fachdisziplinen vor dem Hintergrund des stark begrenzten Studienumfangs in den Bildungswissenschaften auf eine begrenzte Anzahl relevanter bildungswissenschaftlicher Themen einigen können. Zweitens wurde geprüft, ob diesbezüglich ein Konsens auch zwischen den Expert(inn)en aus der ersten und zweiten Phasen der Lehrerbildung erzielt werden kann. Auf der Grundlage der Ergebnisse für die ersten beiden Fragestellungen wurden anschließend solche Themen identifiziert, die von der Mehrheit der Expert(inn)en aus beiden Phasen der Lehrerbildung als besonders relevant für die universitäre Lehrerbildung bzw. die praktische Bewältigung des Berufs bewertet werden.

Bezüglich der ersten Fragestellung sprachen zufriedenstellende ADM-Werte dafür, dass ein Konsens innerhalb der einzelnen universitären Disziplinen erzielt werden konnte. Darüber hinaus konnte trotz vereinzelter unterschiedlicher Themenbewertungen auch ein Konsens zwischen den einzelnen universitären Disziplinen gefunden werden. Bezüglich der zweiten Fragestellung lag für die Mehrheit der Themen ein ähnliches Antwortverhalten für die Expert(inn)en der beiden Phasen der Lehrerbildung vor. Der zunehmende Konsens zeigte sich über die drei Runden hinweg auch in der Zunahme der Beurteilerübereinstimmung. Basierend auf den Ergebnissen der letzten Delphi-Runde wurden schließlich 104 bildungswissenschaftliche Themen identifiziert, die von der Mehrheit der Expert(inn)en als zentral für die Lehrerbildung bewertet wurden – und zwar unter Berücksichtigung der gegebenen zeitlichen Restriktionen im universitären Lehramtsstudium. Innerhalb der Inhaltsbereiche ließen sich dabei klare Abstufungen in den Wahlhäufigkeiten und deutliche thematische Kernbereiche erkennen.

Die Tatsache, dass zwischen den Expertengruppen ein weitgehender Konsens erzielt werden konnte, deutet darauf hin, dass die beklagte Beliebigkeit im bildungswissenschaftlichen Studium und die damit einhergehende Heterogenität zwischen den Universitätsstandorten nicht zwangsläufig durch unterschiedliche Bewertungen verschiedener bildungswissenschaftlicher Themen bewirkt wird, sondern möglicherweise eher pragmatischen Faktoren (beispielsweise verfügbares Lehrpersonal, Anzahl der Studierenden) geschuldet sind.

Trotz der erheblichen Reduktion von 213 auf 104 Themen deckt die ermittelte Systematik ein breites Spektrum an Inhalten aus allen betrachteten Fachdisziplinen ab. Die ermittelten Themen zeigen auf der Ebene von Einzelthemen breite Überlappung mit den Kompetenzmodellen von der KMK und Oser auf. In der übergeordneten Struktur gibt es jedoch deutliche Differenzen, vor allem zum KMK-Modell. Die ermittelten Themen weisen darüber hinaus auch eine hohe Ähnlichkeit mit der berichteten Themenzusammenstellung aus der Dokumentenanalyse von Krattenmacher et al. (2010) auf, wenn auch die Strukturierung der Themen zum Teil unterschiedlich erfolgt. Zudem sind bestimmte Bereiche wie „Lernprozesse“ und „Diagnostik“ deutlich feiner gegliedert als bei Krattenmacher et al. (2010). Ferner sind in der Themenzusammenstellung alle Inhalte aus dem Kerncurriculum der DGfE enthalten. Ein entscheidender Unterschied besteht jedoch darin, dass die Themen in der vorliegenden Delphi-Studie deutlich spezifischer formuliert sind und weniger Überlappungen zwischen den Inhaltsbereichen aufweisen als im Kerncurriculum. Darüber hinaus ist auch die Mehrheit der Themen aus den Empfehlungen der DGPs für ein Rahmencurriculum in der vorläufigen Themenzusammenstellung enthalten. Diese Beobachtungen liefern wichtige Hinweise für die inhaltliche Validierung der ermittelten Themenübersicht.

In diesem Zusammenhang ist es wichtig zu bedenken, dass in der vorliegenden Delphi-Studie zunächst nur die potenziell relevanten Themen im Rahmen des intendierten (d. h. beabsichtigten) Curriculums untersucht werden konnten. Dokumentenanalysen wie die von Terhart et al. (2010) oder Krattenmacher et al. (2010) erlauben hingegen Aussagen über aktuell implementierte (d. h. umgesetzte) Curricula an den Universitäten. Die Beantwortung der Frage, inwieweit diese Themen – im Sinne eines erreichten bzw. realisierten Curriculums – in konkreten Veranstaltungen angeboten und tatsächlich von den Lehramtsstudierenden auch verstanden werden (sodass diese Kenntnisse am Ende des Studiums noch verfügbar sind), erfordert weitere empirische Studien, bei denen das Wissen der Studierenden bzw. (angehenden) Lehrkräfte objektiv gemessen wird.

Darüber hinaus ist es wichtig zu betonen, dass es sich bei den Themen um eine vom Expertenkonsens getragene explorativ ermittelte Systematik relevanter bildungswissenschaftlicher Themen handelt und keinesfalls um ein empirisch abgesichertes theoretisches Modell bezüglich der Repräsentation des bildungswissenschaftlichen Wissens. Die Prüfung, inwieweit sich die einzelnen Inhaltsbereiche auch empirisch als separate Dimensionen des bildungswissenschaftlichen Wissens modellieren lassen, steht noch aus. Die empirische Prüfung der Wissensstruktur wird durch einen standardisierten Test ermöglicht, der auf der Basis des Ergebnisses der Delphi-Studie im Rahmen des BilWiss-Projekts konstruiert wurde. Dieser Test erfasst deklaratives und konzeptuell-analytisches Wissen von Universitätsabsolvent(inn)en bezüglich der zentralen bildungswissenschaftlichen Inhalte, die sich in der Delphi-Studie als Konsens durchgesetzt hatten. Das Testmaterial umfasst insgesamt ca. 280 Aufgaben, die in mehreren Pilotierungsstudien erprobt und im Frühjahr 2011 in einer Erhebung mit mehr als 3.000 Referendar(inn)en aus dem ersten Referendariatshalbjahr an allen Studienseminaren in NRW eingesetzt wurde. Dabei steht die Frage im Vordergrund, über welche bildungswissenschaftlichen Kenntnisse in verschiedenen Inhaltsbereichen Referendare zu Beginn des Referendariats verfügen bzw. – etwas allgemeiner formuliert – welche Lernvoraussetzungen bzgl. des bildungswissenschaftlichen Wissens im universitären Lehramtsstudium für das Referendariat gelegt werden. Diese Analysen ermöglichen verlässliche Aussagen in Bezug auf das erreichte bzw. realisierte Curriculum in den Bildungswissenschaften.

Ein berechtigter Einwand an jeder Delphi-Studie ist, dass die Ergebnisse von der Zusammensetzung der Expertengruppe abhängen können. Wir gehen davon aus, dass die Zusammensetzung der Gruppe in der vorliegenden Studie aus zwei Gründen repräsentativ für die Lehrerbildung in NRW ist. Zum einen ist die Anzahl der Expert(inn)en mit 49 Personen deutlich größer als in Delphi-Studien üblich (s. z. B. Häder 2002, S. 94). Zum zweiten berücksichtigt die Rekrutierung der Expert(inn)en a) beide Phasen der Lehrerbildung, b) die beteiligten Fachdisziplinen und c) alle lehrerbildenden Universitäten in NRW. Dennoch gelten die präsentierten Ergebnisse zunächst nur für NRW; Replikationen in anderen Bundesländern oder auf nationaler Ebene sind wünschenswert. Aufgrund großer Überlappungen mit den Empfehlungen der DGfE und DGPs sowie der Analyse von Krattenmacher et al. (2010) erwarten wir jedoch, dass sich die ermittelte Themensystematik auch in anderen Bundesländern bewähren würde.

6.2 Implikationen für die Gestaltung bildungswissenschaftlicher Studienanteile

Die hier vorliegende Studie zeigt, dass ein Konsens zwischen verschiedenen Disziplinen und Phasen der Lehrerbildung in Bezug auf einen möglichen Kanon relevanter bildungswissenschaftlicher Inhalte der universitären Lehrerbildung erzielt werden kann. Die Studie verdeutlicht ferner, dass sich aus der Vielzahl bildungswissenschaftlicher Themen zentrale Kerninhalte für die Lehrerbildung aus allen betrachteten Fachdisziplinen identifizieren lassen. Dieses wichtige und keineswegs selbstverständliche Ergebnis bestätigt die Notwendigkeit, dass sich alle diese Disziplinen an der Lehrerbildung beteiligen müssen und eröffnet Chancen für eine interdisziplinäre Diskussion, die zur stärkeren Vernetzung des Lehrangebots in den Bildungswissenschaften führen kann. Die Ergebnisse der vorliegenden Delphi-Studie verdeutlichen damit, dass die vielfach kritisierte Willkürlichkeit im bildungswissenschaftlichen Studium und die Unterschiede zwischen verschiedenen Disziplinen und Phasen der Lehrerbildung überwunden werden können.

Ein kontinuierlicher kumulativer Wissenserwerb in den Bildungswissenschaften erfordert – angesichts des begrenzten Rahmens, der für diese Studienanteile zur Verfügung steht – zwangsläufig eine Fokussierung auf bestimmte Kerninhalte. Mit den KMK-Standards bestehen in Deutschland bereits verbindliche Vorgaben für die Lehrerausbildung, welche jedoch keine theoretischen Inhalte vorgeben, sondern zu erreichende Kompetenzen definieren. Wie diese Kompetenzen erlangt werden können, ist dabei nicht explizit formuliert. Somit kann die in dieser Studie ermittelte Themenzusammenstellung – aufgrund eines detaillierteren Auflösungsgrads ergänzend zu den Vorgaben in den KMK-Standards – einen Diskussionsansatz liefern, welche Inhalte für die Lehrerbildung im Sinne eines Kerncurriculums des bildungswissenschaftlichen Studiums als zentral erachtet werden können.

Die vorgeschlagene Themensammlung impliziert jedoch nicht, dass die inhaltliche Gestaltung der bildungswissenschaftlichen Studienanteile im Rahmen der Lehrerbildung vereinheitlicht werden soll, sondern kann lediglich dazu beitragen, potenziell relevante Themen vorzustrukturieren. Da die Menge an ermittelten Themen immer noch zu groß ist, um sie im Rahmen des Studiums umfassend vermitteln zu können, sollten den Universitäten keine verbindlichen Inhalte vorgeschrieben werden. Die ermittelte Themenübersicht liefert lediglich Anregungen zur Gestaltung der Curricula. Die Ergebnisse dieser Studie verhindern auch nicht die Profilbildung einzelner Universitäten, sondern unterstützten diese vielmehr darin, indem sie die Bedeutsamkeit bestimmter Themen innerhalb eines Inhaltsbereichs aufzeigen, auf den in der entsprechenden Universität der Schwerpunkt gelegt werden könnte.

Zusammenfassend lässt sich sagen, dass eine Einigung auf einen reduzierten, inhaltlich jedoch immer noch sehr breiten Kanon an zentralen bildungswissenschaftlichen Themen ein wichtiges Zeichen gegen vielfach kritisierte Beliebigkeit setzen könnte. Solch ein Konsens bietet eine wichtige Chance für eine stärkere inhaltliche Strukturierung und Ausrichtung der bildungswissenschaftlichen Studienanteile, von der alle an den Bildungswissenschaften beteiligten Disziplinen profitieren würden. Darüber hinaus kann dieser Konsens zu einer besseren Vergleichbarkeit dieser Studienanteile über die verschiedenen Universitäten hinweg beitragen. Dies wäre ein wichtiger Schritt zur häufig geforderten besseren Anschlussfähigkeit zwischen den einzelnen Phasen der Lehrerbildung.