1 Einleitung

Die Existenz ethnischer, sozialer und geschlechtsbezogener Bildungsungleichheiten ist empirisch gut belegt (vgl. z. B. Prenzel et al. 2013). Zur Erklärung dieser Disparitäten werden in der empirischen Bildungsforschung verschiedene Faktoren diskutiert, wie etwa Struktur- und Prozessmerkmale der Familien (Baumert et al. 2003), Sprachkenntnisse der Schülerinnen und Schüler (Heinze et al. 2007) sowie verschiedene Arten von Diskriminierung (Diehl und Fick 2016). Eine weitere Annahme bezieht sich auf Leistungserwartungen von Lehrkräften, die für Bildungsgleichheit bedeutsam sein können, da sie eine wichtige Grundlage für pädagogisches Handeln im Unterricht bilden (Schrader und Helmke 2001).

Leistungserwartungen von Lehrkräften basieren nur zum Teil auf tatsächlichen Leistungen der Lernenden (z. B. Südkamp et al. 2012) und scheinen auch unter Kontrolle der Leistungen in Abhängigkeit vom ethnischen Hintergrund, sozialen Hintergrund oder Geschlecht der Heranwachsenden unterschiedlich auszufallen (z. B. Jussim und Harber 2005; Ready und Wright 2011; Lorenz et al. 2016). Obwohl solche systematischen Abweichungen in Leistungserwartungen von Lehrkräften, die als Verzerrungen bezeichnet werden können, sowohl im internationalen als auch im deutschen Kontext wiederholt belegt wurden, ist über ihre Ursachen wenig bekannt. Angenommen werden kann, dass Lehrkräfte in der Wahrnehmung einzelner Kinder unbewusst und automatisch auf Stereotype, also auf verallgemeinernde Vorstellungen über Merkmale, Eigenschaften und Verhaltensweisen von Schülergruppen zurückgreifen (vgl. Fiske und Neuberg 1990; Lorenz 2017). Stereotype von Lehrkräften können sich dabei auf verschiedene Inhalte beziehen. Denkbar wären beispielsweise verallgemeinernde Vorstellungen über verschiedene Fähigkeiten von Lernenden oder über die häusliche Unterstützung, die bestimmte Gruppen von Schülerinnen und Schülern erfahren. Studien zu Übergangsempfehlungen zeigen allerdings, dass Lehrkräfte neben schulischen Leistungen primär der Motivation und dem Arbeitsverhalten von Lernenden hohe Relevanz für zukünftige Leistungen beimessen (z. B. Böhmer et al. 2015). Als mögliche Quelle für Verzerrungen von Leistungserwartungen kommen daher insbesondere stereotypenbasierte Annahmen über die Motivation und das Arbeitsverhalten der Kinder in Betracht. Der vorliegende Beitrag untersucht deshalb, ob ethnische, soziale und geschlechtsbezogene Verzerrungen in Leistungserwartungen auf Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens ihrer Schülerinnen und Schüler zurückgeführt werden können. Hinausgehend über viele der bisherigen Studien werden dabei in der vorliegenden Arbeit Selbsteinschätzungen der Kinder zu ihrer Motivation und ihrem Arbeitsverhalten berücksichtigt und als Vergleichsmaß für die Lehrkrafteinschätzungen herangezogen. Anhand dieses Vorgehens lässt sich bestimmen, ob die Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens primär die Selbsteinschätzungen der Lernenden oder eher stereotypenbasierte Annahmen widerspiegeln.

2 Theorie und Forschungsstand

2.1 Leistungserwartungen von Lehrkräften und deren Verzerrungen

Bei Leistungserwartungen von Lehrkräften handelt es sich um Prognosen der zukünftigen Leistungen von Schülerinnen und Schülern. Auch wenn sie sich konzeptionell von Leistungseinschätzungen aktueller Fähigkeiten abgrenzen lassen, werden in der Forschung häufig Einschätzungen aktueller Leistungen als Indikatoren für Leistungserwartungen herangezogen und beide Begriffe synonym gebraucht. Um die Lesbarkeit zu erhöhen, wird im Folgenden zusammenfassend von Leistungserwartungen gesprochen. Ein weiteres verwandtes Konzept ist die diagnostische Kompetenz von Lehrkräften. Hiermit ist die übergeordnete Fähigkeit gemeint, zu genauen Urteilen über Merkmale von Lernenden, wie z. B. Leistungen, zu gelangen (vgl. Schrader 2010). Um den Forschungsstand umfassend darzustellen, werden im Folgenden einschlägige Ergebnisse aller drei Konzeptionen berücksichtigt. Für die Operationalisierung der Leistungserwartungen werden in der vorliegenden Arbeit jedoch ausschließlich Prognosen zukünftiger Leistungen der Schülerinnen und Schüler herangezogen.

Zahlreiche Studien zeigen, dass Leistungserwartungen von Lehrkräften zu einem hohen Anteil die tatsächlichen Leistungen von Heranwachsenden widerspiegeln (Jussim et al. 1996). Laut Metaanalysen beträgt die geteilte Varianz von Leistungserwartungen und standardisiert erfassten Leistungen etwa 40 % (Hoge und Coladarci 1989; Südkamp et al. 2012). Dies bedeutet jedoch auch, dass ein substanzieller Varianzanteil der Erwartungen nicht auf die Leistungen zurückgeführt werden kann.

Verschiedene Studien verdeutlichen zudem, dass die beobachteten Über- und Unterschätzungen nicht rein zufällig sind. Vielmehr traten über Leistungsunterschiede hinaus systematische Unterschiede in den Leistungserwartungen von Lehrkräften für verschiedene Schülergruppen auf (vgl. auch Lorenz et al. 2016). Derartige Unterschiede werden im Folgenden als Verzerrungen bezeichnet.

Internationale Studien weisen darauf hin, dass Leistungserwartungen von Lehrkräften an Kinder aus zugewanderten Familien (z. B. Jussim und Harber 2005; McKown und Weinstein 2008) und an Kinder aus sozial benachteiligten Familien negativ verzerrt sind (z. B. Jussim et al. 1996; Ready und Wright 2011). Die Befunde zu geschlechtsbezogenen Verzerrungen sind hingegen uneinheitlich und deuten auf bereichsspezifische Effekte hin. So fanden einige Studien eine Überschätzung von Jungen im mathematischen (Jussim und Eccles 1992) und von Mädchen im sprachlichen Bereich (Hinnant et al. 2009; Ready und Wright 2011). Andere Untersuchungen identifizierten keine Verzerrungen in Abhängigkeit vom Geschlecht (McKown und Weinstein 2008; van den Bergh et al. 2010).

In Deutschland wurden bisher kaum Studien zu Verzerrungen in Leistungserwartungen durchgeführt. In Untersuchungen zur diagnostischen Kompetenz von Lehrkräften zeigten sich nach Kontrolle standardisierter Leistungsmaße keine Unterschiede in den Leistungsurteilen für Kinder mit und ohne Zuwanderungshintergrund (Schrader und Helmke 1990; Stahl 2007; Hachfeld et al. 2010; Rjosk et al. 2011). Diese Analysen differenzierten jedoch nicht nach ethnischen Herkunftsgruppen, für die unterschiedliche Stereotype und darauf basierende Annahmen bestehen könnten.

Zu sozialen und geschlechtsbezogenen Verzerrungen in Leistungsurteilen sind die Befunde im deutschsprachigen Raum uneinheitlich. In einigen Studien wurden keine sozialen (Hachfeld et al. 2010; Karing et al. 2011) oder geschlechtsbezogenen Verzerrungen (Schrader und Helmke 1990; Karing et al. 2011) identifiziert. Stahl (2007) berichtete hingegen Überschätzungen im Bereich Lesen für Kinder aus sozial bessergestellten Familien und für Mädchen.

Aufgrund der uneinheitlichen und insgesamt unzureichenden Befundlage, sind Lorenz et al. (2016) anhand von Daten der in Deutschland durchgeführten KuL-Studie der Frage nachgegangen, inwieweit Leistungserwartungen von Lehrkräften in Abhängigkeit vom ethnischen und sozialen Hintergrund sowie vom Geschlecht der Lernenden verzerrt sind. Im Fach Deutsch erwarteten die Lehrkräfte bei gleichen Testleistungen der Erstklässlerinnen und Erstklässler eine weniger günstige Leistungsentwicklung für türkischstämmige Kinder im Vergleich zu Kindern ohne Zuwanderungshintergrund, für Kinder aus sozial schwächeren Familien im Vergleich zu Kindern aus sozial bessergestellten Familien sowie für Jungen im Vergleich zu Mädchen. Im Fach Mathematik fielen die Leistungserwartungen bei gleichen tatsächlichen Leistungen höher aus für Kinder mit osteuropäischem Hintergrund als für Kinder ohne Zuwanderungshintergrund und höher für Kinder aus sozial bessergestellten Familien als für Kinder aus sozial benachteiligten Familien. Geschlechtsbezogene Verzerrungen waren im Fach Mathematik nicht zu verzeichnen.

Zusammenfassend scheinen Leistungserwartungen von Lehrkräften nicht nur die tatsächlichen Leistungen ihrer Schülerinnen und Schüler widerzuspiegeln. Außerdem wird deutlich, dass Leistungserwartungen in Abhängigkeit von Hintergrundmerkmalen der Lernenden verzerrt sein können. Offen ist allerdings, worauf diese Verzerrungen zurückzuführen sind und ob ihnen stereotype Annahmen über weitere lernrelevante Merkmale der Lernenden, wie etwa deren Motivation und Arbeitsverhalten, zugrunde liegen.

2.2 Stereotype Wahrnehmungsprozesse

Als theoretischer Rahmen zur Erklärung systematischer Verzerrungen in Leistungserwartungen eignet sich das sozialpsychologische Kontinuum-Modell (Fiske und Neuberg 1990). Diesem Modell zufolge bewegt sich die Personenwahrnehmung zwischen zwei Polen – der individualisierenden und der kategorisierenden Verarbeitung. Bei letzterer werden Personen anhand eines einfach zu identifizierenden Merkmals einer sozialen Kategorie zugeordnet (Ganter 1997), wobei die Merkmale Alter, Geschlecht, ethnische Herkunft sowie sozialer Status besonders salient sind (Fiske und Neuberg 1990). Es wird angenommen, dass die Zuordnung einer Person zu einer Gruppe kognitive Stereotype aktiviert, also verallgemeinernde Vorstellungen über Merkmale, Eigenschaften und Verhaltensweisen der Gruppenmitglieder (Ganter 1997). Im Wahrnehmungsprozess findet im Allgemeinen zuerst eine kategorisierende Verarbeitung statt. Eine Verschiebung hin zur individualisierenden Verarbeitung, bei der individuelle Eigenschaften und Merkmale der jeweiligen Person berücksichtigt werden, erfolgt erst unter bestimmten Voraussetzungen wie z. B. dem Vorliegen stereotypen-inkonsistenter Informationen (Fiske und Neuberg 1990; Ganter 1997). Ohne eine derartige Verschiebung wird die weitere Wahrnehmung durch Stereotype gelenkt.

Auch in schulischen Situationen können stereotype Wahrnehmungsprozesse auftreten, etwa wenn Einschätzungen von Lehrkräften durch stereotype Merkmalsannahmen für bestimmte Schülergruppen gefärbt sind (Hirschauer und Kullmann 2010). Diese Annahmen können sich auf unterschiedliche Inhalte beziehen. Anhaltspunkte dafür, welche Merkmale Lehrkräfte für Beurteilungen von Schülerinnen und Schülern als bedeutsam erachten, liefern zum Beispiel Interview- und MouseLab-Studien, die Übergangsempfehlungen untersuchten. Neben schulischen Leistungen der Heranwachsenden sprechen Lehrkräfte diesen Studien zufolge der Motivation und dem Arbeitsverhalten (z. B. Ausdauer/ Fleiß, Interesse/ Motivation) die höchste Relevanz zu. Zusätzlich griffen die Lehrkräfte auf Informationen zur elterlichen Unterstützung zurück. Weiteren Merkmalen wie beispielsweise dem Sozialverhalten der Kinder oder dem Beruf der Eltern wurde eine vergleichsweise geringere Bedeutung zugesprochen (Nölle et al. 2009; Böhmer et al. 2015). Dass die Motivation und das Arbeitsverhalten von Lernenden tatsächlich prädiktiv für Schulleistungen und weiteres Lernen sind (vgl. z. B. Spinath 2011), spricht ebenfalls für die Annahme, dass Lehrkräfte motivationalen Merkmalen bei der Prognose von Leistungsentwicklungen hohe Relevanz beimessen und sie in ihre Leistungserwartungen einbeziehen. Auch Studienergebnisse zu Zusammenhängen von Leistungserwartungen und Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens legen nahe, dass dieser Einbezug tatsächlich stattfindet: Ein Kind, dessen Motivation und Arbeitsverhalten von einer Lehrkraft als vergleichsweise günstig eingeschätzt wird, scheint bei gleichen Leistungen auch als begabter und leistungsstärker wahrgenommen zu werden (Schrader und Helmke 1990; Anders et al. 2010), bessere Noten zu erhalten (Trautwein und Baeriswyl 2007; Anders et al. 2010; Kuhl und Hannover 2012) und eher für den Übergang auf ein Gymnasium empfohlen zu werden (Anders et al. 2010).

Legt man auch für die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens von Schülerinnen und Schülern das Kontinuum-Modell der Personenwahrnehmung zugrunde, existieren zwei Wege, über die die Lehrkräfte zu ihren Einschätzungen gelangen können: Zum einen über die Verarbeitung individueller Informationen, die ihnen über die Kinder vorliegen, und zum anderen über die Anwendung stereotyper Annahmen über die Motivation und das Arbeitsverhalten für bestimmte Gruppen. Eine Verarbeitung anhand von Stereotypen ist durchaus wahrscheinlich, da einige Studien zeigen, dass Lehrkräfte die Lernmotivation (Spinath 2005) sowie verwandte emotional-motivationale Merkmale wie z. B. das schulische Interesse (Karing 2009) oder lernbezogene Emotionen (Givvin et al. 2001) nur relativ ungenau einschätzen. Einschätzungen der Motivation und des Arbeitsverhaltens könnten daher ebenfalls anfällig für Einflüsse stereotyper Personenwahrnehmung sein.

Inwieweit Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens systematisch mit Hintergrundmerkmalen der Schülerinnen und Schüler variieren und ob diese möglichen Variationen Unterschiede in den Selbsteinschätzungen der Lernenden widerspiegeln, soll im Folgenden dargestellt werden.

2.3 Unterschiede in Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens in Abhängigkeit vom ethnischen Hintergrund, sozialen Hintergrund und Geschlecht der Schülerinnen und Schüler

Bislang haben nur wenige Studien untersucht, ob Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens von Lernenden systematisch mit Hintergrundmerkmalen wie der ethnischen und sozialen Herkunft oder dem Geschlecht der Schülerinnen und Schüler in Verbindung stehen und die entsprechenden Befunde sind uneinheitlich. Außerdem wurden Selbsteinschätzungen der Schülerinnen und Schüler in den meisten Studien nicht berücksichtigt. Nur drei Studien liefern bislang Anhaltspunkte dafür, inwieweit die Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens den Selbsteinschätzungen der Schülerinnen und Schüler entsprechen oder ob sie eher auf stereotypen Annahmen über diese Merkmale basieren.

Bezogen auf den ethnischen Hintergrund Heranwachsender zeigte eine experimentelle Studie aus den USA, dass Grundschullehrkräfte Jungen mit kaukasisch-amerikanisch klingendem Namen als schulisch motivierter beschrieben als Jungen mit afro-amerikanisch klingendem Namen (Anderson-Clark et al. 2008). In einer ebenfalls in den USA durchgeführten Feldstudie schätzten Lehrkräfte Heranwachsende mit und ohne Zuwanderungshintergrund dagegen ähnlich anstrengungsbereit ein, was mit den Selbsteinschätzungen der Schülerinnen und Schüler übereinstimmte (Jussim et al. 1996).

In Deutschland wurden bisher in zwei Studien Lehrkrafteinschätzungen zu motivationalen Merkmalen und Aspekten des Arbeitsverhaltens für Heranwachsende mit und ohne Zuwanderungshintergrund analysiert. In diesen Studien nahmen Lehrkräfte für Kinder ohne Zuwanderungshintergrund eine etwas höhere Motivation und ein etwas günstigeres Arbeitsverhalten (Anders et al. 2010) sowie eine leicht höhere Schulfreude, Anstrengungsbereitschaft und günstigere schulische Arbeitshaltung an (Schneider 2011) als für Kinder aus zugewanderten Familien, wobei jedoch keine Selbsteinschätzungen der Kinder kontrolliert wurden. Ergebnisse für verschiedene ethnische Gruppen in Deutschland liegen bisher ebenfalls nicht vor.

Auch in Abhängigkeit von der sozialen Herkunft der Heranwachsenden identifizierten verschiedene Studien Unterschiede in Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens. So wurden Kinder aus sozial bessergestellten Familien nicht nur in Deutschland (Trautwein und Baeriswyl 2007; Anders et al. 2010) sondern auch in Studien aus den USA (Jussim et al. 1996) tendenziell als motivierter und anstrengungsbereiter eingeschätzt als Kinder aus sozial benachteiligten Familien. Diese von den Lehrkräften angenommenen Gruppenunterschiede fielen dabei stärker aus als die entsprechenden Gruppenunterschiede in den Selbsteinschätzungen der Kinder (Jussim et al. 1996).

Darüber hinaus weisen mehrere Studienergebnisse darauf hin, dass Lehrkräfte die Motivation und das Arbeitsverhalten in Abhängigkeit vom Geschlecht der Kinder unterschiedlich einschätzen. So scheinen Lehrkräfte davon auszugehen, dass Mädchen im Vergleich zu Jungen insgesamt motivierter sind (Trautwein und Baeriswyl 2007; Anders et al. 2010; Schneider 2011), sich stärker anstrengen (Jussim und Eccles 1992; Jussim et al. 1996) sowie über eine höhere schulische Selbstregulationskompetenz (Duckworth und Seligman 2006; Kuhl und Hannover 2012) verfügen. Inwieweit diese angenommenen Geschlechtsunterschiede Differenzen in Selbsteinschätzungen der jeweiligen Schülerinnen und Schüler widerspiegeln, bleibt allerdings uneindeutig. Lediglich drei Studien haben zusätzlich zu den Einschätzungen der Lehrkräfte auch Selbsteinschätzungen der Schülerinnen und Schüler berücksichtigt. Diese Studien kamen zu uneinheitlichen Ergebnissen: In der Studie von Duckworth und Seligman (2006) stimmten die von den Lehrkräften angenommenen Geschlechtsunterschiede in der Selbstregulationskompetenz mit den Selbsteinschätzungen der Mädchen und Jungen überein. In den Studien von Jussim und Eccles (1992) und Jussim et al. (1996) wurden hingegen Differenzen zwischen den Einschätzungen der Lehrkräfte und den Angaben der Mädchen und Jungen dazu deutlich, wie sehr sie sich in der Schule anstrengen und wie viel Zeit sie in Hausaufgaben investieren.

In der Zusammenschau deutet die Befundlage darauf hin, dass Lehrkräfte die Motivation und das Arbeitsverhalten von Schülerinnen und Schülern in Abhängigkeit von deren Hintergrundmerkmalen unterschiedlich einschätzen. Da sich diese Unterschiede ersten Vergleichen zufolge nur teilweise in den Selbsteinschätzungen der Kinder widerzuspiegeln scheinen, könnte die Wahrnehmung dieser Unterschiede teilweise auf stereotypen Annahmen der Lehrkräfte beruhen. Aufgrund der unzureichenden und uneinheitlichen Befundlage bedarf diese Hypothese jedoch weiterer empirischer Analysen.

Sollten Lehrkräfte Unterschiede in der Motivation und dem Arbeitsverhalten für verschiedene Gruppen von Schülerinnen und Schülern in Abhängigkeit von deren ethnischem Hintergrund, sozialem Hintergrund oder Geschlecht annehmen, die sich nicht in deren tatsächlichen Motivlagen und Verhalten widerspiegeln, kann es dadurch zu den beobachteten Verzerrungen in Leistungserwartungen kommen.

2.4 Vermittlung von Verzerrungen in Leistungserwartungen durch die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens

Die Frage, ob die von Lehrkräften eingeschätzte Motivation und das eingeschätzte Arbeitsverhalten der Schülerinnen und Schüler ethnische, soziale und geschlechtsbezogene Verzerrungen in ihren Leistungserwartungen erklären können, wurde bislang noch nicht empirisch untersucht. Zwei Studien haben allerdings die Mediation des Zusammenhangs zwischen Geschlecht und Noten (als Indikatoren für Leistungseinschätzungen) durch die von der Lehrkraft eingeschätzte Selbstregulationskompetenz der Kinder analysiert und bieten damit erste Hinweise. Die Studien zeigen, dass die von den Lehrkräften als höher eingeschätzte Selbstregulationskompetenz von Mädchen den Zusammenhang zwischen Geschlecht und Noten vermittelte (Duckworth und Seligman 2006; Kuhl und Hannover 2012). In getrennten Analysen für die Deutsch- und Mathematiknoten wurden zudem unterschiedliche Mediationsmuster in den Fächern deutlich (Kuhl und Hannover 2012): Mädchen erhielten im Fach Deutsch auch bei gleicher Leseleistung bessere Noten als Jungen, wobei dieser Zusammenhang größtenteils durch die von den Lehrkräften eingeschätzte Selbstregulationskompetenz vermittelt wurde. Im Gegensatz hierzu waren die Noten der Mädchen und Jungen im Fach Mathematik allgemein und auch unter Kontrolle der Testleistung vergleichbar. Wurde jedoch zusätzlich die Lehrkrafteinschätzung der Selbstregulationskompetenz berücksichtigt, erhielten Jungen im Durchschnitt bessere Mathematiknoten als Mädchen.

Diese Befunde deuten darauf hin, dass Geschlechtsunterschiede in der Benotung durch Lehrkräfte auf deren Annahmen zur Selbstregulationskompetenz, die eine wichtige Voraussetzung für effektives Arbeitsverhalten darstellt, zurückgeführt werden können. Unklar ist allerdings, ob auch ethnische, soziale und geschlechtsbezogene Verzerrungen in Leistungserwartungen über die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens vermittelt werden.

3 Forschungsfragen und Hypothesen

Der vorliegende Beitrag knüpft an den Analysen von Lorenz et al. (2016) an, in denen anhand von Daten des KuL-Projekts gezeigt werden konnte, dass die Leistungserwartungen von Lehrkräften in Abhängigkeit vom ethnischen Hintergrund, sozialen Hintergrund und Geschlecht der Kinder verzerrt sind. Anhand desselben Datensatzes gehen die im Folgenden beschriebenen Analysen der Frage nach, ob sich diese Verzerrungen der Leistungserwartungen auf Unterschiede in der Lehrkrafteinschätzung der schulischen Motivation und des Arbeitsverhaltens ihrer Schülerinnen und Schüler zurückführen lassen.

Dazu wird zunächst untersucht, ob sich die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens in Abhängigkeit von den Hintergrundmerkmalen der Kinder allgemein und nach Kontrolle der Selbsteinschätzungen der Lernenden unterscheiden. Da der theoretische und empirische Forschungsstand zu ethnischen Unterschieden nicht ausreicht, um konkrete Annahmen für einzelne Herkunftsgruppen abzuleiten, wird die entsprechende Hypothese ungerichtet formuliert.

Hypothese 1a

Lehrkräfte schätzen die Motivation und das Arbeitsverhalten von Kindern in Abhängigkeit vom ethnischen Hintergrund unterschiedlich ein.

Hypothese 1b

Lehrkräfte schätzen die Motivation und das Arbeitsverhalten von Kindern aus sozial bessergestellten Familien positiver ein als von Kindern aus sozial schwächeren Familien.

Hypothese 1c

Lehrkräfte schätzen die Motivation und das Arbeitsverhalten von Mädchen positiver ein als von Jungen.

Es wird erwartet, dass die in den Hypothesen 1a–c postulierten Unterschiede auch nach Kontrolle der Selbsteinschätzungen der Motivation und des Arbeitsverhaltens der Schülerinnen und Schüler bestehen bleiben.

Weiterhin wird der Frage nachgegangen, ob Unterschiede in der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens Verzerrungen in den Leistungserwartungen erklären.

Hypothese 2a

Zwischen Leistungserwartungen von Lehrkräften und ihrer Einschätzung der Motivation und des Arbeitsverhaltens der Kinder besteht ein positiver Zusammenhang.

Hypothese 2b

Die Zusammenhänge zwischen den Hintergrundmerkmalen der Lernenden und den Leistungserwartungen der Lehrkräfte lassen sich zum Teil auf die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens zurückführen, d. h. die Koeffizienten des ethnischen Hintergrunds, sozialen Hintergrunds und Geschlechts in Prädiktion der Leistungserwartungen reduzieren sich nach Kontrolle der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens ihrer Schülerinnen und Schüler signifikant.

Eine grafische Darstellung des vollständigen Analysemodells ist in Abb. 1 zu finden.

Abb. 1
figure 1

Grafische Darstellung des vollständigen Analysemodells und der Hypothesen (H 1a bis H 2b)

4 Methodisches Vorgehen

4.1 Stichprobe

Die vorliegende Untersuchung basiert auf Daten der Studie „Kompetenzerwerb und Lernvoraussetzungen (KuL)“Footnote 1, an der im Schuljahr 2013/2014 erste Grundschulklassen aus N = 38 Schulen aus Nordrhein-Westfalen (NRW) auf freiwilliger Basis teilnahmen. Die Rücklaufquoten der Einwilligungen zur Studienteilnahme lagen auf Schulebene bei 8 %, auf Lehrkraftebene bei 74 % und auf Eltern/ Kind-Ebene bei 66 %. In die folgenden Analysen gehen Daten von insgesamt N = 901 Kindern aus N = 66 ersten Klassen mit 69 Klassen- und Fachlehrkräften ein.

Die Lehrkräfte waren im Durchschnitt 41 Jahre und 8 Monate alt (SD = 8,89) und seit durchschnittlich 12 Jahren (SD = 9,00) im Lehrberuf tätig. Es handelte sich fast ausschließlich um weibliche Lehrkräfte (94 %) ohne Zuwanderungshintergrund (94 %).

Zum Zeitpunkt der Einschulung waren die Kinder (48 % weiblich) im Mittel 6 Jahre und 5 Monate alt (SD = 0,32). Laut Elternaussagen zum Geburtsland beider Elternteile sowie der Großeltern lag der Anteil von Kindern mit Zuwanderungshintergrund bei 38 % (mindestens ein Großeltern- oder Elternteil nicht in Deutschland geboren). Kinder der ersten Zuwanderungsgeneration (N = 21)Footnote 2 wurden ebenso wie Kinder ohne Angaben zum Zuwanderungshintergrund (N = 134) aus den Analysen ausgeschlossen. Die Angaben zum Herkunftsland der Familien wurden zu insgesamt vier Herkunftsregionen zusammengefasst: „Deutschland“ (61,6 %), „Türkei“ (11,3 %), „ehem. SU und Osteuropa“ (10,9 %) und „andere Länder“ (16,2 %), wobei die Region „ehem. SU und Osteuropa“Footnote 3 alle Staaten der ehemaligen Sowjetunion sowie Polen, Tschechien, Bulgarien, Rumänien, Ungarn, Slowakei und Slowenien umfasst.

Als Indikator des sozioökonomischen Status (SES) dient der Highest International Socio-Economic Index of Occupational Status (HISEI; Ganzeboom 2010). Die Familien wiesen durchschnittlich einen HISEI von 53,25 (SD = 19,48) auf. Verglichen mit dem durchschnittlichen HISEI von 48,10 (SD = 14,80) für Viertklässlerinnen und Viertklässler in NRW, der im IQB-Ländervergleich 2011 ermittelt wurde (Richter et al. 2012), ist die Stichprobe leicht positiv selektiert.

4.2 Datenerhebung und Messinstrumente

In der dritten bis zwölften UnterrichtswocheFootnote 4 nach Schuljahresanfang gaben die Lehrkräfte ihre Einschätzungen der Leistungen, der Motivation und des Arbeitsverhaltens der teilnehmenden Kinder ihrer Klasse in einem Fragebogen an. Im selben Zeitraum wurden die Kompetenzen der Schülerinnen und Schüler in zwei Einzelsitzungen je Kind (jeweils ca. 30 min) von geschulten Testleiterinnen und Testleitern erfasst.

4.2.1 Leistungserwartungen und Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens

Die Lehrkräfte schätzten für jedes Kind die voraussichtliche Leistungsentwicklung im Verlauf des kommenden Schuljahres sowie die zukünftigen Leistungen am Ende des Schuljahres im sprachlichen und mathematischen Bereich auf einer fünfstufigen Antwortskala im Vergleich zu den anderen Kindern der Klasse ein (z. B. „Wo wird das Kind mit seinen Leistungen am Ende des kommenden Schuljahres im Vergleich zu den anderen Kindern aus dieser Klasse voraussichtlich stehen? a) in Mathematik, b) in Deutsch“).Footnote 5 Die Erwartungen für den mathematischen Bereich wurden mit zwei Items (α = 0,94), die Erwartungen für den sprachlichen Bereich mit drei Items (α = 0,94) erfasst. Die Items wurden teils aus dem Projekt BiKS-3-10 (Artelt et al. 2013) adaptiert und teils in der KuL-Studie selbst entwickelt.

Zusätzlich wurden die Lehrkräfte gebeten, die Motivation und das Arbeitsverhalten der Kinder auf einer fünfstufigen Skala (1 = trifft überhaupt nicht zu bis 5 = trifft voll und ganz zu) einzuschätzen. Auch diese Items wurden teils aus dem Projekt BiKS-3-10 (Artelt et al. 2013) adaptiert und teils in der KuL-Studie selbst entwickelt. Von den insgesamt acht Items (α = 0,96) beziehen sich jeweils drei auf den Deutsch- und Mathematikunterricht (Deutsch: α = 0,92, Mathematik: α = 0,92; z. B. „Das Kind hat große Freude am Lernen im Deutsch‑/Mathematikunterricht.“) und zwei allgemein auf das Lernen in der Schule (z. B. „Das Kind ist sehr fleißig in der Schule.“). Die Items decken verschiedene motivationale Aspekte und Aspekte des Arbeitsverhaltens ab (vgl. Abb. A1 im Online Anhang). Zur Erhöhung der Vergleichbarkeit zwischen den Lehrkrafteinschätzungen und den Selbsteinschätzungen der Kinder, die sich fast ausschließlich allgemein auf das Lernen in der Schule beziehen und nicht nach Fächern differenzieren (vgl. Abschn. 4.2.3), wurden die Items in allen dargestellten Analysen als Gesamtmittelwert berücksichtigt. Um die Robustheit der Ergebnisse abzusichern, wurden alle Analysen jedoch auch mit nach Fächern getrennten Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens durchgeführt. Die Ergebnisse fallen sehr ähnlich aus und werden daher nicht dargestellt. Auf bedeutsam abweichende Ergebnisse wird jeweils hingewiesen.

4.2.2 Sprachliche, mathematische und allgemeine kognitive Schülerfähigkeiten

Die mathematischen und sprachlichen (Vorläufer‑)Kompetenzen der Kinder wurden mit dem computergestützten Instrument Fähigkeitsindikatoren Primarschule (FIPS; Bäuerlein et al. 2012) erhoben. Die Skala Lautbewusstheit (α = 0,82) erfasst Fähigkeiten der phonologischen Bewusstheit. Sie setzt sich aus 26 Aufgaben zusammen, bei denen die Kinder Silben und Fantasiewörter nachsprechen, Reime erkennen und Wörter in ihre einzelnen Laute zerlegen sollen. Die Skala Lesen (α = 0,96) umfasst 88 Aufgaben, die Vorstellungen des Kindes über das Lesen sowie erste Leseaufgaben beinhalten. Der Skala Mathematik (α = 0,92) sind 53 Aufgaben zugeordnet. Nach leichteren Additions- und Subtraktionsaufgaben anhand von Bildern und dem Vorlesen verschiedener Zahlen, erhöht sich der Abstraktionsgrad über Rechenaufgaben anhand von Punkten bis hin zu formalen Rechenaufgaben. Die im Schwierigkeitsgrad aufsteigenden Aufgaben wurden den Kindern in allen Kompetenzbereichen solange dargeboten, bis sie eine bestimmte Anzahl an falschen Antworten gegeben haben. Je nach Kompetenzstand erfasst das Instrument damit bei einigen Kindern vor allem Vorläuferkompetenzen, bei anderen Kindern, die in der Entwicklung bereits fortgeschritten sind, auch sprachliche und mathematische Kompetenzen.

Zusätzlich wurden kognitive Grundfähigkeiten der Kinder erfasst: Zum einen mit dem Matrizentest des Grundintelligenztests Skala 1 (CFT1; Weiß und Osterland 1997; α = 0,78) als Maß des schlussfolgernden Denkens und zum anderen mit der Unterskala Kurzzeitgedächtnis des FIPS (Bäuerlein et al. 2012; α = 0,76) als Maß des räumlich-visuellen Arbeitsgedächtnisses.

4.2.3 Schülerselbsteinschätzung der Motivation und des Arbeitsverhaltens

In der Mitte des Schuljahres wurden die Kinder zu ihrer Motivation und zu ihrem Arbeitsverhalten befragt. Dazu wurden zwei Unterskalen des FEESS1-2 (Rauer und Schuck 2004) in adaptierter Version eingesetzt. Die Kinder machten auf einer dreistufigen Skala (0 = trifft nicht zu bis 2 = trifft zu) Angaben zu ihrer Lernfreude (α = 0,78, 13 Items; z. B. „Ich lerne gern in der Schule.“) und Anstrengungsbereitschaft (α = 0,70, 13 Items; z. B. „Ich versuche, auch ganz schwierige Aufgaben zu lösen.“). Die Items beziehen sich größtenteils allgemein auf das Lernen in der Schule.

4.3 Analysestrategie

Zunächst wurde mit Regressionsanalysen untersucht, ob sich die Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens in Abhängigkeit von den Hintergrundmerkmalen der Kinder (ethnischer Hintergrund, sozialer Hintergrund, Geschlecht) allgemein unterscheiden (Hypothesen 1a–c). Um spezifische Effekte identifizieren zu können, erfolgte die Aufnahme aller drei Merkmale in das Modell simultan (Tab. 3, Modell 1). Um zu überprüfen, inwieweit die gefundenen Unterschiede mit den tatsächlichen Motivlagen und Arbeitshaltungen der Kinder übereinstimmen oder darüber hinausgehen, wurden die Selbsteinschätzungen der Lernfreude und Anstrengungsbereitschaft in einem nächsten Schritt hinzugenommen (Tab. 3, Modell 2).

Mit Pfadmodellen wurde anschließend analysiert, inwieweit sich Verzerrungen in Leistungserwartungen auf Unterschiede in der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens der Kinder zurückführen lassen (Hypothesen 2a–b). Als Verzerrungen werden hierbei ethnische, soziale und geschlechtsbezogene Unterschiede in den Leistungserwartungen verstanden, die nach Kontrolle fachspezifischer Leistungen der Kinder, ihrer kognitiven Grundfähigkeiten und ihrer selbsteingeschätzten Lernfreude und Anstrengungsbereitschaft bestehen bleiben (Tab. 4 und 5, Modell 0). Um den Anteil zu bestimmen, mit dem sich Verzerrungen in Leistungserwartungen auf die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens zurückführen lassen, wurden die Regressionskoeffizienten der Hintergrundmerkmale vor und nach zusätzlicher Kontrolle der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens miteinander verglichen und indirekte Pfade spezifiziert (Tab. 4 und 5, Modell 1).

Die Modellschätzungen erfolgten mit der Software Mplus Version 7.3 (Muthén und Muthén 1998–2012). Die Schätzung der Standardfehler wurde für die Mehrebenenstruktur der Daten korrigiert und die akzeptierte α-Fehlerwahrscheinlichkeit auf 5 % festgelegt. Alle metrischen Prädiktorvariablen gingen z‑standardisiert in die Analysen ein. Die Regressionskoeffizienten wurden an der Varianz der abhängigen Variable standardisiert (y-Standardisierung). Zum Umgang mit fehlenden Werten wurde das in Mplus implementierte Full-Information-Maximum-Likelihood-Verfahren (FIML) unter Einbezug vielfältiger Hilfsvariablen angewendet, u. a. zusätzliche Lehrkrafteinschätzungen, Leistungsmaße sowie Merkmale des familiären Lernumfelds. Der Anteil fehlender Werte in den Analysevariablen lag bei maximal 6,9 % (vgl. Tab. A1 im Online Anhang).

5 Ergebnisse

5.1 Deskriptive Ergebnisse

Mittelwerte und Standardabweichungen der Leistungserwartungen und der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens sowohl für die Analysestichprobe insgesamt als auch für die verschiedenen Schülergruppen sind in Tab. 1 zu finden. Tab. 2 enthält Angaben zu den Leistungen und zur selbsteingeschätzten Lernfreude und Anstrengungsbereitschaft der Lernenden. Die zentralen Ergebnisse sollen im Folgenden kurz beschrieben werden.

Tab. 1 Mittelwerte und Standardabweichungen der Leistungserwartungen und der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens für verschiedene Schülergruppen
Tab. 2 Mittelwerte und Standardabweichungen der Leistungen sowie der Selbsteinschätzungen der Motivation und des Arbeitsverhaltens verschiedener Schülergruppen

Die Mittelwerte der Leistungserwartungen lagen sowohl für den sprachlichen Bereich (M = 3,39; SD = 0,94) als auch für den mathematischen Bereich (M = 3,43; SD = 0,85) insgesamt knapp oberhalb des theoretischen Mittelpunkts der Skala. Die Lehrkräfte tendierten also insgesamt zu leicht positiven Erwartungshaltungen. Sie gingen demnach davon aus, dass die an der Studie teilnehmenden Kinder ihrer Klasse durchschnittlich eine etwas bessere Leistungsentwicklung zeigen werden als die Kinder der Klasse insgesamt. Bei der Einschätzung der Motivation und des Arbeitsverhaltens war die Tendenz zu Urteilen oberhalb des theoretischen Mittelpunkts der Skala noch etwas stärker ausgeprägt (M = 3,71; SD = 0,85). Sowohl die Leistungserwartungen als auch die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens unterschieden sich in Abhängigkeit von den Hintergrundmerkmalen der Lernenden (vgl. Tab. 1). So fielen beispielsweise die Leistungserwartungen für türkischstämmige Kinder sowohl im sprachlichen als auch im mathematischen Bereich geringer aus als für Kinder ohne Zuwanderungshintergrund. Ihre Motivation und ihr Arbeitsverhalten beurteilten die Lehrkräfte aber genauso hoch wie von Kindern ohne Zuwanderungshintergrund. Außerdem schätzten die Lehrkräfte alle berücksichtigten Merkmale der Lernenden umso günstiger ein, je höher der soziale Status der Familien der Kinder war. Ebenfalls sprachen sie Mädchen eine bessere Leistungsentwicklung im sprachlichen Bereich, eine höhere Motivation und ein günstigeres Arbeitsverhalten zu als Jungen, wohingegen sie für Jungen einen stärkeren Leistungszuwachs in Mathematik erwarteten als für Mädchen.

Mit Blick auf die Testleistungen der Schülerinnen und Schüler (vgl. Tab. 2) kann festgehalten werden, dass die Unterschiede in den Leistungserwartungen zum Teil objektiv beobachtbare Leistungsunterschiede zwischen den Gruppen widerspiegeln. Teilweise ließen sich jedoch keine entsprechenden Unterschiede in den Testleistungen der Kinder identifizieren. Die Selbsteinschätzungen der Motivation und des Arbeitsverhaltens der Lernenden unterschieden sich vergleichsweise wenig zwischen den Gruppen. Lediglich Kinder aus sozial bessergestellten Familien gaben tendenziell eine höhere Anstrengungsbereitschaft an als Kinder aus sozial schwächeren Familien. Außerdem fiel die selbsteingeschätzte Lernfreude der Mädchen etwas höher aus als die der Jungen.

Um zu prüfen, ob sich die Befunde zur Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens domänenspezifisch unterscheiden, wurden die fächerbezogenen Items jeweils auch getrennt analysiert (vgl. Tab. 1). Dabei zeigte sich, dass die positivere Einschätzung der Motivation und des Arbeitsverhaltens von Mädchen bezogen auf den Deutschunterricht (Mädchen: M = 3,87, SD = 0,87; Jungen: M = 3,53, SD = 0,84, t(871) = −5,82, p < 0,05) stärker ausfiel als bezogen auf das Fach Mathematik (Mädchen: M = 3,79, SD = 0,89; Jungen: M = 3,61, SD = 0,88, t(838) = −2,97, p < 0,05). Bezüglich des ethnischen und sozialen Hintergrunds der Kinder waren keine Unterschiede zwischen den Domänen erkennbar. Eine Übersicht aller Interkorrelationen der Analyse- und Kontrollvariablen ist in Tab. A1 im Online Anhang zu finden.

5.2 Unterschiede in der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens und Zusammenhänge mit Selbsteinschätzungen der Kinder

Zunächst wurde die Annahme geprüft, dass Lehrkräfte die Motivation und das Arbeitsverhalten von Schülerinnen und Schülern in Abhängigkeit von deren Hintergrundmerkmalen unterschiedlich einschätzen (Hypothesen 1a–c; vgl. Tab. 3).

Tab. 3 Prädiktion der Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens

Unter Kontrolle des SES und Geschlechts schätzten Lehrkräfte Kinder mit osteuropäischem Hintergrund als motivierter ein und sprachen ihnen ein günstigeres Arbeitsverhalten zu als Kindern ohne Zuwanderungshintergrund (βy = 0,26, p < 0,05). Unterschiede für türkischstämmige Kinder im Vergleich zu Kindern ohne Zuwanderungshintergrund zeigten sich hingegen nicht (βy = −0,06, p = 0,51). Lehrkräfte schrieben jedoch Kindern eine umso höhere Motivation und ein umso günstigeres Arbeitsverhalten zu, je höher der SES ihrer Familien war (βy = 0,22, p < 0,05). Zudem wurden Mädchen im Vergleich zu Jungen im Durchschnitt als motivierter und anstrengungsbereiter eingeschätzt (βy = 0,42, p < 0,05). Diese Unterschiede spiegelten sich nur zu einem sehr geringen Teil in der selbsteingeschätzten Lernfreude und Anstrengungsbereitschaft der Kinder wider und blieben auch nach Kontrolle dieser Merkmale mit geringfügig reduzierter Effektstärke bestehen (vgl. Tab. 3, Modell 2).

5.3 Vermittlung der Verzerrungen in Leistungserwartungen durch Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens

Als Basis für die Mediationsanalysen wurden zunächst die Verzerrungen in den Leistungserwartungen der Lehrkräfte bestimmt. Neben den Hintergrundmerkmalen der Kinder wurden hierzu die bereichsspezifischen Ausgangsleistungen der Lernenden, ihre kognitiven Grundfähigkeiten sowie ihre selbsteingeschätzte Lernfreude und Anstrengungsbereitschaft als Prädiktoren der Leistungserwartungen einbezogen. Trotz der leicht modifizierten Operationalisierung der Leistungserwartungen sind die gefundenen Verzerrungen mit den von Lorenz et al. (2016) berichteten Ergebnissen konsistent (vgl. Tab. 4 und 5, Modell 0). So erwarteten Lehrkräfte unter Kontrolle der Leistungen und selbsteingeschätzten Lernfreude und Anstrengungsbereitschaft der Kinder einen geringeren Leistungszuwachs im sprachlichen Bereich für türkischstämmige Kinder im Vergleich zu Kindern ohne Zuwanderungshintergrund (βy = −0,32, p < 0,05), für Kinder aus sozial schwächeren Familien im Vergleich zu Kindern aus sozial bessergestellten Familien (βy = 0,15, p < 0,05) und für Jungen im Vergleich zu Mädchen (βy = 0,17, p < 0,05). Im mathematischen Bereich fielen die Leistungserwartungen höher aus für Kinder mit osteuropäischem Hintergrund als für Kinder ohne Zuwanderungshintergrund (βy = 0,34, p < 0,05) und höher für Kinder aus sozial bessergestellten Familien als für Kinder aus sozial benachteiligten Familien (βy = 0,13, p < 0,05). Geschlechtsbezogene Verzerrungen waren im mathematischen Bereich nicht zu verzeichnen (βy = −0,07, p = 0,34).

Tab. 4 Prädiktion der sprachlichen Leistungserwartungen von Lehrkräften
Tab. 5 Prädiktion der mathematischen Leistungserwartungen von Lehrkräften

Um die Hypothesen 2a und 2b zu prüfen, wurden die Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens als Mediator zwischen den Hintergrundmerkmalen der Kinder und den Leistungserwartungen hinzugenommen und indirekte Pfade spezifiziert (vgl. Tab. 4 und 5, Modell 1; siehe auch Abb. 1). Die Ergebnisse zeigen, dass je positiver die Lehrkräfte die Motivation und das Arbeitsverhalten der Kinder einschätzten, desto höher fielen insgesamt auch die Leistungserwartungen im sprachlichen und mathematischen Bereich aus (Sprache: βy = 0,52, p < 0,05; Mathematik: βy = 0,54, p < 0,05). Dieser Zusammenhang ergab sich bei gleichen Leistungen, bei gleicher selbsteingeschätzter Lernfreude und Anstrengungsbereitschaft sowie bei gleichen Hintergrundmerkmalen der Kinder.

Die Koeffizienten des ethnischen Hintergrunds in der Prädiktion der Leistungserwartungen änderten sich nach Kontrolle der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens weder im sprachlichen noch im mathematischen Bereich (alle ∆βy nicht signifikant). Demnach scheinen die mit dem ethnischen Hintergrund verbundenen Verzerrungen der Leistungserwartungen unabhängig von der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens zu sein.

Anders stellte sich das Bild für Verzerrungen der Leistungserwartungen in Abhängigkeit vom sozialen Hintergrund der Kinder dar. Die Koeffizienten des SES reduzierten sich nach Kontrolle der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens signifikant (Sprache: ∆βy = 0,07, p < 0,05; Mathematik: ∆βy = 0,08, p < 0,05). Etwa die Hälfte der mit dem SES assoziierten Verzerrungen ließ sich auf Unterschiede in der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens der Kinder zurückführen. Die über diese Lehrkrafteinschätzung vermittelten indirekten Pfade des SES waren statistisch signifikant (Sprache: βy = 0,11, p < 0,05; Mathematik: βy = 0,10, p < 0,05).

Für die geschlechtsbezogenen Verzerrungen in den Leistungserwartungen kehrten sich die Effekte um: Ohne Berücksichtigung der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens zeigte sich ein Vorteil zugunsten der Mädchen im sprachlichen Bereich und kein Geschlechtseffekt im mathematischen Bereich (vgl. Tab. 4 und 5, Modell 0). Wurde die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens zusätzlich kontrolliert, verschwand der Geschlechtseffekt im sprachlichen Bereich (βy = −0,02, p = 0,67) und im mathematischen Bereich trat ein Vorteil zugunsten der Jungen auf (βy = −0,33, p < 0,05). Bei gleichen Testleistungen, gleicher selbsteingeschätzter Lernfreude und Anstrengungsbereitschaft der Kinder sowie bei gleicher Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens erwarteten die Lehrkräfte also für Jungen bessere Mathematikleistungen als für Mädchen. Im sprachlichen Bereich erwarteten Lehrkräfte hingegen bei gleicher Leistung und bei gleicher Selbst- und Fremdeinschätzung der Motivation und des Arbeitsverhaltens ähnliche Leistungen für Mädchen und Jungen. Die über die Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens vermittelten indirekten Pfade des Geschlechts waren statistisch signifikant (Sprache: βy = 0,20, p < 0,05; Mathematik: βy = 0,21, p < 0,05).

Wurden die fächerspezifischen Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens in den Modellen berücksichtigt, veränderten sich die Ergebnisse im sprachlichen Bereich nicht bedeutsam. Auch im mathematischen Bereich blieb die Richtung der Befunde identisch. Allerdings fiel der Vorteil der Jungen nach Kontrolle der fächerspezifischen Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens etwas geringer aus (βy = −0,23, p < 0,05), wodurch auch der indirekte Pfad eine etwas geringere Stärke zeigte (βy = 0,10, p < 0,05).

6 Diskussion

Der vorliegende Beitrag ging zwei Fragestellungen nach: Erstens, ob Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens primär die Selbsteinschätzungen von Schülerinnen und Schülern oder eher stereotypenbasierte Annahmen widerspiegeln, und zweitens, ob ethnische, soziale und geschlechtsbezogene Verzerrungen von Leistungserwartungen auf diese Unterschiede zurückgeführt werden können.

Zunächst wurde deutlich, dass Lehrkräfte die Motivation und das Arbeitsverhalten von Schülerinnen und Schülern in Abhängigkeit von deren Hintergrundmerkmalen unterschiedlich einschätzten. Diese Differenzen spiegelten sich dabei nur marginal in den Selbsteinschätzungen der Kinder wider. Es kann also davon ausgegangen werden, dass es sich teilweise um stereotype Annahmen der Lehrkräfte handelt.

Übereinstimmend mit Befunden bisheriger Studien (z. B. Trautwein und Baeriswyl 2007; Anders et al. 2010) schrieben Lehrkräfte Kindern aus sozial bessergestellten Familien im Vergleich zu Kindern aus sozial schwächeren Familien sowie Mädchen im Vergleich zu Jungen eine höhere Motivation und ein günstigeres Arbeitsverhalten zu. Aus der Berücksichtigung der Selbsteinschätzungen der Kinder in der vorliegenden Studie ergibt sich darüber hinaus ein zusätzlicher Erkenntnisgewinn: Die Befunde verdeutlichen, dass die Einschätzungen der Lehrkräfte gegenüber Kindern aus sozial bessergestellten Familien und Mädchen auch dann noch höher ausfielen, wenn die Selbsteinschätzungen der Kinder berücksichtigt wurden. Die Ergebnisse bestätigen damit die Hypothesen 1b und 1c.

Unterschiede in Abhängigkeit vom ethnischen Hintergrund (Hypothese 1a) fanden sich unter Kontrolle des SES und Geschlechts nur für die Gruppe der Kinder mit osteuropäischem Hintergrund: Lehrkräfte schrieben diesen Schülerinnen und Schülern eine höhere Motivation und ein günstigeres Arbeitsverhalten zu als Kindern ohne Zuwanderungshintergrund, auch dann wenn die Selbsteinschätzungen der Kinder kontrolliert wurden. Dieser Befund steht im Gegensatz zu Studien von Anders et al. (2010) und Schneider (2011), die kleine negative Effekte des allgemeinen Zuwanderungshintergrunds auf die Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens identifizierten. Allerdings wurden dort verschiedene ethnische Herkunftsgruppen nicht separat betrachtet, sodass sich entgegengesetzte Verzerrungen für verschiedene Zuwanderergruppen möglicherweise überdeckt haben.

Weiterhin zeigte sich, dass Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens mit höheren Leistungserwartungen assoziiert sind, wobei dieser Zusammenhang in Übereinstimmung mit Hypothese 2a auch unter Kontrolle der Testleistungen und der Selbsteinschätzungen der Kinder bestehen blieb. In die Leistungserwartungen von Lehrkräften flossen also nicht nur die tatsächlichen Leistungen der Lernenden sowie deren bei sich selbst wahrgenommene Lernfreude und Anstrengungsbereitschaft ein, sondern zusätzlich auch Lehrkraftannahmen zur Motivation und zum Arbeitsverhalten der Kinder.

Außerdem bestätigte sich die Annahme, dass Unterschiede in der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens in Abhängigkeit vom ethnischen und sozialen Hintergrund sowie vom Geschlecht der Schülerinnen und Schüler zur Erklärung von Verzerrungen in Leistungserwartungen beitragen (Hypothese 2b). Damit unterstützen die Befunde insgesamt die Vermutung, dass Verzerrungen in Leistungserwartungen von Lehrkräften teilweise auf Annahmen über die Motivation und das Arbeitsverhalten verschiedener Gruppen von Schülerinnen und Schülern basieren.

Die mit dem sozialen Hintergrund assoziierten Verzerrungen in Leistungserwartungen konnten etwa zur Hälfte auf Unterschiede in der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens zurückgeführt werden. Lehrkräfte scheinen anzunehmen, dass Kinder aus sozial bessergestellten Familien insgesamt motivierter und anstrengungsbereiter sind und dass sich damit einhergehend auch ihre Leistungen günstiger entwickeln. Der verbleibende verzerrte Anteil könnte z. B. auf die Annahme der Lehrkräfte zurückgehen, Kinder aus sozial bessergestellten Familien erhielten in schulischen Belangen mehr Unterstützung von ihren Eltern (vgl. z. B. Nölle et al. 2009). Zukünftige Studien sollten dieser Annahme nachgehen. Zusätzlich zu Lehrkrafteinschätzungen der elterlichen Unterstützung sollten dabei auch Elternangaben berücksichtigt werden und als Vergleichsmaß für die Lehrkrafteinschätzungen dienen.

Für die geschlechtsbezogenen Verzerrungen in den Leistungserwartungen kehrten sich die Effekte nach Kontrolle der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens um, sodass im mathematischen Bereich ein Vorteil zugunsten der Jungen und im sprachlichen Bereich kein Geschlechtseffekt auftrat. Demnach scheinen Lehrkräfte die Motivation und das Arbeitsverhalten von Jungen insgesamt als ungünstiger anzunehmen als von Mädchen und ihnen daher im sprachlichen Bereich einen Leistungsnachteil zu attestieren, obwohl sich die sprachlichen Leistungen der Mädchen und Jungen in unserer Studie nicht unterschieden. Im mathematischen Bereich scheinen die Lehrkräfte hingegen die höheren Leistungen, die sie den Jungen eigentlich zutrauen, nach unten zu adjustieren, weil sie Jungen als weniger schulisch motiviert einschätzen und ihnen ein ungünstigeres Arbeitsverhalten zusprechen. Zwar berichteten die Jungen auch tatsächlich eine etwas geringere Lernfreude als die Mädchen, diese Unterschiede wurden von den Lehrkräften jedoch überschätzt. Diese Befunde zu Leistungserwartungen und Geschlecht sind weitgehend konsistent mit den Ergebnissen der bereits beschriebenen Studie von Kuhl und Hannover (2012) zur Benotung von Mädchen und Jungen.

Die mit dem ethnischen Hintergrund verbundenen Verzerrungen der Leistungserwartungen traten unabhängig von der Lehrkrafteinschätzung der Motivation und des Arbeitsverhaltens auf. Dies weist darauf hin, dass Leistungserwartungen von Lehrkräften für Kinder aus zugewanderten Familien mit stereotypen Annahmen über andere lernrelevante Merkmale der Kinder oder ihres familiären Umfelds verknüpft sind. Ein möglicher Erklärungsansatz für die höheren Leistungserwartungen an Kinder mit osteuropäischem Hintergrund im mathematischen Bereich könnte sein, dass Lehrkräfte bei den Eltern dieser Kinder eine besondere Wertschätzung der mathematisch-naturwissenschaftlichen Fächer wahrnehmen (z. B. Walter und Taskinen 2008), was sich möglicherweise auch in höheren mathematischen Leistungserwartungen für diese Kinder niederschlagen könnte. Außerdem könnten geringere Erwartungen im sprachlichen Bereich für türkischstämmige Kinder durch die Annahme geringerer Deutschkenntnisse bedingt sein. So thematisierten z. B. in einer Interviewstudie von Kratzmann und Pohlmann-Rother (2012) alle befragten Erzieherinnen fehlende Deutschkenntnisse türkischstämmiger Kinder, die ihrer Einschätzung nach zu Herausforderungen im Kindergartenalltag führen. Allerdings sollte diesbezüglich bedacht werden, dass in unseren Analysen im sprachlichen Bereich die Lautbewusstheit als Leistungsmaß kontrolliert wurde. Da die Testung auf Deutsch erfolgte, bildet dieses Maß zu einem gewissen Anteil auch die sprachlichen Fähigkeiten der Kinder im Deutschen ab. Dennoch wäre es aufschlussreich, in weiterführenden Studien zusätzlich eine Gruppierung anhand des Sprachhintergrunds der Kinder vorzunehmen um eventuelle Unterschiede der Befunde im Vergleich zu den Ergebnissen zu ethnischen Herkunftsgruppen identifizieren zu können. Zukünftige Studien sollten außerdem klären, auf welche Merkmale sich stereotype Annahmen von Lehrkräften für verschiedene ethnische Herkunftsgruppen neben der Motivation und dem Arbeitsverhalten noch beziehen und ob diese die in der vorliegenden Studie nicht erklärten Anteile ethnischer Verzerrungen in Leistungserwartungen erklären können.

Die Ergebnisse des Vergleichs zwischen Selbst- und Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens legen nahe, dass es sich eher um stereotype Annahmen der Lehrkräfte über diese Merkmale der Lernenden handelt. Dennoch ist es auch möglich, dass die Lehrkrafteinschätzungen tatsächliche Gruppenunterschiede im Lernverhalten der Kinder widerspiegeln, die die Erstklässlerinnen und Erstklässler selbst nicht beurteilen können. Zukünftige Studien sollten daher systematische Beobachtungen des Lernverhaltens der Kinder durchführen und diese als objektiveren Vergleichsmaßstab für die Lehrkrafteinschätzungen heranziehen.

Bei der Interpretation der Ergebnisse insgesamt ist außerdem zu beachten, dass die Stichprobe der Schülerinnen und Schüler in Bezug auf ihre soziale Zusammensetzung leicht positiv selektiert war. Zudem haben sich möglicherweise besonders engagierte Lehrkräfte freiwillig für die Studienteilnahme entschieden. Geht man davon aus, dass engagiertere Lehrkräfte besonders bemüht sind, ihre Schülerinnen und Schüler präzise einzuschätzen, hätte die höhere Beteiligungsquote dieser Lehrkräfte an der Studie eher eine Unterschätzung der Verzerrungen in den Leistungserwartungen zur Folge. Der ermittelte Zusammenhang zwischen den Leistungserwartungen und den Lehrkrafteinschätzungen der Motivation und des Arbeitsverhaltens sollte davon jedoch nicht beeinflusst sein.

Werden nicht erklärte Varianzanteile in Leistungserwartungen als Verzerrungen interpretiert, ist es möglich, dass Messungenauigkeiten in den Leistungsmaßen zu einer Unterschätzung des zutreffenden Anteils der Leistungserwartungen und damit zu einer Überschätzung etwaiger Verzerrungen führen. Trotz des Einbezugs vielfältiger Leistungsmaße lässt sich dies in der vorliegenden Studie nicht ausschließen.

Insgesamt weisen die Befunde darauf hin, wie wichtig es ist, Lehrkräfte für den möglichen Einfluss von Stereotypen auf schulische Einschätzungen und Erwartungen zu sensibilisieren. Dies ist vor allem deshalb relevant, weil verzerrte Leistungserwartungen über Prozesse der selbsterfüllenden Prophezeiung die Leistungsentwicklung Heranwachsender beeinflussen (Jussim und Harber 2005) und damit zu einer Verfestigung von Bildungsungleichheiten beitragen können. Dass es möglich ist, den Einfluss von Stereotypen zu reduzieren, zeigt die sozialpsychologische Literatur (vgl. z. B. Blair 2002). Hierzu ist es jedoch erforderlich, die zugrunde liegenden Mechanismen zu kennen und diesen aktiv entgegen zu wirken. Hierzu hat die vorliegende Studie wichtige Erkenntnisse geliefert.