Einleitung

Das erste Studienjahr in den Fächergruppen Natur- und Ingenieurwissenschaften gehört zu einer kritischen Phase des Studiums; 42 % aller Studienabbrecher in diesen Fächern brechen ihr Studium innerhalb der ersten beiden Semester ab (Heublein et al. 2017). Um diesem Studienabbruch entgegenzuwirken, investieren die betroffenen Fakultäten viel in die fachliche Vorbereitung der Erstsemester. Der Fokus liegt dabei vor allem auf der Förderung des mathematischen Wissens, was beispielsweise die hohe Zahl mathematischer Vor- und Brückenkurse an deutschen und angelsächsischen Universitäten zeigt (Bausch et al. 2014; Dürr, Dürr et al. 2016; Marr und Grove 2010).

Ein für Studienerfolg prognostischer Test zum mathematischen Wissen könnte den Bedarf der Studierenden identifizieren, um ein angepasstes Angebot an Brückenkursen anzubieten. Bisher wurde zur adäquaten inhaltlichen Gestaltung des Übergangs zwischen Schule und Hochschule jedoch wenig geforscht (Biehler et al. 2014).

Mit der im Folgenden beschriebenen korrelativen Studie wird der Einfluss des mathematischen Wissens von Studierenden zu Studienbeginn auf die Klausurergebnisse am Ende des ersten Semesters in den Fächern Bauingenieurwesen, Biologie, Chemie und Physik im Vergleich zu den Schulnoten untersucht. Dadurch soll die Prognose für Studienerfolg in diesen Fächern, über die Schulnoten hinaus, mit einem gemeinsamen Test zur Erfassung des mathematischen Wissens verbessert werden. Für die Untersuchung wurden Daten der DFG-Forschergruppe ALSTER (Akademisches Lernen und Studienerfolg in der Eingangsphase von naturwissenschaftlich-technischen Studiengängen) (Fleischer et al. 2017; Müller et al. 2017) herangezogen.

Theoretischer Hintergrund

Prädiktion von Studienerfolg durch schulische Leistungen

Das Deutsche Zentrum für Hochschul- und Wissenschaftsforschung berichtet von überdurchschnittlich hohen Abbruchquoten in naturwissenschaftlich-technischen Studiengängen; sie sind z. B. in Chemie (41 %) und Physik (40 %) über die letzten Jahre konstant hoch und im (Bau-) Ingenieurwesen (39 %) und der Biologie (23 %) nur leicht rückläufig (Heublein et al. 2017). Die Quote im Fach Physik wird mit 29 % angegeben, wenn sogenannte Parkstudierende nicht berücksichtigt werden (Nienhaus 2010). Die wichtigsten Gründe für die hohen Abbruchquoten sind Leistungsprobleme; sie wurden von den Studierenden unter allen Abbruchgründen mit 33 % in der Fächergruppe Mathematik und Naturwissenschaften und mit 38 % in den Ingenieurwissenschaften genannt (Heublein et al. 2017).

Die universitären Leistungsprobleme, die zu Studienabbrüchen führen können, werden für naturwissenschaftlich-technische Fächergruppen vor allem mit geringen mathematischen Vorkenntnissen begründet; Studienabbrecher haben prozentual weniger „sehr gute“ und „gute“ Zensuren im Schulfach Mathematik als Absolventen (Tab. 1).

Tab. 1 Anteile der Noten „sehr gut“ und „gut“ nach Studienabbrechern und Absolventen, zitiert nach Heublein et al. (2017)

Die Zensur im Schulfach Mathematik kann deshalb als ein Indikator für Erfolg im Studium gesehen werden, was für die untersuchten Fächer bestätigt wird (Buschhüter et al. 2017; Gold und Souvignier 2005; Trapmann et al. 2007).

Während die Mathematiknote in einem direkten Zusammenhang mit naturwissenschaftlich-technischen Studiengängen gebracht wird, ist die Abiturnote der beste Prädiktor für Studienerfolg im Allgemeinen (Rindermann und Oubaid 1999; Rach und Heinze 2017; Trapmann et al. 2007). Dies wird durch Studien im Ingenieurwesen (Rager und Rottmann 2015), in der Biologie (Schachtschneider 2016), in der Chemie (Freyer 2013) und der Physik (Buschhüter et al. 2017; Gold und Souvignier 2005; Sorge et al. 2016) belegt.

Nach bisheriger Befundlage sind also sowohl die Abiturdurchschnittsnote als auch die Zensur im Schulfach Mathematik prädiktiv für Studienerfolg in den naturwissenschaftlich-technischen Studiengängen.

Validität von schulischen Leistungen und Studierfähigkeitstests für Studienerfolg

Gute schulische Leistungen, gemessen über die Abiturnote und die Mathematiknote, machen Studienerfolg wahrscheinlicher. Schulnoten werden jedoch nicht nur durch fachliche Leistungen, sondern auch durch andere Faktoren beeinflusst, die nicht unbedingt prädiktiv für Studienerfolg sein müssen. So verfälscht beispielsweise der sogenannte Schulleistungseffekt die Notengebung. Sparfeldt et al. (2010) weisen auf unterschiedliche Notengebung bei gleichen kognitiven Fähigkeiten aber unterschiedlichen Ausprägungen in schulnahen Variablen hin (z. B. schulische Selbstkonzepte). Unter anderem fließt in Schulnoten zusätzlich die mündliche Mitarbeit ein, die eher auf sprachliche und kommunikative Fähigkeiten hinweist, was bei Studierfähigkeitstests und Klausurnoten nicht der Fall ist. Außerdem existieren bezüglich der Schulleistung am Ende der gymnasialen Oberstufe schulform- und bundeslandspezifische Unterschiede (Köller 2013). Die Vielfalt der Faktoren, die nicht mit mathematischen Fähigkeiten verbunden werden können, erklärt den Befund von Neumann et al. (2015). Sie finden bei ingenieurwissenschaftlichen Studienanfängern nur mittlere Korrelationen zwischen Schulnoten und einem Studierfähigkeitstest zum mathematischen Wissen (Abiturnote: r = −0,37, p < 0,000, N = 865; Mathematiknote: r = −0,50, p < 0,000, N = 848). Somit repräsentieren die Abitur- und Mathematiknoten das Wissen, mit dem Studierende das Studium beginnen, nicht präzise genug und die Individuen sind nur eingeschränkt vergleichbar.

Der Konstanzer Studierendensurvey zeigt außerdem, dass sich die mittlere Abiturnote in den alten Bundesländern für die Jahre 1972 bis 2010 alle neun Jahre um eine Zehntelnachkommastelle verbessert hat. Der zunehmende Anteil „sehr guter“ und „guter“ Zensuren kann tendenziell zu einem Deckeneffekt führen, der die Prognose von Studienerfolg zusätzlich einschränkt. Die Verbesserung der Noten lässt sich auf eine Änderung der Notengebung zurückführen und nicht auf eine Änderung des mathematischen Wissens. In diesem Zeitraum haben sich unter anderem die Bewertungsstandards und Prüfungsbedingungen mehrmals verändert (Grözinger und Baillet 2015), während nach Buschhüter et al. (2016) für das mathematische Wissen von Physikstudierenden zwischen den Jahren 1978 und 2013 keine signifikante Veränderung festgestellt werden konnte. Auch in einer angelsächsischen Studie wurden die Zeugnisnoten von Studienanfängern in naturwissenschaftlich-technischen Studiengängen im Schulfach Mathematik mit ihren Leistungen in einem mathematischen Studierfähigkeitstests verglichen. Während sich die Notengebung im Schulfach Mathematik über den Verlauf von 10 Jahren nicht veränderte, hat die Testleistung der Studierenden in den Bereichen Algebra und Arithmetik, bei zunehmender Varianz, signifikant abgenommen (Faulkner et al. 2010).

Es kann deshalb angenommen werden, dass die Abitur- und Mathematiknoten, obwohl sie immer noch prognostisch valide für Studienerfolg sind (Trapmann et al. 2007), nicht hinreichend das mathematische Wissen abbilden, das für das erfolgreiche Absolvieren des ersten Semesters erforderlich ist. Für das Studienfach Mathematik zeigt sich zum Beispiel, dass der Einfluss der Mathematiknoten auf den Studienerfolg unbedeutend wird, wenn neben den Mathematiknoten auch das Vorwissen zur universitären Mathematik als Prädiktor für den Studienerfolg herangezogen wird (Rach und Heinze 2017).

Studierfähigkeitstests können dazu beitragen einen quantitativen Standard zu etablieren, indem sie Leistungsveränderungen zwischen verschiedenen Jahrgängen valide überprüfen (Faulkner et al. 2010; Rindermann und Oubaid 1999) und sie verbessern zudem die Prognose von Studienerfolg in Ergänzung zur alleinigen Prognose durch Schulnoten (Faulkner et al. 2010; Kraus et al. 2017; Rindermann und Oubaid 1999). Nach Hell et al. (2009, S. 264 f.) gehören Studierfähigkeitstests zu den validesten Prädiktoren zur Vorhersage des individuellen Studienerfolgs. Für die Physik konnte mit einem aus dem Jahr 1978 stammenden Studierfähigkeitstest zur Messung des mathematischen Wissens der Studienerfolg (Studienleistungsparameter, die sich aus Noten und Credits berechnen) in einer einfachen Regression mit einem mittleren Effekt (\(\beta =-0,45\) und \(R_{\mathrm{korr}.}^{2}=0,20\)) vorhergesagt werden (Buschhüter et al. 2017). Studierfähigkeitstests zur Messung der mathematischen Fähigkeiten eigenen sich somit dazu Studienerfolg vorherzusagen. Ob jedoch „ein gemeinsamer Einsatz von Studierfähigkeitstests und Schulnoten sinnvoll ist, hängt letztlich von der inkrementellen Validität und somit von der Interkorrelation von Schulnoten und Studierfähigkeitstests ab. Nach den bisherigen Erfahrungen ist eine inkrementelle Validität im einstelligen Bereich […] mit […] Fähigkeitstests erreichbar“ (Hell et al. 2009). Inwieweit sich Studierfähigkeitstests für eine inkrementell bessere Vorhersage im Vergleich zu Schulnoten eignen, ist für die Fächer Bauingenieurwesen, Biologie, Chemie und Physik noch nicht belegt.

Forschungsfragen und Hypothesen

Forschungsfrage 1: Inwieweit ist das mathematische Wissen, erfasst mit einem Studierfähigkeitstest zu Beginn des ersten Semesters, in den untersuchten Fächern jeweils prädiktiv für Studienerfolg?

Buschhüter et al. (2017) konnten bereits für das Fach Physik einen mittleren prädiktiven Zusammenhang zwischen mathematischem Wissen, das mit einem Studierfähigkeitstest von 1978 erhoben wurde, und Studienerfolg nachweisen. Die Größe dieses Zusammenhangs wird auch für die anderen Fächer angenommen. Deswegen wird die folgende Hypothese formuliert.

Hypothese 1:

In den untersuchten Fächern gibt es einen mittleren prädiktiven Zusammenhang zwischen mathematischem Wissen und Studienerfolg, erhoben am Ende des ersten Semesters.

Forschungsfrage 2: Inwieweit ist das mathematische Wissen in den untersuchten Fächern jeweils prädiktiv für Studienerfolg unter Kontrolle der durchschnittlichen Abiturnote und der MathematiknoteFootnote 1?

Hell et al. (2009) halten Werte im einstelligen Bereich für die inkrementelle Validität von Studierfähigkeitstests für plausibel. Deswegen wird in den folgenden Hypothesen lediglich formuliert, dass der Studierfähigkeitstest unter Kontrolle der Schulnoten prädiktiv ist.

Hypothese 2.1:

In den untersuchten Fächern ist das mathematische Wissen unter Kontrolle der durchschnittlichen Abiturnote prädiktiv für Studienerfolg.

Hypothese 2.2:

In den untersuchten Fächern ist das mathematische Wissen unter Kontrolle der Mathematiknote1 für Studienerfolg prädiktiv.

Forschungsfrage 3: Inwieweit klärt das mathematische Wissen in den untersuchten Fächern jeweils inkrementelle Varianz des Studienerfolgs gegenüber der Abiturnote und der Mathematiknote1 auf?

Hunsley und Meyer (2003) halten ein Inkrement dann für substanziell, wenn die Zunahme in der Varianzaufklärung mindestens äquivalent zum hier erwarteten korrelativen Zusammenhang ist, den wir bei Hypothese 1 zugrunde gelegt haben. Aus diesem Grund werden folgende Hypothesen formuliert.

Hypothese 3.1:

Es kann ein substanzielles Inkrement des mathematischen Wissens gegenüber der Abiturnote gezeigt werden.

Hypothese 3.2:

Es kann ein substanzielles Inkrement des mathematischen Wissens gegenüber der Mathematiknote1 gezeigt werden.

Methode

Stichprobe

Zur Beantwortung der Forschungsfragen zum mathematischen Wissen wurden im Wintersemester 2016/17 Erstsemesterstudierende (N = 751) der Studiengänge Bauingenieurwesen, Biologie, Chemie und Physik an zwei nordrhein-westfälischen Universitäten zu zwei Messzeitpunkten (Anfang und Ende des ersten Fachsemesters) getestet. Die naturwissenschaftlich-technischen Studiengänge weisen im Durchschnitt einen Frauenanteil von 41 % auf. Das Durchschnittsalter der Studierenden der Fächer Bauingenieurwesen (N = 208), Biologie (N = 162), Chemie (N = 275) und Physik (N = 106) beträgt 22,1 Jahre (SD = 3,5 Jahre). Für beide Universitätsstandorte zusammen wurde eine mittlere Ausschöpfungsquote von 71,1 % erreicht. Die Ausschöpfungsquoten berechnen sich aus der Anzahl der Studierenden, die an der Erhebung teilgenommen haben, im Verhältnis zur Anzahl der Erstsemesterstudierenden, die in der ersten Vorlesungswoche in der jeweiligen Fachveranstaltung anwesend waren.

Erhebungsverfahren

Noten

Alle Studierenden wurden nach ihrer Abiturnote und die Bauingenieur- und Physikstudierenden zusätzlich nach ihren erzielten Punkten im Schulfach Mathematik und der Kurswahl im Schulfach Mathematik gefragt. Da Mathematik in der Oberstufe Nordrhein-Westfalens entweder als Grund- oder Leistungskurs gewählt werden muss und die Studierenden überwiegend im Bundesland Nordrhein-Westfalen das Abitur absolviert haben, hat die Variable Kurswahl für die Studienfächer Bauingenieurwesen und Physik zwei Ausprägungen. Die Mathematiknoten für die Fächer Biologie und Chemie wurden von den kooperierenden Teilprojekten des ALSTER-Projekts nicht miterhoben, sodass sie nicht als Prädiktoren für Studienerfolg berücksichtigt werden können. Das gilt auch für die fachspezifischen Abiturleistungen, beispielsweise die Chemienote im Abitur, die nicht in allen Teilprojekten erhoben wurden.

StudierfähigkeitstestFootnote 2 – Fächerübergreifende Erhebung des mathematischen Wissens

Für eine parallele Überprüfung der Forschungsfrage für die Fächer Bauingenieurwesen, Biologie, Chemie und Physik sowie für eine spätere ökonomische Verwendbarkeit eines Studierfähigkeitstest, sollte ein Studierfähigkeitstest nicht nur für ein Fach, sondern für verschiedene Fächer einsetzbar sein. Deswegen sollte, um eine mögliche prädiktive Kraft eines Studierfähigkeitstests auf den Studienerfolg in den einzelnen Fächern nicht zu mindern, das im Test abgefragte Wissen auch in allen Curricula der jeweiligen Fächer verankert sein. Dies ist für die oben genannten Fächer der Fall (Dürr et al. 2016; GDCh 2015; KBF 2013; KFP 2011). Zusätzlich liefert das bundesweit angelegte Projekt „Mathematische Lernvoraussetzungen für MINT-Studiengänge“ (MaLeMINT) ein weiteres Indiz für eine gemeinsame inhaltliche mathematische Basis dieser Fächer. Aus einer Delphi-Befragung von Hochschullehrerinnen und -lehrer sollen Mindeststandards für mathematische Kompetenzen zu Studienbeginn abgeleitet werden. Bei der Einschätzung der Voraussetzungen zeigen 664 Hochschullehrende eine Übereinstimmung in 144 von 179 Aspekten (etwa 80 %); es gibt einen großen Konsens bei der Bewertung der mathematischen Lernvoraussetzungen (Neumann et al. 2017). Damit ist die inhaltliche Validität eines fachübergreifenden Testinstruments zur Erhebung des mathematischen Wissens für die Fächer Bauingenieurwesen, Biologie, Chemie und Physik gegeben.

Die Testitems wurden auf Basis eines Mathematiktests der Arbeitsgruppe Fischer für das BMBF Projekt ProfileP (Riese et al. 2015) ausgewählt, adaptiert und erweitert und zu Beginn des Semesters administriert. Die Bearbeitung des Tests dauert in der Grundversion (NItems = 23) 25 min. Die Items in der Grundversion umfassen die fünf Themenbereiche mathematische Operationen (NItems = 3), Terme und Gleichungen (NItems = 9), Vektoren und Matrizen (NItems = 6), Differenzieren (NItems = 3) und Integrieren (NItems = 2). Der Themenbereich Trigonometrie (NItems = 3) kann ergänzt werden. Die Operationalisierung dieser Themenbereiche ist deckungsgleich mit der thematischen Verortung mathematischen Wissens in der Kategorie „mathematische Inhalte“ des Projektes MaLeMINT (Neumann et al. 2017). Die Teilthemen entsprechen den von Hochschullehrenden am häufigsten geforderten Lernvoraussetzungen „Grundlagen“, „Analysis“ und „Lineare Algebra“; es gibt keine Items zu den zusätzlich geforderten Lernvoraussetzungen „Analytische Geometrie“, „Stochastik“ und „bereichsübergreifende Inhalte“. Die drei weiteren Kategorien des Projektes MaLeMINT „mathematische Arbeitstätigkeiten“, „Wesen der Mathematik“ und „persönliche Merkmale“ sind ebenfalls nicht operationalisiert. Grundsätzlich lassen sich alle Testitems (siehe Anhang in Kap. 10) mit schulischem Mathematikwissen lösen. Dabei werden Inhalte der Sekundarstufe I und II berücksichtigt. Die Items S‑01 bis S‑12 (Mathematische Operationen/Terme und Gleichungen) sind beispielsweise als Kompetenz fünf (mit symbolischen, formalen und technischen Elementen der Mathematik umgehen) in den Bildungsstandards des Faches Mathematik für den mittleren Schulabschluss verankert (KMK 2012). Die Items S‑13 bis S‑18 sind dem Sachgebiet Lineare Algebra zuzuordnen und die Items S‑19 bis S‑23 dem Sachgebiet Analysis, die als zwei von drei Sachgebieten (das dritte ist Stochastik) in den einheitlichen Prüfungsanforderungen der Abiturprüfung Mathematik vorgesehen sind (EPA Mathematik; KMK 2002). Für angehende Bauingenieur- und Physikstudierende werden zusätzlich durchschnittlich schwerere Items (P-01 bis P-21) eingesetzt, die aber ebenfalls mit mathematischem Schulwissen (Analysis und Lineare Algebra) lösbar sind. Eine Ergänzung dieser Items wurde vorgenommen, um die erwarteten unterschiedlichen Personenfähigkeiten für verschiedene Studiengänge adäquat auflösen zu können. Ein Bezug zu mathematischen Inhalten der Schulbiologie, -chemie und -physik lässt sich über die entsprechenden einheitlichen Prüfungsanforderungen in der Abiturprüfung nicht herstellen. Sie fordern allgemein, dass die Schülerinnen und Schüler im Rahmen von Aufgabenlösungen „Mathematisieren“ (Chemie und Physik) und Formeln sowie mathematische Sätze aus einem begrenzten Gebiet (Biologie) verfügbar haben sollen. Bestimmte mathematische Fähigkeiten werden nicht gefordert und benötigte mathematische Inhaltsbereiche werden nicht explizit genannt (KMK 2004a, 2004b, 2004c). Dem Studiengang Bauingenieurwesen lässt sich nicht eindeutig ein Schulfach zuordnen.

Die Bearbeitung der umfassendsten Testversion (NItems = 41) dauert 45 min. Alle Items weisen ein offenes Antwortformat auf (Abb. 1), um die Ratewahrscheinlichkeit einzuschränken und alternative richtige Lösungen bei einer Aufgabe zuzulassen (Rost 1996). Auch wenn durch das freie Antwortformat die Testökonomie eingeschränkt wird, kann ein geschulter Rater mithilfe eines Kodiermanuals ein Testheft der Grundversion in durchschnittlich einer Minute bewerten. Für den umfangreichsten und im Mittel schwierigsten Test dauert die Bewertung durchschnittlich drei Minuten pro Testheft. Die standardisierte Durchführung des Tests wurde durch ein Testleitermanual sichergestellt, die Testabläufe wurden protokolliert. Um die Auswertungsobjektivität einschätzen zu können, wurden im Rahmen einer Pilotstudie im November 2015 (N = 474) 10 % der Testhefte einer Doppelkodierung unterzogen; hierbei wurde eine Übereinstimmung von 100 % erzielt.

Abb. 1
figure 1

Beispielitems, die in der Grundversion des Tests eingesetzt werden

Um das mathematische Wissen der Studierenden der untersuchten Fächer miteinander vergleichen zu können, wurde eine 1PL-Rasch-Skalierung mit dem Paket TAM (Robitzsch et al. 2017) in der Statistiksoftware R (R Core Team 2018) durchgeführt. Durch die Raschskalierung können die Personenfähigkeiten von Studierenden unterschiedlicher Fächer mit verschiedenen Testversionen auf einer gemeinsamen Skala dargestellt werden (Rost 1996). Die aus der Raschskalierung resultierenden empirischen Itemschwierigkeiten sind im Anhang (Kap. 10) aufgelistet. Zudem wurden die mittleren gewichteten Personenfähigkeiten der Studierenden im mathematischen Wissen geschätzt (Warm 1989). Die Reliabilität der Schätzer der Personenfähigkeiten (WLE-Reliabilität) ist als gut zu bezeichnen (Tab. 2). Auch die Infit-Werte sprechen für eine gute Modellpassung, da die Standardgrenzwerte (Range) von 0,75–1,3 weder über- noch unterschritten werden (Bond und Fox 2012). Die Personenfähigkeiten stellen in dieser Erhebung ein Maß für das mathematische Wissen von Studierenden zu Beginn des ersten Studiensemesters dar.

Tab. 2 Fitwerte der Raschskalierung (1PL) für die Erstsemesterkohorte zu Beginn Wintersemesters 2016/17

Studienerfolg

Studienerfolg ist in dieser Studie als gemittelte Prüfungsleistung am Ende des ersten Semesters operationalisiert, da die individuelle Prüfungsleistung das meistgenutzte und wichtigste Kriterium für Studienerfolg ist (z. B. Freyer 2013). Klausurnoten von Nebenfächern wurden nicht bei der Operationalisierung berücksichtigt, da sie nicht von allen Studierenden eines Studiengangs belegt wurden.

Eine Übersicht der Operationalisierung von Studienerfolg ist in Tab. 3 dargestellt. Es werden jeweils die Klausurnoten der Hauptfächer berücksichtigt, die für beide Standorte inhaltlich vergleichbar sind. Da die Gewichtung der Credits je nach Standort verschieden ist, wurden jeweils die Mittelwerte der Credits hinter den Modulnamen der Hauptfächer angegeben. Der Anteil der Hauptfächer beträgt, mit Ausnahme der Biologie, immer mehr als die Hälfte aller Credits im ersten Semester. An der Gewichtung der Credits wird deutlich, dass die Affinität der hier untersuchten Fächer zur Mathematik vergleichbar ist. In den Fächern Bauingenieurwesen, Chemie und Physik sind die bivariaten Korrelationen zwischen den Klausurnoten der fachspezifischen Hauptfach- und der Mathematikmodule in der gleichen Größenordnung.

Tab. 3 Operationalisierung von Studienerfolg. Es werden jeweils die Klausurnoten der Hauptfächer (Mittelwerte) operationalisiert, die für beide Standorte inhaltlich vergleichbar sind. Mit Ausnahme der Biologie gehören dazu auch immer Mathematikmodule. Praktikumsmodule, die zwischen dem ersten und zweiten Semester stattfinden, werden nicht berücksichtigt

Vorgehen bei der Datenanalyse

Um Forschungsfrage 1 zu beantworten, wurde das mathematische Wissen jeweils korrelativ mit den gemittelten Prüfungsleistungen der Studierenden in den vier Studiengängen am Ende des ersten Semesters verglichen. Die gemittelten Prüfungsleistungen wurden jeweils für jedes Fach z‑standardisiert. Beim Studiengang Bauingenieurwesen liegen die Klausurnoten am Ende des ersten Semesters im Studium vor, bei allen anderen Studiengängen liegen die erreichten Klausurpunkte vor; dies muss bei der Interpretation des Vorzeichens bei den Variablen der folgenden Korrelations- und Regressionsmodelle berücksichtigt werden. Eine erwartete mittlere Korrelation liegt nach Cohen (2013) dann vor, wenn der Korrelationskoeffizient \(r\cong 0,3\) ist.

Die Forschungsfragen 2 und 3 wurden mithilfe verschiedener multipler Regressionen und deren Vergleich beantwortet, da diese Methode es erlaubt Beziehungen zwischen mehreren Prädiktorvariablen und einer Kriteriumsvariablen (gemittelte Prüfungsleistungen) zu analysieren (Field et al. 2013).

Forschungsfrage 2 geht über Forschungsfrage 1 hinaus, da nach der Prädiktion für Studienerfolg auch unter Kontrolle der Schulleistungen gefragt wird. Dafür wurde jedes Studienfach mithilfe der hierarchischen Methode durch zwei Regressionen (A und B) spezifiziert. Die Abiturnote, als bisher bester Prädiktor für Studienerfolg, wurde jeweils vor dem mathematischen Wissen in die Regressionsgleichung eingeführt, um so im nächsten Schritt das Inkrement des mathematischen Wissens überprüfen zu können.

Um auch die Punkte im Schulfach Mathematik als schulischen Prädiktor nutzen zu können, musste zusätzlich die Kurswahl bezüglich des Fachs Mathematik berücksichtigt werden. Für diese Analyse wurde eine Kombination aus der hierarchischen und der „all-subset“ Methode gewählt (Field et al. 2013), wie schematisch in Abb. 2 dargestellt. In Regression A wurden immer die beiden Haupteffekte berücksichtigt. Zusätzlich wurde mithilfe des Interaktionsterms überprüft, ob die Kurswahl die Schulnoten beeinflusst. Falls eine Beeinflussung vorlag, wurden beide Haupteffekte genannt. Regression B baut auf Regression A auf, ergänzt um den Prädiktor mathematisches Wissen aus dem Studierfähigkeitstest.

Abb. 2
figure 2

Schematische Darstellung der Analysemethode der multiplen Regression in Tab. 6

Um Forschungsfrage 3 zu beantworten, wurden die multiplen Regressionen mithilfe von F‑Tests paarweise verglichen, um zu überprüfen, ob sich die Werte der jeweiligen Varianzaufklärung (R2) der beiden Regressionen signifikant voneinander unterscheiden (Field et al. 2013). Um zu entscheiden, ob ein Inkrement auch mindestens einem mittleren Effekt von \(r\cong 0,3\) (Cohen 2013) entspricht, muss in einer Regression für die inkrementelle Varianz des zweiten Prädiktors \(\Updelta R^{2}\)> 0,09 und für die des dritten Prädiktors \(\Updelta R^{2}\)> 0,02 gelten (Hunsley und Meyer 2003). Diese Inkremente werden als substanziell beschrieben und mindestens in dieser Größenordnung in den Hypothesen 3.1 und 3.2 erwartet.

Im Folgenden werden zunächst alle Prädiktorvariablen beschrieben, bevor die Forschungsfragen zur Prädiktion des Studienerfolgs durch mathematisches Wissen beantwortet werden können.

Ergebnisse

In unserer Stichprobe unterscheiden sich die Studierenden aller Fächer bezüglich der mittleren Abiturnote auf einem zweiseitigen \(5\%\)-Niveau signifikant (F(1,740) = 13,21, p < 0,001), mit Ausnahme der Paare Biologie-Physik (p = 1,00) und Physik-Chemie (p = 0,07) (Tab. 4).

Tab. 4 Absteigende Reihenfolge der mittleren Abiturnoten mit Standardabweichungen (SD). Punkte im Schulfach Mathematik nur für die beiden Fächer Bauingenieurwesen und Physik. Die Punkte im Schulfach Mathematik wurden entweder in einem Grundkurs (GK) oder einem Leistungskurs (LK) erzielt

Für die beiden Fächer Bauingenieurwesen und Physik wird erwartet, dass die Punkte im Schulfach Mathematik ebenfalls prädiktiv für Studienerfolg sind (Trapmann et al. 2007). Zusätzlich wird angenommen, dass eine Person, die in einem Grundkurs beispielsweise die Note „2,0“ erzielt nicht demselben Leistungsniveau zugeordnet werden kann, wie eine Person, die in einem Leistungskurs die Note „2,0“ erzielt hat. Deshalb wird eine Differenzierung nach Kurswahl und Studienfach vorgenommen, sodass sich insgesamt vier Mittelwerte für die Punkte im Schulfach Mathematik (Bauingenieurwesen GK: \(10,0,SD=2,8\), LK: \(9,9,SD=2,5\) und Physik GK: \(9,8,SD=3.,\), LK: \(11,8,SD=2,5\)) ergeben. Drei der vier Gruppen unterscheiden sich nicht voneinander, die vierte Gruppe (Studiengang Physik und Kurswahl Leistungskurs) unterscheidet sich jedoch signifikant von den ersten drei Gruppen (F(1, 265) = 21,93, p < 0,001).

Alle Studierenden der naturwissenschaftlich-technischen Studiengänge unterscheiden sich bezüglich des mittleren mathematischen Wissens (WLE) signifikant (F(1, 708) = 96,70, p < 0,001, Tab. 5), mit Ausnahme der Paarung Chemie–Bauingenieurwesen (p = 1,00).

Tab. 5 Aufsteigende Reihenfolge des mittleren mathematischen Wissens (∅ WLE) und deren Standardabweichungen (SD) nach Studiengang

Prädiktion von Studienerfolg

Die bivariaten Korrelationen in Tab. 6 zeigen für alle untersuchten Variablen signifikante Korrelationen zum Studienerfolg. Die Höhe der Korrelationen zwischen dem mathematischen Wissen und dem Studienerfolg ist für die Fächer Bauingenieurwesen, Chemie und Physik hoch und für die Biologie in einem mittleren Bereich (Cohen 2013). Gleichzeitig sind die Korrelationen zwischen Abiturnote und Studienerfolg in allen Fächern betraglich geringer als die Korrelationen zwischen mathematischem Wissen und Studienerfolg, jedoch statistisch nicht signifikant (Fishers z‑Test). Leistungskurse (LK) und Grundkurse (GK) gehen mit unterschiedlicher Gewichtung in die mittlere Abiturnote ein, deshalb wird für Studierende mit LK eine höhere Korrelation zwischen dem mathematischen Wissen und der Abiturnote erwartet. Da mehr Physikstudierende einen LK im Schulfach Mathematik als Bauingenieurstudierende belegt haben (vgl. Tab. 4), waren Korrelationsunterschiede (−0,76 zu −0,56) zu erwarten (vgl. Tab. 6).

Tab. 6 Korrelationen des mathematischen Wissens, der Abiturnote, der Punkte im Schulfach Mathematik und des Studienerfolgs nach Studienfach

Zusammenfassend sind für jedes Fach die Korrelationen zwischen mathematischem Wissen und Studienerfolg signifikant, sodass vertiefende Analysen zur Prädiktion von Studienerfolg durch den Studierfähigkeitstest ertragreich sein können. Im Folgenden werden die Beziehungen der Variablen mithilfe von Regressionen genauer untersucht, wobei die Abiturnote, die Punkte im Schulfach Mathematik und die WL-Schätzer zum mathematischen Wissen entsprechend der Forschungsfragen als Prädiktoren und die Variable Studienerfolg als Kriteriumsvariable gewählt werden.

Prädiktoren Abiturnote und mathematisches Wissen

Die Ergebnisse bezüglich der Abiturnote sind in Tab. 7 dargestellt. Wie im Theorieteil bereits ausgeführt, prädiziert die Abiturnote den Studienerfolg im jeweiligen Fach, wobei die aufsteigende Reihenfolge an aufgeklärter Varianz lautet: Biologie, Bauingenieurwesen, Chemie und Physik (Korr. R2 = 0,09; 0,25; 0,26; 0,35, Modelle A).

Tab. 7 Regressionen zur Prädiktion von Studienerfolg durch die Abiturnote und das mathematische Wissen mit standardisierten Regressionskoeffizienten β. Die abhängigen Variablen entsprechen jeweils der Operationalisierung für Studienerfolga aus Tab. 3

Im zweiten Schritt wird die Abiturnote kontrolliert und das mathematische Wissen in die Regression aufgenommen (Modelle B). In allen vier Fächern sind sowohl die Abiturnote als auch das mathematische Wissen signifikante Prädiktoren für Studienerfolg (Hypothese 2.1).

Darüber hinaus klärt das mathematische Wissen unter Kontrolle der Abiturnote im Vergleich zu den Modellen A mit dem alleinigen Prädiktor Abiturnote signifikant inkrementelle Varianz auf (Hypothese 3.1); die F‑Tests der paarweisen Vergleiche zwischen den A‑ und B‑Modellen werden signifikant. Die Differenzen im korrigierten R2 für die Fächer Biologie, Bauingenieurwesen, Chemie und Physik betragen \(\Delta R_{\mathrm{korr}.}^{2}\)= 0,08; 0,17; 0,23; 0,16 und sind damit, mit Ausnahme des Fachs Biologie, auch substanziell (Hunsley und Meyer 2003). Für das Fach Biologie hat das mathematische Wissen unter Kontrolle der Abiturnote nur einen kleinen bis mittleren Effekt in der Regressionsanalyse.

In den B‑Modellen fällt auf, dass die \(\upbeta\)-Koeffizienten des mathematischen Wissens für jedes einzelne Fach betraglich stets größer sind als die \(\upbeta\)-Koeffizienten der Abiturnote. Das Verhältnis der Beträge der beiden \(\upbeta\)-Koeffizienten (mathematisches Wissen/Abiturnote) deutet auf einen etwa gleich großen Einfluss beider Prädiktoren auf den Studienerfolg im Fach Biologie (1,17) hin, bei den Fächern Bauingenieurwesen (1,35) und Physik (1,57) ist der Einfluss des mathematischen Wissens größer als bei der Abiturnote und im Fach Chemie (1,84) liegt ein fast doppelt so großer Einfluss des mathematischen Wissens vor. Die Unterschiede sind aber nicht signifikant.

Insgesamt werden mit den Ergebnissen aus Tab. 7 die Hypothesen 2.1 für alle Fächer und 3.1 für die Fächer Bauingenieurwesen, Chemie und Physik bestätigt: das mathematische Wissen ist Prädiktor für Studienerfolg unter Kontrolle der Abiturnote und klärt inkrementelle Varianz auf. Im Folgenden geht es um die Hypothesen 2.2 und 3.2, indem das mathematische Wissen als Prädiktor für Studienerfolg unter Kontrolle der Mathematiknote untersucht wird.

Prädiktoren Mathematiknote und mathematisches Wissen

Der Prädiktor Abiturnote wird gegen die beiden Prädiktoren Punkte im Schulfach Mathematik und Kurswahl (Mathematikleistungskurs oder -grundkurs) für die beiden Studienfächer Bauingenieurwesen und Physik ausgetauscht. In Tab. 8 werden für beide Fächer zunächst nur die Punkte im Fach Mathematik, die Kurswahl und die Interaktion der Punkte und Kurswahl als Prädiktoren für Studienerfolg berücksichtigt, um eine Referenz für die beiden Modelle B zu generieren.

Tab. 8 Regressionen zur Prädiktion von Studienerfolg durch das mathematische Wissen und die Punkte im Schulfach Mathematik mit standardisierten Regressionskoeffizienten β. Die Kurswahl wird separat und in einem Interaktionsterm mit berücksichtigt. Alle Prädiktoren, die mit nicht signifikant (n. s.) gekennzeichnet sind, wurden in den dargestellten Modellen nicht mitberücksichtigt. Die abhängigen Variablen entsprechen jeweils der Operationalisierung für Studienerfolg aus Tab. 3

Für die Studierenden des Bauingenieurwesens zeigt Modell Bau. A, dass die Punkte im Fach Mathematik durch die Kurswahl moderiert werden und die Kurswahl selbst einen zusätzlichen Prädiktor darstellt. In Modell Bau. A ist der Einfluss der Kurswahl auf Studienerfolg (\(|\upbeta |\) = 0,43) etwa doppelt so groß wie der Einfluss der Punktzahl im Schulfach Mathematik (\(|\upbeta |\) = 0,21). Für die Physikstudierenden (Modell Ph. A) konnte der Einfluss der Variable Kurswahl auf Studienerfolg nicht nachgewiesen werden.

In den Modellen B wird jeweils das mathematische Wissen der Studierenden zusätzlich in die Regressionen einbezogen. Bei Kontrolle der schulischen Leistungen aus den Modellen A wird das mathematische Wissen signifikant als Prädiktor für Studienerfolg (Hypothese 2.2). Darüber hinaus verbessert sich das korrigierte R2 im Bauingenieurwesen um \(\Delta R_{\mathrm{korr}.}^{2}=0,14\) und in der Physik um \(\Delta R_{\mathrm{korr}.}^{2}\)= 0,10. Diese Differenzen sind in den paarweisen Vergleichen (F-Tests) jeweils signifikant und nach Hunsley und Meyer (2003) auch substanziell (Hypothese 3.2).

Insgesamt werden mit den Ergebnissen aus Tab. 8 die Hypothesen 2.2 und 3.2 bestätigt: das mathematische Wissen ist Prädiktor für Studienerfolg unter Kontrolle der Mathematiknote und klärt inkrementelle Varianz auf.

Diskussion und Limitationen

Die Ergebnisse zeigen, dass alle Hypothesen, mit Ausnahme der Hypothese 3.1 für das Fach Biologie, bestätigt werden konnten. Die Korrelationen zwischen dem mathematischen Wissen und dem Studienerfolg sind für die Fächer Bauingenieurwesen, Chemie und Physik hoch und für die Biologie in einem mittleren Bereich. Die Korrelationen alleine beantworten jedoch nicht die Frage, ob ein Studierfähigkeitstest zum mathematischen Wissen im direkten Vergleich zu schulischen Leistungen, wie zum Beispiel der Abiturnote oder den Leistungen im Schulfach Mathematik, zur Prädiktion von Studienerfolg geeignet ist. Der bisherige Forschungsstand (Faulkner et al. 2010; Hell et al. 2009; Rach und Heinze 2017; Rindermann und Oubaid 1999) wurde durch Ergebnisse zu Hypothese 2.1 bestätigt, das mathematische Wissen ist auch unter Kontrolle der durchschnittlichen Abiturnoten prädiktiv für Studienerfolg.

Letztendlich bietet der Einsatz des Testinstruments zum mathematischen Wissen nur dann einen ökonomischen Mehrwert zur Prädiktion von Studienerfolg, wenn die inkrementelle Validität eines solchen Tests nachgewiesen werden kann (Hell et al. 2009). Deswegen wird mit Forschungsfrage 3 nach der zusätzlich zur Abiturnote (beziehungsweise der Mathematiknote) aufgeklärten Varianz von Studienerfolg gefragt. Tatsächlich wird die zusätzlich aufgeklärte Varianz für die Fächer Bauingenieurwesen (\(\Delta R_{\mathrm{korr}.}^{2}=0,17\)), Biologie (\(\Delta R_{\mathrm{korr}.}^{2}=0,08\)), Chemie (\(\Delta R_{\mathrm{korr}.}^{2}=0,23\)) und Physik (\(\Delta R_{\mathrm{korr}.}^{2}=0,16\)) jeweils signifikant. Im Fach Biologie wird eine inkrementelle Validität im einstelligen Bereich und in den anderen drei Fächern im zweistelligen Bereich erreicht. Dieser Befund bestätigt bzw. übertrifft die Erwartungen im Vergleich zu einer Metaanalyse anderer Fächer, die im einstelligen Bereich liegen (Hell et al. 2009). Dabei ist das Inkrement im Fach Biologie allerdings nicht substanziell (Hunsley und Meyer 2003). Ein neuer Befund ist die aufsteigende Reihenfolge der aufgeklärten Varianz des Studienerfolgs in den Fächern Biologie (\(R_{\mathrm{korr}.}^{2}=0,17)\), Bauingenieurwesen (\(R_{\mathrm{korr}.}^{2}=0,42\)), Chemie (\(R_{\mathrm{korr}.}^{2}=0,49\)) und Physik (\(R_{\mathrm{korr}.}^{2}=0,51\)).

Ähnlich wie es sich in der Studie von Rach und Heinze (2017) andeutet, kann die inkrementelle Validität des Studierfähigkeitstests zum mathematischen Wissen über die schulische Mathematikleistung hinaus in dieser Studie empirisch gezeigt werden; das Inkrement beträgt im Fach Bauingenieurwesen \(\Delta R_{\mathrm{korr}.}^{2}\)= 0,14 und in der Physik \(\Delta R_{\mathrm{korr}.}^{2}\)= 0,10. Zwar fällt die zusätzlich aufgeklärte Varianz im Vergleich zur Abiturnote geringer aus, sie ist aber immer noch zweistellig. Zu beachten ist, dass die Physikstudierenden hinsichtlich ihrer Schulnoten im Fach Mathematik (vgl. Tab. 4) wegen des großen Anteils von Studierenden, die einen Leistungskurs gewählt haben, eine Positivauswahl und eine homogenere Gruppe darstellen.

Der Einsatz eines Studierfähigkeitstests zum mathematischen Wissen ist deshalb mindestens für die Fächer Bauingenieurwesen, Chemie und Physik zu empfehlen, da das mathematische Wissen über die Abiturnote hinaus substanziell zusätzlich Varianz aufklärt. Dass im Fach Biologie zwar ein signifikantes Inkrement des mathematischen Wissens vorliegt (vgl. Hypothese 3.1), es jedoch nicht substanziell wird, spricht vermutlich für die geringere Relevanz des mathematischen Wissens im ersten Fachsemester, da die operationalisierten Hauptfächer (vgl. Tab. 3) eine geringere Affinität zur Mathematik haben. Doch auch die Abiturnote klärt im Fach Biologie (Modell Bio. A) im Vergleich zu den anderen drei Fächern einen um mehr als eine Größenordnung geringeren Varianzanteil auf (\(\Delta R_{\mathrm{korr}.}^{2}\)= 0,09). Dieser Befund kann durch den Numerus Clausus (NC) erklärt werden, der nur bei den Biologiestudierenden vorlag. Infolge des NC kommt es bei der Abiturnote eventuell zu einem Deckeneffekt (∅(Abiturnote) = 2,14, SD(Abiturnote) = 0,57). Für das Fach Biologie ist deshalb keine Empfehlung zum Einsatz des Studierfähigkeitstests möglich.

Zusätzlich ist auszuschließen, dass lediglich die Operationalisierung von Studienerfolg, unter anderem über die Mathematikklausuren, zu den signifikanten und substanziellen Effekten in den Fächern Bauingenieurwesen, Chemie und Physik führt. Hypothese 2.1 und Hypothese 3.1 werden für diese drei Fächer auch dann bestätigt, wenn die abhängige Variable Studienerfolg in den Regressionen aus Tab. 7 ohne die jeweiligen Noten der Mathematikklausuren berechnet werden. Die hohen Korrelationen zwischen den Klausurnoten der fachspezifischen Hauptfach- und der Mathematikmodule in den jeweiligen Fächern (vgl. Tab. 3) sind ein weiteres Indiz für die Belastbarkeit der Regressionsergebnisse.

Im deutschsprachigen Raum wurde der gezielte Einsatz von Studierfähigkeitstests zur Verbesserung der prognostischen Validität im Fach Psychologie von Formazin et al. (2011) untersucht: Für die beiden Prädiktoren „schlussfolgerndes Denken“ und „Wissen“ konnte, operationalisiert durch eine Testbatterie (Matrizen, Gleichungen, Propositionen, Psychologie, Mathematik, Englisch und Biologie), eine Zunahme der aufgeklärten Varianz der Studiennoten um 6 % gegenüber der Abiturnote als alleinigem Prädiktor gezeigt werden. Im direkten Vergleich klärt der hier vorgestellte Test für die Fächer Biologie (8 %), Bauingenieurwesen (17 %), Chemie (23 %) und Physik (16 %) mehr zusätzliche Varianz auf, sodass er für zukünftige Studienerfolgsprognosen eine wichtige Rolle spielen kann. Die gemeinsame Varianzaufklärung durch die Abiturnote sowie alle Studierfähigkeitstests zusammen liegt in der Psychologie bei \(R_{\mathrm{korr}.}^{2}=20\,\%\) (Formazin et al. 2011) und in unserer Studie mit der Abiturnote und dem Studierfähigkeitstest zum mathematischen Wissen bei \(R_{\mathrm{korr}.}^{2}=17\,\%\) (Biologie), \(R_{\mathrm{korr}.}^{2}=42\,\%\) (Bauingenieurwesen), \(R_{\mathrm{korr}.}^{2}=49\,\%\) (Chemie) und \(R_{\mathrm{korr}.}^{2}=51\,\%\) (Physik). Während im Fach Biologie die Varianzaufklärung der Studienleistung geringer ist als in der Psychologie, wird sie für die Fächer Chemie, Physik und Bauingenieurwesen übertroffen. Es ist zu erwarten, dass weitere Fachkonstrukte die Prädiktion des Studienerfolgs zusätzlich erhöhen können, beispielsweise spielt in der Physik beim Lösen von Aufgaben wahrscheinlich spezifisches Fachwissen (Buschhüter et al. 2017), die Kenntnis von Strategien zum Aufgabenlösen (Renkl 2001), Lerntypen (Rach und Heinze 2017) und mathematisches Modellieren physikalischer Probleme (Uhden 2012) eine Rolle.

Die Korrelation zwischen der Mathematiknote und dem mathematischen Wissen ist im Fach Bauingenieurwesen (\(r=0,24\)) geringer als in der Stichprobe von Neumann et al. (2015) (\(r=-0,50\)), die aus den Fächern Maschinenbau, Bauingenieurwesen und Fahrzeugtechnik zusammengesetzt ist. Dieser Unterschied ist vermutlich auf die Zusammensetzung der Stichproben und auf die unterschiedliche Operationalisierung der Tests zur Erfassung des mathematischen Wissens zurückzuführen. Für das Fach Physik wird die betraglich insgesamt höchste Korrelation zwischen Mathematiknote und mathematischem Wissen (\(r=0,55\)) erreicht. Dass der Studierfähigkeitstest im Vergleich zur Mathematiknote sowohl im Bauingenieurwesen als auch in der Physik signifikant und substanziell inkrementelle Varianz (\(\Delta R_{\mathrm{korr}.}^{2}=0,14\) und \(\Delta R_{\mathrm{korr}.}^{2}\)= 0,10) am Studienerfolg aufklärt, spricht für eine Unschärfe bei der Notengebung im Fach Mathematik. Diese Unschärfe resultiert einerseits aus dem sogenannten Schulleistungseffekt, der die Notengebung bei gleichen kognitiven Fähigkeiten zugunsten unterschiedlicher Ausprägungen schulnaher Variablen verzerrt (Sparfeldt et al. 2010). Andererseits existieren bezüglich der Schulleistung am Ende der gymnasialen Oberstufe schulformspezifische Unterschiede (Köller 2013).

Der Studierfähigkeitstest ist aufgrund der eingeschränkten Themenvielfalt im Vergleich zu den Mindeststandards für mathematische Kompetenzen aus der Delphi-Studie von Neumann et al. (2017) und zugunsten der Testökonomie nicht für eine Individualdiagnostik geeignet. Ebenso wie bei den Lernstandserhebungen kann der Test zur Erfassung des mathematischen Wissens allenfalls die Funktion eines „Screenings“ erfüllen, um zukünftige Studierende zu identifizieren bei denen es sich lohnen könnte, mit weitergehenden fachspezifischen Studierfähigkeitstests eine Erfolgsprognose für einen Studiengang zu machen (Leutner et al. 2008). Hier werden das Entwicklungspotential des Tests und der Vorteil der Rasch-Skalierung deutlich. Der Itempool und die Testlänge kann systematisch vergrößert werden, um den Anforderungen einer Individualdiagnostik gerecht zu werden. Die Ergebnisse eines standardisierten Studierfähigkeitstests bieten aber dennoch eine Bezugsnorm, die als Grundlage für Gruppendiagnostik dienen kann. So könnten Technik‑, Biologie‑, Chemie und Physiklehrkräfte oder Fachstudienberaterinnen und -berater schon vor der Studienwahl eine Wahrscheinlichkeitsaussage über das Bestehen der Klausuren am Ende des ersten Semesters im angestrebten Studiengang machen, indem sie die schulischen Leistungen zusammen mit dem mathematischen Wissen der zukünftigen Studierenden mit den hier vorgestellten Analysen vergleichen.

Zusammenfassung und Ausblick

Hypothese 1 kann bestätigt werden: in allen untersuchten Fächern existiert eine signifikante Korrelation zwischen dem mathematischen Wissen der Studierenden zu Studienbeginn und dem Studienerfolg. Da in den untersuchten Fächern der Studierfähigkeitstest zum mathematischen Wissen den Studienerfolg im jeweiligen Fach unter Kontrolle der Abiturnote signifikant prädiziert, kann Hypothese 2.1 bestätigt werden. Hypothese 2.2 wurde ebenfalls bestätigt; in den Fächern Bauingenieurwesen und Physik ist das mathematische Wissen unter Kontrolle der Mathematiknote und der Kurswahl im Schulfach Mathematik (LK/GK) prädiktiv für Studienerfolg. Hypothese 3.1 wird teilweise angenommen, da es in den Fächern Bauingenieurwesen, Chemie und Physik ein signifikantes und substanzielles Inkrement des mathematischen Wissens gegenüber der Abiturnote gibt; im Fach Biologie ist das Inkrement zwar signifikant, aber nicht substanziell. Hypothese 3.2 wird ebenfalls bestätigt, da das mathematische Wissen auch gegenüber der schulischen Mathematiknote signifikant wird und substanziell inkrementelle Varianz aufklärt.

Diese Ergebnisse bilden eine Bezugsnorm, die als Grundlage für zukünftige Gruppendiagnostik durch Lehrkräfte oder Fachstudienberaterinnen und -berater dienen kann. Die Vorhersage des Studienerfolgs wird für die untersuchten Fächer insgesamt verbessert, wobei sich jedoch an der Aussagekraft der schulischen Prädiktoren nichts ändert. Obwohl der Studierfähigkeitstests keine zusätzlichen Inhaltsbereiche zur Schulmathematik erfasst, sondern inhaltlich sogar begrenzter ist, hat er eine hohe inkrementelle Validität hinsichtlich der Abiturnote beziehungsweise der Mathematiknote. Während die Abiturnote auch als Indikator für kognitive Fähigkeiten interpretiert werden kann (z. B. Sorge et al. 2016), sodass ein hohes Inkrement auf zusätzliches mathematisches Wissen zurückzuführen ist, ist die Mathematiknote im Vergleich zum Studierfähigkeitstest möglicherweise nicht präzise genug, um Studienerfolg in den jeweiligen Fächern zu erklären. Weiterhin muss geklärt werden, ob die hohe inkrementelle Validität auch dann bestehen bleibt, wenn der Studierfähigkeitstest im direkten Vergleich mit fachspezifischen Studieneingangstests eingesetzt wird. Mittelfristig kann eine verbesserte Prognose von Studienerfolg zu höheren Abschlussquoten führen und das in nicht erfolgreiche Studienverläufe investierte Geld (sunk costs) minimieren (Schleithoff 2015). Aus didaktischer Sicht kann durch den fachübergreifenden systematischen Einsatz dieses Studierfähigkeitstests an deutschen Universitäten, beispielsweise in mathematischen Vor- und Brückenkursen, frühzeitig der fachliche Bedarf der Studierenden identifiziert werden. In der Folge wäre es denkbar in den jeweiligen Fachstudiengängen gezielte (und möglichst obligatorische) semesterbegleitende Angebote zum mathematischen Wissen anzuschließen, deren Inhalte bedarfsgerecht gestaltet sind.