Einleitung und Forschungshintergrund

Dieser Abschnitt stellt zunächst die große Bedeutung multipler Repräsentationen für die Naturwissenschaften und den naturwissenschaftlichen Unterricht dar. Anschließend wird auf notwendige Zusammenhänge mit allgemeinen kognitionspsychologischen bzw. enger auf das Lernen bezogenen Theorien eingegangen (Schnotz 2002, 2005; Schnotz und Bannert 2003; bzw. Ainsworth 1999, 2006a). Auf dieser Basis erfolgen die Diskussion des Begriffs der repräsentationalen Kohärenzfähigkeit und die Begründung der Notwendigkeit eines Instrumentes zu deren Messung.

Repräsentationen und Multiple Repräsentationen

Unter einer „Repräsentation“ versteht man eine stellvertretende Darstellung jenes Gegenstandes oder Sachverhaltes (des Referenten), auf den sich die Repräsentation bezieht (Peterson 1996). Repräsentationen können extern (z. B. auf Papier gedruckt) oder intern bzw. mental (im Geiste) vorliegen und werden in depiktive (bildliche) und deskriptive (beschreibende, Schnotz 2002) „Repräsentationsformen“ eingeteilt. Depiktive Repräsentationsformen nutzen Bildzeichen (vgl. Peirce 1958 [1931]) und stehen mit dem Referenten in einer Beziehung realistischer oder abstrakter struktureller Ähnlichkeit (Schnotz 2002). Dazu gehören z. B. die Repräsentationsform „realistisches Bild“, das einen Experimentalaufbau zeigt, die Repräsentationsform „schematisches Bild“, welches den Verlauf von Strahlen beschreibt (s. Abb. 1) und als Beispiele abstrakterer struktureller Ähnlichkeit die Repräsentationsformen „Graph“ oder „Diagramm“. Sie haben Vorteile bei Bereitstellung und Ablesbarkeit von konkreten und spezifischen Informationen (Schnotz 2002). Für deskriptive Repräsentationsformen besteht eine solche Ähnlichkeitsbeziehung nicht, sie nutzen auf Konventionen beruhende Symbolzeichen (vgl. Peirce 1958 [1931]), die ein Objekt beschreiben (Buchstaben, Zahlen etc.). Ihnen sind Repräsentationsformen wie gesprochene oder geschriebene Texte, Formeln, Tabellen und logische Ausdrücke zugeordnet (Schnotz 2002). Sie eignen sich gut für logische Schlussfolgerungen (Schnotz 2002). Verschiedene Repräsentationsformen des gleichen Gegenstandes können unterschiedliche Informationen beinhalten und unterschiedlich nützlich zur Lösung von Aufgaben sein (Schnotz 1994; Herrmann 1993; Schnotz et al. 2011). Als Erweiterung der Arbeit mit einzelnen Repräsentationsformen wird insbesondere dem gleichzeitigen Arbeiten mit mehreren extern zum gleichen Sachverhalt vorliegenden oder intern zu konstruierenden, separaten Repräsentationsformen („multiple Repräsentation“, vgl. Schnotz 2002, 2005) eine Lernförderlichkeit zugeschrieben (vgl. Mayer 2005, „Multimediaprinzip“: verbessertes Lernen bei Verwendung von Text-Bild Kombinationen im Vergleich zur Verwendung von Text alleine). Der Begriff der „Kohärenz zwischen multiplen Repräsentationen“ (und der diesbezüglichen Fähigkeit dazu) wird weiter unten eingeführt. Die wichtige Rolle (multipler) Repräsentationen für naturwissenschaftliches Denken und Lernen ist wohl bekannt für die Naturwissenschaften im Allgemeinen (Tytler et al. 2013), für Biologie, Chemie, und Physik (Tsui und Treagust 2013; Gilbert und Treagust 2009; Docktor und Mestre 2014), die Geowissenschaften (Sell et al. 2006), und auch die Mathematik (Lesh et al. 1987; Even 1998). Auch eine umfangreiche Forschung in der kognitiven und pädagogischen Psychologie (Mandl und Levin 1989; Van Someren et al. 1998; Held et al. 2006; Verschaffel et al. 2010) belegt ihre hohe Bedeutung.

Abb. 1
figure 1

Beispiele von bildhaften (depiktionalen) Repräsentationen: links ein realistisches Bild eines Versuchsaufbaus zur Bildentstehung und -konstruktion bei der Sammellinse. Rechts eine schematische Zeichnung, die den Verlauf von drei ausgewählten Strahlen angibt (G Gegenstandgröße, B Bildgröße, g Gegenstandsweite, b Bildweite, F Brennpunkt)

Wie Repräsentationsformen kognitiv verarbeitet werden, kann mit der cognitive theory of multimedia-learning (Mayer 2005) oder dem ihr verwandten integrierten Modell des Text- und Bildverstehens (Schnotz und Bannert 2003; Schnotz 2002, 2005) erklärt werden. Letzteres bietet eine alternative Sicht auf multimedia learning, in der repräsentationale Prinzipien stärker betont werden (Schnotz und Kürschner 2007). Es wird die Idee eines nach verbalem und des bildlichem Kanal getrennten kognitiven Untersystems (dual coding, Paivio 1986) mit zugehörigen beiden jeweils begrenzten Teilen eines Arbeitsgedächtnisses aufgegriffen (Baddeley 1986; Chandler und Sweller 1992). Dabei werden aus wahrgenommenen äußeren verbalen oder visuellen Reizen durch Herstellung von „representational connections“ mentale Repräsentationen der gleichen Form gebildet (Paivio 1986; Mayer und Anderson 1991). Verbindungen gleicher Repräsentationsformen können mental durch „associative within system interconnections“ gebildet werden (Paivio 1986), welche wir zusammengefasst für mentalen und externen Fall als „intra-representational connections (ICsFootnote 1)“ bezeichnen. Die verbalen und visuellen Repräsentationen können durch „referential connections“ (RCs) miteinander verbunden werden (Paivio 1986; Mayer und Anderson 1991). Durch die Verteilung der Informationen auf die beiden Kanäle begrenzter Kapazität und der damit verbundenen besseren Kapazitätsausnutzung kann schon eine Vereinfachung des Lernens von Text durch Verwendung von Bildern erklärt werden. Das Verarbeiten der gleichen Informationsmenge in nur einem der beiden begrenzten Kanäle würde zu einer hohen Belastung des Arbeitsgedächtnisses führen, bei einer Überlastung ist das dem Lernen abträglich (zu hoher „cognitive load“, vgl. Sweller 1999; Chandler und Sweller 1992; Van Merriënboer und Sweller 2005; Schnotz und Kürschner 2007). Mit cognitive load ist die Belastung des Arbeitsgedächtnisses durch die Anzahl der gleichzeitig vorliegenden Informationselemente (Van Merriënboer und Sweller 2005), und durch deren kognitive Verarbeitung (Schnotz 2010) gemeint. Zu bemerken ist, dass das dual coding (im Sinne von Paivio 1986; Mayer 2005; Schnotz 2005) nach Ausschöpfung der Kapazitäten beider Kanäle auch begrenzt ist, aber auf höherem Niveau als bei Nutzung nur eines Kanals. Das integrierte Modell des Text- und Bildverstehens von Schnotz erklärt das kognitive Verarbeiten von Repräsentationsformen detailliert (die o. g. Begriffe „IC“ und „RC“ sind von großer Bedeutung für unsere Arbeit und werden daher in die folgenden Abschnitte zur Verdeutlichung integriert).

Das Modell nach Schnotz (2005) enthält zwei Kanäle begrenzter Kapazität, in dem die entsprechenden Repräsentationsformen verarbeitet werden: einen deskriptiven Kanal, in dem die Informationen durch Analyse von Symbolstrukturen verarbeitet werden, und einen depiktiven Kanal, in dem Informationen durch Prozesse der analogen Strukturabbildung verarbeitet werden. Nach Wahrnehmung einer externen deskriptiven Repräsentationsform wird auf der deskriptiven Seite des Modells eine interne mentale Oberflächenrepräsentation des Inhaltes gebildet. Daraus wird dann nach Selektion von Informationen eine interne propositionale Repräsentation des semantischen Inhalts als Beschreibung mittels Symbolen gebildet (vgl. IC). Dabei werden, je nach Fähigkeit der Person zu mehr oder weniger konsistenten mentalen Repräsentationen führend, kognitive Schemata aus dem Langzeitgedächtnis aktiviert (bzw. müssen erst im Arbeitsgedächtnis erzeugt werden). Diese beschreiben, wie Selektion und Organisation von Informationen auszuführen sind. Aus der propositionalen Repräsentation entsteht durch Modellkonstruktion (vgl. RC) ein mentales Modell (mentale Struktur, die in Struktur- oder Funktionsanalogie mit dem dargestellten Gegenstand steht). Wird eine externe depiktive Repräsentationsform wahrgenommen, entsteht eine interne visuelle Wahrnehmung der depiktiven Repräsentationsform. Daraus wird auf Basis von kognitiven Schemata nach Selektion von Informationen zuerst ein mentales Modell des Gegenstands gebildet (vgl. IC) und dann durch Modellinspektion eine interne propositionale Repräsentation erzeugt (vgl. RC). Durch Modellinspektion und -konstruktion werden bei der simultanen Verwendung von deskriptiven und depiktiven externen Repräsentationsformen Informationen zusammengeführt und können von einer in die andere übersetzt und integriert werden. Propositionale Repräsentationen und mentale Modelle der Referenten von externen Repräsentationsformen, können auf Basis von kognitiven Schemata miteinander abgeglichen werden (vgl. RC; und danach in äußere Repräsentationsformen überführt werden). Diese konzeptuelle Organisation führt, je nach Verfügbarkeit von kognitiven Schemata mehr oder weniger erfolgreich, zu Konsistenz von internen multiplen Repräsentationen. Wird nur eine Repräsentationsform verwendet (beispielsweise ein Strahlendiagramm als depiktive Repräsentationsform), können Informationen daraus nach Bildung des mentalen Modells durch Modellinspektion über eine Proposition in eine externale deskriptive Repräsentationsform (z. B. einen Text oder eine Formel) übersetzt werden (vgl. RC). Beim Üben werden die genannten spezifischen kognitiven Schemata gebildet und im Langzeitgedächtnis gespeichert. Ob diese Schemata aus dem Langzeitgedächtnis abgerufen werden können oder erst im Arbeitsgedächtnis gebildet werden müssen, hat einen Einfluss auf die Anzahl der zur Verfügung stehenden Schemata für Bildung und Organisation von interner propositionaler Repräsentation, mentalem Modell, Oberflächenrepräsentationen sowie die Selektionen durch die Filter (vgl. Schnotz und Bannert 2003). Sind wenig kognitive Schemata abrufbar und müssen deshalb erst bei Verarbeitung einer Aufgabe gebildet werden, sinkt dadurch die Speicherkapazität der Kanäle für miteinander zusammenhängende Informationen, das Arbeitsgedächtnis wird überlastet (zu hoher cognitive load, s. oben). Anspruchsvolle repräsentationale Aufgaben sind dann weniger gut lösbar.

Ein Anspruch an die Lernenden ist, zu erkennen, welche Informationen aus Repräsentationsformen abgelesen werden müssen. Damit zusammenhängend ist der Realitätsgrad ein wichtiger Parameter von Repräsentationsformen, der ein Spektrum von fotografischen über realistische bis zu schematischen Repräsentationsformen umfasst (Höffler und Leutner 2007; Niegemann et al. 2008), dabei variiert regelmäßig auch die Detailgenauigkeit (Niegemann et al. 2008). Bei schematischen Zeichnungen können für das Verstehen wesentliche Aspekte hervorgehoben werden. Realistische Bilder sind hingegen zwar vollständiger im Informationsgehalt, sie können jedoch dadurch eine Vielzahl auch irrelevanter Informationen enthalten. Dadurch werden an den Lerner höhere Ansprüche bezüglich der Identifizierung und Auswahl relevanter Aspekte gestellt (ebenda). Plötzner und Lowe (2012) verwenden in ihrem systematischen Forschungsüberblick den Abstraktionsgrad als etwas weiter gefassten Begriff, der von depiktionalen Repräsentationsformen unterschiedlichen Realitätsgrades bis zu mathematischen Formeln als abstrakteste Form deskriptiver Repräsentationsformen reicht.

Ein weiteres zentrales Merkmal von multiplen Repräsentationen ist die Anzahl der vorkommenden Repräsentationsformen (Ainsworth 2006a) und damit auch von deren Verbindungen. Beispielsweise wachsen mit der Hinzunahme der Repräsentationsform „Formel“ (etwa in der Abbildungsgleichung) zu den beiden in Abb. 1 dargestellten bildhaften Repräsentationsformen der Informationsgehalt, aber auch die kognitiven Anforderungen. Dabei sei darauf hingewiesen, dass die Multiplizität im Begriff multiple Repräsentationen nicht ausschließlich an verschiedene Repräsentationsformen gebunden ist: z. B. könnte in einer Situation wie der von Abb. 1 auch ein zusätzlicher Vergleich zu einem weiteren Strahlendiagramm (gleiche Repräsentationsform) die Funktionalität erhöhen. Zugleich erhöht sich aber auch die Beanspruchung des begrenzten Arbeitsgedächtnisses (vgl. Baddeley 1986; Chandler und Sweller 1992; Paivio 1986), und dies ist ein ganz zentraler Gesichtspunkt für das Lernen mit multiplen Repräsentationen. Im nächsten Abschnitt wenden wir uns einer genaueren theoretischen Beschreibung von kognitiven Funktionen und Effekten von multiplen Repräsentationen zu.

Kognitive Funktionen und Effekte von multiplen Repräsentationen

Die Kognitionsforschung, insbesondere das erwähnte integrierte Modell des Text- und Bild-Verstehens (Schnotz 2002, 2005; Schnotz und Bannert 2003) bietet einen theoretischen Rahmen, die verschiedenen kognitiven Funktionen verschiedener Repräsentationen alleine und in Wechselwirkung zu verstehen: Eine externe Repräsentation kann die kognitive Anstrengung reduzieren, welche beim Lösen einer gegebenen Aufgabe aufgebracht werden muss, da die enthaltenen Informationen nicht alle mental im Gedächtnis gehalten werden müssen (s. a. 2006a). Und sie kann, durch die Bereitstellung zeitlich stabiler und strukturell wesentlicher Information, domänenspezifische Denk- und Lernprozesse unterstützen. Je nach Repräsentationsform können sich dabei Art und Menge der externalisierten Information unterscheiden, ebenso, die Art der ausgelösten kognitiven Prozesse. Eine Darstellung von Informationen in einer anderen Repräsentationsform, welche die gleiche abstrakte Struktur hat (Re-Repräsentation) beeinflusst das Aufgabenlösen, z. B. wenn mehr Information externalisiert wird (Zhang und Norman 1994), oder die Informationen anders gruppiert (2006a) oder komplementär sind (Schnotz 2002, 2005). Das heißt, es ist regelmäßig nicht ausreichend, nur mit einer einzelnen Repräsentationsform zu arbeiten, und der Gedanke spezifischer, sich ergänzender Funktionen für verschiedene Repräsentationsformen ist grundlegend für die o. g. dual coding-Modelle (Paivio 1986; Schnotz 2002, 2005; s. a. „Multimedia-Prinzip“, Mayer 2005).

Wie oben erwähnt, ist ein wesentlicher kognitiver Gesichtspunkt, der in dem integrierten Modell des Text- und Bild-Verstehens sowie bei verwandten genannten theoretischen Ansätzen (Schnotz 2002, 2005; Mayer 2005) und der Naturwissenschaftsdidaktik (Wu und Shah 2004; Cook 2006; Tsui und Treagust 2013, Kap. 1) vielfach thematisiert wird, cognitive load. Im Zusammenhang mit multiplen Repräsentationen ist dabei basierend auf der o. g. Definition die Be- und mögliche Überlastung des Arbeitsgedächtnisses durch die Anzahl und Verarbeitung von mehreren simultan zu bearbeitenden Repräsentationen und von deren Verbindungen gemeint (Tsui und Treagust 2013). Multiple Repräsentationen sind für Denken und Lernen in den Naturwissenschaften essentiell (s. oben), bedingen aber für den Lernenden zugleich die Gefahr einer kognitiven Überlastung.

Unter anderem mit Blick auf die möglichen positiven und negativen Funktionen von multiplen Repräsentationen und auf der Basis dieses kognitionspsychologischen Hintergrundes entwickelte Ainsworth (1999, 2006a, 2008) einen umfassenden Rahmen zu den lehr-lern-theoretischen Dimensionenen von Design, Funktionen und Aufgaben von multiplen Repräsentationen (DeFT: Design, Functions, Tasks). Das Design von externen multiplen Repräsentationen wird durch Parameter wie Anzahl, Art und Reihenfolge der verwendeten Repräsentationsformen sowie enthaltene Informationen bestimmt (vgl. auch Merkmale von Repräsentationen weiter oben im Text). Ein weiteres Design-Merkmal (für Lernaufgaben) ist die Art, wie das Aufzeigen der Beziehungen zwischen Repräsentationsformen als Hilfe zur Übersetzung geschieht. Da es in dem vorliegenden Beitrag um Testaufgaben geht, in denen multiple Repräsentationen erst während der Lösung durch das Hinzukommen interner Repräsentationen entstehen, werden die Design-Merkmale von multiplen externen Repräsentationen hier nur kurz aufgeführt.

Der DeFT-Theorierahmen enthält eine Taxonomie der auf Lehren und Lernen bezogenen Funktionen von multiplen Repräsentationen. Als hauptsächliche Funktionen sind „complementary roles“, „constrain interpretation“ und „construct deeper understanding“ (siehe Abb. 2) aufgeführt. Sie sind für diese Arbeit besonders wesentlich und werden daher hier ausführlicher beschrieben (Ainsworth, 1999, 2006a, 2008).

Abb. 2
figure 2

Hauptfunktionen von multiplen Repräsentationen. (Ainsworth 2006a)

Die komplementäre Funktion (complementary roles) besteht darin, dass multiple Repräsentationsformen sich in den Informationen unterscheiden können, die sie enthalten. So werden Informationen über verschiedene Repräsentationsformen verteilt, wenn die Darstellung in einer zu kompliziert wäre (z. B. aufgrund sehr verschiedener Größenordnungen von Information). Durch multiple Repräsentationsformen können komplementäre Prozesse unterstützt werden, da jede Repräsentationsform spezielle Vorteile bei der Lösung von Aufgaben hat. Zum Beispiel wird die Lösung erleichtert, wenn eine Repräsentationsform in einer Aufgabe angeboten wird (oder ausgewählt werden muss), bei der die verwendete Informationsstruktur zur durch die Aufgabe geforderten Informationsstruktur passt. Die Lösungsstrategien für die Aufgabe werden ebenso von den verwendeten Repräsentationsformen beeinflusst, Verwendung mehrerer Repräsentationsformen führt zu einem Wechsel von Lösungsstrategien (welche mehr oder weniger effektiv sein können). Weiterhin haben individuelle Unterschiede der Lerner wie Expertise und zum Teil auch individuelle Vorlieben, z. B. zu visuellen Repräsentationsformen, einen Einfluss auf das Arbeiten mit multiplen Repräsentationsformen.

Die einschränkende Funktion (constrain interpretation) besteht darin, dass die in einer Repräsentationsform möglicherweise bestehende Uneindeutigkeit durch die inhärenten Eigenschaften einer anderen eingeschränkt wird (z. B. geben Abbildungen i. A. die räumliche Lage besser wieder als ein Text). Die einschränkende Funktion kann auch darin bestehen, dass die Ungewissheit über die Bedeutung einer unvertrauten Repräsentationsform durch eine andere, besser vertraute, vermindert wird (z. B. eine schematische Darstellung eines Schaltkreises oder Strahlendiagramms wird durch eine gesprochene oder geschriebene Erläuterung erklärt).

Die Verständnis-konstruierende Funktion (construct deeper understanding) schließlich besteht darin, dass Informationen aus verschiedenen Repräsentationsformen integriert werden und durch Abstrahierung, Ausweitung, und In-Beziehung-Setzen zu einem vertieften Verständnis führen (für die Strahlenoptik einschlägige Beispiele werden in dem Abschnitt „Material und Methoden“ angeführt). Ein wenig tiefes Verständnis ist demzufolge durch einen Mangel an solchen Relationen gekennzeichnet.

Der Teil „Tasks“ des DeFT-Theorierahmens beschreibt die kognitiven Aufgaben beim Arbeiten mit multiplen Repräsentationen: Lerner sollen verstehen, wie Repräsentationen aufeinander bezogen, ineinander übersetzt und integriert werden können. Dies fällt vielen Lernenden jedoch schwer (siehe z. B. Ainsworth et al. 2002; Schoenfeld et al. 1993). Die Schwierigkeiten dieser kognitiven Aufgaben hängen von Eigenschaften der Repräsentation und ihrer kognitiven Verarbeitung wie Verarbeitungskanal, Möglichkeit von dual coding, Art der Repräsentationsform, Abstraktionsgrad, Spezifizität sowie Dimensionalität ab, und ob Repräsentationen separat oder integriert angeordnet sind (im theoretischen Hintergrund z. T. bereits aufgeführt). Individuelle Eigenschaften wie Alter, persönliche und kognitive Faktoren sowie Bekanntheit von Domäne und Repräsentation sind ebenso schwierigkeitsbestimmend (Ainsworth 2006a).

Im Folgenden wird der dargestellte Theorierahmen auf das Inhaltsfeld Strahlenoptik übertragen und an Beispielen erläutert. In der hier vorgestellten Studie wird der ursprünglich für Lernaufgaben formulierte DeFT-Theorierahmen als eine Basis für die Erhebung von Fähigkeiten, Repräsentationen aufeinander beziehen zu können, verwendet. Dafür sind die folgenden Kernpunkte dieses theoretischen Rahmens von zentraler Bedeutung (sie werden nicht in der Reihenfolge des DeFT-Akronyms behandelt; insbesondere kann Design hier erst sinnvoll erläutert werden, wenn klar ist, auf welche Functions und in den Testitems geforderten cognitive Tasks es sich bezieht):

Funktionen (functions): Beim naturwissenschaftlichen Arbeiten im Allgemeinen und der Strahlenoptik im Besonderen lassen sich die drei o. g. Grundfunktionen gut identifizieren:

  1. a.

    Der Informationsgehalt von multiplen Repräsentationen ist wesensmäßig komplementär (complementary roles, z. B. zwischen dem Text, dem Strahlendiagramm und ggf. der Formel in einer Aufgabenstellung).

  2. b.

    Es gibt typische Fälle, in denen dabei eine Spezifikation der einen durch eine andere Repräsentationsform erfolgt, z. B. wenn man die geometrischen Gegebenheiten im Strahlengang an die einer Realsituation oder deren Fotografie anpassen muss (constrain interpretation). Man kann sogar sagen, dass diese besondere Form von constrain besonders wichtig im Sinne einer adäquaten, kohärenten Verbindung von Repräsentation und Referent und damit für die Rolle von multiplen Repräsentationen für das Experiment ist.

  3. c.

    Fast durchwegs wird erst durch das Zusammenwirken mehrerer Repräsentationsformen, und insbesondere deren Konsistenz ein tieferes und vollständigeres Verständnis aufgebaut (construct deeper understanding). Hier ist die zentrale Rolle hervorzuheben, die Ainsworth (2006a, 2008) ebenso wie sich hieran anschließende Arbeiten anderer Autoren (z. B. Seufert 2003; Bodemer et al. 2004; Berthold und Renkl 2009), der Integration von Informationen aus verschiedenen multiplen Repräsentationen einräumen, und zwar sowohl für die Konstruktion und das Verständnis von Schlüsselkonzepten eines Fachgebiets als auch für das Verständnis der Beziehung dieser Konzepte untereinander.

Aufgaben (Tasks): Betreffs dieser Dimension von DeFT sind für diese Arbeit folgende zwei Typen kognitiver Aufgaben bzw. deren Anforderungen besonders wichtig (Ainsworth 2006a, 2008): Erstens die Anforderung zu verstehen, wie Repräsentationsformen aufeinander zu beziehen sind („understand how to relate representations“) und zweitens die Anforderung zu verstehen, wie korrekte Beziehungen zwischen Repräsentationen und der inhaltlichen Domäne herzustellen sind („understand the relation between the representation and the domain“). Durch Letzteres bekommen Repräsentationen erst Sinn. Dies stellt einen essentiellen, aber auch schwierigen Schritt beim Umgang mit Repräsentationen dar (McDermott 2001; Kozma und Russell 2005). Die Fähigkeiten, diese beiden Arten von Beziehungen herzustellen, gehören zum Kern von repräsentationaler Kohärenzfähigkeit im Sinne dieser Arbeit (s. unten).

Design: Mehrere Design-Merkmale (als dritte Dimension des DeFT-Bezugsrahmens) sind für die Operationalisierung von repräsentationaler Kohärenzfähigkeit wesentlich und werden mit Blick auf die Konstruktion der Items unten im Detail diskutiert.

Repräsentationale Kohärenzfähigkeit

Die Fähigkeit, multiple Repräsentationen als domänenspezifische Werkzeuge des Denkens und Lernens nutzen zu können, beruht zunächst auf der Fähigkeit, eine gegebene Repräsentationsform sinngebend mit ihren Referenten in Beziehung setzen zu können (s. oben): Dies stellt grundlegend den Sinnzusammenhang für die Verwendung einzelner oder mehrfacher Repräsentationen dar (Ainsworth 2006a, 2008). Insbesondere gilt dies natürlich für Situationen in der Physik, in der Referenten von multiplen Repräsentationen oft Experimente oder Prozesse in der Natur sind. Ebenso ist die Fähigkeit, korrekte, konsistente, sinnvolle und damit kohärente Beziehungen zwischen verschiedenen externen Repräsentationsformen herzustellen, ganz wesentlich: Der o. g. Begriff „RC“ wird auf die Verbindung zwischen allen unterschiedlichen – auch externen – Repräsentationsformen erweitertFootnote 2. Schließlich spielt auch die Fähigkeit, kohärente Beziehungen innerhalb gleicher Repräsentationsformen herstellen zu können, eine große Rolle: Mit dem o. g. Begriff „IC“ („I“ wie „intra“) meinen wir in Bezug zu einer externen Repräsentationsform primär die Verbindungen innerhalb dieser (nicht die Verbindungen zwischen mehreren gleichen Repräsentationsformen)Footnote 3. Mayer (2002) betont, dass Verbindungen und Kohärenz innerhalb einer Repräsentationsform eine wesentliche Voraussetzung von sinnhaftem Lernen (Ausubel 1963) sind. Ein Beispiel für ICs im gegenwärtigen Kontext ist die Herstellung von Bezügen innerhalb eines Strahlendiagramms. Wenn jedoch zwei oder mehr Varianten von Strahlendiagrammen für verschiedene physikalische Situationen miteinander verglichen werden sollen, müssen auch hier Verbindungen zwischen getrennten Repräsentationen hergestellt werden, d. h. es muss information integration geleistet werden. Wegen der Ähnlichkeit der Eigenschaften und Funktionen von ICs zwischen mehreren gleichen Repräsentationsformen und RCs zwischen verschiedenen Repräsentationsformen (Komplementarität, information integration, coherence) wird an mehreren Stellen die Verwendung des Oberbegriffs „Repräsentationsform-Verbindungen“ (RFC, representation form connection Footnote 4) sinnvoll sein. Die wesentliche Bedeutung dieser Verbindungen für naturwissenschaftliches Denken und Lernen steht natürlich in Einklang mit der zentralen Rolle, die auch in dem DeFT-Modell der Integration von Informationen aus verschiedenen Repräsentationsformen zugewiesen wird (Ainsworth 2006a, 2008; s. oben).

Vor dem Hintergrund dieser umfangreichen empirischen und theoretischen Arbeiten ergibt sich zunächst ein Verständnis von (multiplen) Repräsentationen als domänenspezifisches „Denkwerkzeug“ („a powerful tool“, Ainsworth 2008; „tools for thinking“, Uttal und O’Doherty 2008; Singer et al. 2012), das sowohl für den wissenschaftlichen Fortschritt wie für das individuelle Lernen in dem betreffenden Gebiet unabdingbar ist (Tytler et al. 2013). Die Fähigkeit, Repräsentationsformen als Denkwerkzeugadäquat einzeln oder miteinander verbunden nutzen zu können, wird Repräsentationskompetenz genannt (Guthrie 2002; Kozma und Russell 2005). In Dänemark ist sie bereits als Anforderung im Lehrplan aufgeführt (Dolin 2007). Repräsentationskompetenz bedeutet, dass die Regeln, die den jeweiligen Repräsentationsformen unterliegen, adäquat und konsistent umgesetzt werden und Informationen fehlerfrei innerhalb einer Repräsentationsform und über Repräsentationsformen hinweg verarbeitet und übertragen werden können. Auf diese Weise werden Informationen einzelner Repräsentationsformen verbunden und Verarbeitungsmöglichkeiten mehrerer Repräsentationsformen genutzt. Auch wenn einzelne Repräsentationsformen verändert werden sollen, sind interne Vergleichsprozesse zwischen der ursprünglichen und der veränderten Repräsentationsform nötig. All diese Denkprozesse basieren wesentlich auf der Voraussetzung, die o. g. Verbindungen zum Referenten, referential und intra-representational connections bzw. „representational coherence“ oder „integration“ (Seufert 2003; Mayer 1997) herstellen zu können, d. h. Informationen aus einer oder mehreren Repräsentationsformen inhaltlich korrekt und zielführend auf einander beziehen, vergleichen, ändern oder ineinander übersetzen zu können. Dies sind innerhalb von Repräsentationskompetenz also speziell diejenigen Fähigkeiten, die zur Herstellung von Verbindungen zwischen Informationselementen sowohl innerhalb einer als auch über Repräsentationsformen hinweg nötig sind. Diese Fähigkeiten wurden in der pädagogisch-psychologischen Literatur als „representational skills“ bezeichnet („ability to translate and switch between representations“, Nistal et al. 2010), eng verwandte Überlegungen und Begrifflichkeiten finden sich in der Physikdidaktik („representational consistency“; Nieminen et al. 2010), Chemiedidaktik (Kozma et al. 2000) und Mathematikdidaktik (Even 1998). Auf der Basis dieser Arbeiten und im Sinne der Grundfunktionen des DeFT-Modells (s. oben) stellt in diesem Beitrag repräsentationale Kohärenzfähigkeit einen Teil der allgemeineren Repräsentationskompetenz dar.

Repräsentationale Kohärenzfähigkeit wird als die Fähigkeit verstanden, korrekte, sinnvolle Verbindungen von Informationen innerhalb einzelner und zwischen mehreren Repräsentationsformen, sowie mit ihren Referenten herstellen zu können.

Damit folgt diese Arbeit einer Sicht von Repräsentationskompetenz und repräsentationaler Kohärenzfähigkeit nicht als isolierte Fähigkeiten, die von domänen-spezifischer Expertise unterschieden werden können, sondern sie ist eine wesentliche Komponente davon (siehe z. B. Anzai 1991; van Heuvelen 1991). Domänenspezifisch ist die Expertise, weil Repräsentationsformen die Domäne mit ihren Anforderungen repräsentieren und dadurch selbst domänenspezifisch sind (vgl. Konstruktion von Strahlendiagrammen oder die Verwendung der Abbildungsgleichung als bestimmte Formel). Weitere Argumente folgen nach den Beispielen. Man sieht dies schon an konventionellen Aufgabenstellungen wie z. B. der Aufgabe, einen Strahlengang mit gegebenen Werten von G, g und f zu zeichnen (z. B. Item 1a im Test, s. Onlinematerial), aber auch an repräsentational fokussierten Aufgabenstellungen wie z. B. die in Abb. 1 gezeigten verschiedenen Bildelemente (z. B. Gegenstands‑, Bild- und Brennweite etc.), die in den beiden Repräsentationsformen miteinander zu vergleichen sind. Im ersten Fall handelt es sich um das Übersetzen von einer Repräsentationsform in eine andere (Text nach Strahlendiagramm), im zweiten Falle um das Vergleichen gegebener Informationselemente (Prüfung auf ein Grundverständnis der Begriffe und der Fähigkeit sie aus verschiedenen Repräsentationsformen herauslesen und sie über Repräsentationsformen hinweg vergleichen zu können). Vor allem Aufgaben des ersten Typs sind in der Strahlenoptik und in vielen anderen physikalischen Teilgebieten absolut gängig (z. B. Zeichnen eines Geschwindigkeitsvektors mit gegebenen Eigenschaften, d. h. Repräsentationsform „Text“ – Repräsentationsform „schematische Darstellung“ wie eben, oder Berechnung der Widerstandes in einem Schaltkreis mit gegebenen Eigenschaften, Repräsentationsform „Text/schematische Darstellung“ – Repräsentationsform „Formel“). Solche Aufgabentypen zur sachgerechten und kohärenten Verwendung von multiplen Repräsentationen sind in der Disziplin Physik üblich und gehören quasi implizit zu den Grundanforderungen. Darüber hinaus sind Repräsentationskompetenz und repräsentationale Kohärenzfähigkeit aber auch notwendige Voraussetzungen für den weitergehenden Gebrauch von multiplen Repräsentationen als domänenspezifische Denkwerkzeuge, mit hoher Bedeutung für andere Fähigkeiten, siehe die eingangs genannte Literatur (Abschnitt „multiple Repräsentationen“) für Überblicksdarstellungen, und insbesondere für konzeptuelles Verständnis (Van Heuvelen und Zou 2001; Hubber et al. 2010), schlussfolgerndes Denken („reasoning“, van Heuvelen 1991; Plötzner und Spada 1998; Verschaffel et al. 2010), Problemlösen (Kohl und Finkelstein 2006; Verschaffel et al. 2010, Kap. 4), und Kreativität (Schnotz et al. 2010). Daher ist zu erwarten, dass mit der Verbesserung von Repräsentationskompetenz und repräsentationaler Kohärenzfähigkeit auch insgesamt eine Verbesserung der Leistungsfähigkeit in einer gegebenen Domäne einhergeht und sich repräsentationale Kohärenzfähigkeit und die Fähigkeit, mit Repräsentationsformen lernen zu können beim Arbeiten mit Repräsentationen sukzessive entwickeln und somit wechselseitig in einer Kausalbeziehung zueinander stehen. Vor diesem Hintergrund muss betont werden, dass multiple Repräsentationen nicht nur ein didaktischer Ansatz sind, den man (im besten Fall evidenzbasiert) nutzen könnte, sondern sie sind durchgängig ganz wesentlicher Bestandteil der naturwissenschaftlichen Denk- und Arbeitsweise, den man – ähnlich wie Experimente – nicht einfach aus didaktischen Gründen weglassen könnte, ohne etwas Wesentliches zu verfehlen. Das heißt pointiert gesagt, multiple Repräsentationen sind, ähnlich wie Experimente, nicht nur ein Verfahren, sondern grundlegender Gegenstand naturwissenschaftlichen Unterrichts (van Heuvelen 1991).

Wie oben erwähnt, ist cognitive load ein wesentlicher Gesichtspunkt für das Lernen mit multiplen Repräsentationen. Dabei ist nachrangig, welche Repräsentationsform und welche Art von Verbindungen (RC, IC) involviert sind. Entscheidend ist die Anzahl der Informationselemente, d. h. der involvierten Repräsentationsformen und deren Verbindungen (Van Merriënboer und Sweller 2005, Schnotz und Kürschner 2007). Auf dieser theoretischen Basis, und in Anlehnung an das DeFT Modell, sowie an Neumann et al. (2007) und Kauertz (2008) werden wir bei der Operationalisierung der Items (Abschn. 2) daher auch die Anzahl der Elemente und ihrer Verbindungen als Design-Merkmal aufnehmen.

Wir gehen an dieser Stelle noch auf die Frage einFootnote 5, ob Repräsentationskompetenz und repräsentationale Kohärenzfähigkeit in kognitionspsychologischen Begriffen ein Teil des prozeduralen Wissens einer Domäne ist, des „Knowing How“ in Form von domänenspezifischen Fähigkeiten, Techniken, Algorithmen und Methoden sowie deren Anwendungsregeln (Krathwohl 2002; Koziol und Budding 2012). Die vorliegende Literatur geht nur sehr vereinzelt explizit auf die Beziehung von multiplen Repräsentationen und prozeduralem Wissen ein (uns sind nur Beispiele aus der Mathematikdidaktik bekannt: z. B. Haapsalo und Kadjievich 2000), jedoch ist der Gedanke von multiplen Repräsentationen als Denkwerkzeuge sehr ausgeprägt (s. oben). Nimmt man diesen ernst, so ergibt sich die Antwort fast zwingend: Der Gebrauch von Werkzeugen setzt Knowing How voraus. Das Knowing how von multiplen Repräsentationen besteht darin, domänenspezifische multiple Repräsentationen und deren Verbindungen zu verstehen, sowie sie einzeln oder miteinander verbunden als Denkwerkzeuge nutzen zu können. In diesem Sinne sind Repräsentationskompetenz und repräsentationale Kohärenzfähigkeit in der Tat Bestandteile des prozeduralen Wissens einer Domäne, z. B. wie Information aus einem Diagramm erschlossen werden kann (Plötzner und Lowe 2012). Laut Ainsworth (2006) beeinflusst die Domänenkenntnis auch die Schwierigkeit der Arbeit mit multiplen Repräsentationen. Um mit den in Abb. 1 dargestellten Repräsentationsformen arbeiten zu können, ist repräsentationale Kohärenzfähigkeit in Form der Bildung von ICs nötig, um das Strahlendiagramm zu verstehen und die Bildung von RCs, um Informationselemente wie z. B. die Bildweite zwischen beiden Bildern vergleichen zu können. Grundvoraussetzung ist immer, die abgebildeten Gegenstände mit ihrem Referenten in Beziehung setzen zu können.

Notwendigkeit eines Instruments für repräsentationale Kohärenzfähigkeit

Man steht nach den o. g. angeführten Überlegungen vor dem didaktischen Dilemma, dass multiple Repräsentationen einen wesentlichen Bestandteil physikalischen Denkens und Lernens darstellen, zugleich aber (z. T. sehr) hohe Anforderungen mit sich bringen. Instrumente zur Bestimmung von Fähigkeiten sind in diesem Spannungsfeld offensichtlich von Bedeutung (s. weitere Begründung unten). Es gibt viele Hinweise, dass Aneignung und Gebrauch des kognitiven Werkzeugs multiple Repräsentation alles andere als leicht für Lernende sind. Empirische Belege hierfür gibt es von der Primarstufe (Ainsworth et al. 2002) bis zum universitären Niveau (Elektrodynamik, Saniter 2003; Mechanik, Nieminen et al. 2010). Als ein Hauptproblem wird auf Lernerebene die Schwierigkeit genannt, RCs herzustellen (Schwonke et al. 2009), d. h. es liegt eine unzureichende repräsentationale Kohärenzfähigkeit im Sinne dieses Beitrages vor. Eine weitere, für Verständnis und Gebrauch von Repräsentationen zentrale Schwierigkeit für Lernende liegt darin, die Beziehung von Repräsentationen zu wirklichen Objekten und Prozessen herzustellen (McDermott 2001). Damit kann der eigentlich erst sinnstiftende Bezug zum Referenten als eine der zentralen Funktionen des DeFT-Modells nur unzulänglich oder gar nicht ausgeführt werden (s. oben). Auf Unterrichtsebene wird eine Hauptschwierigkeit durch eine Analyse von 26 Unterrichtsstunden über das Thema Strahlenoptik in der Sekundarstufe I belegt (Lee 2009), nach der im Unterricht überwiegend eine nur implizite, rezeptive und kurze Verwendung (<3min ) von Repräsentationen umgesetzt ist. Weniger als 10 % der Repräsentationen werden durch die Schülerinnen und Schüler selbst erzeugt. Ein ähnliches Bild zeigte sich bei einer Analyse von über 800 Aufgaben aus gymnasialen Physikschulbüchern (Scheid 2013): ganz überwiegend enthalten die Aufgabenstellungen nur eine Repräsentationsform (mittlere Anzahl „\(\bar{N}\)“, Standardabweichung davon in Klammern: \(\bar{N}\) RF = 1,24 (0,44)), und sie erfordern für die Lösung i. d. R. erst recht wenige RCs (\(\bar{N}\) RC = 0,66 (0,54)).

Empfehlungen für Lehr-Lern-Ansätze, die auf der o. g. Forschungsbasis beruhen, sehen in dem Fehlen einer gezielten und systematischen kognitiven Aktivierung zu multiplen Repräsentationen (Cox und Brna 1995; Verschaffel et al. 2010, Kap. 6) eine wesentliche Quelle von Fehlern und Lernschwierigkeiten, und fordern als Gegenmaßnahme einen „representational focus“ (Tytler et al. 2013; Hubber et al. 2010), im Sinn einer aktiven und expliziten Auseinandersetzung mit multiplen Repräsentationen (van Someren et al. 1998, Kap. 16; Tsui und Treagust 2013, Kap. 7). Ausdrücklich werden dabei auch auf multiple Repräsentationen bezogene Lernaktivitäten gefordert, die über vereinfachte Schulbeispiele hinausgehen und komplexere Formen von RCs enthalten. Insbesondere sind solche mit höherer Anzahl von verwendeten Repräsentationsformen und von deren Verbindungen gemeint (van Someren et al. 1998, Kap. 15; van Heuvelen und Zou 2001; Tsui und Treagust 2013, Kap. 1). Dabei soll für diese Aktivitäten auch deren Charakter als authentische Tätigkeit im Sinne der disziplinären Praxis der Bezugsdomäne sichergestellt werden (Tytler et al. 2013, Kap. 5). Ein besonders wichtiger Fall für eine solche höhere Anzahl (N RF > 2, N RC > 1) ist die Kombination von zwei verschiedenen Repräsentationsformen und dem Referenten, z. B. einer Text-Bild Kombination und einem Experiment oder empirischen Phänomen (ein für die Naturwissenschaften quasi „natürlicher“ Fall). Beispiele für explizite Lernaktivitäten und -ansätze dieser Art finden sich in der Literatur etwa bei Tytler et al. (2013), Kap. 1 (biologisches Thema), Kap. 7 und 8 (astronomisches Thema), sowie bei van Heuvelen und Zou (2001, physikalisches Thema). Zusammengefasst lässt sich sagen, dass repräsentationale Kohärenzfähigkeit in dem Sinne korrekte, sinnvolle Verbindungen von multiplen Repräsentationen untereinander und mit ihrem Referenten herstellen zu können, zum einen eine ganz wesentliche Komponente von domänen-spezifischer Expertise ist. Zum anderen aber stellen diese Verbindungen eine erhebliche Lernschwierigkeit dar: Die Fähigkeit dazu ist häufig auch nach Unterricht und sogar noch auf universitärem Niveau gering ausgeprägt. Des Weiteren fehlt es vielfach an Gelegenheiten für auf Repräsentationen bezogene kognitive Aktivierung und selbstständige repräsentationale Arbeit der Lernenden, mit der die genannten Lernschwierigkeiten überwunden und das kognitive Potential ausgeschöpft werden könnten.

Um den Stand an repräsentationaler Kohärenzfähigkeit feststellen zu können und einschlägige fördernde Maßnahmen bewerten zu können, gibt es daher einen gut begründeten Bedarf an validen und reliablen Messinstrumenten (van Someren et al. 1998, Kap. 2; Tytler et al. 2013, Kap. 2 und 9), der auch im Rahmen des DeFT-Modells unterstrichen wird (Ainsworth 2006a, 2008). Seitens der Literatur stehen jedoch sehr wenige Instrumente für repräsentationale Kohärenzfähigkeit in der Physik zur Verfügung (siehe Nieminen et al. 2010 für eine der wenigen Ausnahmen im Bereich Newtonsche Mechanik), und keines im Bereich Strahlenoptik, als einem an multiplen Repräsentationen besonders reichen und in vielen Lehrplänen in der Sekundarstufe I früh angesiedelten Thema. Sollte sich hier eine niedrige repräsentationale Kohärenzfähigkeit bestätigen, wäre es als Konsequenz nötig, durch geeignete Fördermaßnahmen deren Entwicklung zu unterstützen sowie den Erfolg der Fördermaßnahmen zu evaluieren. Aus diesen Gründen war das Ziel der hier vorgestellten Arbeit die Entwicklung und psychometrische Charakterisierung eines Testinstrumentes zur Erhebung von repräsentationaler Kohärenzfähigkeit (RKF-Test) von Lernenden im Bereich Strahlenoptik.

Material und Methoden

Design-Merkmale der Items und Operationalisierung von repräsentationaler Kohärenzfähigkeit

Eine Kompetenz ist nicht direkt, sondern indirekt an der Performanz, Aufgaben lösen zu können, diagnostizierbar (Köller 2008). In dieser Arbeit beruht die Operationalisierung von repräsentationaler Kohärenzfähigkeit auf der oben eingeführten Konzeptualisierung als Fähigkeit, korrekte, kohärente und sinnvolle Verbindungen von Informationselementen innerhalb einzelner und zwischen verschiedenen Repräsentationsformen herstellen zu können (ICs und RCs). Wesentliche Eigenschaft von repräsentationalen Kohärenzfähigkeit-Items ist also, dass die korrekte Lösung ausschließlich mittels solcher kohärenter Verbindungen (RCs, ICs und als Voraussetzung die Verbindung zum Referenten, s. Abschn. 1) möglich ist, die hier wie folgt operationalisiert sind: Aufeinander beziehen, Übersetzen, Vergleichen und Ändern/Anpassen von Informationselementen innerhalb und zwischen Repräsentationsformen.

Verwendet werden dabei Text und Formeln als deskriptive und Fotos und Strahlendiagramme/Zeichnungen als depiktionale Repräsentationsformen (siehe Beispiele unten und Tab. 1 für einen Überblick). Mit Blick auf curriculare Validität in Rheinland-Pfalz und anderen Bundesländern mit ähnlichem Lehrinhalt (siehe Diskussion) sollen die Items des Tests die in der schulischen Zielstufe typischen Themengebiete im Bereich Strahlenoptik zur Bildentstehung abdecken (MBWW 1998). Formeln als Repräsentationsform sind dabei wenig vertreten (4 von 14 Items), weil laut Lehrplan auf einen starken Anteil der Mathematisierung verzichtet werden soll (MBWW 1998). So kann die Studie mit schulrelevanten Themen durchgeführt werden und der effektive Zeitverlust für den Unterricht ist gering. Um Testzeit gewinnbringend für den Unterricht nutzen zu können, sollen Lehrer nach Lerngelegenheit der Schülerinnen und Schüler die Möglichkeit haben, die Testergebnisse zur Bewertung der Lernenden verwenden zu können, sofern die curriculare Validität inklusive Eignung der Items für einen Leistungstest positiv evaluiert wird.

Tab. 1 Übersicht über die im RKF-Test verwendeten Repräsentationsformen, der für die Lösung der Items notwendigen Verbindungen auf der Ebene von Repräsentationsformen und auf der Ebene von Einzelelementen

Wie im Theorieteil erläutert, müssen die verwendeten Repräsentationsformen dabei nicht alle extern vorliegen oder generiert werden, auch eine interne Verwendung von Repräsentationsformen im Arbeitsgedächtnis z. B. als mentales Modell oder Proposition (Schnotz 2005) ist möglich. Als Lösung des jeweiligen Items muss natürlich immer (wie bei jedem Test) eine externe Repräsentationsform erzeugt werden, anhand welcher der Erfolg der durch die Lernenden vollzogenen Verknüpfungsprozesse von Informationselementen, d. h. die Kohärenzfähigkeit im Sinne dieser Arbeit, erkennbar wird.

In Begriffen des o. g. Theorierahmens (DeFT, s. Abschn. 1) gilt für die Design-Parameter der repräsentationalen Kohärenzfähigkeit-Items:

  1. a.

    Es sind mindestens zwei verschiedene Repräsentationsformen beteiligt (N RF ≥ 2). Außerdem ist mindestens eine Verbindung zwischen den verwendeten Repräsentationsformen erforderlich (N RFC ≥ 1). Man beachte, dass solche Verbindungen im Sinne von Abschn. 1 („Repräsentationale Kohärenzfähigkeit“) zwischen verschiedenen Repräsentationsformen bestehen können (RC-Typ), oder zwischen zwei verschiedenen Versionen der gleichen Repräsentationsform (IC-Typ).

  2. b.

    Die Verteilung der Informationen über die beteiligten Repräsentationsformen ist komplementärer Art, mit teilweise gemeinsamen Inhalten (partielle Redundanz); das ist bei multiplen Repräsentationen in den Naturwissenschaften der Regelfall (z. B. tritt die Bildweite in einem Strahlengang und in einer Formel auf).

  3. c.

    Das Repräsentationssystem ist das eines Papier-und-Bleistift-Dokumentes, d. h. statisch und monomodal (Sehen).

  4. d.

    Die Sequenzierung hat die Grundform:

    1. 1.

      Die Aufgabenstellung besteht primär aus Text und erläutert ggf. eine weitere gegebene depiktionale Repräsentationsform.

    2. 2.

      Die Aufgabenlösung enthält verschiedene Kombinationen von Repräsentationsformen und Verbindungen zwischen solchen, die Voraussetzung für eine erfolgreiche Bearbeitung der Aufgabenstellung sind. Eine Besonderheit besteht dabei darin, dass die Sequenzierung im Sinne der DeFT-Taxonomie innerhalb des eigentlichen Lösungsschrittes von dem Lernenden selbst festgelegt wird.

    3. 3.

      Das Ergebnis enthält eine der Repräsentationsformen aus Schritt 2, z. T. zusätzlich Text in Form eines Lösungssatzes.

  5. e.

    Die Übersetzungsunterstützung im Sinne von DeFT (Ainsworth 2006a) hat hier insofern einen besonderen Status, als sie durch den Aufgabencharakter seitens des Lernenden selbst festgelegt wird bzw. Gegenstand des Items ist (Beziehungen zwischen Repräsentationsformen werden nicht gegeben, sondern erfragt).

Ein weiteres Unterscheidungsmerkmal von Aufgaben ist, ob die Art der Verbindung von Repräsentationsformen zum Lösen eines Items einen Bezug bzw. eine Übersetzung darstellt, und damit der konventioneller Standardaufgaben entspricht, oder ob die Verbindung von der Art her ein Vergleichen von Repräsentationsformen darstellt und über ein bloßes Beziehen bzw. Übersetzen hinausgeht. Wie in dem in Abschn. 1 dargestellten theoretischen Hintergrund erläutert, ist repräsentationale Kohärenzfähigkeit eine wichtige Teilkomponente von physikalischem Verständnis überhaupt, oder anders gesagt, es gibt domänenspezifische Fragestellungen, die man gar nicht ohne den impliziten Gebrauch von multiplen Repräsentationen und repräsentationaler Kohärenzfähigkeit beantworten kann. Es gibt also auch unter gängigen Aufgaben schon solche, die implizit auf repräsentationale Kohärenzfähigkeit testen, z. B. muss für jede Formel, oder insbesondere für Strahlengänge in der Optik, eine kohärente Verbindung zu der im Aufgabentext beschriebenen Situation hergestellt werden. In solchen Items werden die Verbindungsarten „Beziehen“ (Bsp. Informationselemente in den beiden Repräsentationsformen von Abb. 1, oder Einsetzen aus Text in Formel in Item 4a, s. Abb. 3) und „Übersetzen“ (Übersetzen von Strecken als Zahlenwert in Strecken eines Strahlendiagramms, s. Item 1a) vorausgesetzt. Zweck dieses Itemtyps ist es, denjenigen Teil von repräsentationaler Kohärenzfähigkeit abzubilden, der in gängigen Unterrichtszielen und Leistungstests implizit vorausgesetzt wird. Um diesen Aufgabentyp innerhalb des RKF-Tests so ähnlich wie möglich zu üblichen Aufgaben zu machen, wurden dabei für die Anzahl der nötigen multiplen Repräsentationen und Verbindungen von Repräsentationsformen deren Minimalwerte genommen (N RF = 2; N RFC = 1). Wir werden diese Form der Anforderung an repräsentationale Kohärenzfähigkeit und die zugehörigen Items als „Standard“ bezeichnen, weil sie Standard-Aufgaben in einer gegebenen Domäne entsprechen.

Abb. 3
figure 3

Item, welches als RC das Beziehen zwischen den Repräsentationsformen „Text“ und „Formel“ erfordert sowie als IC die Weiterverarbeitung innerhalb der Rechnung (Item 4a des Tests)

Das DeFT-Modell sieht jedoch auch eine darüber hinaus gehende Funktion vor, nämlich „construct deeper understanding“ (Ainsworth 2006a), s. Abschn. 1. Für Testaufgaben ist „construct“ schon erfolgt, da tieferes Verständnis schon konstruiert sein muss, um die Aufgabe lösen zu können. Items, welche diese Anforderung an repräsentationale Kohärenzfähigkeit haben, bezeichnen wir als „deeper understanding-Items“ („DU-Items“). Die Anforderungsart wird hier durch Items mit den Verbindungsarten „Vergleichen“ und „Ändern/Anpassen“ realisiert: Beim Vergleichen geht es beispielsweise darum, bei einer Linsenabbildung den AbbildungsfallFootnote 6 zu identifizieren, wenn die Größe und der Abstand des Gegenstands nicht gezeigt sind (Vergleich Foto-Tabelle; Item 5a). Beim Ändern/Anpassen geht es zum Beispiel um die Änderungen der Bildeigenschaften nach Änderung der Gegenstandsweite (Item 1b). Man beachte, dass mit „Vergleich“ hier nicht der einzelner Elemente gemeint ist, sondern der einer (informationstragenden) Beziehung von Elementen, und dass zielgerechtes Ändern immer einen Vergleich voraussetzt (nämlich den der ursprünglichen und der geänderten Situation). Eine für die Operationalisierung interessante und nützliche Verbindung zu einer weiteren theoretischen Perspektive besteht zu dem Komplexitätsmodell für Lerninhalte der Essener Gruppe (Kauertz und Fischer 2006; Neumann et al. 2007; Kauertz 2008), welches Komplexität als Anzahl von Informationselementen (Fakten) und von deren Zusammenhängen fasst. Danach entsprechen die Standard-Items den Komplexitätsstufen „Ein Zusammenhang“, evtl. durch bloßes Abarbeiten mehrerer paarweiser Beziehungen auch der Stufe „Mehrere unverbundene Zusammenhänge“ (nämlich durch Beziehen oder Übersetzen). Die DU-Items hingegen fallen unter die höheren Komplexitätsstufen mit verbundenen Zusammenhängen, für die o. g. Beispiele ereignet sich dies in folgender Form: Bei der Identifikation des Abbildungsfalles in einem Abbildungsexperiment (als Foto vorliegend; Aufgabe 5) muss die Relation mehrerer Zusammenhänge betrachtet werden: z. B.

  • die Bildweite im Abbildungsexperiment muss mittels der Bildweite in der Tabelle der Bildfälle gefunden werden, um den Zusammenhang zur Gegenstandsweite dort ablesen zu können und auf das auf dem Foto gezeigte Abbildungsexperiment übertragen zu können.

  • Alternativ kann das gegebene Foto des Abbildungsexperimentes auch nach Erinnerung an durchgeführte Abbildungsexperimente und der Auswahl des passenden Experimentes durch eine realistische Abbildung ergänzt werden. Dasselbe würde gelten, wenn man den Abbildungsfall mit einem Strahlendiagramm rekonstruiert.

Bei der Frage zu den Änderungen der Bildweite und Bildgröße nach Änderung der Gegenstandsweite (Item 1b) müssen im ursprünglichen und geänderten Strahlengang z. B. jeweils der Winkel zwischen Brennpunktstrahl und optischer Achse auf der einen Seite der Linse und der Abstand der Parallelstrahlen auf der anderen betrachtet werden (mehrere Zusammenhänge zwischen Informationselementen). Dazu muss man schon weitgehend über das mentale Modell der Bildkonstruktion verfügen.

Zweck des DU-Itemtyps ist es, höhere Ausprägungen von repräsentationaler Kohärenzfähigkeit zu erfassen und die Wirkung von didaktischen Ansätzen zu testen, bei denen – im Unterschied zum üblichen Unterricht, aber im Einklang mit Vorschlägen aus der Literatur, s. Abschn. 1 – ein Fokus auf kognitive Aktivierung und eine i.a. höhere Anzahl von multiplen Repräsentationen und Verbindungen von Repräsentationsformen Lern- und Übungsgegenstand gelegt wird. Dementsprechend beinhalten DU-Items mindestens drei Repräsentationsformen und mindestens zwei Verbindungen zwischen ihnen (N RF ≥ 3; N RFC ≥ 2). Es sind also jeweils mindestens eine Repräsentationsform und eine Verbindung von Repräsentationsformen mehr als bei Standard-Items (im Durchschnitt sogar je zwei mehr: \(\bar{N}\) RF = 4,0; \(\bar{N}\) RFC = 3,0).

Es sei darauf hingewiesen, dass schon die Standard-Items auf einer mittleren Komplexitätsstufe des Essener Modells (a. a. O.) stehen. Es ist also davon auszugehen, dass sie keineswegs einfach für Lernende sind. Für die DU-Items gilt dies in verstärktem Maße. Man kann also durch die Verwendung der Komplexitätsstufen nach diesem Modell gut noch einmal das eingangs genannte didaktische Dilemma von multiplen Repräsentationen verdeutlichen: Wesentlicher Bestandteil von naturwissenschaftlichem Denken und Lernen einerseits, von hoher intrinsischer Komplexität und Schwierigkeit andererseits.

Übersicht über das Instrument für repräsentationale Kohärenzfähigkeit

Inhaltlich verbundene Items sind in acht „Aufgaben“ (im Sinne gängiger Unterrichtspraxis) gruppiert. Diese enthalten in der Mehrzahl auch Items („Teilaufgaben“) im offenen Antwortformat, um auch Informationen zu erhalten, auf welchem Weg die Lernenden zur Lösung gelangt sind. Insgesamt enthält das Instrument für repräsentationale Kohärenzfähigkeit fünf Standard-Items (N RF = 2; N RFC = 1 per Konstruktion) und neun DU-Items (\(\bar{N}\) RF = 4,0; \(\bar{N}\) RFC = 3,0).

Tab. 1 fasst die Variation der wesentlichen Parameter über die Items des RKF-Tests zusammen, und die Operationalisierung wird im Folgenden anhand mehrerer Item-Beispiele erläutert (s. Tab. 3 im Onlinematerial 2 für weitere Angaben zu den Items, u. a. zu den o. g. Anzahlen von representation form connections und der Verbindungsarten sowie diesbezüglichen Erläuterungen).

Um Standard-Items zu lösen genügt es, zwei Repräsentationsformen aufeinander zu beziehen. Dies entspricht der auch bei traditionellen Aufgaben implizit erforderlichen repräsentationalen Kohärenzfähigkeit im Sinne einer einfachen Verbindung bzw. Übersetzung von Informationen aus zwei Repräsentationsformen. Abb. 3 zeigt ein Beispiel dieser Art (Item 4a). Es handelt sich um eine traditionelle Textaufgabe zur Anwendung der Abbildungsgleichung. In der Lösung müssen die Repräsentationsformen Text und Formel aufeinander bezogen werden (N RFC = 1), dazu müssen dem Text Informationselemente über die Größen entnommen werden und ein fachlich korrekter Bezug zu den Größen in der Formel hergestellt werden. Die Ausprägung des Erfolgs dieses Verbindungsaufbaus gibt Aufschluss auf die interrepräsentationale Komponente der repräsentationalen Kohärenzfähigkeit der Lernenden, also in diesem Fall die Qualität der von Lernenden erzeugten Kohärenz zwischen der Textrepräsentation und der mathematischen Darstellung. Die (Weiter‑)Verarbeitung von Informationselementen innerhalb einer Repräsentationsform gibt Aufschluss auf die intrarepräsentationale Komponente der repräsentationalen Kohärenzfähigkeit der Lernenden.

Ein zweites Beispiel dieser Art ist die zeichnerische Ermittlung der Brennweite einer Linse auf der Basis der im Aufgabentext enthaltenen Angaben zu Bildweite, Gegenstandsweite und Gegenstandsgröße (ebenfalls eine gängige Aufgabenstellung). Dabei müssen die Repräsentationsformen Text und Strahlengang aufeinander bezogen werden (N RFC = 1) und dazu Informationselemente (Strecken, Größen) aus der Repräsentationsform „Text“ in die Repräsentationsform „Strahlengang“ übersetzt und dort weiterverwendet werden (s. Item 7, Onlinematerial 1 und 2). Um die Lösung anzugeben („Brennweite“) wird die oben erwähnte Verbindung zwischen den Repräsentationsformen „Text“ und „Strahlengang“ in umgekehrter Richtung wiederholt (keine neue Kohärenzleistung).

Zu den DU-Items gehört der Aufgaben-Typ „Vergleichen von Repräsentationsformen“. Die Aufgabenstellung verlangt neben dem bei Standard-Items nötigen Beziehen von zwei Repräsentationsformen eine Prüfung auf Abweichungen bzw. Übereinstimmungen von Sachverhalten in (mindestens) zwei Repräsentationsformen. Dafür müssen mehrere verbundene Informationselemente aus zwei Repräsentationsformen entnommen und miteinander in Beziehung gesetzt werden; eine dritte bzw. evtl. vierte Repräsentationsform kommt durch den Aufgabentext und die Antwortrepräsentation ins Spiel. Abb. 4 zeigt ein Beispiel dieser Art (Aufgabe 5). Dabei muss die Aufgabenstellung auf ein gegebenes Foto bezogen werden (1. RFC) und das Foto zur Lösung der Teile a) und b) zusätzlich mit einer Abbildungsfalltabelle oder bereits gemachten Experimenten mental verglichen werden (2. RFC, alternativ können auch Strahlendiagramme verwendet werden, die mental erzeugt werden). Man beachte, dass Fotos von Repräsentationsformen zwar einen hohen Grad an Realismus haben, aber dennoch einen hohen Anspruch bei der Erstellung von Verbindungen zu anderen Repräsentationen mit sich bringen, weil sie viele irrelevante Informationen enthalten, und vom Betrachter verlangen, diese Informationen herauszufiltern. In jedem Fall müssen auf Elementebene relevante Informationen wie Bildweite bzw. Bild- und Gegenstandsgröße der beiden Repräsentationsformen von den Lernenden verglichen und angepasst werden, bis sie mit den im Experimentausschnitt gezeigten Parametern übereinstimmen. Dann erfolgt direkt die Angabe der in der Tabelle abgelesenen Lösung, bzw. bei Verwendung einer bildhaften Repräsentationsform anstatt der Tabelle, die Übersetzung der gefundenen Lösung in den Antworttext (in letzterem Fall gibt es eine zusätzliche representation form connection). Ein weiterer Aufgabenteil (Items 5ca/b) fragt jeweils nach dem Lösungsweg der Lernenden (z. B. mit welcher RF) im offenen Antwortformat. Hierzu muss die Bearbeitung des Aufgabenteils 5a bzw. 5b (jeweils 1. und 2. RFC) in eine Textrepräsentation übersetzt werden (3. RFC).

Abb. 4
figure 4

Item-Beispiele für den Aufgabentyp „Vergleich von Repräsentationsformen“ (Items 5a und 5b des Tests; die Aufgabe enthält außerdem einen qualitativen Teil 5c, der Aufschluss über den Lösungsweg zu Item 5a und 5b gibt, s. Text)

Als weiteren Typ enthalten die DU-Items Aufgabenstellungen, in denen das Ändern oder Anpassen von Repräsentationsformen gefordert ist. Dabei muss eine Repräsentationsform anhand von Informationen geändert werden, welche aus einer oder mehreren anderen Repräsentationsformen entstammen. Dies setzt zunächst einen Vergleich zwischen Repräsentationsformen im Sinne des vorigen Abschnittes voraus (nämlich zw. Ausgangs- und Ziel-RF), und darüber hinaus das eigenständige Generieren der nötigen Änderung; damit geht eine erhöhte Anzahl von Repräsentationsformen und Verbindungen zwischen ihnen einher. Beispielsweise fragt Item 1b (siehe Onlinematerial 1 und 2) in Bezug auf eine gegebene Strahlenkonstruktion einer optischen Abbildung durch eine Sammellinse nach der Auswirkung einer vergrößerten Gegenstandsweite auf Bildgröße und Bildweite. Zur Lösung wird in einem ersten Schritt das Beziehen des Aufgabentextes auf den Strahlengang (1. RFC) erwartet. In einem zweiten Schritt soll der gegebene Strahlengang zur Lösungsgenerierung nach den Vorgaben aus dem Text verändert werden, wobei eine selbst neu zu generierende (interne oder externe) schematische Zeichnung mit der vorliegenden zu vergleichen ist, um Unterschiede erkennen und Anpassungen vornehmen zu können (2. RFC). Die Erkenntnisse aus dem Strahlengang werden in eine Textrepräsentation als Antwort überführt (3. RFC). Auf Ebene der Informationselemente müssen Informationen zwischen Repräsentationsformen und innerhalb von Repräsentationsformen verbunden werden (RCs bzw. ICs).

Zur Auswertung des RKF-Tests werden für alle Items Punkte nach der Anzahl der für die Lösung nötigen Verbindungen von Informationselementen vergeben. Das heißt, ein Item trägt umso mehr zum Gesamtscore bei, je mehr ICs oder RCs auf Elementebene seine Lösung voraussetzt, im Sinne des Komplexitätsbegriffs des Essener Modells. Wir treffen dabei die Annahme, dass alle zur Antwortgenerierung verwendeten Verbindungen als gleichwertig anzusehen sind. Dabei können bei manchen Items (vor allem bei dem DU-Typ) RCs und ICs in den Antworten nicht getrennt erfasst werden, sondern nur das Ergebnis einer Kombination von mehreren solchen Verbindungen, deren Punktzahl dann für die Beantwortung des Items vergeben wird. Die Komplexitätsstufe eines Items steigt mit der Anzahl aller für die Lösung nötigen Einzel-Verbindungen. Um je nach Komplexität (Anzahl der RCs und ICs) Punkte feinstufig zuordnen zu können, wurde das oben erwähnte Essener Modell auf repräsentationale Kohärenzfähigkeit wie folgt angepasst: Die Komplexitätsniveaus 1 und 2 („Einzelfaktum“, „mehrere (unverbundene) Einzelfakten“) finden bei Aufgaben zu Verbindungen von multiplen Repräsentationen per Konstruktion keine Anwendung. Das Komplexitätsniveau 3 („Ein Zusammenhang“) entspricht bei Verbindungen von multiplen Repräsentationen per definitionem der niedrigsten Komplexitätsstufe. Bei den Komplexitätsniveaus 4 und 5 („Mehrere Zusammenhänge“) findet folgende Anpassung statt: Die Komplexitätseinstufung wird proportional zu deren Anzahl feiner aufgelöst; dabei kommen unverbundene Zusammenhänge (Niveau 4) bei mehrfachen RCs per Konstruktion nicht vor (ein mehrfacher Zusammenhang z. B. zwischen Text, Strahlendiagramm und Formel bezieht sich ja auf den denselben Sachverhalt). Insgesamt ergibt sich folgende Einstufung: ein Zusammenhang: 0,5 P („gering komplex“); zwei Zusammenhänge: 1 P („mittelkomplex“); vier Zusammenhänge: 2 P („hochkomplex“); sechs Zusammenhänge: 3 P („höchstkomplex“).

Um Missverständnisse zu vermeiden, sei darauf hingewiesen, dass es in der Operationalisierung von Komplexität (nach dem Essener Vorschlag, a. a. O.) hier um Verbindungen zwischen einzelnen Informationselementen geht, die von Verbindungen zwischen verschiedenen Repräsentationsformen zu unterscheiden sind. Ersteres meint herzustellende Verbindungen von einzelnen Informationselementen (die in der gleichen Repräsentationsform oder in verschiedenen Repräsentationsformen liegen können) und mit denen die Punktzahl des Tests operationalisiert wird (s. Beispiele oben), letzteres meint Kombinationen von ganzen Repräsentationsformen, die zur Lösung eines Items nötig sind (gezählt als N RFC).

Wir fügen noch zwei Beispiele für Punktzuweisungen bei höherkomplexen Antworten hinzu, bei denen mehrere Verbindungen zwischen einzelnen Informationselementen (IC und RC) in der Antwort integriert sind:

  • mittelkomplex (1P , zwei Zusammenhänge). Aus DU-Item 2: „Ein Gegenstand befindet sich vor einer Linse. Die Gegenstandsweite liegt zwischen einfacher und doppelter Brennweite der Linse. Wie groß ist die Bildweite verglichen mit der Brennweite?“

    • RC: Gegenstandsweite in Abbildungsfalltabelle übertragen und Bildweite suchen

    • IC: f < g < 2f → b größer als 2f (zur anschließenden Angabe der Antwort wird der Tabellentext einfach übernommen, was keine Kohärenzleistung erfordert)

  • hochkomplex (2 P, vier Zusammenhänge). Aus DU-Item 1b: „Wie würde sich die Bildgröße und Bildweite verändern, wenn man den Gegenstand weiter von der Linse entfernt (gegeben: Strahlendiagramm eines Abbildungsexperiments mit Sammellinsen)?“

    • RC: Gegenstand im Strahlendiagramm finden und nach links rücken

    • IC: Feststellung: Mittelpunktstrahl wird flacher

    • IC: Feststellung: Schnittpunkt Mittelpunktstrahl-Brennpunktstrahl ist näher an Achse

    • RC: den im Strahlengang erkannten Sachverhalt als Text ausdrücken

Eine detaillierte Erläuterung des Punkteschlüssels für die Items findet sich im Onlinematerial 2.

Auf diese Weise entsteht ein Auswerteverfahren, das die Komplexität der repräsentationalen Verbindungen als schwierigkeitserzeugendes Merkmal der Items in Form der Anzahl der zu vergebenden Punkte berücksichtigt. Diese Herangehensweise wurde gewählt, weil sie eine konsistente Verbindung von theoretischen und unterrichtspraktischen Überlegungen darstellt, zum einen nämlich die theoretische Begründung durch das Essener Modell (s. oben), zum anderen ist eine Berücksichtigung der nötigen Anzahl von Lösungsschritten (hier: Verbindungen) auch gängige Bewertungspraxis im Unterricht.

Empirische Prüfung des RKF-Testinstruments

Die Untersuchung wurde an rheinland-pfälzischen Gymnasien durchgeführt, in denen der Bereich Strahlenoptik (Wirkung von Sammellinsen und Bildentstehung) überwiegend in der 8. Klassenstufe unterrichtet wird und fand im Rahmen des DFG-Graduiertenkollegs „Unterrichtsprozesse“ (DFG-Nr. GK 1561, Graduiertenkolleg Unterrichtsprozesse, Universität Koblenz- Landau, Campus Landau) statt.

Der Ablauf der Gesamtstudie gliedert sich in Pilotstudie und Hauptstudie, deren methodische Grundlagen im Folgenden beschrieben werden. In der Pilotstudie wurden zur Validierung zunächst Items auf Verständlichkeit geprüft, anschließend wurde eine erste psychometrische Itemanalyse durchgeführt. Anschließend folgte die Hauptstudie zur psychometrischen Prüfung des Testinstruments mit höherer Teilnehmerzahl. Als zusätzliche Fragestellung in der Hauptstudie wurde untersucht, ob die Items des RKF-Tests bezüglich des Bundeslandes Rheinland-Pfalz curricular valide sind oder sich stark von üblichen Schulaufgaben unterscheiden.

Pilotstudie

Eine Vorversion eines RKF-Tests mit 16 Items, welche zu sechs Aufgaben zusammengesetzt sind, wurde in zwei Schritten einer Prüfung auf folgende Kriterien unterzogen: Im ersten Schritt (N = 30, 7. Klasse einer Realschule) wurden die Aufgaben qualitativ auf Verständlichkeit der Instruktion geprüft, indem die Lernenden schriftlich Kommentare zu den Aufgaben geben konnten. Nach der Überarbeitung von unverständlichen Formulierungen wurden die Aufgaben in einem zweiten Schritt (N = 59, 7. Klasse einer Realschule) nach Behandlung des Themas im Unterricht eingesetzt und qualitativ und quantitativ analysiert. Im Test wurden bei 6 Items Begründungen und Erklärungen im offenen Antwortformat gefordert, um qualitative Auskunft darüber zu erhalten, ob die Lösung in intendierter Weise aufgrund von RCs zustande kam, also im Sinne der o. g. Operationalisierung das Konstrukt repräsentationale Kohärenzfähigkeit misst, oder die Lernenden anhand von Oberflächenmerkmalen bzw. zufällig zur richtigen Lösung kamen. Bei keiner der fachlich richtig gelösten Aufgaben ergaben sich Hinweise auf nicht repräsentationale Kohärenzfähigkeit-basierte Lösungswege. Anschließend wurde zur Feststellung der Dimensionalität des Tests eine exploratorische Faktorenanalyse durchgeführt, bei der sich bis auf eine Aufgabe ein Generalfaktor zeigte. Bei einer Bestimmung der Kenngrößen des Tests zeigte diese Aufgabe außerdem nicht ausreichende psychometrische Kenngrößen (zu geringe Trennschärfe, zu hohe Schwierigkeit) und wurde daher aus dem Test entfernt. Die bereinigte Version des Tests enthielt 14 Items und ergab in der Pilotstudie akzeptable Werte für die Aufgabenschwierigkeiten (0,32 < P i < 0,92; \(\bar{P}\) i = 0,61) und Trennschärfen (0,34 < r it  < 0,56; \(\bar{r}\) it  = 0,43), sowie einen noch ausreichenden Wert für die interne Konsistenz (α C = 0,65). Sieben Items der Pilotstudie konnten nahezu unverändert in die Hauptstudie übernommen werden. Acht Items wurden in Hinblick auf eine weiter optimierte Umsetzung der Operationalisierung überarbeitet, fünf davon wurden stark überarbeitet. Die daraus entstandene Testversion enthielt 15 Items, die für den Einsatz in der Hauptstudie vorgesehen waren.

Hauptstudie

In der Hauptstudie wurde im Rahmen einer im o. g. DFG-Graduiertenkolleg durchgeführten Interventionsstudie zu drei Zeitpunkten Daten erhoben (s. Scheid 2013 für Details): Ein Prätest (t 1) direkt vor Beginn einer sechswöchigen Unterrichtsreihe über Bildentstehung an Sammellinsen mit bzw. ohne besonderen Fokus auf Repräsentationen, ein Posttest direkt danach (t 2) und ein Follow up-Test sechs Wochen nach deren Abschluss (t 3). An der Hauptstudie nahmen sechs rheinland-pfälzische Schulen mit 17 Klassen und insgesamt 488 Schülerinnen und Schülern teil. Die Schüler waren zwischen 12 und 14 Jahre alt (M = 13,3; SD = 0,54), davon waren 54 % weiblich und 46 % männlich.

Der folgende Hauptabschnitt des Artikels befasst sich mit der Bestimmung der üblichen psychometrischen Gütekriterien (Bühner 2011; Bortz und Döring 2002), die auch für normative Kompetenztests Anwendung finden (Schecker und Parchmann 2006). Die aus der Pilotstudie weiterentwickelte Testversion enthielt wie oben beschrieben ursprünglich 15 Items, die in der Hauptstudie zum Einsatz kommen sollten. Davon wurde ein Item bei einer Voranalyse der Hauptstudiendaten wegen zu geringer Trennschärfe ausgeschlossen. Daher besteht der RKF-Test in der hier vorgestellten Version aus 14 Items, die wegen thematischer Verwandtschaft in acht Aufgaben zusammengefasst wurden. Wortlaut und Charakteristika des Tests finden sich in den Onlinematerialien. Für den Test standen 20 min zur Verfügung. Die Vergabe der Punkte für die einzelnen Items in der Auswertungsvorschrift (siehe Onlinematerial 2) geschah unter Berücksichtigung der Anzahl erfolgter Elementverbindungen sowie des oben erläuterten Komplexitätsmodells. Die Auswertung des Summenscores der repräsentationalen Kohärenzfähigkeit-Skala als intervallskalierte Größe und mit parametrischen Tests folgt dabei gängiger Praxis (Bortz und Schuster 2010; Bühner 2011), die aber weit über eine bloße „per fiat“-Setzung hinaus auf einer breiten Literatur-Basis und mehreren forschungsbasierten Argumenten beruht: dem zentralen Grenzwertsatz (Borgatta und Bohrnstedt 1980), Simulationen zum Vergleich mit und ohne Intervallskalen-Annahme (Brockett und Golden 1992), sowie der Robustheit parametrischer Verfahren gegenüber Verletzung der Annahmen in einem breiten Spektrum von Anwendungsbereichen (Dowling und Midgley 1991; Carifio und Perla 2007; Norman 2010).

Weil bei einem neuentwickelten Testinstrument nicht bekannt ist, wie viele Formen von repräsentationaler Kohärenzfähigkeit den Items ggf. zu Grunde liegen, sollte dies durch eine exploratorische Faktorenanalyse herausgefunden werden (Eid et al. 2011). Dabei wurde die quartimax-Rotation als Verfahren gewählt, die auch einen Generalfaktor zulässt, auf dem alle Items laden (Eid et al. 2011, S. 903). Die Anzahl der Faktoren wurde nach dem Scree-Test bestimmt (Faktoren sind relevant, wenn sie deutlich mehr Varianz erklären als die anderen Faktoren; Cattell 1966); dabei sollen sie auch nicht weniger Varianz aufweisen als einzeln beobachtbare Variablen (Kaiser-Kriterium: Eigenwert ≥ 1; Kaiser und Dickman 1959, Eid et al. 2011). Faktoren können unabhängig von der Stichprobengröße erst ab einer Faktorladung von F L  ≥ 0,4 bei mindestens 10 Variablen bzw. ab einer Faktorladung von F L ≥ 0,6 bei mindestens 4 Variablen als einer Dimension zugehörig interpretiert werden (nach Guadagnoli und Velicer 1988).

Zur weiteren Klärung der Eignung von Items zur Testkonstruktion wird die interne Konsistenz α C berechnet, welche den Zusammenhang der einzelnen Items untereinander angibt (Eid et al. 2011) und einen Schätzer für die Reliabilität darstellt. Folgende Bereiche werden angegeben:

  • Werte von α C ≥ 0,60 gelten als „zur Gruppendiagnostik geeignet“ (Evers 2001, EFPA 2013)

  • Werte von α C ≥ 0,70 gelten als akzeptabel (Bühner 2011, S. 81) und „zur Individualdiagnostik mit weniger hoher Tragweite geeignet“ (EFPA 2013).

  • der Bereich 0,80 ≥ α C ≥ 0,90 gilt als gut und „zur Individualdiagnostik mit hoher Tragweite geeignet“ (EFPA 2013).

Das Maß der korrigierten Item-Skala-Korrelation (Trennschärfe) ist hilfreich, wenn der Zusammenhang eines Items mit der Summe der übrigen Items ermittelt werden soll. Werte ab r i ≥ 0,3 gelten als akzeptabel (Weise 1975). Des Weiteren wird die Lösungswahrscheinlichkeit berechnet, da Werte, die außerhalb des erwünschten Bereichs von 0,20 ≤ P i ≤ 0,80 liegen, aufgrund von Boden- oder Deckeneffekten Unterschiede nicht gut erfassen können und so zu einer geringen Trennschärfe führen (Bortz und Döring 2002).

Als zusätzliche Fragestellung der Hauptstudie wurde untersucht, ob sich die Items des RKF-Tests stark von gewöhnlichen Schulaufgaben unterscheiden oder ob eine gewisse Konformität besteht. So wurde die curriculare Validität bezüglich des Bundeslandes Rheinland-Pfalz geprüft. Dies geschah durch ein Expertenrating mit 11 Gymnasiallehrern (mittlere Unterrichtserfahrung 14,5 (SD = 9,18) Jahre). Dabei sind die Einschätzungen zu folgenden Fragen erhoben worden (6-stufige Likertskala mit folgenden Antwortmöglichkeiten: „trifft überhaupt nicht zu“, „trifft nicht zu“, „trifft eher nicht zu“, „trifft eher zu“, „trifft zu“, „trifft voll und ganz zu“):

  • Ich halte die Aufgabe inhaltlich für einen Leistungstest im Fach Physik geeignet.

  • Diese Aufgabe ist lehrplankonform.

Ergebnisse

Faktoren- und Item-Analyse

Als Ergebnis der Faktorenanalyse zum ersten Messzeitpunkt (Hauptkomponentenanalyse, quartimax-Rotation konvergiert über drei Iterationen mit Kaiser-Normalisierung) ergab sich eine uneindeutige Dimensionsstruktur: Die Eigenwerte der Faktoren fielen zwar nach dem sechsten bzw. dritten Faktor mit gleichmäßiger Steigung ab, was auf fünf bzw. zwei Dimensionen hindeutet, jedoch ließen sich die Faktoren im fünf- bzw. zweifaktoriellen Modell inhaltlich nur widersprüchlich zuordnen und in anderen Modellen war die Itemanzahl pro Faktor selbst im Falle einer inhaltlichen Interpretierbarkeit unzureichend (vgl. Guadagnoli und Velicer 1988). Zum ersten Messzeitpunkt ließ sich also keine Dimensionsstruktur erkennen. Die Ergebnisse des zweiten und dritten Messzeitpunkts ergaben die im Folgenden beschriebene Dimensionsstruktur. Im Scree-Plot erkennt man, dass Faktor 1 mit Abstand den höchsten Eigenwert von 4,65 (post) bzw. 4,52 (follow-up) besitzt (Abb. 5). Die anderen Faktoren besitzen Eigenwerte im Bereich von Einzelvariablen oder darunter. Alle Items dieses Faktors außer Item 8 (F L(t 3) = 0,36) weisen in der Komponentenmatrix der Hauptkomponentenanalyse Ladungen von F L = 0,4 oder mehr auf \(\bar{F}\) L(t 2) = 0,56 (0,10); \(\bar{F}\) L(t 3) = 0,56 (0,09).

Abb. 5
figure 5

Faktorenanalyse des RKF-Tests (Postzeitpunkt): Scree-Plot (Hauptkomponentenanalyse, quartimax-Rotation mit Kaiser-Normalisierung konvergiert über 8 Iterationen, Scree-Plot im dritten Messzeitpunkt nicht als abweichend erkennbar)

Die interne Konsistenz des RKF-Tests liegt zu den einzelnen Messzeitpunkten bei α C (t 1) = 0,53 (N = 464), α C(t 2) = 0,79 (N = 488) bzw. bei α C(t 3) = 0,78 (N = 484, Cronbach und Snow 1977). Durch das Ausschließen einzelner Items wurde keine Verbesserung der internen Konsistenz erreicht.

Abb. 6 zeigt die korrigierte Item-Skala-Korrelation, welche den Zusammenhang zwischen einzelnen Items mit der Summe der übrigen Items des RKF-Tests angibt. Im ersten Messzeitpunkt (N(t 1) = 464) korrelieren nur die Items 1a, 5b und 7 mit r it \(\geq\) 0,3 mit der Summe der übrigen Items, im zweiten (N(t 2) = 488) und dritten Messzeitpunkt (N(t 3) = 484) korrelieren alle Items mit r it \(\geq\) 0,3 mit der Summe der übrigen Items.

Abb. 6
figure 6

Korrigierte Item-Skala-Korrelationen der Items des RKF-Tests

Im ersten Messzeitpunkt (direkt vor der Unterrichtssequenz) lagen die Lösungswahrscheinlichkeiten großteils unter dem Wert P i < 0,2 (Abb. 7). Zu den übrigen Messzeitpunkten (direkt und 6 Wochen nach der Unterrichtssequenz) lagen die Lösungswahrscheinlichkeiten hingegen überwiegend im Bereich 0,2 < P i < 0,8 (bis auf Item 1c und Item 6 nur im Follow-up Test, die kleinere Werte aufwiesen). Die mittlere Lösungswahrscheinlichkeit (Bortz und Döring 2002) für den gesamten Test lag vor dem Unterricht über Bildentstehung an Sammellinsen bei \(\bar{P}\)(t 1) = 0,16 (0,09), direkt danach bei \(\bar{P}\)(t 2) = 0,37 (0,17) und sechs Wochen nach Abschluss bei \(\bar{P}\)(t 3) = 0,31 (0,18).

Abb. 7
figure 7

Lösungswahrscheinlichkeiten der Items des RKF-Tests (N(t 1) = 490, N(t 2) = 488, N(t 3) = 484)

Die Auswertung der qualitativen Fragen bezüglich des eingeschlagenen Lösungswegs, welche in Item 5a und 5b gestellt wurden ergab, dass sich viele Lerner an Experimentiererfahrungen erinnerten und auf diese Weise das Item lösen konnten. Nur in selteneren Fällen wurden mental Strahlendiagramme konstruiert und verändert oder Tabellen genutzt. Alle Varianten erfordern jedoch wie intendiert repräsentationale Kohärenzfähigkeit, es werden lediglich andere Repräsentationsformen dazu verwendet.

Curriculare Validität

Für die Auswertung des Expertenratings stellt bei Annahme einer höchstens schwachen Verletzung der Gleichabständigkeit der Ratingskala (Baker 1966; Wirtz und Caspar 2002) eine unjustierte Intra-Class-Correlation (ICC) ein geeignetes Verfahren dar. Die Interrater-Übereinstimmung war jeweils höchstsignifikant und führte zu folgenden Ergebnissen:

  • Elf Items wurden inhaltlich für einen Leistungstest im Fach Physik als „geeignet“ bzw. „voll und ganz geeignet“ eingeschätzt, zwei als eher geeignet (Items 5ca, 5cb) und eines als eher ungeeignet (Item 6). Der (unjustierte) ICC-Wert ist 0,61, was nach Cicchetti und Sparrow (1981) einer guten Übereinstimmung entspricht.

  • Zehn Items wurden als „lehrplankonform“ bzw. „voll und ganz lehrplankonform“ eingeschätzt, drei als eher geeignet (Items 4a, 5ca, 5cb), eines als eher ungeeignet (Item 6). Der (unjustierte) ICC-Wert ist 0,52, was einer ausreichenden Übereinstimmung entspricht (nach Cicchetti und Sparrow 1981).

Interpretation und Diskussion

Die Item- und Testkennwerte des RKF-Tests lagen in den Post- und Follow-up-Messzeitpunkten durchweg in den psychometrisch erwünschten Bereichen. Betreffs der Dimensionalität des Tests hat sich faktorenanalytisch gezeigt, dass ein Faktor das bei weitem höchste Gewicht hat, drei andere Faktoren liegen jeweils in der Nähe des Eigenwertes von 1, also an der Grenze der Bedeutsamkeit als getrennte Faktoren. Weil repräsentationale Kohärenzfähigkeit auch innerhalb eines Themengebietes wie Strahlenoptik eine Kompetenz mit mehreren Anforderungsbereichen ist, enthält das Instrument mehrere Inhalte und Itemtypen. Diese haben jedoch einen starken inhaltlichen Zusammenhang, und die Ergebnisse der Faktorenanalyse sprechen für eine Eindimensionalität des Tests. Dies bedeutet bezogen auf die Theorie, dass das Konstrukt repräsentationale Kohärenzfähigkeit nicht in Komponenten zerlegt werden muss und es sowohl Standard- als auch DU-Items zu Grunde liegt. Cronbach’s Alpha und die Item-Skala-Korrelationen als Indikatoren der Reliabilität und der Trennschärfe erreichten als akzeptabel bis gut angesehene Werte (α C ≈ 0,8; r it ≥ 0,3; Nunnally und Bernstein 1994; Ding und Beichner 2009). Der Wert für Cronbach’s Alpha ist gemäß gängiger Richtlinien (COTAN-System, Evers 2001; darauf beruhend: EFPA 2013) für Einzelfalldiagnostik mit weniger hoher Tragweite und Gruppenuntersuchungen zulässig. Einschränkend ist festzustellen, dass die interne Konsistenz aber keinen sehr guten Wert erreicht, und hinsichtlich Individualdiagnostik mit hoher Tragweite die Schwelle des empfohlenen Reliabilitätsbereiches nur annähernd erreicht. Diese Begrenzung wird bei der Belastbarkeit der gefundenen Ergebnisse mit berücksichtigt (Moosbrugger und Kelava 2012). Einige weitere Einschränkungen werden noch diskutiert.

Nach Unterricht liegen die Lösungswahrscheinlichkeiten der Items zwar bis auf einzelne Ausnahmen im Zielintervall (Bortz und Döring 2002, s. Diskussion unten), das Ergebnis der repräsentationalen Kohärenzfähigkeit liegt aber auch nach Unterricht und für curricular valide eingeschätzte Testitems (s. unten) im unteren Teil des Zielintervalls für die Lösungswahrscheinlichkeiten (\(\bar{P}\)(t 2) = 0,37, \(\bar{P}\)(t 3) = 0,31). Wir sehen unser Resultat im Einklang mit den Ergebnissen vorheriger Studien (vgl. Saniter 2003; Nieminen et al. 2010), wonach repräsentationale Kohärenzfähigkeit (hier im Bereich Strahlenoptik) für Lernende eine schwierige Anforderung darstellt.

Die Item- und Testkennwerte des RKF-Erhebungsinstruments lagen zum ersten Messzeitpunkt hingegen nicht durchweg in den psychometrisch erwünschten Bereichen. Vor Unterricht lag der Wert der Reliabilität ca. 10 % unterhalb des für Gruppendiagnostik benötigten Wertes, die Item-Skala-Korrelation ist gering und es ergeben sich sehr niedrige Lösungswahrscheinlichkeiten (\(\bar{P}\)(t 1) = 0,16). Ein theoretischer Bezug zur geringen Lösungswahrscheinlichkeit kann z. B. in DeFT (Ainsworth 2006) gesehen werden, hier wird geringe Kenntnis der Domäne als schwierigkeitserzeugendes Merkmal beim Arbeiten mit multiplen Repräsentationen aufgeführt. Wie schon beschrieben wurde, ist es selbst nach Unterricht in der Domäne noch schwierig, repräsentationale Kohärenzfähigkeit herzustellen. Vor Unterricht ist es dem Ergebnis nach zu schwierig. Damit zusammenhängend ergibt sich ebenfalls eine Erklärung für geringe interne Konsistenz (und auch geringe Item-Skala-Korrelationen) zu diesem Zeitpunkt. Interne Konsistenz setzt eine Vernetzung des Wissens innerhalb eines Fachgebietes voraus und ist bei Vorliegen eines überwiegend geringen Wissensstands im Fachgebiet auch nur in geringem Ausmaß zu erwarten (Zeilik et al. 1997; Ramlo 2008, Lasry et al. 2011). Dies ist beispielsweise bei Konzepttests wohlbekannt (ebenda). Dass dies insbesondere auch bei Tests zutage tritt, die auf Kohärenz abzielen, dürfte wenig überraschen und wurde auch in früheren einschlägigen Studien gefunden (Nieminen et al. 2010). Die Ergebnisse des Instrumentes sind vor domänenspezifischem Unterricht deshalb nur sehr eingeschränkt interpretierbar. Vor Unterricht sind eine Individualdiagnose und damit auch eine differenzierte Analyse auf der Ebene von Änderungen zwischen Prä- und Post-Ergebnissen nicht möglich. Die Ergebnisse für die Lösungswahrscheinlichkeiten können aber als Indikatoren für den Lernfortschritt im Rahmen eines messwiederholten Designs zur Gruppendiagnostik und auch zur Kontrolle vergleichbarer Anfangsbedingungen im Rahmen von Vergleichsstudien sinnvoll sein, obwohl die Reliabilität des RKF-Tests vor Unterricht um ca. 10 % unter dem für Gruppendiagnostik notwendigen Wert liegt (Evers 2001; EFPA 2013). Das ist ähnlich wie beispielsweise bei Konzepttests, die trotz Eindimensionalität ein etwas breiter gefasstes Konstrukt enthalten können. Dies kann sich u. U. auf die Reliabilitätsinterpretation auswirken, denn das Maß der inneren Konsistenz ist eigentlich für eindimensionale Tests mit sehr eng gefasstem Konstrukt ausgelegt (vgl. Adams und Wieman 2010). Darüber hinaus gehende Aussagen zu der Situation vor Unterricht sind nicht möglich.

Grenzen des vorgestellten Instruments liegen des Weiteren in einzelnen nicht ganz zufrieden stellenden Werten psychometrischer Indizes von Einzelitems. Die Lösungswahrscheinlichkeiten zu den Messzeitpunkten t2 und t3 sind bis auf Item 1c und Item 6 (nur Follow-up Messzeitpunkt) im gewünschten Bereich. Item 1c erfragt eine Begründung über die Konstruktion ausgezeichneter Strahlen, wie die Gegenstandsweite die Bildgröße beeinflusst, Item 6 erfragt den Grund für die Unmöglichkeit der Herleitung der Abbildungsgleichung aus zwei angegebenen Dreiecken eines Strahlengangs. Beide Items erfordern jedoch komplexe Vorgänge zur Lösungsgenerierung (N RF = 4 bzw. 5), und damit ist eine hohe Schwierigkeit plausibel. Die Items leisten für die Erhebung einer hohen Ausprägung von repräsentationaler Kohärenzfähigkeit einen Erkenntnisgewinn. Dies spricht für ihre Beibehaltung; ebenso, dass sich durch ihren Ausschluss die Reliabilität α C des Instruments nicht verbessert (s. Abschn. 3).

Die hohe curriculare Validität (inkl. Einschätzung der Eignung der Items für einen Leistungstest) wurde für 10 von 14 Items in dem Expertenrating mit guter Übereinstimmung bestätigt, für drei Items wurde curriculare Validität bestätigt. Dies bedeutet, dass es trotz deutlich von Standard-Anforderungen abweichender Operationalisierung bis auf lediglich eine Ausnahme gelungen ist, curricularer Validität zu entsprechen. Nach einer Lerngelegenheit für repräsentationale Kohärenzfähigkeit (siehe Scheid et al. 2014, 2015) könnte ein Großteil des RKF-Tests möglicherweise in der Schule zur Leistungsbeurteilung verwendet werden (das „eher nicht“ geeignete Item 6 und je nach Lerngelegenheit auch „die eher geeigneten“ Items 4a, 5ca, 5cb sollten dazu aus der Bewertung genommen werden).

Auch die Validitäts-Einschätzung ist punktuell noch verbesserbar: Die Items 5ca/5cb wurden nur als „eher curricular valide“ eingeschätzt, sie fragen nach einem Lösungsweg, nicht nach der Lösung selbst. Dies ist in der Schule eher unüblich und könnte ein Grund für die eher verhaltene Zustimmung zur curricularen Validität sein. Item 6 (Einschätzung „curricular eher nicht valide“) enthält ein Thema (s. oben), das im Lehrplan von Rheinland-Pfalz nicht ausdrücklich gefordert wird. Somit ist die Einschätzung der Experten nachvollziehbar. Dieses Item sollte daher ggf. ausgeschlossen werden. Der Test ist zwar nur für das Land Rheinland-Pfalz curricular validiert worden, mit teilweiser Übereinstimmung sind seine Inhalte jedoch auch in den Ländern Berlin (Stufe 7/8) und Brandenburg (Stufen 9/10) vorgesehen. Mit weitgehender Übereinstimmung zum Lehrplan von Rheinland-Pfalz sind die Inhalte des Tests von den 8 Ländern Bremen und Hamburg (jeweils Stufe 8), Hessen (Stufe 7 G8, Stufe 8 G9), Nordrhein-Westfalen (Stufe 8), Thüringen (Stufe 8), Schleswig-Holstein (Stufe 8, mit Abbildungsgleichung), Saarland (Stufe 9, im naturwissenschaftlicher Zweig mit Herleitung der Abbildungsgleichung) und Sachsen Anhalt (Stufe 6, Stufe 10 mit Herleitung der Abbildungsgleichung) vorgesehen, so dass eine Übertragbarkeit der Ergebnisse auf die genannten Bundesländer wahrscheinlich gegeben ist (Quellen der Lehrpläne in der angegebenen Reihenfolge: LISUM 2006, 2008; SBW 2006; LLS 2011; HK o.J.a, o.J.b; Qualis-NRW 2008; TMBWK 2012; MBWFK o.J.; MBKS 2014a und 2014b; MBSA 2016).

Hinsichtlich der Validität des Instrumentes als Ganzes bleibt kritisch betrachtet aufgrund einer theoretisch möglichen Verletztheit der Gleichabständigkeitsannahme der sechsstufigen Likertskala eine geringe Restwahrscheinlichkeit, dass die ICC die Rater-Übereinstimmung leicht überschätzt (Wirtz und Caspar 2002). Die gefundenen Intraklassen-Korrelationen sind jedoch genügend hoch, um das Expertenrating als reliabel einschätzen zu können. Das Instrument zur Erhebung der repräsentationalen Kohärenzfähigkeit kann daher insgesamt als „curricular valide“ eingeschätzt werden. Damit ist der Einsatz auch als Bewertungskomponente im Unterricht möglich, sofern zumindest die fachliche Thematik des Instrumentes schon im Unterricht behandelt wurde oder es explizit Lerngelegenheiten zur Entwicklung von repräsentationaler Kohärenzfähigkeit gab (Beispiele zu Aufgaben zur Förderung von repräsentationaler Kohärenzfähigkeit siehe Scheid et al. 2014, 2015). Ein solcher Einsatz ist wünschenswert, denn wie häufig gefordert (Black und Wiliam 1998; Bell 2007) sollen als didaktisch und lernpsychologisch wichtig erkannte Faktoren – wie hier repräsentationale Kohärenzfähigkeit – auch ihren Niederschlag in der Bewertungspraxis finden.

Schließlich ist noch folgende Limitierung der Studie einzuräumen: Das vorgestellte Instrument erlaubt es zwar, repräsentationale Kohärenzfähigkeit in praktikabler Weise und mit psychometrisch annehmbarer Güte zu erheben, und es werden auch bei allen Items entweder wichtige Schritte des Lösungswegs erfasst oder anderweitig (offene Items) Einblicke in die Vorgehensweise der Lernenden gegeben. Das Instrument ist aber nicht geeignet, Aufschluss über die kognitiven Prozesse beim gelingenden und misslingenden Entstehen von repräsentationaler Kohärenzfähigkeit zu liefern, wozu ergänzend weitere qualitative Daten und Methoden nötig wären. Diese Fragestellung ist von offensichtlichem Interesse für das Lernen mit multiplen Repräsentationen, geht aber über den hier gesteckten Rahmen hinaus.

Ausblick

Ein sinnvoller möglicher Einsatzzweck des Instrumentes ist die Diagnostik von repräsentationaler Kohärenzfähigkeit auf Gruppen- oder Individualebene (für letzteres unter den o. g. Einschränkungen). Im Falle einer niedrigen Ausprägung können so Maßnahmen zur Förderung von repräsentationaler Kohärenzfähigkeit eingeleitet werden. Ein Beispiel für eine wirksame Maßnahme ist der Einsatz von „Representational Analysis Tasks“ (siehe z. B. Scheid et al. 2014). Auch für die Prüfung solcher Förderstrategien mittels Interventionsstudien kann der vorgestellte Test verwendet werden. Perspektivisch sind Untersuchungen von repräsentationaler Kohärenzfähigkeit in Verbindung mit anderen Kompetenzen wie z. B. Optik-Konzeptverständnis (siehe Hettmannsperger 2015) interessant, um mögliche Verbindungen zwischen verschiedenen Kompetenzbereichen besser zu verstehen –eine für Forschung und Unterrichtspraxis gleichermaßen fruchtbare Fragestellung. Schließlich erscheint es für die Zukunft sinnvoll, RKF-Tests für andere repräsentationsreiche Themengebiete im naturwissenschaftlichen Unterricht zu entwickeln (z. B. Elektrizitätslehre (Cheng 2002), elektromagnetische Felder (Törnkvist et al. 1993), die Verbindung von Mikro- und Makro-Ebene in der Chemie (Gilbert und Treagust 2009, Kap. 2, 8, 14), Genetik (Tsui und Treagust 2013, Kap. 7, 9) u. a. m.) und darauf zielende Lehr-Lern-Maßnahmen damit zu untersuchen.