Während in der Vergangenheit die Magnetresonanztomographie (MRT) in der klinischen Praxis vorrangig zur anatomischen Diagnostik eingesetzt wurde, findet in den letzten Jahren auch die funktionelle Magnetresonanztomographie (fMRT) praktisches Interesse. Als nichtinvasives, kontrastmittelfreies Verfahren erlaubt sie die Lokalisation neuronaler Aktivität des zentralen Nervensystems mit bisher unerreichter Genauigkeit. Zur Abbildung der zerebralen Aktivität werden dabei Effekte der neurovaskulären Kopplung, insbesondere der sog. BOLD-Effekt („blood oxygenation level dependent effect“) genutzt [19]. Aufgrund einer Reihe physiologischer und physikalischer Gegebenheiten [24] ist die Sensitivität dieser fMRT-Verfahren zwar gering, doch kann man durch geeignete Wahl der experimentellen Parameter trotzdem eine ausreichend sichere Detektion der mit der neuronalen Aktivität verbundenen hämodynamischen Antwort („hemodynamic response function“, HRF)—bei noch akzeptabler Messzeit—erreichen. Diesbezügliche Optimierungsmöglichkeiten gibt es

  • beim Entwurf des experimentellen Paradigmas,

  • bei der Auswahl der MR-Hardware und der Bildgebungsparameter,

  • bei der Artefaktreduktion.

In den letzten Jahren ist eine Vielzahl methodischer Arbeiten zu dieser Fragestellung publiziert worden. Der vorliegende Artikel soll dem klinischen Forscher und dem interessierten Arzt einen Überblick über die Ergebnisse dieser Arbeiten und Richtwerte für die praktische Durchführung von fMRT-Experimenten geben.

BOLD-Effekt

Basis für das Verständnis des Folgenden ist die Kenntnis des Zusammenhangs zwischen physikalischer Stimulation und der hervorgerufenen hämodynamischen Antwort [21]. Zur quantitativen Beschreibung dieses Zusammenhangs existieren ähnliche, empirisch validierte Ansätze von Cohen [5] und Friston et al. [9]. Beide beschreiben den zeitlichen Verlauf des BOLD-Effekts als eine gewichtete Überlagerung (Linearkombination) von Gammafunktionen. Die Höhe der evozierten BOLD-Antwort ist dabei wesentlich von der Dauer der Stimulation abhängig. Bis zu einer Stimulationsdauer (SD) von etwa 15 s vergrößert sich die BOLD-Amplitude und damit auch der funktionelle Kontrast. In Abhängigkeit vom genutzten Modellierungsansatz verbleibt das Signal bei länger andauernder Stimulation auf einem gewissen Amplitudenniveau (Sättigung) oder relaxiert nach dem Überschreiten eines Maximalwertes. Das von Friston et al. vorgeschlagene ModeIl aus 2 subtraktiv überlagerten Gammafunktionen gestattet darüber hinaus auch eine Beschreibung des oft zu beobachtenden sog. „post-stimulus undershoot“. Abbildung 1 zeigt eine vergleichende Darstellung der auf der Basis dieser beiden Modellierungsansätze vorausgesagten BOLD-Antworten, für Stimulationen von 1, 2, 4, 8, 16 und 32 s Dauer. Die Antwortfunktionen wurden von uns dabei durch die Faltung der von den genannten Autoren vorgeschlagenen Modellfunktionen mit einer Rechteckfunktion der entsprechenden Breite erzeugt.

Abb. 1
figure 1

Zusammenhang zwischen Stimulationsdauer (SD) und BOLD-induzierter Änderung des MR-Signals (ΔSMR, in relativen Einheiten). Vergleichende Modellierung auf der Basis der von Cohen [5] und Friston et al. [9] vorgeschlagenen Antwortfunktionen

Experimentelles Design

Der Grundgedanke des funktionellen Ansatzes besteht darin, unterschiedliche psychologische Zustände durch geeignete Reize herzustellen und die jeweils evozierten BOLD-Antworten zu vergleichen. Für eine erfolgreiche funktionell-tomographische Messung spielen dabei die exakten Durchführungsbedingungen in medizinischer, experimentalpsychologischer und MR-physikalischer Hinsicht die entscheidende Rolle. Wir bezeichnen diesen Komplex der Festlegungen als experimentelles Paradigma oder Design. Es umfasst die experimentellen Bedingungen, deren zeitliche Reihenfolge und die Parameter der Bildgebung zur Abbildung der evozierten Effekte.

Bezüglich der experimentellen Bedingungen unterscheidet man kategorielle, faktorielle und parametrische Designs. Die experimentellen Bedingungen sind in der Regel durch die inhaltliche Zielsetzung des Experiments selber bestimmt und sollen hier nicht näher besprochen werden.

Hinsichtlich der zeitlichen Abfolge der Reizung existieren 2 gebräuchliche Ansätze:

  • Das sog. Blockdesign, bei dem in wiederholten, festen Zeitabschnitten des Experiments, von z. B. 20 s Dauer, je eine Serie von Stimulationen der gleichen Bedingung dargeboten wird.

  • Das ereigniskorrelierte („event related“) Design, welches durch kurze Einzelreizungen gekennzeichnet ist [7].

Abbildung 2 zeigt eine Definition der für den Ablauf der Reizung relevanten Zeitabschnitte. Die für die Optimierung des Designs wichtigsten Größen sind dabei die Dauer einer zusammenhängenden Einzelreizung („stimulus duration“, SD) und der zeitliche Abstand zwischen dem Beginn zweier aufeinanderfolgenden Reizungen, das sog. Interstimulusintervall (ISI).

Abb. 2a–c
figure 2

Definition der für den Ablauf der Stimulation relevanten Zeitabschnitte. A: Stimulus onset asynchrony (SOA), B: Stimulus- oder Stimulationsdauer (SD), C: Interstimulusintervall (ISI)

Die zeitliche Verlaufsform des MR-Signals ist in denjenigen Hirnarealen, die an der neuronalen Verarbeitung der jeweiligen (bedingungsspezifischen) Reize beteiligt sind, mit der zeitlichen Verlaufsform des Paradigmas korreliert. Ziel der Designoptimierung ist deshalb die Maximierung der durch das Paradigma induzierten Varianz in den fMRT-Zeitreihen. Dadurch wird der interessierende neuronale Effekt gegenüber dem der ständig vorhandenen neuronalen Aktivität erhöht, d. h. technisch gesprochen das Signal-Rausch-Verhältnis verbessert und damit die Detektionssicherheit für BOLD-Antworten erhöht.

Zur Schätzung der Paradigmeneffizienz eignet sich eine prädiktive Modellierung des fMRT-Signals, welche auf einer physiologischen Hypothese basiert. Dazu wird die beobachtete Zeitreihe Y zu den m Messzeitpunkten in einem gegebenen Voxel v (x,y,z) durch die mit den Koeffizienten β i gewichtete Summe n erklärender Modellzeitreihen (Modellfunktionen, Regressoren) x i der Länge m beschrieben:

$$ Y = {\mathop \Sigma \limits_{i = 1}^n }\beta _{i} x_{i} + \varepsilon $$
(1)

Die n Modellfunktionen x i fasst man zur sog. Designmatrix X zusammen und damit lautet diese Gleichung in Matrixform:

$$ Y = \beta X + \varepsilon $$
(2)

Der durch die Modellfunktionen nicht beschreibbare Anteil der Zeitreihe verbleibt als Fehlervektor ε, dessen Komponenten als normalverteilt angenommen werden,  εN(0, σ2 I).

Die Designmatrix X beschreibt mit Hilfe der enthaltenen Regressoren das experimentelle Design. Im einfachsten Fall sind diese Regressoren Folgen von Rechteckfunktionen, die das Vorhandensein des Reizes anzeigen. Pro experimenteller Bedingung wird dabei mindestens ein Regressor angenommen (z. B. eine Folge von 10 Rechteckfunktionen von jeweils 10 s Dauer). Dieser Modellierungsansatz orientiert sich zunächst rein am zeitlichen Ablauf der Stimulation, ohne dabei physiologische Vorinformationen über den typischen Verlauf der hämodynamischen Antwort zu nutzen. Durch Einbeziehen der bereits angesprochenen experimentell gewonnenen Informationen über den Verlauf der hämodynamischen Antwort [5, 9] kann aber die Varianz des Modells der zu erwartenden empirischen Varianz weit besser angepasst werden. Das entspricht einer mathematischen Faltung der Regressoren mit dem HRF-Modell. Die Modellfunktionen (die Spalten) der Designmatrix sind dann, anschaulich gesprochen, Abfolgen der hämodynamischen Antworten.

Damit wird nun eine Voraussage über die Effizienz des Designs in Abhängigkeit von der Auftretensdauer der Reizung und deren Zeitabständen möglich. Wenn als Effizienz der zu erwartende Anteil an aufgeklärter Varianz in den Voxelzeitreihen Y definiert wird, ist diese nach Friston et al. invers mit der Kovarianz der über Gleichung 2 mittels Regression geschätzten Modellkoeffizienten \({\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } }\) verbunden. Durch Umstellung der Gleichung 2 lässt sich nämlich der durch das Modell erklärte Signalanteil errechnen zu \( Y - \varepsilon = \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } X \)

Durch Substitution von \( \varepsilon = Y - \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } X \) in dieser Gleichung ergibt sich die erklärte Varianz σ2 zu:

$$ \sigma ^{2} = {\left( {Y - \varepsilon } \right)}^{T} {\left( {Y - \varepsilon } \right)} = (\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } X)^{T} \cdot \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } X = X^{T} \cdot {\left( {\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } ^{T} \cdot \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } } \right)} \cdot X $$
(3)

Mit \( (\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } ^{T} \cdot \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } ) = \operatorname{cov} \{ \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } \} \) folgt

$$ \sigma ^{2} = \operatorname{cov} \{ \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } \} X^{T} X $$
(4)

Die Umstellung nach cov{β} ergibt die endgültige Form [11, 14, 15]:

$${{\text{cov\{ }}\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } \} = \sigma ^{{\text{2}}} (X^{T} X)^{{ - {\text{1}}}} }$$
(5)

Im Kontext einer inferenzstatistischen Testung der Signifikanz der bedingungsspezifischen Haupteffekte sowie der differenziellen Effekte zwischen 2 und mehr Bedingungen müssen jedoch die jeweiligen Teilvarianzen bei der Effizienzabschätzung berücksichtigt werden. Das erfolgt über die Wichtung der einzelnen Regressoren (Spalten der Designmatrix X). Diese Wichtung wird auch als inferenzstatistische Kontrastbildung bezeichnet und erfolgt durch Transformation mittels eines Kontrastvektors c der Länge n. Gleichung 5 nimmt damit (nach [11], Gleichung 3) bei selektiver Beachtung der interessierenden Varianzkomponenten sowie der Annahme einer stationären, normalverteilten Fehlervarianz die folgende Form an:

$${{\text{cov\{ }}c^{T} \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\beta } \} = \sigma ^{2} c^{T} (X^{T} X)^{{ - {\text{1}}}} c}$$
(6)

Die Effizienz E Design lässt sich unter Verwendung von Gleichung 7 abschätzen über:

$$ {E_{{Design}} \propto trace[c^{T} (X^{T} X)^{{ - {\text{1}}}} c]^{{ - {\text{1}}}} } $$
(7)

Dabei wird die Spur („trace“, d. h. die Summe der diagonalen Elemente) der gewichteten Kovarianzmatrix (X T X)–1 gebildet und als Maß für die nicht aufgeklärte Varianz verwendet. Gleichung 7 zeigt, dass die Optimierung des Designs von den interessierenden inferenzstatistischen Kontrasten abhängt. Bei einem experimentellen Design mit einer einzigen Bedingung ist somit die Bestimmung der idealen Sequenz für den Reizeinsatz („stimulus onset asynchrony“, SOA) und der optimalen Präsentationsdauer möglich. fMRT-Experimente beinhalten jedoch in der Regel mehr als nur eine Bedingung. Somit kann bei der Optimierung solcher Designs nur ein Kompromiss im Interesse einer möglichst großen Gesamteffizienz angestrebt werden.

Friston et al. [11] sagten auf dieser Basis von Gleichung 7 eine optimale Stimulationswahrscheinlichkeit von 0,5 voraus (d. h. eine durch Ruhephasen unterbrochene Stimulation über ca. 50% der Gesamtmesszeit t gesamt , vgl. Gleichung 8). Das optimale mittlere ISI beträgt dabei etwa das Doppelte der mittleren Dauer einer Einzelreizung:

$${\Sigma SD_{{optimal}} \approx {\text{0}}{\text{.5}}t_{{gesamt}} }$$
(8)
$${\overline{{ISI}} _{{optimal}} \approx {\text{2}}SD}$$
(9)

Birn et al. [2] validierten diese theoretischen Voraussagen mit Hilfe einer umfangeichen Simulationsstudie und Mechelli et al. [16] zeigten empirisch die praktische Bedeutung einer A-priori-Design-Effizienzschätzung in einem MR-Experiment zur Sprachverarbeitung. Abbildung 3a zeigt die von Birn et al. [2] simulierten Designeffizienzen in Abhängigkeit von der Reizdauer und den mittleren Interstimulusintervallen.

Abb. 3
figure 3

a Designeffizienzen in Abhängigkeit von den mittleren Interstimulusintervallen und 3 verschiedenen Stimulationszeiten (SD). Die vertikalen Punktgruppen kennzeichnen die Effizienzverteilung der simulierten Designs. Die Kurven definieren dabei die 95%-Effizienzgrenze, d. h. sie trennen die besten 5% der Simulationen vom Rest der Verteilung. Durchgezogene Linien kennzeichnen variable ISI, unterbrochene Linien kennzeichnen konstante ISI. Die SD-assoziierten Effizienzmaxima liegen bei 2, 4 und 8 s und werden durch die Pfeile und senkrechten Punktlinien gekennzeichnet. b Detektionssicherheit in Abhängigkeit von der Reizdauer. Durchgezogene Linie 95%-Detektionsgrenze für variable ISI, unterbrochene Linie 95%-Detektionsgrenze für konstante ISI, waagerechte Punktlinie 95% der maximal erreichbaren Detektionssicherheit, Pfeil und senkrechte Punktlinie minimale SD für die optimale Effektdetektion. (Mod. aus [2])

Aufbauend auf diesen grundsätzlichen Überlegungen kann die Designoptimierung für fMRT-Experimente in 2 Hauptrichtungen erfolgen:

  • mit dem Ziel einer maximal sicheren Entdeckung des lokalen BOLD-Effekts („detection“);

  • mit dem Ziel der möglichst genauen Beschreibung der zeitlichen Charakteristik der hämodynamischen Antwort („estimation“).

Detektion („detection“)

Die Wahrscheinlichkeit, einen beliebigen Effekt zu detektieren, nimmt mit seiner Stärke zu. In fMRT-Experimenten ist die Amplitude der BOLD-Antwort ein Maß für die Effektstärke. Da die Amplitude der HRF eine Funktion der Dauer der evozierten neuronalen Aktivität ist, ist die Detektionssicherheit unmittelbar mit der Stimulationsdauer verbunden. Die Amplitude der HRF steigt bis zu einer SD von ca. 15 s und verbleibt dann auf dem erreichten Niveau (Abb. 1). Die entsprechende Detektionssicherheit beträgt für diese SD bereits 95% des maximal erreichbaren Wertes (Abb. 3b). Demzufolge kann ein Blockdesign mit einer Blocklänge von 15 s und einer zeitlichen Differenz von 30 s für den Beginn zweier aufeinanderfolgender Stimulationsblöcke als ideal für eine möglichst effektive BOLD-Lokalisation angesehen werden.

Bestimmung der zeitlichen Verlaufsform („estimation“)

FMRT-Experimente mit dem Ziel einer möglichst genauen Beschreibung der zeitlichen Charakteristik der HRF sind nur unter Verwendung von ereigniskorrelierten („event-related“) Designs möglich. Die HRF wird dabei in der Regel unter Nutzung eines Satzes unspezifischer Modellfunktionen (Sätze von Kosinus- oder Sinusfunktionen unterschiedlicher Frequenz oder von Gammafunktionen unterschiedlicher Dispersion) geschätzt. Neben den für beide Designtypen gültigen Aussagen aus den Gleichungen 8 und 9 sind für die Optimierung ereigniskorrelierter Designs zusätzliche Aspekte von Bedeutung. Diese betreffen in erster Linie die Verbesserung der Schätzgenauigkeit für die HRF (Güte der Schätzung, „goodness of fit“). Die Schätzgenauigkeit wird wesentlich durch die Datenabtastrate („sampling rate“ oder „data acquisition rate“, Messungen/Zeiteinheit) bestimmt. Je höher diese ist, desto mehr Informationen über den Verlauf der HRF stehen für die Schätzung ihres zeitlichen Verlaufs zur Verfügung. Die Abtastrate einer fMRT-Messung ist physikalisch durch die Repetitionszeit TR gegeben. Für Ganzkopfaufnahmen beträgt diese in der Regel 2000–3000 ms. Um die hämodynamische Antwort trotzdem mit einer höheren Frequenz messen zu können, wird für gleichartige Reize die zeitliche Differenz zwischen Stimulations- und Scanbeginn systematisch variiert. Diese Vorgehensweise bezeichnet man als Jittern. Sie ist in Abb. 4 schematisch dargestellt. Durch ein anschließendes Poolen der so gesammelten Datenpunkte vergrößert sich die virtuelle Abtastrate (Anzahl der Messungen/hämodynamischer Antwort) und die Güte der Verlaufsschätzung steigt. Parallel dazu verbessert sich die Effizienz des ereigniskorrelierten Designs (Abb. 3a und b, durchgehende Linien: variable ISI, Jitter; unterbrochene Linien: konstante ISI).

Abb. 4
figure 4

a Einfluß der Abtastrate („sampling rate“ oder „data acquisition rate“): In Abhängigkeit von der zeitlichen Dichte der diskreten Messung eines kontinuierlichen (stetigen) Signals wird dieses Signal in unterschiedlicher Güte abgebildet. Die Zeitpunkte eines Scanbeginns sind in der Signalverlaufskurve (dicke Linie) als Knickpunkte sichtbar. Die dünne Kurve zeigt den aus Modellansätzen geschätzten kontinuierlichen Verlauf der HRF. Je höher die Messfrequenz, desto kleiner ist der Abbildungsfehler. b „Jittering“: Zur Erhöhung der zeitlichen Auflösung der Messung kann durch eine Veränderung der Relation zwischen Stimulus- und Scanbeginn (Δt) die Dichte der Messpunkte für die mittlere HRF deutlich erhöht werden. Diese Problematik ist für 4 verschiedene Δt dargestellt. Dabei wird der Wert für den zeitlichen Versatz in 500-ms-Schritten erhöht. Der Verlauf der mittleren HRF wird anschließend unter Verwendung aller Messpunkte mit einer virtuellen zeitlichen Auflösung von 500 ms geschätzt (unterste Abbildung)

Ein praktikabler Weg zur Berechnung der optimalen Stimulationssequenz für ereigniskorrelierte Designs ist der einer numerischen Simulation. Bei diesem Ansatz werden die zentralen Designparameter SD und ISI systematisch variiert und eine große Anzahl von Designmatrizen berechnet. Durch Berechnung der Effizienz entsprechend der Gleichung 7 wird aus der Menge der erzeugten Designmatrizen das effektivste Design ausgewählt [2]. Wagner u. Nichols [22] schlagen als dazu alternativen Weg einen „genetischen“ Algorithmus zur Ermittlung des optimalen Designs vor. Dabei wird ein Ursprungsdesign so lange „mutiert“, bis es ein entsprechendes Gütekriterium erfüllt. Das Gütekriterium ist im konkreten Fall wiederum die Designeffizienz, wie in Gleichung 7 definiert.

Stichprobenumfang

Die Stärke oder Macht eines Tests („test power“) entspricht der Wahrscheinlichkeit einer Widerlegung der Nullhypothese H0, wenn sie tatsächlich falsch ist, und die Alternativhypothese H1 zutrifft. Damit entspricht die Teststärke P dem Komplement der Wahrscheinlichkeit des Fehlers zweiter Art (β-Fehler) und errechnet sich zu:

$$ P = 1 - \beta $$
(10)

Die Teststärke wird determiniert durch:

  1. 1.

    Die Effektstärke, d. h. die Differenz der Mittelwerte μD der zu testenden Verteilungen (z. B. der Voxelsignalintensitäten innerhalb einer Region für Ruhe und Reizung oder 2 unterschiedliche Reize) und deren interindividueller („between subject variance“, σB) und intraindividueller Varianz („within subject variance“, σW);

  2. 2.

    das für den Test gewählte α-Signifikanzniveau und

  3. 3.

    den Stichprobenumfang NVP und die Messwiederholungen/Bedingung NSP [6].

In diesem Abschnitt wird die Optimierung der unter 3. aufgeführten Einflussfaktoren näher diskutiert. Eine Reihe neuerer methodischer Arbeiten beschäftigt sich mit der Abschätzung der notwendigen Stichprobenumfänge für fMRT-Experimente [6, 10, 18]. Die Schwierigkeit liegt dabei in einer adäquaten Schätzung der Effektstärken μD und der zugehörigen Varianzkomponenten σW und σB. Die Effektstärke ist dabei von der Art und Dauer der Stimulation sowie der subjektiven vaskulären Reaktivität abhängig. Ihre Schätzung sollte auf der Basis eines Pilotexperiments erfolgen. Für die intraindividuelle Varianz kann ein typischer Wert von σW=0,75% als gute Näherung angenommen werden [6]. Da die Schätzung der interindividuellen Varianz \( \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\sigma } ^{2}_{B} \) aus den gepoolten Daten aller Versuchspersonen des Pilotexperiments durch die intraindividuellen Varianzen \( \sigma ^{2}_{W} \) kontaminiert ist, muss folgende Korrekturformel angewendet werden:

$$ \sigma _{B} = {\sqrt {\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\sigma } ^{2}_{B} - {2\sigma ^{2}_{W} } \mathord{\left/ {\vphantom {{2\sigma ^{2}_{W} } n}} \right. \kern-\nulldelimiterspace} n} } $$
(11)

Dabei bezeichnet der Wert n die Anzahl unabhängiger Messungen (Scans). Desmond u. Glover [6] geben für eine Scannerfeldstärke von 3 Tesla die folgenden empirischen Werte für die betrachteten Größen an (taktile bilaterale Stimulation): μD=0,25–0,75%, σW=0,75–1,25%, σB=0,3–0,7%. Abbildung 5 zeigt die Teststärkekurven, die von Desmond und Glover [6] auf der Basis dieser Richtwerte berechnet wurden.

Abb. 5
figure 5

Teststärke (1-β) in Abhängigkeit vom Stichprobenumfang (NVP) für eine intraindividuelle Varianz (σW) von 0,75% und eine 2-seitige Irrtumswahrscheinlichkeit von α=0,05 unkorrigiert. Die dargestellten Kurven wurden für verschiedene Kombinationen der Parameter μ0 (Effektstärke), σB (interindividuelle Varianz) und NSP (Anzahl der Messungen/Bedingung) errechnet. (Mod. aus Desmond u. Glover [6])

Sie sind unter der Annahme einer konstanten α-Irrtumswahrscheinlichkeit von 0,05 und einer intraindividuellen Varianz von 0,75% für ausgewählte Werte von μD, σB und NSP dargestellt. Folgende Zusammenhänge werden dadurch sichtbar:

  • Je größer die mittlere Signaldifferenz zwischen den zu testenden Bedingungen (respektive je größer der BOLD-Effekt im MR-Signal), desto größer ist die Teststärke und desto kleiner muss der Stichprobenumfang angesetzt werden (μD~P, μD~1/NVP, Abb. 5a).

  • Je kleiner die interindividuelle Varianz, d. h. je homogener die Stichprobe, desto größer die Teststärke (σB~1/P, σB~NVP, Abb. 5b).

  • Je höher die Anzahl der Wiederholungsmessungen/Bedingung („sampling points per condition“, NSP) desto höher ist die Power (NSP~P, NSP~1/NVP, Abb. 5c).

Diese Zusammenhänge sollten bei der Versuchsplanung in Betracht gezogen werden. Die konkrete Abschätzung der Teststärke sowie des Stichprobenumfangs muss jedoch dem geplanten Experiment entsprechen und sollte durch Daten aus Vorexperimenten gestützt werden.

MR-Hardware

Die Einschränkungen für die funktionelle MRT werden von technischer Seite durch die zur Verfügung stehende MR-Hardware bestimmt. Insbesondere mit einer adäquaten Auswahl der für die Bildgebung eingesetzten HF-Spulen kann bei vorgegebener Hauptfeldstärke eine wesentliche Verbesserung des Signal-Rausch-Verhältnisses („signal to noise ratio“, SNR) erreicht werden. Die dadurch mögliche Steigerung der Messempfindlichkeit kann Defizite im Bereich der Hauptfeldstärke verringern oder kompensieren.

Im Wesentlichen werden für die zerebrale Bildgebung 3 HF-Spulentypen eingesetzt [3, 12]:

  • Volumenspulen zur Messung des gesamten Hirnvolumens (in der Regel zirkular polarisierte Kopfspulen, „circularly polarized head coils“, CPHP),

  • Oberflächenspulen zur Messung partieller Hirnvolumina (surface coils, SC),

  • Kombinationen mehrerer parallel betriebener Oberflächenspulen zur Messung des gesamten Hirnvolumens („phased-array head coils“, PAHC).

Die Einsatzmöglichkeiten der einzelnen Spulentypen sind wesentlich von ihren physikalisch-technischen Eigenschaften abhängig. Zur Verdeutlichung der Unterschiede zwischen den einzelnen Spulenarchitekturen führten wir an der Neurologischen Klinik der Charité zu Berlin eine vergleichende Phantommessung durch. Mit einer CPHC und PAHC wurden jeweils 100 Gradientenecho-EPI-Aufnahmen („gradient-echo echo planar imaging“, GE-EPI) eines Kugelphantoms gemacht (Messanordnung Abb. 6a, Scanner 1,5 T Siemens Sonata, Matrix 64×64, Schichtanzahl 26, Voxelgröße 4×4×4,6 mm, Voxelvolumen 73 mm3, TR 2500 ms, TE 40 ms). Zur Quantifizierung des im Bild enthaltenen Rauschanteils wurden 2 Referenzschichten außerhalb des Phantomvolumens und eventueller Geisterbilder („ghost artefacts“) definiert. Das arithmetische Mittel der Signalwerte S aller in diesen Schichten enthaltenen Voxel (2×26×64=3328) wurde als hinlänglich gute Schätzung des Rauschniveaus angenommen (Abb. 6b). Die SNR-Berechnung erfolgte entsprechend folgender Gleichung für jedes Voxel in jedem funktionellen Volumen:

$$ SNR(x,y,z) = \frac{{S(x,y,z)}} {{{\Sigma S_{{referenz}} } \mathord{\left/ {\vphantom {{\Sigma S_{{referenz}} } {N_{{referenz}} }}} \right. \kern-\nulldelimiterspace} {N_{{referenz}} }}} $$
(12)
Abb. 6a–d
figure 6

HF-Spulen-spezifische Verteilungen des Signal-Rausch-Verhältnisses (SNR-Karten, berechnet entsprechend Gleichung 12). a Geometrische Charakteristik der Messanordnung, b Wahl der Referenzschichten für die Berechnung der SNR-Karten, c spulendesignabhängige SNR-Karten für CPHC (linke Spalte) und PAHC (rechte Spalte), d Ergebnisse der t-Tests auf statistisch signifikante Differenzen in den SNR-Karten

Im Anschluss wurde für jeden Kopfspulentyp durch Mittelung der resultierenden 100 Bilder die durchschnittliche Verteilung des Signalrauschverhältnisses innerhalb des Volumens berechnet (Abb. 6c). Zur inferenzstatistischen Testung der lokalen SNR-Differenzen zwischen CPHC und PAHC wurde unter Nutzung des Programmpakets SPM2 ein (two sample) t-Test zwischen den spulenspezifischen SNR-Karten durchgeführt. Die Ergebnisse dieser Testung sind in Abb. 6d dargestellt und sollen im Folgenden diskutiert werden.

CPHC

Die Spule besteht aus einer einzigen integrierten Sende- und Empfangseinheit, welche alternierend betrieben wird. Der geometrische Aufbau (zylindrisch, käfigförmig) garantiert eine relativ homogene Verteilung der HF-Anregung innerhalb des Volumens (vgl. die gleichmäßige Ausleuchtung des Hirnvolumens in Abb. 7a oben). Das SNR ist deshalb über das gesamte Messvolumen vergleichbar (Abb. 6c und 6d, linke Seite). Insbesondere im frontalen und zentralen Bereich des Messvolumens weist die CPHC ein besseres Signal-Rausch-Verhältnis auf als die PAHC. Deshalb ist diese Spulenarchitektur bei der Bildgebung von frontalen und Zwischenhirnstrukturen überlegen.

Abb. 7a, b
figure 7

Intensitätscharakteristik für (a) eine zirkular polarisierte Kopfspule (CPHC, hier mit Kissen zur Fixierung des Kopfes dargestellt) und (b) eine Oberflächenspule (SC, in der Halterung zur Messung im Temporalbereich montiert, Pfeil). Deutlich sichtbar ist die hohe Signalhomogenität für die CPHC. Im Gegensatz dazu zeigt die SC mit zunehmender Entfernung von der Spule (d. h. hier dem Okzipitalbereich) einen deutlichen Signalverlust

SC

Die Oberflächenspule besitzt bis zu einer Eindringtiefe, die etwa ihrem Durchmesser entspricht, ein besseres SNR als die CPHC. Der wesentliche Nachteil dieses Spulentyps ist der starke Signalverlust mit zunehmendem Abstand von der Oberfläche (Abb. 7b). Deshalb können mit Oberflächenspulen nur partielle Volumina gemessen werden. Eine weitere Einschränkung ist durch die notwendige geometrische Anordnung zwischen Spulenfeld \( \ifmmode\expandafter\vec\else\expandafter\vecabove\fi{B}_{1} \) und Hauptfeld \( \ifmmode\expandafter\vec\else\expandafter\vecabove\fi{B}_{0} \) gegeben. Da die Oberflächenspule ihre maximale Effizienz nur bei orthogonaler Position beider Felder erreicht [12], ist die Menge der erfassbaren Hirnregionen eingeschränkt. Bei Messungen im okzipitalen und lateral-temporalen Kortex bietet dieser Spulentyp allerdings ein besseres SNR als die CPHC.

PAHC

Phased-array-Kopfspulen vereinigen die Vorteile von CPHC und SC. Durch die zylinderförmige Anordnung mehrerer Oberflächenspulen kann fast der gesamte Kortex mit einem deutlich höheren Signal-Rausch-Verhältnis gemessen werden als mit der CPHC. Die Verbesserung beträgt dabei im kortikalen Bereich etwa 50%. Wie in Abb. 6c ersichtlich, nimmt das Signal auch für diese Spulenarchitektur mit zunehmender Entfernung von der Oberfläche ab. Die in der Abbildung sichtbare Asymmetrie der SNR-Verteilung ist auf die etwas exzentrische Lage des Kugelphantoms zurückzuführen. Spulen des Phased-array-Typs besitzen jedoch Schwächen bei der Abbildung tieferer Hirnstrukturen. In diesem Bereich sind ihnen klassisch zirkular polarisierte Spulen weiterhin überlegen (Abb. 6d).

Die Wahl einer der Messaufgabe angepassten Spulenarchitektur hat wesentlichen Einfluss auf das erreichbare Signal-Rausch-Verhältnis. Existiert eine Hypothese über die Lokalisation der zu erwartenden Effekte und/oder sollen schwache Effekte in definierten kortikalen Regionen abgebildet werden, ist der SC bzw. PAHC der Vorrang zu geben. Ist das nicht der Fall und das gesamte Hirnvolumen soll mit relativ homogener Empfindlichkeit gemessen werden, sollte die CPHC zum Einsatz kommen.

MR-Bildgebungsparameter

Die möglichst empfindliche Messung der BOLD-Antwort ist das Ziel der fMRT. Da der abzubildende Effekt relativ schwach und das Messverfahren vergleichsweise unempfindlich und artefaktanfällig ist, muss einer Optimierung der Bildgebungsparameter besondere Aufmerksamkeit geschenkt werden.

Die MR-Messung des BOLD-Effekts basiert auf den durch die Modulation der venösen Deoxihämoglobinkonzentration hervorgerufenen Suszeptibilitätsveränderungen innerhalb von Gefäßen und des sie umgebenden Parenchyms. Diese Veränderung der Magnetisierbarkeit wirkt sich unmittelbar auf das lokale Relaxationsverhalten aus und führt zu einer Verlängerung der T2*-Zeit in der Nähe neuronaler Aktivität. Die für die Messung dieses Effekts eingesetzten Pulssequenzen haben im Interesse einer möglichst hohen T2*-Empfindlichkeit lange Echozeiten (TE). Das hat den Nachteil, dass zum Zeitpunkt der Datenakquisition bereits ein großer Teil des MR-Signals zerfallen ist. Zwangsläufig verringert sich dadurch bei gleichbleibendem Rauschen das für die BOLD-Detektion wesentliche Kontrast-Rausch-Verhältnis („contrast-to-noise-ratio“, CNR), d. h. das Verhältnis zwischen Effektstärke Δ S und Rauschen N. Für lange Repetitionszeiten (TR >T1) ist die BOLD-induzierte Signaldifferenz näherungsweise gegeben durch:

$$ \Delta S = S_{{Stimulation}} - S_{{Ruhe}} = S_{{Ruhe}} \cdot TE \cdot {\left| {\Delta R2^{*}_{{}} } \right|} \cdot \exp ^{{ - TE \cdot R2^{*}_{{}} }} $$
(13)

Im Falle einer positiven BOLD-Antwort gilt S Stimulation >S Ruhe . Die Signalzunahme bei der Stimulation wird dabei durch eine Erhöhung der T2*-Zeit \( {{\text{(Verringerung der T2* - Relaxationsrate }}R2^{*}_{{}} = \frac{1} {{T2*}}{\text{ )}}} \) verursacht. Die Differenz ΔR2* zwischen den T2*-Relaxationsraten für Ruhe- und Stimulationsbedingung ist demnach ein Maß für die Stärke des BOLD-Effekts:

$$ \Delta R2^{*}_{{}} = R2^{*}_{{Stimulation}} - R2^{*}_{{Ruhe}} = \frac{1} {{T2^{*}_{{Stimulation}} }} - \frac{1} {{T2^{*}_{{Ruhe}} }} $$
(14)

Für das korrespondierende Kontrast-Rausch-Verhältnis folgt aus Gleichung 13 [13]:

$$ CNR = \frac{{\Delta S}} {N} = \frac{{S_{{Ruhe}} }} {N} \cdot TE \cdot {\left| {\Delta R2^{*}_{{}} } \right|} \cdot \exp ^{{ - TE \cdot R2^{*}_{{}} }} $$
(15)

Das im MR-Signal enthaltene thermische, technische und physiologische Rauschen N kann vom Experimentator in der Regel nicht beeinflusst werden. Die Optimierung des Kontrast-Rausch-Verhältnis ist demnach nur über die Maximierung der Signaldifferenz ΔS zu erreichen. Dazu muss in einem 1. Schritt das MR-Ruhesignal S Ruhe maximiert werden. Am Beispiel der für BOLD-Experimente gebräuchlichen Gradientenechopulssequenzen sollen im Folgenden mögliche physikalische Ansätze zur Parameteroptimierung diskutiert werden. Gleichung 16 beschreibt die Faktoren, durch welche die MR-Signalstärke in einem Voxel eines GE-Bildes bestimmt wird:

$$ S \propto M_{0} \frac{{\sin (\alpha ) \cdot \exp ^{{ - TE \cdot R2^{*}_{{}} }} \cdot (1 - \exp ^{{ - TR \cdot R1}} )}} {{1 - \cos (\alpha ) \cdot \exp ^{{ - TR \cdot R1}} }} $$
(16)

Die Anfangslongitudinalmagnetisierung M 0 verhält sich direkt proportional zur Stärke des Hauptfeldes \({\left| {\vec{B}_{0} } \right|}\) und zur Anzahl der angeregten Kerne. Bei gegebener Hauptfeldstärke ist eine Erhöhung der Anfangslongitudinalmagnetisierung nur über eine Vergrößerung des Voxelvolumens und damit auch der Absolutanzahl angeregter Kerne möglich. Auch die Longitudinal- und Transversalrelaxationsraten R1 und R2* sind Abhängige des Hauptmagnetfeldes. Gleichzeitig wird ihr Betrag auch wesentlich von den lokalen Suszeptibilitätseigenschaften beeinflusst. Da sich diese Größen einer direkten Einflussnahme durch den Experimentator entziehen, wird im Folgenden auf die Wahl der optimalen Werte für messtechnisch relevante Parameter wie Kippwinkel α, Repetitionszeit TR und Echozeit TE eingegangen. Kippwinkel und Repetitionszeit sind mit den R1 -Termen der Gleichung 16 assoziiert. Das MR-Basissignal S Ruhe wird wesentlich durch die Wechselwirkung diese beiden Parameter definiert. Für lange Repetitionszeiten (TR >T1) hat der ideale Kippwinkel in den meisten Fällen einen Betrag von 90°. Wird die TR jedoch verkürzt, relaxiert im Zeitraum zwischen einem 90°-Puls und der nächsten Anregung nur ein unzureichender Anteil der Longitudinalmagnetisierung. Dadurch nimmt die Transversalmagnetisierbarkeit des Spin-Ensembles ab und das MR-Signal verringert sich. Mit einer Verkleinerung des Kippwinkels kann dieser Tendenz entgegen gewirkt werden. Der optimale Kippwinkel αE (Ernst-Winkel) kann nach Gleichung 17 berechnet werden [4]:

$$ \alpha _{{\text{E}}} = {\text{arccos}}({\text{exp}}^{{ - {\text{TR/T}}1}} ) $$
(17)

Die Beachtung des Ernst-Winkels ist insbesondere bei Feldstärken über 1,5 Tesla von Bedeutung [20], da schon beim Übergang von 1,5 zu 3,0 T die T1-Relaxationszeit um etwa 30% steigt und damit dem Bereich der experimentell gebräuchlichen TR-Zeiten nahe kommt. In Abb. 8 ist der Zusammenhang zwischen optimalem Kippwinkel und Repetitionszeit für Feldstärken von 1,5 und 3 Tesla dargestellt.

Abb. 8
figure 8

Ernst-Winkel in Abhängigkeit von der TR für 2 Feldstärken und T1-Relaxationszeiten. Gepunktete Linie \( {\left| {\ifmmode\expandafter\vec\else\expandafter\vecabove\fi{B}_{o} } \right|} = 1,5{\text{T}}{\text{,T1}} = {\text{970}}\;{\text{ms}} \), durchgehende Linie \( {\left| {\ifmmode\expandafter\vec\else\expandafter\vecabove\fi{B}_{o} } \right|} = 3,0{\text{T;T1}} = {\text{1330}}\;{\text{ms}} \) Die Berechnung des Ernst-Winkels αE erfolgte unter Verwendung der Gleichung 17

Die Maximierung der BOLD-Sensitivität der Pulssequenz erfolgt über die Optimierung der Echozeit TE. Bei Kenntnis der BOLD-induzierten Differenz in der Transversalrelaxationsrate ΔR2* wird die optimale TE durch das Maximum der nach Gleichung 13 berechneten Kurve ΔS=f(TE) bestimmt (Abb. 9). Die in der Literatur angegebenen empirischen Werte für ΔR2* differieren allerdings teilweise beträchtlich. Tabelle 1 beinhaltet eine vergleichende Darstellung der von Krüger et al. [13] und Bandettini [1] angegebenen Werte.

Abb. 9
figure 9

Zusammenhang zwischen gewählter Echozeit und MR-Signalstärke (durchgezogene und gestrichelte Kurven) sowie funktionellem Kontrast (Punktkurven, vergleichende Darstellung für 1,5 und 3 Tesla, normiert auf die jeweiligen Maximalwerte für 3 Tesla). Die weißen Pfeile kennzeichnen die Echozeit für den maximalen funktionellen Kontrast; die schwarzen Pfeile zeigen die T2*-Zeit für graue Substanz (aufwärts gerichtete Pfeile 1,5 Tesla, abwärts gerichtete Pfeile 3 Tesla). Es wird deutlich, dass die für den funktionellen Kontrast optimale Echozeit in unmittelbarer Nähe der T2*-Zeit liegt. Die Berechnungen erfolgten unter Nutzung der von Krüger et al. [13] angegebenen Werte für T1 (970 bzw. 1330 ms), T2* (65 bzw. 49 ms) und ΔR2* (−320 bzw. −800 ms-1). Für die Ausgangslongitudinalmagnetisierung M 0 (1,5 T) wurde ein Wert von 0,7 M 0 (3 T) angenommen

Tabelle 1 Vergleichende Darstellung der empirisch ermittelten T2*-Zeiten und ΔR2*-Werte für Feldstärken von 1,5 und 3 Tesla (T)

In Abb. 9 sind die echozeitabhängigen MR-Signale für Ruhe und Stimulation sowie die korrespondierenden BOLD-Empfindlichkeiten dargestellt. Die Berechnung erfolgte mit Hilfe der Gleichungen 13 bzw. 16 und unter Nutzung der von Krüger et al. angegebenen Werte. Wie aus der Abbildung ersichtlich, liegt die optimale Echozeit TE opt im Bereich der mittleren T2*-Relaxationszeit. Bei Unkenntnis der Relaxationsratendifferenz Δ R2* kann deshalb der Betrag von T2* als gute Näherung für TE opt angenommen werden:

$$ TE_{{opt}} \approx T2* $$
(18)

Die im vorangegangenen Abschnitt dargelegten theoretischen Überlegungen betreffen die physikalischen Zusammenhänge für ideale Versuchsbedingungen. Die Vernachlässigung der konkreten Versuchsbedingungen (exakte \( \ifmmode\expandafter\vec\else\expandafter\vecabove\fi{B}_{0} \), Feldstärke, Güte des Shimmings etc.) und die Unsicherheiten hinsichtlich der Quantifizierung der stimulationsabhängigen Veränderung der lokalen Suszeptibilitätseigenschaften (Tabelle 1) geben den hier dargestellten Zusammenhängen den Charakter von Richtgrößen. Eine empirische Überprüfung der theoriebasierten Optimierung ist deshalb anzuraten.

MR-Bildartefakte

Artefakte, also Störungen des MR-Signals, können physikalischen und/oder physiologischen Ursprungs sein. Einige Artefaktquellen sind bei der Durchführung des funktionellen Experiments beeinflussbar. Dadurch kann eine deutliche Reduktion der mit ihnen assoziierten Störungen erreicht werden. Im Folgenden werden 2 ausgewählte, für die fMRT relevante Artefakte diskutiert und Ansätze zu ihrer Vermeidung beschrieben.

Suszeptibilitätsartefakte

Die bei funktionellen Experimenten eingesetzten T2*-gewichteten schnellen Gradientenecho-Sequenzen (z. B. GE-EPI) haben eine dem Wesen des abzubildenden BOLD-Effekts entsprechende hohe Sensitivität gegenüber Magnetisierbarkeitsgradienten. Neben den von der vaskulären Antwort verursachten Suszeptibilitätseffekten gibt es auch anatomisch bedingte Magnetisierbarkeitssprünge, welche eine Verkürzung der T2*-Zeit und die signifikante Verringerung des messbaren MR-Signals zur Folge haben. Insbesondere bei hirnnahen Luft-Gewebe-Übergängen kommt es zu Störungen, die bis in den Kortex hineinreichen. Das vom Sinus frontalis und Sinus sphenoidalis verursachte Artefakt verschlechtert wesentlich das SNR für den ventralen Frontal- und medialen Temporalkortex. Die funktionelle Bildgebung olfaktorisch-sensorischer Areale und der Amygdala wird dadurch stark beeinträchtigt [17]. Ähnlich starke Störungen werden durch den Meatus acusticus im Bereich des ventralen Temporalkortex hervorgerufen (Abb. 10a). Die Ausdehnung der Störung ist direkt proportional der Hauptfeldstärke, d. h. für ein kleineres \({\left| {\vec{B}_{0} } \right|}\) ist auch die Ausdehnung des Artefakts geringer. Bei gegebenen \({\left| {\vec{B}_{0} } \right|}\) kann die Artefaktausprägung nur durch eine Verringerung jener Voxeldimension erreicht werden, die senkrecht zur verursachenden Grenzfläche verläuft [17]. Das ist durch eine Verringerung der Schichtdicke oder auch durch eine modifizierte Schnittführung möglich. Dadurch nimmt der Anteil der diesbezüglichen Partialvolumeneffekte ab. Gleichzeitig verringert sich jedoch durch das kleinere Voxelvolumen auch das SNR, und die zur Messung des gesamten Hirns benötigte Akquisitionszeit (TA) steigt aufgrund der größeren Schichtanzahl an. In der Praxis werden häufig Kombinationen aus beiden Alternativen angewendet. An der Academic Unit of Radiology der University of Sheffield führten wir diesbezügliche GE-EPI-Testmessungen mit unterschiedlich dicken Schichten durch. Welche Wirkung durch die Verringerung der Schichtdicke (bei unverändert obliquer Schnittführung) erzielt wird, ist in Abb. 10b dargestellt (Scanner 3,0 T Philips Intera, Matrix 128×128×20, Voxelgröße 2×2×3 mm/8 mm, TR 3000 ms, TE 45 ms, Kippwinkel 80°).

Abb. 10
figure 10

a Suszeptibilitätsartefakte treten in Bereichen mit großen Magnetisierbarkeitsgradienten auf. Insbesondere der Übergang zwischen Stirnhöhle und ventralem Frontalkortex und die Umgebung der Gehörgänge sind von diesem Artefakt betroffen (gestrichelter Kreisbogen). Die Signalgrenzen für 10% (dicke Linie) und 50% (dünne Linie) des Maximalsignals sind im Koronar- bzw. Sagittalschnitt markiert. b Entsprechend der in a durch die Pfeile gekennzeichneten Schnittführung wurden 2 unterschiedlich dicke GE-EPI-Schichten gemessen und die zugehörigen SNR-Karten entsprechend der Gleichung 9 berechnet. Mit abnehmender Schichtdicke sind eine Verringerung der Artefaktausdehnung, aber auch die allgemeine Verschlechterung des Signal-Rausch-Verhältnisses zu beobachten

Neben dem Voxelvolumen hat auch die Echozeit einen Einfluss auf die Ausprägung der Suszeptibilitätsartefakte. Da die T2*-Wichtung der GE-EPI-Bilder direkt proportional der Echozeit ist, wächst mit zunehmender TE auch die Suszeptibilitätsempfindlichkeit der Messung. GE-EPI-Bilder, bei deren Messung lange Echozeiten verwendet wurden, weisen deshalb ausgeprägtere Magnetisierbarkeitsartefakte auf. Kürzere Echozeiten führen zwar bei gleichzeitiger Verbesserung des SNR zu einer Verringerung der Artefakte, verschlechtern aber gleichzeitig die BOLD-Sensitivität der GE-Sequenz. Ein optimaler Kompromiss zwischen hinreichender Artefaktunterdrückung, gutem SNR und maximal erreichbarer BOLD-Empfindlichkeit ist oft nur durch empirische Voruntersuchungen erreichbar. Deshalb muss bereits bei der Optimierung der Bildgebungsparameter die effektive Unterdrückung von Suszeptibilitätsartefakten berücksichtigt werden. Basierend auf den Ergebnissen eigener Experimente empfehlen wir für eine TR von 2000 ms folgende Richtwerte:

  • I. \( {\left| {\vec{B}_{0} } \right|} = 1,5T,\;\alpha = 90^\circ ,\;TE = 40\;ms \),

  • II. \( {\left| {\vec{B}_{0} } \right|} = 3,0T,\;\alpha = 80^\circ ,\;TE = 35\;ms \).

Bewegungsartefakte

Die Bewegungen des Probanden sind eine der Hauptartefaktquellen in fMRT-Datensätzen. Grundsätzlich können die Bewegungsartefakte nach ihrer Korrelation mit dem experimentellen Paradigma klassifiziert werden:

paradigmenkorrelierte Bewegungen treten in unmittelbarer zeitlicher Nähe der Reizungen auf und verursachen Signaländerungen, welche oftmals nicht von BOLD-induzierten Signalmodulationen zu trennen sind. Eine nachträgliche Korrektur dieser Artefakte ist nicht möglich; ihrer Vermeidung kommt deshalb besondere Bedeutung zu.

Stochastische Bewegungen sind mit dem experimentellen Paradigma nur gering oder gar nicht korreliert. Die Korrektur dieser Artefakte erfordert einerseits die Eliminierung des räumlichen Versatzes zwischen den einzelnen funktionellen Volumen. Andererseits müssen die durch die Bewegung hervorgerufenen Signalschwankungen innerhalb der Volumen korrigiert werden. In einem 1. Korrekturschritt werden die sequenziell gemessenen funktionellen Volumina mit Hilfe eines Least-squares-Algorithmus aufeinander koregistriert (Bewegungskorrektur, „realignment“). Im 2. Schritt erfolgt die Filterung der Voxelzeitreihen mit dem Ziel, alle nicht paradigmenkorrelierten Signalfrequenzanteile zu eliminieren.

Trotz der hohen Effizienz der gebräuchlichen Korrekturverfahren verringern Bewegungen jeglicher Art die effektive Auflösung („effective resolution“, R eff ) der MR-Messung. In Gleichung 19 ist der analytische Zusammenhang zwischen physikalischer Auflösung des MR-Tomographen („physical resolution“, R phys ) und der Probandenbewegung dargestellt [25]:

$$ R_{{Eff}} = {\sqrt {R^{2}_{{phys}} + FWHM^{2}_{{Bewegung}} } } $$
(19)

7

Die Bewegung des Probanden wird dabei durch die Breite der normierten Dichtefunktion für die Bewegungsamplituden ausgedrückt („full width at half maximum“, FWHM Bewegung ). Gleichung 20 gestattet die Berechnung dieser Größe auf Basis der Standardabweichung:

$$ FWHM_{{Bewegung}} = SD_{{Bewegung}} \cdot {\sqrt {8 \cdot \ln (2)} } $$
(20)

Abbildung 11 zeigt eine graphische Darstellung dieses Zusammenhangs.

Abb. 11
figure 11

a Absolute Abweichung der Kopfposition über die Zeit der Datenakquisition bezogen auf das 1. Bild („displacement“). b Dazugehöriges Histogramm der absoluten Häufigkeiten für das Displacement. c Kumulative Wahrscheinlichkeitsdichtefunktion (Punktkurve) im Vergleich mit der kumulativen Normalverteilungsdichte (Punktlinie). Zusätzlich ist die Lage der Standardabweichung (Strichlinie) für das Displacement und die korrespondierende FWHM (Strichpunktlinie) dargestellt

Die Reduktion der effektiven Auflösung für verschiedene Scannerauflösungen R phys und Bewegungsamplituden FWHM Bewegung ist in Abb. 12 dargestellt. Die verringerte Auflösung ist insbesondere bei der Messung kleinvolumiger Hirnstrukturen kritisch. Einer wirksamen Vermeidung von Bewegungsartefakten sollte man deshalb vor und während des Experimentes größte Aufmerksamkeit widmen.

Abb. 12
figure 12

Effektive Auflösung in Abhängigkeit von physikalischer Scannerauflösung und Probandenbewegung (vgl. Gleichung 19)

Die Vermeidung von Bewegungsartefakten ist durch ein kooperatives Verhalten der Probanden (I–II), den Einsatz von mechanischen Hilfsmitteln zur Fixierung des Kopfes (III), oder MR-physikalische Korrekturalgorithmen (IV) möglich. Dazu existieren folgende Ansätze:

  1. I.

    Das bewusst ruhige Verhalten der Versuchspersonen hat extremen Einfluss auf den Umfang der Bewegung. Dazu sollten die Probanden vor dem Experiment explizit auf die Vermeidung von Kopfbewegungen hingewiesen werden.

  2. II.

    Die größten Bewegungen treten erfahrungsgemäß in den Pausen zwischen den experimentellen Durchgängen auf. Deshalb sollten diese Pausen kurz gehalten werden. Zu Beginn einer jeden Pause ist es ratsam, die Probanden nochmals hinsichtlich ihres Bewegungsverhaltens zu instruieren.

  3. III.

    Die mechanische Fixierung des Kopfes kann auf verschiedene Weise erfolgen, muss aber immer den Probandenkomfort garantieren, da es sonst sogar zu einer Vergrößerung der Bewegungsartefakte kommen kann. Die mechanische Fixierung kann realisiert werden durch

    1. a.

      ein Schaumgummipolster (Abb. 7a unten),

    2. b.

      ein Unterdruckkissen, welches mit Styroporkügelchen gefüllt ist und nach Anpassung an die Kopfform des Probanden mit einer Luftpumpe evakuiert wird,

    3. c.

      ein an der Kopfspule befestigtes Stirnband, welches dem Probanden eine somatosensorische Rückmeldung bzgl. der eigenen Kopfbewegung vermittelt,

    4. d.

      eine sog. „bite bar“, ein der Gebissform des Probanden angepasstes und an der Kopfspule befestigtes Mundstück, auf das die Versuchsperson im Verlauf der Messung zu beißen hat,

    5. e.

      ein thermoplastisches Gitter, welches der Kopfform der Versuchsperson zu Beginn der Messung angepasst wird,

    6. f.

      eine Fixierung des Probanden mit Hilfe von Klebeband [8].

  4. IV.

    MR-physikalisch scheint der effektivste Ansatz für die Onlinekorrektur der aktuellen Kopfverschiebung („displacement“) in der navigatorechogesteuerten Nachführung der Gradientenschaltung zu bestehen [23].

Insbesondere die MR-basierten Methoden zur akquisitionsbegleitenden Bewegungskorrektur haben das größte Potenzial für eine vollständige Artefakteliminierung. Einige MRT-Hersteller tragen dieser Tatsache bereits durch integrierte Routinen Rechnung. Deshalb ist zu erwarten, dass dieser Ansatz in den nächsten Jahren wesentlich an Bedeutung gewinnen wird.

Fazit für die Praxis

Im vorliegenden Artikel werden ausgewählte methodische Aspekte der Optimierung von fMRT-Experimenten diskutiert. Eine wesentliche Zielstellung bestand in der Vermittlung der physikalisch-methodischen Grundlagen. In diesem Kontext sind die angegebenen Optimierungsrichtwerte als eine beispielhafte Anwendung der dargestellten Basisformeln zu verstehen. Sie sind deshalb nicht bindend und haben keinen allgemeingültigen Charakter. Vielmehr sollte jeder Anwender eine seiner experimentellen Fragestellung und seinem experimentellen Design entsprechende Optimierungsstrategie verfolgen. In diesem Fall kann durch die dargestellten Ansätze eine Verbesserung der Sensitivität und Effizienz von fMRT-Experimenten erreicht und die Reliabilität der experimentellen Ergebnisse wesentlich gesteigert werden.