Hintergrund

Dieser Beitrag berührt klinisch-epidemiologische Aspekte des Themenhefts und verzichtet daher bewusst auf technische Details und klinische Erfahrungswerte, welche von Experten auf den entsprechenden Gebieten bereits umfassend dargelegt wurden.

Die intraoperative 3‑D-Bildgebung stellt ein innovatives Verfahren dar, mit dem par excellence die hierarchisch gegliederten Ebenen der diagnostischen Forschung und Nutzenbewertung dargestellt werden können. Diese umfassen grundsätzlich die

  • diagnostische Genauigkeit (mit anderen Worten: misst die Methode, was sie vorgibt zu testen?),

  • diagnostische Effektivität (beeinflusst das Testergebnis die ärztliche Entscheidungsfindung?),

  • diagnostische Effizienz (hat die durch das Testergebnis beeinflusste Entscheidungsänderung einen günstigen Effekt auf patientenzentrierte Outcomes wie Funktion und gesundheitsbezogene Lebensqualität oder im Idealfall sogar nationale oder internationale Ergebnisindikatoren?).

Die von Fryback und Thornbury [1] bereits 1991 vorgeschlagene Gliederung diagnostischer Effekte ist unverändert gültig und sollte von allen Partnern im Gesundheitswesen auch für die Bewertung des Nutzens der intraoperativen 3‑D-Bildgebung für die chirurgische Versorgung von Frakturen herangezogen werden.

Die ausreichende diagnostische Genauigkeit der 3‑D-Bildgebung im Vergleich zu einem Referenzstandard (z. B. Multidetektor[MD]-CT oder makroanatomisches Präparat) UND die Beeinflussung der ärztlichen Entscheidung sind hierbei die conditio sine qua non, also die notwendige Bedingung B für jede Form von Nutzen N (N → B, es kommt nicht vor, dass N erfüllt ist, ohne dass B erfüllt ist).

Es ist eingängig, dass nur ein Test, welcher sowohl genau als auch entscheidungsrelevant ist, überhaupt einen Nutzen für die Betroffenen, die Gesellschaft oder das Gesundheitssystem generieren kann.

Die möglichen Konsequenzen der 3‑D-Bildgebung (gegeben, dass sie auch nachweislich genau ist) liegen klinisch auf der Hand und umfassen die intraoperative Revision (z. B. Repositionierung von Schrauben oder anderem Osteosynthesematerial, die komplette Aufhebung und Neuorganisation des Osteosynthesekonstrukts oder der bewusste Verzicht auf eine derartige Maßnahme).

Nur ein genauer und entscheidungsrelevanter Test kann auch einen Nutzen für die Betroffenen nach sich ziehen

Der intraoperative 3‑D-Scan vermeidet potenziell Sekundäreingriffe, welche durch eine postoperative CT-Bildgebung aufgedeckte unzureichende Fraktur- bzw. Gelenkreposition und Materialfehllagen bedingt und mit einem erhöhten Risiko für Weichteilschäden, Wundinfektionen etc. assoziiert sind.

Es ist offensichtlich, dass sich diese Konsequenzen im Hinblick auf die untersuchten Körperregionen unterscheiden. Die intraoperative 3‑D-Bildgebung ist etabliert bzw. wurde systematisch untersucht in der Versorgung von Frakturen

  • des distalen Radius (und des Radiokarpalgelenks),

  • des Ellenhakens und des Radiusköpfchens (und aller beteiligten Gelenkstrukturen),

  • des Tibiaplateaus,

  • des Pilon tibiale,

  • des Kalkaneus (mit Einbeziehung der Gelenkflächen des unteren Sprunggelenks),

  • verschiedener Bewegungssegmente der Wirbelsäule.

Das Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) beurteilt den Wert einer diagnostischen Maßnahme vorrangig im Hinblick auf den Patienten-, gesellschaftlichen oder Systemnutzen. Deshalb soll im Folgenden auch auf den sog. „effectiveness gap“ eingegangen werden, d. h. die Diskrepanz zwischen Daten über technische Machbarkeit, Bildauflösung, Genauigkeit und chirurgische Konsequenzen einerseits und Outcome-relevante Indikatoren andererseits.

Methoden

Mithilfe einer selektiven Literaturrecherche in PubMed Medline, Ovid Medline und Embase sowie dem Cochrane CENTRAL Register of Controlled Trials wurden unabhängig von der Sprache Volltextpublikationen identifiziert, welche folgende Kriterien erfüllten:

systematische Reviews und/oder Metaanalysen von vergleichenden (d. h. randomisierten, quasirandomisierten oder Kohortenstudien), welche den Nutzen der intraoperativen 3‑D-Bildgebung (unabhängig von der spezifischen Hardware) im Vergleich zum „standard of care“, d. h. der konventionellen 2‑D-Bildgebung bzw. Fluoroskopie, analysierten.

Die Suchbegriffe umfassten (einschl. Trunkierungen mittels des „wildcard“-Symbols *):

  • (3D OR three-dimensional) AND fracture* AND (intra-op* OR peri-op*),

  • random* OR systematic review OR meta-analysis,

  • outcome* OR function* OR qual*,

und wurden im Schneeballsystem um „related articles“ sowie die Referenzlisten der Originalbeiträge ergänzt.

Es handelte sich hier um eine eingeladene („commissioned“) „best evidence synthesis“, nicht um ein formales „systematic review“. Daher wurde bewusst auf eine formale qualitative methodische Bewertung der zugrunde liegenden Studien verzichtet.

Nach unserer Kenntnis existiert bis auf das EF3X-Trial [2] bisher keine andere randomisierte Prüfung des Nutzens einer intraoperative 3‑D-Bildgebung gegenüber dem etablierten „standard of care“.

Das Protokoll sieht vor, dass alle Teilnehmer einen 3‑D-Scan durchlaufen, die Ergebnisse aber per Zufall nur der Hälfte der beteiligten Chirurginnen und Chirurgen mitgeteilt werden.

Nach eingehender Durchsicht des Prüfplans musste sich unsere Klinik gegen eine Teilnahme an dieser Studie entscheiden, da zwar alle Patientinnen und Patienten gegenüber einer erhöhten Strahlendosis durch den 3‑D-Scan exponiert werden, aber nur eine zufällig zugeteilte Hälfte der Gesamtstichprobe überhaupt von den Ergebnissen therapeutisch profitieren kann. Eine vorgeschlagene Modifikation der Randomisierungsarchitektur (im Sinne einer „einfachen“ Randomisierung zu einer 3‑D- oder 2‑D-Bildgebung) wurde von den Leitern der Prüfung abgelehnt.

Das Projekt startete im Oktober 2009; die letzte Aktualisierung der Website (http://ef3x-trial.net/?id=1&p=0&lng=EN) stammt von September 2011. Zu diesem Zeitpunkt waren 208/750 angestrebten Studienteilnehmern eingeschlossen. Der aktuelle Stand ist unklar. Dies verdeutlicht die Schwierigkeiten, die sich im Zuge eines derart ambitionierten multizentrischen klinischen Experiments ergeben können.

In dieser Übersicht wurden absolute Zahlen, prozentuale Häufigkeiten, Mittelwerte mit Standardabweichungen (SD) und Mediane mit Spannen bzw. Interquartilsspannen (IQR) berichtet. Auf der Basis berichteter Informationen bzw. deren Ableitung wurden Indikatoren wie absolute Risiken, Risikodifferenzen, relative Risiken etc. mit 95 %-Konfidenzintervallen (KI) berechnet. Eine Datenaggregation erfolgte mithilfe der in STATA 11.0 implementierten Metaanalyseverfahren mit zufälligen („random effects“) und gemischten Effekten sowie Metaregression.

Diagnostische Genauigkeit der intraoperativen 3‑D-Bildgebung

Welche wissenschaftlichen Schritte innerhalb der Hierarchie der Nutzenbewertung der 3‑D-Bildgebung weithin als durchlaufen angesehen werden, illustriert Abb. 1. Sowohl die hohe Auflösung der Technologie (unabhängig von der verwendeten Hardware und der betroffenen anatomischen Region bzw. dem Gelenk) als auch deren diagnostische Genauigkeit (im Vergleich zu Referenzstandards wie der Multidetektorcomputertomographie [MDCT] oder anatomischen Präparaten) gelten als gesichert [312].

Abb. 1
figure 1

Verschiedene Ebenen der Gesundheitstechnologiebewertung diagnostischer Tests mit spezieller Bedeutung für die intraoperative 3‑D-Bildgebung. (In Anlehnung an Fryback und Thornbury [1]; *adaptiert nach Beerekamp et al. [13])

Die derzeit beste verfügbare Evidenz über die erste und zweite Ebene der diagnostischen Nutzenbewertung liefert die systematische Übersichtsarbeit der EF3X-Arbeitsgruppe [13].

Tatsächlich beruhen die verfügbaren Genauigkeitsdaten aber vorwiegend auf Experimenten mit humanen Leichenpräparaten. Die in die oben genannte Übersichtsarbeit eingeschlossenen Originalarbeiten [4, 8, 12, 1419] beinhalten:

  • anatomisch unterschiedliche Regionen (u. a. distaler Radius, Talushals und talonavikularer Gelenkspalt, Kalkaneus und unteres Sprunggelenk etc.),

  • variable oder nicht spezifizierte Beobachtungseinheiten (d. h. Präparat, Gelenkabschnitte, Anzahl von Schrauben, Anzahl von Beobachtern etc.),

  • qualitativ und quantitativ uneinheitliche Messgrößen (u. a. Stufen, Spalten, intraartikuläre Schraubenlagen etc.) und

  • verschiedene Referenzstandards (z. B. CT, anatomisches Präparat).

Zudem lassen sich aus den Originalbeiträgen die berichteten Genauigkeitsparameter wie Sensitivität und Spezifität nicht einheitlich nachvollziehen. So wechseln z. B. die Beobachtungseinheiten zwischen Präparat, untersuchter Region (Gelenkflächenabschnitt), Anzahl der durchgeführten Experimente oder Beobachter. Die verfügbaren Daten aus präklinischen Arbeiten können aufgrund ihrer starken inhaltlichen und statistischen Heterogenität nicht aggregiert werden. Gleichzeitig existiert bisher keine belastbare Evidenz aus klinischen Stichproben über die diagnostische Genauigkeit der intraoperativen 3‑D-Bildgebung gegenüber einem akzeptieren Referenzstandard wie z. B. der postoperativen MDCT. Hierfür müssten alle Patienten, bei welchen eine intraoperative 3‑D-Bildgebung angewendet wird, unabhängig von deren Ergebnis sich auch einer postoperativen MDCT unterziehen.

Intraoperativer Scan vs. postoperative MDCT

Erst dieses Design könnte Aufschlüsse über die Genauigkeit des intraoperativen Scans liefern. Da jedoch argumentiert wird, dass der intraoperative Scan eine postoperative MDCT vermeidet, ergibt sich ein erhebliches methodisches und auch argumentatives Problem.

Entgegen langläufiger Annahme wurde die diagnostische Genauigkeit der intraoperativen 3‑D-Bildgebung im Vergleich zur postoperativen MDCT-Kontrolle (dem akzeptierten Referenzstandard) also bisher nicht ausreichend verifiziert.

Die diagnostische Genauigkeit des intra-operativen 3-D-Scans wurde bisher nicht verifiziert

Eine Besonderheit ergibt sich aus der möglichen direkten therapeutischen Konsequenz des intraoperativen 3‑D-Scans. In einem perfekten Szenario müsste der intraoperative 3‑D-Scan sowohl vor als auch nach einer aus dem Ergebnis abgeleiteten Intervention (im Sinne einer Repositionierung von Schrauben etc.) mit der MDCT verglichen werden. Dies ist aus ethischen, strahlenhygienischen und logistischen Gründen unmöglich.

Die derzeitige Situation ist somit folgende:

  • Auf der Basis sehr heterogener präklinischer Experimente wurde der intraoperativen 3‑D-Bildgebung möglicherweise voreilig oder fälschlich eine hohe diagnostische Genauigkeit bei der Erkennung unzureichender Repositionen, Gelenkstufen und Materialfehllagen attestiert, ohne dass diese durch klinische Daten bestätigt wurde.

  • Dies führte dazu, dass die Ergebnisse der intraoperativen 3‑D-Bildgebung als ausreichend akkurat akzeptiert wurden, um chirurgische Entscheidungen zu beeinflussen.

  • Eine Verifizierung der intraoperativen 3‑D-Scans durch die MDCT (außerhalb des OP und in fortgesetzter Narkose) ist theoretisch denkbar, praktisch aber kaum zu realisieren.

In einem multizentrischen bzw. nationalen Bemühen sollte versucht werden, die Ergebnisse der intraoperativen 3‑D-Bildgebung gegenüber einem diagnostischen Referenzstandard wie der MDCT in einer konsekutiven Stichprobe mit einheitlichen Zielgrößen (z. B. „Stufenbildung >1 mm“, „jede Form der intraartikulären Schraubenlage“) zumindest nach bereits erfolgter intraoperativer Revision zu validieren.

Partieller Bestätigungsbias

Vermieden werden muss der systematische Fehler des sog. partiellen Bestätigungsbias. Dieser entsteht, wenn nur positive (bzw. pathologische) Befunde des experimentellen Tests durch einen Referenzstandard bestätigt werden, negative (bzw. Norm-)Befunde hingegen nicht.

Im konkreten Fall würde eine im 3‑D-Scan erkannte intraartikuläre Schraubenlage durch die CT bestätigt werden (oder intraoperativ korrigiert). Zeigt der 3‑D-Scan eine korrekte Schraubenlage, wird diese nicht verifiziert, es wird davon ausgegangen, dass es sich um einen richtig-negativen Befund handelt. Falsch-negative Befunde können so jedoch nicht detektiert werden. Dies führt zu einer artifiziellen Überschätzung der Sensitivität der Methode (Abb. 2).

Abb. 2
figure 2

Propädeutik: Herleitung der wichtigsten diagnostischen Genauigkeitsindikatoren aus einer Kreuztabelle. Die Krankheitshäufigkeit oder Vortestwahrscheinlichkeit (Prävalenz) ergibt sich als (RP + FN)/(RP + FN + FP + RN). PPV positiver prädiktiver Wert („positive predictive value“), NPV negativer prädiktiver Wert („negative predictive value“)

Therapeutische Konsequenzen der intraoperativen 3‑D-Bildgebung

In 6 Studien mit Einschluss von 526 Patienten wurden intraoperative Fragmentrepositionen und Neupositionierungen von Implantaten aufgrund der 3‑D-Bildgebung in 11–40 % aller Fälle berichtet [13]. In dieser Analyse dominierte die von Kendoff et al. [12] berichtete Serie von 248 Patienten, die an unterschiedlichen Körperregionen mithilfe der 3‑D-Bildgebung operiert wurden. Es erfolgten 46 intraoperative Revisionen (19 %, 95 %-KI 14–24 %), zumeist aufgrund unzureichender Reposition von Gelenkstufen oder intraartikulär gelegenen Osteosynthesematerials. Interessanterweise war bei der Osteosynthese von Kalkaneusfrakturen der stärkste Einfluss auf chirurgische Interventionen zu beobachten (9/39 Revisionen, 23 %, 95 %-KI 11–39 %).

Revisionsraten

Aus der metaanalytischen Datenzusammenführung lässt sich folgern, dass die 3‑D-Bildgebung in jedem 4. Fall zu einer intraoperativen Revision führen könnte (Abb. 3).

Abb. 3
figure 3

Intraoperative Revisionsraten. Ergebnisse der systematischen Übersichtsarbeit von Beerekamp et al. [13]. Die berichteten Daten wurden mithilfe des metaprop-Moduls in STATA 11.0 aggregiert. 95 %-KI 95 %-Konfidenzintervall. (Adaptiert nach [13])

Die Ergebnisse konnten später reproduziert werden. Von Recum et al. [20] schlüsselten die therapeutischen Konsequenzen von 1841 mit Hilfe der 3‑D-Bildgebung durchgeführten Eingriffe am Bewegungsapparat ebenfalls in Abhängigkeit von der anatomischen Region auf. Bemerkenswert ist die im Vergleich zur oben genannten Übersicht identische Frequenz intraoperativer Revisionen, welche durch Osteosynthesen des Fersenbeins dominiert wurden (Abb. 4).

Abb. 4
figure 4

Intraoperative Revisionsraten. Re-Analyse unter Verwendung der metaprop-Prozedur in STATA 11.0. 95 %-KI 95 %-Konfidenzintervall, OSG oberes Sprunggelenk. (Adaptiert nach von Recum et al. [20])

Der Einfluss der 3‑D-Bildgebung auf die Positionierung von Pedikelschrauben in der Wirbelsäulenchirurgie ist schwer zu quantifizieren. Erneut spielt die Wahl der Beobachtungseinheit (d. h. individuelle Schraube, Bewegungssegment, Patient) eine entscheidende Rolle. Im Falle einer multisegmentalen Instrumentierung könnte nur eine von 12 Schrauben (1/12 ~ 8 %) fehlplatziert sein, der Betroffene aber hieraus eine neurologische Komplikation davontragen.

Zudem werden in der aktuellen wissenschaftlichen Literatur 3‑D-Scan und Navigation sinnvoll gekoppelt – eine Aussage über den individuellen Beitrag der Bildgebung zum Gesamtnutzen wird damit erschwert.

In der von Mason et al. [21] veröffentlichten Übersicht von 30 Studien erzielten die konventionelle intraoperative Bildgebung, die 2‑D- und 3‑D-Navigation exakte intrapedikuläre Schraubenpositionen bei 2532/3719 (68 %, 95 %-KI 67–70 %), 1031/1223 (84 %, 95 %-KI 82–86 %) und 4170/4368 (95 %, 95 %-KI 95–96 %) aller Eingriffe. Es erfolgte jedoch keine Aufschlüsselung hinsichtlich der betroffenen Bewegungssegmente, der Dringlichkeit des Eingriffs und anderer elementarer Einflussgrößen.

Gesundheitsbezogene Folgen der intraoperativen 3‑D-Bildgebung

Derzeit existieren keine systematischen Untersuchungen über den möglichen günstigen Effekt der intraoperativen 3‑D-Bildgebung auf Funktion oder gesundheitsbezogene Lebensqualität.

Beim internationalen Forum der Orthopaedic Trauma Association (OTA) hatten wir 2013 die Ergebnisse einer Kohortenstudie mit eingebetteter Matched-pair-Analyse über den möglichen Benefit der 3‑D- gegenüber der etablierten 2‑D-Bildgebung bei operativer Versorgung von Fersenbeinfrakturen präsentiert.

Diese basierten auf einer Serie von 176 zwischen 12/2000 und 01/2007 operativ therapierten Patienten mit intraartikulären Fersenbeinfrakturen. Von diesen lagen über 86 Probanden vollständige Informationen im Sinne präoperativer CT-Scans für die Sanders-Klassifikation, intraoperativer 3‑D-Scans als auch klinisch-funktioneller Nachuntersuchungen (u. a. American Orthopaedic Foot and Ankle Society [AOFAS], Lebensqualitätserhebungsbogen „short form 12“ [SF12]) vor.

Aus dieser Stichprobe wurden wiederum 2‑mal 29 Teilnehmer mit vergleichbaren Basischarakteristika im Sinne einer Matched-pair-Analyse extrahiert (Tab. 1). Aufgrund der überschaubaren Kohorte wurde das konservative Paarungsregime gegenüber aufwendigeren Verfahren wie einem propensity score matching bevorzugt.

Tab. 1 Basisprofil der Matched-pair-Kohorte zum Vergleich funktioneller und gesundheitsbezogener Outcomes nach operativer Versorgung intraartikulärer Fersenbeinfrakturen mit und ohne 3‑D-Assistenz

Wir konnten keinen Vorteil der 3‑D- gegenüber der konventionellen 2‑D-Bildgebung in den relevanten American-Academy-of-Orthopaedic-Surgeons (AAOS)- bzw. SF12-Dimensionen beobachten (Abb. 5).

Abb. 5
figure 5

Funktionelle Endpunktparameter in Abhängigkeit von Intervention und Kontrolle nach einem medianen Nachbeobachtungsintervall von 50 (IQR 24–62) Monaten. IQR Interquartilsspanne, AAOS-FAM American Academy of Orthopedic Surgeons Lower Limb Outcomes Assessment: Foot and Ankle Module, SF12-PCS Lebensqualitätserhebungsbogen „short form 12“ Physical Component Summary, -MCS Mental Component Summary

Fazit für die Praxis

  • Derzeit existieren keine robusten klinischen Daten über die Sensitivität oder Spezifität der Methode.

  • Genauigkeitsschätzungen beruhen auf heterogenen präklinischen Versuchen. Insbesondere negative bzw. Normergebnisse (im Sinne einer akkuraten Schraubenlage, akzeptablen Frakturreposition, Wiederherstellung der Gelenkfläche etc.) dürfen nicht als bewiesen hingenommen werden.

  • Jeder vierte pathologische 3‑D-Scan könnte zu einer intraoperativen Revision führen.

  • Im nationalen Rahmen sollten unter klinischen Bedingungen daher sowohl die diagnostische Genauigkeit des 3‑D-Scans als auch dessen versorgungsrelevante Konsequenzen ermittelt werden. Erst wenn diese Daten vorliegen, lassen sich mögliche Systemimplikationen erörtern.