Es gibt keine international akzeptierte Definition der Langzeitopioidtherapie [“long-term opioid therapy“ (LTOT)]. Die chronische Opioidtherapie wurde definiert als tägliche oder beinah tägliche Verwendung von Opioiden über mindestens 90 Tage, oft auch auf unbestimmte Zeit [27]. Eine systematische Übersichtsarbeit zur Opioidtherapie bei chronischem Kreuzschmerz unterschied kurz- (4–12 Wochen), mittel- (13–26 Wochen) und langfristige Studien (> 26 Wochen; [2]).

Aufgrund fehlender wissenschaftlicher Daten ist die evidenzbasierte LTOT bei chronischem nicht-tumorbedingtem Schmerz (CNTS; „chronic noncancer pain“) mit Unsicherheiten behaftet [4]. Die wichtigste Unwegbarkeit ist die langfristige Wirksamkeit und Sicherheit von Opioiden im Vergleich zu anderen pharmakologischen und nichtpharmakologischen Behandlungsoptionen [13]. Weitere Fragestellungen mit Relevanz für die klinische Praxis, wie die Wahl eines bestimmten Opioids oder Applikationswegs (oral oder transdermal), wurden bislang kaum in systematischen Übersichtsarbeiten adressiert.

Das Oregon Evidence-based Practice Center durchsuchte die Literatur bis zum Jahr 2007 und führte einen qualitativen Review zu Vergleichen der Wirksamkeit und Verträglichkeit von Opioiden bei CNTS durch [3]. Eine quantitative Zusammenführung der Ergebnisse erfolgte dabei nicht. Im August 2010 kam dann Tapentadol, der erste Vertreter der μ-Opioid-Rezeptor-Agonisten/Noradrenalin-Wiederaufnahmehemmer (MOR-NRI), auf den Markt. Gepoolte Analysen der randomisierten, kontrollierten Studien (RCT) zeigten, dass Tapentadol gegenüber Oxycodon das Risiko typischer opioidbedingter unerwünschter Wirkungen signifikant verringerte, während die analgetische Wirkung gleichwertig war [15]. Die Autoren analysierten allerdings nicht die Rate an „drop-outs“ aufgrund von unerwünschten Ereignissen als einen globalen Ergebnisparameter der Verträglichkeit und ebensowenig schwere unerwünschte Ereignisse als Sicherheitsparameter.

In Deutschland ist die Zahl der Verschreibungen von oralen und transdermalen Opioiden über die vergangenen 5 Jahre gestiegen [11, 26], wobei am häufigsten transdermales Fentanyl gewählt wurde [26]. In einem systematischen Review zum Einsatz oraler und transdermaler Opioide bei Knie- oder Hüftgelenksarthrose wurden die wissenschaftlichen Publikationen bis Juli 2008 gesichtet. Für eine Beziehung zwischen Wirksamkeit und Applikationsweg fand sich nur eine geringe Evidenz [20].

Angesichts der offenen Fragen zur LTOT bei Patienten mit CNTS sollten in der vorliegenden Arbeit bei ebendiesen Patienten die Wirksamkeit, Verträglichkeit und Sicherheit verschiedener Opioidtypen (selektive Opioidrezeptoragonisten und Opioidrezeptoragonisten mit zusätzlichem Wirkmechanismus) und ihrer Applikationswege (oral, transdermal) verglichen werden. Das Review wurde im Rahmen der Aktualisierung der Deutschen Leitlinie zur Langzeitanwendung von Opioiden bei CNTS (LONTS; [22]) von 2008 erstellt.

Methoden

Das Review wurde gemäß dem Preferred-Reporting-Items-for-Systematic-Reviews-and-Meta-Analyses(PRISMA)-Statement [18] und nach den Empfehlungen der Cochrane Collaboration [10] durchgeführt.

Ein- und Ausschlusskriterien

Studientypen

Wir schlossen vollständig publizierte randomisierte, kontrollierte Studien (RCT) ein. Berücksichtigt wurden Studien mit Paralleldesign. Cross-over-Studien wurden eingeschlossen, wenn

  • Daten zu den beiden Phasen separat aufgeführt waren,

  • Daten publiziert wurden, die einen statistisch signifikanten Überhangeffekt („carry-over effect“) ausschlossen oder

  • im Falle eines signifikanten Überhangeffekts entsprechende statistische Adjustierungen vorgenommen wurden.

Alle Studien sollten eine Mindestdauer von 4 Wochen (Aufdosierung und Erhaltung) haben. Pro Behandlungsarm sollten sie mindestens 10 Patienten einschließen. Hinsichtlich der Publikationssprache bestanden keine Einschränkungen.

Ausgeschlossen wurden Studien mit einer Aufdosierungs-/Erhaltungs- oder Absetzphase von < 4 Wochen; Studien mit Paralleldesign nach einer offenen Vorbereitungsphase, die nur Responder in die doppelblinde Phase aufnahmen („enriched enrollment randomized withdrawal design“); Studien mit experimentellem Design (Grundlagenforschung als Hauptzweck der Studie) und Studien, die lediglich als Abstract veröffentlicht waren.

Teilnehmer

Berücksichtigt wurden Patienten jeden Alters mit Schmerzen, die eine beliebige nicht-tumorbedingte Ursache hatten und vor Studieneinschluss mindestens 3 Monate bestanden hatten. Eingeschlossen wurden neuropathische Schmerzen, Arthrose, rheumatoide Arthritis, Fibromyalgie, Rückenschmerzen, muskuloskeletale Schmerzen, chronische viszerale Schmerzen (chronische Pankreatitis) und chronische ischämische Schmerzen bei Gefäßerkrankungen.

Ausgeschlossen wurden Studien, die auch Patienten mit Tumorschmerzen beinhalteten und die die Ergebnisse zu CNTS nicht gesondert aufführten. Ausgeschlossen waren auch Studien zum Einsatz von Opioiden bei Durchbruch-CNTS.

Interventionsformen

Wir berücksichtigten Studien, in denen ein beliebiges oral oder transdermal appliziertes Opioid mit einem anderen Opioid in therapeutischer Anwendung verglichen wurde.

Eingeschlossen wurden Studien mit Tramadol, einem zentral wirkenden, synthetischen Opioidanalgetikum, das über zwei komplementäre Wirkmechanismen verfügt, zum einen die Bindung der Ausgangssubstanz und des M1-Metaboliten an μ-Opioid-Rezeptoren, zum anderen eine Hemmung der Noradrenalin- und Serotoninwiederaufnahme. Ebenfalls eingeschlossen wurden Studien mit Tapentadol. Auch diese Substanz hat als μ-Rezeptor-Agonist und Noradrenalinwiederaufnahmehemmer zwei Wirkmechanismen. Beide Substanzen fließen in diese Übersichtsarbeit ein, da die deutschen Arzneimittelbehörden sie als Opioide klassifizieren.

Ausgeschlossen wurden Studien, in denen Opioide mit Nicht-Opioidagonisten kombiniert wurden (beispielsweise Tramadol mit Paracetamol), da eine Unterscheidung der Opioidwirkung von den Effekten des anderen Analgetikums nicht möglich ist.

Gleiches gilt für Studien mit Propoxyphen, da die Substanz vom Markt genommen wurde (US Food and Drug Administration, Pressemitteilung vom 19.11.2010).

Typen von Studienendpunkten

Die Auswahl der Endpunkte basierte auf den Empfehlungen der ACTINPAIN Writing Group der International Association for the Study of Pain (IASP) Special Interest Group (SIG) on Systematic Reviews in Pain Relief, zudem auf den Empfehlungen der Cochrane Pain, Palliative and Supportive Care Systematic Review Group zur Publikation der Metaanalysen von RCT bei chronischem Schmerz [19]. Die Schmerzintensität wurde als zusätzlicher Ergebnisparameter berücksichtigt, da die meisten vor 2005 durchgeführten Studien keine Responder-Analysen beinhalteten.

Endpunkte

Wirksamkeit

  1. 1.

    Schmerzintensität

  2. 2.

    Anteil der Patienten, die eine 50%ige Schmerzmilderung angaben (Responder)

  3. 3.

    Allgemeine Besserung (Zahl der Patienten, die eine starke oder sehr starke Besserung angaben)

  4. 4.

    Funktionsfähigkeit: Beispiele für funktionelle Endpunkte, die mit folgenden Instrumenten extrahiert werden konnten: Brief Pain Inventory; Fibromyalgia Impact Questionnaire (FIQ; körperliche Funktionsfähigkeit); Multidimensional Pain Inventory (MPI, körperliche Funktionsfähigkeit); Western Ontario and McMaster Universities Arthritis Index (WOMAC); Neck Disability Index; Oswestry Disability Index (ODI); Pain Disability Index (PDI; körperliche Beeinträchtigung); Roland Disability Questionnaire (RDQ) und Short Form 36 (SF-36) oder SF-12 (Skala der körperlichen Funktionsfähigkeit). Wurden sowohl krankheitsspezifische als auch -unspezifische Instrumente eingesetzt, bevorzugten wir erstere Form, beispielsweise den FIQ gegenüber dem PDI oder WOMAC gegenüber der SF-36-Skala der körperlichen Funktionsfähigkeit.

Verträglichkeit

  1. 1.

    Anteil der Patienten, die die Studie wegen unerwünschter Ereignisse abbrachen

Sicherheit

  1. 1.

    Anteil der Patienten mit schwerem unerwünschtem Ereignis

  2. 2.

    Anteil der Patienten, die im Verlauf der Studie verstarben

Ausgeschlossen wurden Studien, deren primärer Endpunkt keiner der drei oben definierten Wirksamkeitsendpunkte war, wie sie in den ersten vier Punkten der Aufzählung definiert sind.

Verfahren zur Identifizierung von Studien

Suche in elektronischen Datenbanken und anderen Quellen

Die Literaturrecherche der ersten deutschen LONTS-Leitlinien-Version, die Publikationen bis Oktober 2008 abdeckt [22], wurde aktualisiert und ausgeweitet. Die aktualisierte und erweiterte Suche schloss das Cochrane Central Register of Controlled Trials (CENTRAL), MEDLINE und Scopus von Oktober 2008 bis Oktober 2013 ebenso ein wie Übersichtsartikel zur LTOT bei CNTS (Details in [25]). Sämtliche Sprachen wurden berücksichtigt.

Datensammlung und -analyse

Studienauswahl

Zwei Autoren (PW, WH) prüften unabhängig anhand der Titel, Zusammenfassungen und Schlüsselwörter, ob die mit der Suchstrategie gefundenen Studien die Einschlusskriterien erfüllten. Soweit die Studien im Einklang mit den Kriterien zu stehen schienen oder ihr Einschluss unsicher war, wurde der Volltext herangezogen. Die Volltextbeiträge wurden auf ihre Übereinstimmung mit den Einschlusskriterien hin gesichtet. Waren die Autoren unterschiedlicher Meinung, wurde im Gespräch eine Einigung herbeigeführt.

Datenextraktion und -management

Anhand standardisierter Formblätter extrahierten zwei Autoren (RL, WH) unabhängig Daten zu Einschluss- und Ausschlusskriterien der Studien, Teilnehmermerkmalen, Interventionsgruppen, klinischen Settings, Interventionen, zum Studienland und zur Studienfinanzierung. Waren die Daten nicht in einer für die Datenextraktion geeigneten Form verfügbar, verzichteten wir auf eine Anfrage bei den Studienautoren zur Lösung des Problems. Die Äquivalenz der durchschnittlichen Gesamtdosen (umgerechnet in die Tagesgesamtdosis an Morphinäquivalenten) wurde von zwei Autoren (LR, WH) unabhängig mithilfe eines Opioidrechners geprüft [28]. Unterschiede in der Tagesgesamtdosis an Morphinäquivalenten von ≤ 25 % waren erlaubt. Waren die Autoren unterschiedlicher Meinung, wurde im Gespräch eine Einigung herbeigeführt.

Umgang mit fehlenden Daten

Fehlten Angaben zu Mittelwerten oder Standardabweichungen (SD), berechneten wir sie aus den t-Werten, Konfidenzintervallen (KI) oder Standardfehlern, soweit diese im Beitrag angegeben waren [10]. Ließen sich fehlende SD nicht aus berichteten Werten ermitteln, wurde die Studie von der Analyse ausgeschlossen.

Maße des Therapieeffekts

Als Effektmaße wurden die absolute Risikoreduktion (RD) für dichotome Daten und die standardisierte mittlere Differenz (SMD) für kontinuierliche Daten verwendet. Die Unsicherheit wurde in 95 %-Konfidenzintervallen (95 %-KI) angegeben.

Aspekt der Analyseeinheit

Im Falle von mehreren Dosierungsarmen in einer oder beiden Gruppen wurde die Zahl der Teilnehmer angepasst.

Datenauswertung

Mithilfe eines Random-effects- und inversen Varianzverfahrens wurden Daten aus Studien gepoolt, in denen das Opioid des Sponsors der Studie (Hersteller der getesteten Substanz) mit Standardopioiden verglichen wurde. Zur Beschreibung der prozentualen Variabilität von Effektschätzern, die durch Heterogenität bedingt ist, wurde der I2-Test angewendet. I2-Werte > 50 % zeigen eine hohe, Werte von 25–50 % eine mäßige und Werte < 25 % eine niedrige Heterogenität an [10].

Das Risiko eines systematischen Fehlers (Bias) wurde für jede Studie von zwei Autoren (RL, WH) unabhängig geprüft. Hierzu wurden 8 von der Cochrane Collaboration empfohlene Bereiche herangezogen: systematischer Selektionsfehler (Randomisierung, Geheimhaltung der Behandlungszuordnung, Gleichheit der Gruppen bei der Ausgangsmessung der Studie), systematischer Durchführungsfehler, systematischer Erkennungsfehler, systematischer Fehler aufgrund von Verlust von Teilnehmern, systematischer Berichtsfehler, systematischer Fehler durch Studienfinanzierung [25]. Für jedes Kriterium wurde das Risiko als niedrig, hoch oder unsicher eingestuft. Als qualitativ hochwertig wurden Studien definiert, die 6 der 8 Validitätskriterien erfüllten; Studien von mäßiger Qualität erfüllten 3–5, Studien von niedriger Qualität 0–2 Kriterien. Die Methode des Grading of Recommendations Assessment, Development and Evaluation (GRADE) wurde zur Bewertung der Gesamtqualität der Evidenz gewählt [8], definiert als Maß des Vertrauens in die Schätzungen des Behandlungsnutzens und der unerwünschten Wirkungen. Die Qualität wurde für jeden der 7 Endpunkte getrennt bewertet. Im Folgenden sind Faktoren aufgeführt, bei deren Vorliegen die Evidenzqualität um jeweils eine Stufe herabgesetzt wurde:

  • Einschränkungen des Studiendesigns: > 50 % der Teilnehmer waren aus Studien mit niedriger Qualität.

  • Unstimmigkeit der Ergebnisse: I2 > 50 %.

  • „Indirectness“: Wir prüften, ob die Fragestellung im systematischen Review von der verfügbaren Evidenz abwich und, in Bezug auf die Patientenpopulation im klinischen Alltag, ob bei ≥ 50 % der Teilnehmer der eingeschlossenen Studien gegeben war, dass Patienten mit klinisch relevanter körperlicher Erkrankung und/oder schwererer psychischer Erkrankung (Substanzmissbrauch oder „major depression“ in der Anamnese) ausgeschlossen wurden.

  • Ungenauigkeit: Vorliegen von nur einer Studie oder Gesamtzahl der Patienten < 400 bei Vorliegen von mehr als einer Studie.

Die Evidenzqualität wurde folgendermaßen eingestuft:

  • Hohe Qualität (++++): Wir sind sehr sicher, dass der wahre Behandlungseffekt nahe unserer Schätzung des Behandlungseffekts liegt.

  • Moderate Qualität (+++): Wir sind mäßig sicher bezüglich des Behandlungseffekts: Der wahre Behandlungseffekt liegt wahrscheinlich nahe unserer Schätzung des Behandlungseffekts. Es besteht aber die Möglichkeit, dass ein erheblicher Unterschied besteht.

  • Niedrige Qualität (++): Unser Vertrauen in unsere Schätzung des Behandlungseffekts ist beschränkt. Der wahre Behandlungseffekt kann sich erheblich von unserer Schätzung unterscheiden.

  • Sehr niedrige Qualität (+): Wir haben sehr geringes Vertrauen in unsere Schätzung des Behandlungseffekts. Der wahre Behandlungseffekt unterscheidet sich wahrscheinlich erheblich von unserer Schätzung.

Einschätzung des Publikationsbias

Waren ≥ 10 Studien verfügbar, führten wir den Egger-Intercept- [6] und den Begg-Rangkorrelationstest [1] mit einem Signifikanzniveau von p < 0,05 durch. Mithilfe des Begg-Tests wird die Rangkorrelation zwischen dem standardisierten Therapieeffekt und dessen Standardfehler überprüft. Ein asymmetrischer Funnel-Plot würde zu einer solchen Korrelation führen und kann auf einen Publikationsbias hinweisen [1]. Im Egger-Test wird eine Regression der Standardnormalvariable auf die Genauigkeit durchgeführt, definiert als der Kehrwert des Standardfehlers. Der Achsenabschnitt in dieser Regression entspricht der Steigung in einer gewichteten Regression des Effekts der Größe auf den Standardfehler [6].

Subgruppenanalyse

A priori wurde entschieden, eine Subgruppenanalyse der Schwankungen in der Effektgröße (Heterogenität) durchzuführen: selektive Opioidrezeptoragonisten vs. Opioidrezeptoragonisten mit zusätzlichem Wirkmechanismus; Opioidapplikationsweg (oral vs. transdermal) bei allen Formen von CNTS gepoolt. Folgende Subgruppenanalysen wurden post hoc beschlossen: verschiedene Opioide bei allen Formen von CNTS gepoolt und Art des chronischen Schmerzsyndroms (z. B. Arthrose, chronischer Rückenschmerz). Voraussetzung war, dass mindestens 2 Studien für diese Analyse vorlagen.

Sensitivitätsanalyse

Sensitivitätsanalysen erfolgten für 2 primäre Endpunkte (Schmerz, Behinderung) unter Ausschluss von Studien mit substituierten Mittelwerten und/oder SD, die aus Abbildungen gezogen wurden, sowie unter Auschluss von Studien mit offenem Design.

Software

Für die quantitative Analyse der Ergebnisse verwendeten wir Comprehensive Meta-Analysis (Biostat, Englewood, NJ, USA) und RevMan 5.2 [23].

Ergebnisse

Literatursuche

Nach Ausschluss von Duplikaten ergab die Literatursuche 12.601 Publikationen. Die Sichtung der Titel und Abstracts führte zum Ausschluss von 12.586 Arbeiten. Fünfzehn Volltextartikel wurden auf ihre Eignung geprüft. Eine Studie mit Buprenorphin schlossen wir aus, da die Ergebnisse der Vergleichssubstanz Oxycodon nicht angegeben waren (Infobox 1). Ebenso wurde mit einer Studie verfahren, die Fentanyl- und Buprenorphin-Pflaster verglich, deren Ergebnisse aber nicht unsere Einschlusskriterien erfüllten (Infobox 1). Letztlich wurden 13 Studien in die Metaanalyse einbezogen (Abb. 1).

Abb. 1
figure 1

Preferred-Reporting-Items-for-Systematic-Reviews-and-Meta-Analyses(PRISMA)-Flussdiagramm

Eigenschaften der eingeschlossenen Studien

In Tab. 1 sind die Eigenschaften der Studien zusammengefasst, die in diese systematische Übersicht eingeschlossen wurden ([30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42]; Details online auf SpringerLink unter Supplementary Material, Tab. 1).

Tab. 1 Überblick über die randomisierten, kontrollierten Studien, die in die systematische Übersicht eingeschlossen wurden (alphabetisch nach Erstautor geordnet)

Settings

Alle Studien waren multizentrisch angelegt; 5 wurden in Nordamerika, 4 in Europa und 4 auf mehr als einem Kontinent durchgeführt.

Studien

Die mittlere Studiendauer betrug 15 Wochen (4–56 Wochen). Fünf Studien hatten eine mittlere Dauer (13–26 Wochen), 2 waren Langzeitstudien (> 26 Wochen). Zwölf Studien hatten ein paralleles, eine hatte ein Cross-over-Design. Sieben waren doppelblind, 6 offen. In 3 Fällen handelte es sich um Nichtunterlegenheitsstudien, ohne dass ein geeignetes statistisches Design für Nichtunterlegenheitsanalysen [5] vorgelegen hätte. Die Zahl der durchschnittlich pro Studie eingeschlossenen Patienten lag bei 494 (112–1121).

Teilnehmer

Insgesamt umfassten die Studien 6782 Patienten, wobei ausschließlich Erwachsene eingeschlossen wurden. Die Spannweite des Durchschnittsalters in den Studien lag bei 46–52 Jahren. Die Teilnehmer waren überwiegend Weiße. Einschlusskriterien waren in 5 Studien Arthrose, in 2 Studien Kreuzschmerz sowie in 5 Studien Kreuzschmerz und Arthrose. Eine Studie schloss Patienten mit Kreuzschmerz, Arthrose oder polyneuropathischem Schmerz ein. Patienten mit Substanzmissbrauch und/oder schwereren psychischen Erkrankungen in der Anamnese waren mit Ausnahme von 2 Studien ausgeschlossen. Von allen Studien ausgeschlossen wurden Patienten mit kritischen somatischen Störungen, z. B. Leber- oder Nierenerkrankungen.

Interventionen

In 5 Studien wurde Tapentadol mit Oxycodon verglichen; in 2 Studien Hydromorphon mit Oxycodon; in 2 Fentanyl mit Morphin; in 2 Morphin mit Oxycodon; in einer Studie Buprenorphin mit Tramadol und ebenfalls in einer Studie Oxymorphon mit Oxycodon. Alle oralen Opioide wurden als Retardpräparat appliziert. In 3 Studien wurde ein transdermales Opioidsystem einem oralen Opioid gegenübergestellt. Angaben zur durchschnittlichen Opioiddosis im Studienverlauf fehlten in 2 Studien. Eine Äquivalenz der täglichen Morphindosen war lediglich in den 2 Arbeiten gegeben, die Fentanyl mit Morphin verglichen (Tab. 2). In allen weiteren Studien wurde das Opioid höher dosiert, das von besonderem Interesse war (für das finanzierende Pharmaunternehmen). Angaben zum Einsatz zusätzlicher Analgetika fanden sich in allen Studien.

Tab. 2 Vergleich der durchschnittlichen Dosierungen der Studienmedikation. (Nach [28])

Evidenzqualität

In 3 Studien konnte das Risiko eines systematischen Fehlers nur unzureichend eingeschätzt werden, da die Methodik mangelhaft beschrieben war. Die Studienqualität von 5 Studien war mäßig, 8 hatten eine geringe Qualität. Alle Studien wurden vom Hersteller eines der getesteten Medikamente finanziert (Abb. 2, Abb. 3: grafische und zusammenfassende Darstellung des Risikos eines systematischen Fehlers). Genauere Angaben zur Ermittlung des Risikos eines systematischen Fehlers in den einzelnen Studien finden sich im Supplementary Material, Tab. 2.

Abb. 2
figure 2

Grafische Darstellung des Risikos eines systematischen Fehlers

Abb. 3
figure 3

Zusammenfassung des Risikos eines systematischen Fehlers

Zusammenführung der Ergebnisse

Die Ergebnisse werden mit 95 %-Konfidenzintervallen (KI) angegeben (Supplementary Material, Abb. 1–7; Tab. 1 und 2).

Neun Studien mit 4159 Teilnehmern wurden einer Analyse der durchschnittlichen Schmerzreduktion bei Studienende unterzogen. Ein signifikanter Unterschied zwischen den beiden Opioidgruppen ergab sich dabei nicht: SMD: −0,05 (−0,12; 0,02); I2 = 0 % (mäßige Evidenzqualität; Supplementary Material, Abb. 1).

Drei Studien mit 1977 Teilnehmern flossen in eine Analyse der 50 %igen Schmerzreduktion bei Studienende ein. Jede dieser Studien verglich Tapentadol mit Oxycodon. Tapentadol war Oxycodon überlegen: RD: 0,09 (0,03; 0,16); I2 = 64 % (geringe Evidenzqualität; Supplementary Material, Abb. 2).

Fünf Studien (3209 Teilnehmer) wurden in eine Analyse des Gesamteindrucks der Patienten bezüglich einer starken oder sehr starken Besserung bei Studienende eingeschlossen. In allen Studien wurden Tapentadol und Oxycodon verglichen. Tapentadol war Oxycodon nicht überlegen: RD: 0,06 (−0,01; 0,12); I2 = 61 % (geringe Evidenzqualität; Supplementary Material, Abb. 3).

Mit 9 Studien (2991 Teilnehmer) wurde eine Analyse der körperlichen Funktionsfähigkeit bei Studienende durchgeführt. Ein signifikanter Unterschied zwischen den beiden Opioidgruppen ergab sich dabei nicht: SMD: 0,02 (−0,10; 0,14); I2 = 59 % (sehr geringe Evidenzqualität; Supplementary Material, Abb. 4).

13 Studien mit 6748 Teilnehmern flossen in eine Analyse der Abbruchraten wegen unerwünschter Ereignisse ein. Diesbezüglich fand sich ein signifikanter Unterschied zwischen den beiden Opioidgruppen: RD: −0,08 (−0,15; −0,01); I2 = 90 %, bedingt durch niedrigere Drop-out-Raten unter Tapentadol gegenüber Oxycodon (niedrige Evidenzqualität; Supplementary Material, Abb. 5).

Mit 8 Studien, die 4817 Teilnehmer umfassten, wurde eine Analyse der schweren unerwünschten Ereignisse durchgeführt. Ein signifikanter Unterschied zwischen den beiden Opioidgruppen ergab sich dabei nicht: RD: −0,01 (−0.02; 0,00); I2 = 11 % (mäßige Evidenzqualität; Supplementary Material, Abb. 6).

Neun Studien mit 4614 Teilnehmern wurden einer Analyse der Mortalität unterzogen. Ein signifikanter Unterschied zwischen den beiden Opioidgruppen ergab sich dabei nicht: RD: −0,00 (−0,00; 0,00); I2 = 0 % (mäßige Evidenzqualität; Supplementary Material, Abb. 7).

Subgruppenanalysen

Drei im Vorfeld definierte Subgruppenanalysen konnten durchgeführt werden (a. verschiedene Opioide für alle CNTS gepoolt; b. Tapentadol vs. Oxycodon bei chronischem Arthroseschmerz; c. orales vs. transdermales System bei allen Formen von CNTS gepoolt).

Ad a. Es fand sich eine Evidenz von mäßiger Qualität in 4 Studien (2 Studien bei Arthrose, je eine Studie bei chronischem Rückenschmerz bzw. chronischem Rücken- oder Arthroseschmerz) dafür, dass Tapentadol Oxycodon in Bezug auf die durchschnittliche Schmerzreduktion überlegen war und dass kein signifikanter Unterschied zwischen den beiden Wirkstoffen hinsichtlich schwerer unerwünschter Ereignisse und der Mortalität bestand. Eine Studie, in der sich keine signifikanten Unterschiede in der durchschnittlichen Schmerzreduktion zwischen Tapentadol bzw. Oxycodon und Placebo zeigten, berichtete keine Mittelwerte und Standardabweichungen und konnte daher nicht in die Metaanalyse einbezogen werden [31]. Qualitativ geringwertig war die Evidenz, dass Tapentadol Oxycodon in der Rate der 50 %igen Schmerzreduktion und in Bezug auf die Abbruchraten wegen unerwünschter Ereignisse überlegen war. Gleiches gilt für den Befund, dass sich die Wirkstoffe hinsichtlich der Verbesserung der körperlichen Funktionsfähigkeit nicht unterschieden (Supplementary Material, Abb. 2, 4 und 5). Eine Studie, in der sich keine signifikanten Unterschiede in der durchschnittlichen Verbesserung der körperlichen Funktionsfähigkeit zwischen Tapentadol bzw. Oxycodon und Placebo zeigten, berichtete keine Mittelwerte und Standardabweichungen und konnte daher nicht in die Metaanalyse einbezogen werden [31]. Ebenfalls von geringer Qualität war die Evidenz dafür, dass Hydromorphon und Oxycodon (eine Studie bei Arthrose, eine Studie bei verschiedenen CNTS) nicht in der durchschnittlichen Schmerzreduktion, den Abbruchraten wegen unerwünschter Ereignisse oder der Mortalität differierten; sehr gering war die Qualität der Evidenz, dass die Wirkstoffe sich nicht bezüglich der Verbesserung der körperlichen Funktionsfähigkeit unterschieden (Supplementary Material, Abb. 1, 4, 5 und 6). Es fand sich eine Evidenz von sehr geringer Qualität für den Befund, dass Oxycodon und Morphin die funktionelle Funktionsfähigkeit in gleichem Maße verbesserten (eine Studie bei chronischem Rückenschmerz, eine Studie bei verschiedenen CNTS); qualitativ geringwertig war die Evidenz, dass die Wirkstoffe sich nicht hinsichtlich der Abbruchraten wegen unerwünschter Ereignisse unterschieden (Supplementary Material, Abb. 4 und 5). In beiden Studien, die Oxycodon und Morphin verglichen, wurde (ohne Mittelwerte und Standardabweichungen) berichtet, dass die durchschnittliche Schmerzreduktion durch diese Wirkstoffe nicht verschieden war.

Ad b. Qualitativ geringwertig war die Evidenz, dass Tapentadol Oxycodon beim chronischen Arthroseschmerz in der 50 %igen Schmerzreduktion, dem Gesamteindruck der Patienten bezüglich einer starken oder sehr starken Besserung sowie der Verträglichkeit überlegen war. Analysen für durchschnittliche Schmerzintensität und körperliche Funktionsfähigkeit wurden bei nur einer analysierbaren Studie nicht durchgeführt. Es fanden sich keine signifikanten Unterschiede bezüglich der Sicherheit (Details auf Anfrage erhältlich).

Ad c. Transdermale Systeme zeigten keine Überlegenheit gegenüber der oralen Einnahme in Bezug auf die durchschnittliche Schmerzreduktion, die Verbesserung der körperlichen Funktionsfähigkeit oder die Häufigkeit schwerer unerwünschter Ereignisse (alle Vergleiche hatten eine geringe Evidenzqualität). Genauso wenig waren sie hinsichtlich der Drop-out-Raten wegen unerwünschter Ereignisse überlegen (sehr geringe Evidenzqualität; Tab. 3).

Tab. 3 Subgruppenvergleich: transdermale vs. orale Applikation

Sensitivitätsanalyse

Der Ausschluss von Studien mit substituierten SD oder extrahierten Mittelwerten/SD, von Studien mit offenem Design und von Nichtunterlegenheitsstudien führte zu keiner Änderung der Ergebnisse (Analysedetails auf Anfrage).

Publikationsbias

Das Kendall-τ des Begg-Rangkorrelationstests in Bezug auf die Abbruchrate wegen unerwünschter Ereignisse war nicht signifikant (τ = 0,18; 2-seitiger p-Wert = 0,35). Das Egger-Intercept des Endpunkts Schmerz war ebenfalls nicht signifikant (Intercept = 1,02; 2-seitiger p-Wert = 0,59).

Diskussion

In gepoolten Analysen von Studien, in denen das Opioid des Sponsors der Studie mit einem Standardopioid verglichen wurde, mit einer Dauer von ≥ 4 Wochen fanden sich keine signifikanten globalen Unterschiede in der Wirksamkeit, Verträglichkeit und Sicherheit von Opioiden bei Erwachsenen mit CNTS. Die Evidenzqualität der meisten Vergleiche war gering. Die Befunde, dass Tapentadol in seiner Wirksamkeit und Verträglichkeit Oxycodon überlegen war, unterlagen einem systematischen Fehler, da in einer Studie an Patienten mit Arthroseschmerz, in der weder Tapentadol noch Oxycodon eine Überlegenheit gegenüber Placebo zeigte, die Ergebnisse unvollständig angegeben waren. Ein Review zu Tapentadol-Studien bei CNTS schloss die Daten dieser negativen Studie ein [31]. Die berichteten Ergebnisse zu Schmerz und körperlicher Funktion eigneten sich nicht für eine Metaanalyse. Zudem fehlten Angaben zu schweren unerwünschten Ereignissen [31]. Folglich können wir nicht schlussfolgern, dass Tapentadol Oxycodon in seiner Wirksamkeit, Verträglichkeit und Sicherheit überlegen ist.

Unsere Ergebnisse stimmen überein mit dem systematischen qualitativen Review des Oregon Evidence-based Practice Center [3]. Die Autoren dieser Arbeit bewerteten die Evidenzstärke von 8 RCT mit schwach bis mäßig (6 Studien mit mäßiger und 2 Studien mit geringer Qualität). Sie berichteten weiterhin, dass die Belege aus direkten Vergleichsstudien nicht ausreichten, um einem lang wirksamen Opioid im Vergleich zu einem anderen eine überlegene Wirksamkeit bei erwachsenen Patienten mit CNTS zuzusprechen. Für 7 direkte Vergleichsstudien zu lang wirksamen Opioiden ermittelten die Autoren eine schwache Evidenzstärke. Die Studiendaten rechtfertigten nicht den Schluss, dass eines der lang wirksamen Opioide gegenüber anderen Vertretern geringere schädliche Wirkungen hat [3]. Alle in diesem qualitativen Review berücksichtigten Studien waren auch in unserer Arbeit eingeschlossen. Eine Netzwerkmetaanalyse fasste 14 randomisierte Studien zum Einsatz von Fentanyl-Pflastern, Buprenorphin-Pflastern und oralem Morphin bei Patienten mit chronischem Schmerz zusammen. Die Schmerzkontrolle durch transdermales Buprenorphin oder Fentanyl war hier vergleichbar. Im Vergleich zu Morphin verringerte transdermales Fentanyl die Schmerzintensität signifikant stärker (mittlere Differenz: −16,2; 95 %-KI: −28,9–−3,5). Im Vergleich zu transdermalem Buprenorphin wurde die Behandlung unter Morphin signifikant häufiger wegen unerwünschter Ereignisse abgebrochen (OR: 5,8; 95 %-KI: 1,7–20,1; [29]). Eine andere Netzwerkmetaanalyse verglich 45 Studien (CNTS) für Tapentadol 200–500 mg/Tag im Vergleich zu Tramadol 300 mg/Tag. Es fand sich kein signifikanter Unterschied in der durchschnittlichen Schmerzreduktion [43]. Eine weitere Netzwerkmetaanalyse von 50 Studien (Tumorschmerz und CNTS) verglich Tapentadol, transdermales Buprenorphin, transdermales Fentanyl, Hydromorphon, Morphin und Oxymorphon. Tapentadol war in der durchschnittlichen Schmerzreduktion Hydromorphon und Morphin, nicht jedoch den anderen getesteten Opioiden überlegen [44]. Zusammengefasst erlauben die zur Verfügung stehenden (Netzwerk-)Metaanalysen nicht die Bevorzugung eines spezifischen Opioids aufgrund einer überlegenen Wirksamkeit.

Aufgrund ihrer geringen Qualität begründen die verfügbaren Studiendaten keine Bevorzugung von transdermalen Systemen gegenüber der oralen Einnahme. Unsere Ergebnisse stehen in Einklang mit einer systematischen Übersicht zur Verwendung oraler oder transdermaler Opioide bei Knie- oder Hüftgelenksarthrose, in der die wissenschaftliche Literatur bis Juli 2008 durchsucht wurde. Die Autoren fanden kaum Belege für einen Zusammenhang zwischen Wirksamkeit und Applikationsweg [20].

Die Wahl des Applikationswegs für das Opioid wird möglicherweise durch die Präferenzen der Patienten und Ärzte sowie durch Komorbiditäten beeinflusst. Patienten, die mehrere andere Medikamente oral einnehmen, könnten ein transdermales System bevorzugen. In einer retrospektiven Studie an gesetzlich Krankenversicherten aus Deutschland (2001–2003) erhielten Patienten aus der transdermalen Gruppe die Opioide signifikant häufiger von ihrem Hausarzt [11]. In einer weiteren retrospektiven Studie wurden die Medicaid-Abrechnungsdaten von Leistungsempfängern aus Kansas in der Zeit von Mai 1999 bis April 2002 analysiert. Ausgewertet wurden die Daten von älteren Patienten (> 60 Jahre) mit einer Opioidmedikation, die äquivalent zu 600 mg Morphin/Monat oder höher war. Eine transdermale Applikation war wahrscheinlicher bei höherem Alter (85-Jährige vs. 60- bis 75-Jährige), Unterbringung in einem Pflegeheim und Demenz [24].

Die Ergebnisse unserer Übersichtsarbeit widersprechen den Schlussfolgerungen eines aktuellen systematischen Reviews zur > 6-monatigen LTOT bei CNTS. Die Autoren kamen zu dem Schluss, dass es zu wenige Publikationen zu diesem Thema gäbe [14], eine Feststellung, die nur auf placebokontrollierte Studien zutrifft [25]. Unser Review schloss 2 Studien mit direktem Vergleich von Opioiden über 52 und 56 Wochen ein. Beide Studien zeigen eine signifikante und klinisch relevante anhaltende Schmerzreduktion von Studienbeginn bis Behandlungsende unter Einsatz von Fentanyl, Morphin, Oxycodon und Tapentadol [32, 42]. Allerdings ist es ohne eine Placebogruppe nicht möglich, die positiven Wirkungen der Opioide klar von unspezifischen (Placebo-)Effekten zu trennen [9]. Für die Unterscheidung der Opioidwirkung von einer spontanen Erholung [12] wäre zudem eine Gruppe ohne Behandlung erforderlich.

Die vorliegende Übersichtsarbeit ist folgenden Einschränkungen unterworfen:

  1. a)

    Möglicherweise haben wir mit unserer Suchstrategie nicht alle veröffentlichten Studien erfasst. Diese Feststellung gilt v. a. für Studien, die durchgeführt wurden, bevor Register klinischer Studien verfügbar waren. Die Ergebnisse der Tests auf einen Publikationsbias waren jedoch nicht signifikant.

  2. b)

    Die methodische Studienqualität könnten wir zu gering bewertet haben, da wir fehlende Informationen nicht von den Autoren nachforderten.

  3. c)

    Die empfohlenen äquianalgetischen Verhältnisse für Opioide unterscheiden sich je nach verwendetem Opioidrechner. Die vorgeschlagenen Verhältnisse sind als grobe Richtwerte zu verstehen, die in vielfältigen klinischen Situationen ein vernünftiges Dosierungsregime ermöglichen [7].

  4. d)

    Wir analysierten nicht andere Endpunkte der Verträglichkeit wie Übelkeit, Obstipation und Schwindel/Benommenheit. Eine systematische Übersichtsarbeit berichtete, dass gastrointestinale Nebenwirkungen unter Tapentadol seltener waren als unter Oxycodon [15]. In einer Netzwerkmetaanalyse waren gastrointestinale Nebenwirkungen unter Tapentadol seltener als unter Tramadol, Benommenheit war häufiger unter Tapentadol als unter Tramadol. Die Art der Erfassung der Nebenwirkungen außer von Obstipation und Entzugszeichen wurde jedoch von den Tapentadol-Studien nicht berichtet, was zu Unsicherheit bezüglich der Überlegenheit von Tapentadol über Oxycodon bei Übelkeit und Benommenheit führt (Häuser et al., in Vorbereitung).

  5. e)

    Wir führten eine Metaanalyse der Vergleiche eines Opioids eines Herstellers, der die Studie finanzierte, im Vergleich zu einem Standardopioid durch. Eine Netzwerkmetaanalyse wäre eine angemessenere Methode für den Vergleich aller Opioide gewesen.

Fazit für die Praxis

Direktvergleiche von Opioiden begründen keine bevorzugte Anwendung eines bestimmten Vertreters dieser Substanzklasse und/oder eines Applikationswegs bei Patienten mit CNTS. Die Wahl der Opioide (oder anderer Medikamente) und ihrer Verabreichungsform sollte sich in dieser Gruppe von Patienten an deren individuellen Komorbiditäten und Präferenzen in Bezug auf das Nebenwirkungsprofil der verfügbaren Medikamente orientieren. Von einer Monotherapie mit Opioiden wird in aktuellen Leitlinien zur Behandlung von CNTS abgeraten. Die medikamentöse Therapie sollte mit körperlichem Training und/oder psychologischen Maßnahmen kombiniert werden [21, 22].

In Anbetracht der Tatsache, dass die LTOT bei CNTS zunehmend angewendet wird, ist die eingeschränkte Datenlage verwunderlich. Mehr qualitativ hochwertige Langzeitstudien sind von Nöten. Sie könnten in der laufenden Diskussion über den Wert von Opioiden in der Behandlung von CNTS Orientierung bieten [4]. Traditionelle RCT sind möglicherweise nicht die Methode der Wahl. Alternative Ansätze sollten entwickelt und evaluiert werden, beispielsweise systematische vergleichende Wirksamkeitsstudien an Gesundheitsregisterdaten. Gesundheitsökonomische Endpunkte, wie Arbeitsausfalltage oder die berufliche Wiedereingliederung, sollten gängige Wirksamkeitsendpunkte, wie Schmerz und körperliche Funktionsfähigkeit, ergänzen.