Einleitung

Der Stellenwert von Opioiden in der Langzeittherapie von chronischen nicht-tumorbedingten Schmerzen (CNTS; „chronic noncancer pain“) hat sich im Laufe der vergangenen 30 Jahre verändert. Eine Langzeitopioidtherapie wurde definiert als tägliche oder beinahe tägliche Verwendung von Opioiden über mindestens 90 Tage, oft auch auf unbestimmte Zeit [28]. Eine systematische Übersichtsarbeit zur Opioidtherapie bei chronischem Kreuzschmerz unterschied kurz- (4–12 Wochen), mittel- (13–26 Wochen) und langfristige Studien (> 26 Wochen; [2]). Zur Behandlungspraxis in Bonica-Schmerzkliniken zwischen 1960 und 1980 schrieb Loeser: „Es kam uns nicht in den Sinn, dass es eine nennenswerte Zahl an Patienten mit chronischem Schmerz geben könnte, die erfolgreich mit Opioiden behandelt wurden. Denn wenn es sie überhaupt gab, dann bekamen wir sie so gut wie nie zu Gesicht“ [14]. In den 1990er-Jahren änderten die Meinungsführer der Schmerzmedizin ihre Einstellung zu diesem Thema. Opioide wurden als wirksam und sicher in der Langzeittherapie von CNTS angesehen [30]. Es wurde dargelegt, dass in Deutschland eine Unterversorgung von CNTS-Patienten mit Opioiden bestand [29, 30]. Der Begriff des „opioidpflichtigen“ CNTS wurde geprägt [20]. In Bezug auf chronische Schmerzen bei entzündlich-rheumatischen Erkrankungen, Arthrose, chronische Kreuzschmerzen (Zustand nach fehlgeschlagenem rückenchirurgischem Eingriff) und neuropathische Schmerzsyndrome wie die Postzosterneuralgie oder Phantomschmerz wurde geschrieben, dass sie den Einsatz von Opioiden erforderten, soweit sie nicht auf andere Analgetika ansprachen [20]. Das Konzept opioidpflichtiger Schmerzen würde allerdings voraussetzen, dass die Überlegenheit von Opioiden gegenüber Nichtopioidanalgetika in der Behandlung von CNTS belegt ist. Die Verschreibungen von starken Opioiden für Patienten mit CNTS nahmen in Deutschland zwischen 2000 und 2010 zu [15, 24].

In den vergangenen 5 Jahren hat sich die Gemeinschaft der Schmerzmediziner in Kritiker [28] und Befürworter [27] der langfristigen Opioidtherapie bei CNTS aufgespalten. Die erste Version der deutschen interdisziplinären Leitlinien zur Langzeitanwendung von Opioiden bei CNTS (LONTS; [22]) wurde heftig wegen der Aussage kritisiert, dass Opioide Nichtopioiden in Bezug auf die Schmerzreduktion bei CNTS nicht überlegen sind [27].

Dass die Evidenzqualität und Zuverlässigkeit von Empfehlungen aufgezeigt werden müssen, wenn die Validität von Behandlungsempfehlungen bewertet werden soll, ist medizingeschichtlich eine neuere Erkenntnis (etwa seit 1990; [7]). Eine evidenzbasierte Pharmakotherapie von CNTS würde verlangen, dass Opioide und Nichtopioidanalgetika hinsichtlich der Wirksamkeit, Verträglichkeit und Sicherheit direkt verglichen werden. In einer systematischen Übersicht zum Einsatz von Opioiden bei CNTS, die direkte Vergleichsstudien mit Opioiden und Nichtopioidanalgetika einschloss, wurde die Literatur bis zum Jahr 2005 durchsucht. Ein signifikanter Unterschied in Bezug auf die Schmerzreduktion fand sich hier nicht. Nichtopioidanalgetika waren Opioiden in Bezug auf die funktionellen Ergebnisse überlegen [8]. Ziel dieser systematischen Übersichtsarbeit war es, die Literatursuche zu aktualisieren. Weiterhin sollten in einer Metaanalyse von randomisierten, kontrollierten Studien (RCT) an CNTS-Patienten aller Altersstufen die Wirksamkeit, Verträglichkeit und Sicherheit von Opioiden und Nichtopioidanalgetika verglichen werden.

Methoden

Das Review wurde gemäß dem Preferred-Reporting-Items-for-Systematic-Reviews-and-Meta-Analyses(PRISMA)-Statement [17] und nach den Empfehlungen der Cochrane Collaboration [12] durchgeführt.

Ein- und Ausschlusskriterien

Studientypen

Wir schlossen vollständig publizierte, doppelblinde RCT ein. Berücksichtigt wurden Studien mit Paralleldesign. Cross-over-Studien wurden eingeschlossen, wenn

  • Daten zu den beiden Phasen separat aufgeführt waren,

  • Daten publiziert wurden, die einen statistisch signifikanten Überhangeffekt („carry-over effect“) ausschlossen oder

  • im Falle eines signifikanten Überhangeffekts entsprechende statistische Adjustierungen erfolgt waren.

Die Studiendauer musste mindestens 4 Wochen betragen (Titrations- und Erhaltungsphase). Die Studien mussten pro Behandlungsarm mindestens 10 Patienten einschließen. Hinsichtlich der Publikationssprache bestanden keine Einschränkungen.

Ausgeschlossen wurden Studien mit einer Titrierungs-/Erhaltungs- oder Absetzphase von unter 4 Wochen; Studien mit experimentellem Design (Grundlagenstudien, mit denen primär Schmerzmechanismen untersucht werden sollten, oder klinische Studien, die sich nicht auf die Schmerzlinderung als therapeutisches Ziel konzentrierten) und Studien, die lediglich als Abstract veröffentlicht waren.

Teilnehmer

Als Teilnehmer berücksichtigt wurden Patienten jeden Alters mit Schmerzen, die eine beliebige nicht-tumorbedingte Ursache hatten und die vor Studieneinschluss mindestens 3 Monate bestanden hatten. Eingeschlossen wurden neuropathische Schmerzen, Arthrose, rheumatoide Arthritis, Fibromyalgie, Rückenschmerzen, muskuloskeletale Schmerzen, chronische viszerale Schmerzen (chronische Pankreatitis) und chronische ischämische Schmerzen, bedingt durch Gefäßerkrankungen.

Ausgeschlossen wurden Studien, die auch Patienten mit Tumorschmerzen beinhalteten und die Ergebnisse für CNTS nicht gesondert aufführten. Ausgeschlossen waren auch Studien zum Einsatz von Opioiden bei Durchbruch-CNTS.

Interventionsformen

Wir berücksichtigten Studien mit oraler oder transdermaler Opioidapplikation, in denen ein Opioid mit einem Nichtopioidanalgetikum [Paracetamol; nichtsteroidale Antirheumatika (NSAR) inklusive Cyclooxygenase(COX)-Inhibitoren; Metamizol; Antikonvulsiva; Antidepressiva und Muskelrelaxanzien] in therapeutischer Anwendung verglichen wurde. Nicht eingeschlossen wurden Vergleichsstudien mit Cannabinoiden, da diese Substanzen in den meisten Ländern nicht als Analgetika für die Behandlung von CNTS etabliert sind.

Eingeschlossen wurden Studien mit Tramadol, einem zentral wirkenden, synthetischen Opioidanalgetikum, das über zwei komplementäre Wirkmechanismen verfügt, zum einen die Bindung der Ausgangssubstanz und des M1-Metaboliten an μ-Opioid-Rezeptoren, zum anderen eine Hemmung der Noradrenalin- und Serotoninwiederaufnahme. Ebenfalls eingeschlossen wurden Studien mit Tapentadol. Auch diese Substanz hat als μ-Rezeptor-Agonist und Noradrenalinwiederaufnahmehemmer zwei Wirkmechanismen.

Ausgeschlossen wurden Studien, in denen Opioide mit Nicht-Opioidagonisten kombiniert wurden (beispielsweise Tramadol mit Paracetamol), da hier eine Unterscheidung der Opioidwirkung von den Effekten des anderen Analgetikums nicht möglich ist.

Auch Studien mit Propoxyphen wurden ausgeschlossen, da die Substanz vom Markt genommen wurde [US Food and Drug Administration (FDA), Pressemitteilung vom 19.11.2010].

Typen von Studienendpunkten

Die Auswahl der Endpunkte basierte auf den Empfehlungen der ACTINPAIN Writing Group der International Association for the Study of Pain (IASP) Special Interest Group (SIG) on Systematic Reviews in Pain Relief, zudem auf den Empfehlungen der Cochrane Pain, Palliative and Supportive Care Systematic Review Group zur Publikation der Metaanalysen von RCT bei chronischem Schmerz [18]. Die Schmerzintensität wurde als zusätzlicher Ergebnisparameter berücksichtigt, da die meisten vor 2005 durchgeführten Studien keine Responder-Analysen beinhalteten.

Endpunkte

Wirksamkeit

  1. 1.

    Einschätzung der Schmerzintensität

  1. 2.

    Anteil der Patienten, die eine 50 %ige Schmerzlinderung angaben

  2. 3.

    Allgemeine Besserung (Zahl der Patienten, die eine starke oder sehr starke Besserung angaben)

  3. 4.

    Funktionsfähigkeit: Beispiele für funktionelle Endpunkte, die folgendermaßen extrahiert werden konnten: Brief Pain Inventory; Fibromyalgia Impact Questionnaire (FIQ; körperliche Funktionsfähigkeit); Multidimensional Pain Inventory (MPI; körperliche Funktionsfähigkeit); Western Ontario and McMaster Universities Arthritis Index (WOMAC); Neck Disability Index; Oswestry Disability Index (ODI); Pain Disability Index (PDI; körperliche Beeinträchtigung); Roland Disability Questionnaire (RDQ) und Short Form 36 (SF-36) oder SF-12 (Skala der körperlichen Funktionsfähigkeit). Wurden sowohl krankheitsspezifische als auch -unspezifische Instrumente eingesetzt, bevorzugten wir erstere Form, beispielsweise den FIQ gegenüber dem PDI oder WOMAC gegenüber der SF-36-Skala der körperlichen Funktionsfähigkeit.

  4. 5.

    Anteil der Patienten, die die Studie wegen fehlender Wirksamkeit abbrachen

Verträglichkeit

  1. 1.

    Anteil der Patienten, die die Studie wegen unerwünschter Ereignisse abbrachen

Sicherheit

  1. 1.

    Anteil der Patienten mit schwerem unerwünschtem Ereignis

  2. 2.

    Anteil der Patienten, die im Verlauf der Studie verstarben

Ausgeschlossen wurden Studien, deren primärer Endpunkt keinem der fünf oben definierten Wirksamkeitsendpunkte entsprach.

Verfahren zur Identifizierung von Studien

Suche in elektronischen Datenbanken und anderen Quellen

In dieser Übersichtsarbeit wurde die Literaturrecherche der ersten deutschen LONTS-Leitlinien-Version, die Publikationen bis Oktober 2008 abdeckt [22], aktualisiert und ausgeweitet. Die aktualisierte und erweiterte Suche schloss Cochrane Central Register of Controlled Trials (CENTRAL), MEDLINE und Scopus von Oktober 2008 bis Oktober 2013 ein. Details der Suchstrategie wurden bereits an anderer Stelle beschrieben [23].

Datensammlung und -analyse

Studienauswahl

Zwei Autoren (PW, WH) prüften unabhängig anhand der Titel, Zusammenfassungen und Schlüsselwörter, ob die mit der Suchstrategie gefundenen Studien die Einschlusskriterien erfüllten. Soweit die Studien im Einklang mit den Kriterien zu stehen schienen oder ihr Einschluss unsicher war, wurde der Volltext herangezogen. Die Volltextbeiträge wurden auf ihre Übereinstimmung mit den Einschlusskriterien hin gesichtet. Waren die Autoren unterschiedlicher Meinung, wurde im Gespräch eine Einigung herbeigeführt.

Datenextraktion

Anhand standardisierter Formblätter extrahierten zwei Autoren (PW, WH) unabhängig Daten zu Einschluss- und Ausschlusskriterien der Studien, Teilnehmermerkmalen, Interventionsgruppen, klinischen Settings, Interventionen, zum Studienland und zur Studienfinanzierung. Waren die Daten nicht in einem für die Datenextraktion geeigneten Format verfügbar, verzichteten wir auf eine Anfrage bei den Studienautoren zur Klärung des Problems. Bei Meinungsverschiedenheiten wurde im Gespräch eine Einigung herbeigeführt.

Umgang mit fehlenden Daten

Wenn sowohl Baseline-observation-carried-forward(BOCF)- als auch Last-observation-carried-forward(LOCF)-Daten für eine Intention-to-treat(ITT)-Analyse angeführt waren, gaben wir den BOCF-Daten den Vorzug [19]. Fehlten Angaben zu Mittelwerten oder Standardabweichungen (SD), berechneten wir sie aus den t-Werten, Konfidenzintervallen (KI) oder Standardfehlern, soweit diese im Beitrag angegeben waren [12]. Ließen sich fehlende SD nicht aus berichteten Werten ermitteln, wurde die Studie von der Analyse ausgeschlossen.

Maße des Therapieeffekts

Als Effektmaße wurden die absolute Risikoreduktion (RD) für dichotome Daten und die standardisierte Mittelwertdifferenz (SMD) für kontinuierliche Daten verwendet. Die Unsicherheit wurde in 95%-Konfidenzintervallen (95 %-KI) angegeben. Mithilfe der Kategorien nach Cohen ermittelten wir die Effektgröße, berechnet mit SMD, wobei Hedges-g-Werte von 0,2 als klein, Werte von 0,5 als moderat und Werte von 0,8 als groß angesehen wurden [3]. g-Werte < 0,2 betrachteten wir als unwesentliche Effektgrößen.

Aspekt der Analyseeinheit

Wurden mehrere Opioidtherapiearme mit einer Nichtopioidanalgetikumgruppe verglichen, passten wir die Zahl der Teilnehmer in der Placebogruppe entsprechend der Teilnehmerzahl in den verschiedenen Opioidarmen für kontinuierliche Endpunkte an.

Datenauswertung

Mithilfe eines Random-effects- und inversen Varianzverfahrens wurden Daten aus Studien gepoolt, in denen Opioide mit Kontrollen verglichen wurden. Zur Beschreibung der prozentualen Variabilität von Effektschätzern, die durch Heterogenität bedingt ist, wurde der I2-Test angewendet. I2-Werte > 50 % zeigen eine hohe Heterogenität [12].

Das Risiko eines systematischen Fehlers (Bias) wurde für jede Studie von zwei Autoren (PW, WH) unabhängig geprüft. Hierzu wurden 8 von der Cochrane Collaboration empfohlene Bereiche herangezogen: systematischer Selektionsfehler (Randomisierung, Geheimhaltung der Behandlungszuordnung, Gleichheit der Gruppen bei der Ausgangsmessung der Studie), systematischer Durchführungsfehler, systematischer Erkennungsfehler, systematischer Fehler aufgrund von Verlust von Teilnehmern, systematischer Berichtsfehler, systematischer Fehler durch Studienfinanzierung (Details in [23]). Für jedes Kriterium wurde das Risiko als niedrig, hoch oder unsicher eingestuft. Als qualitativ hochwertig wurden Studien definiert, die mindestens 6 der 8 Validitätskriterien erfüllten; Studien von mäßiger Qualität erfüllten 3–5, Studien von niedriger Qualität 0–2 Kriterien. Die Methode des Grading of Recommendations Assessment, Development and Evaluation (GRADE) wurde zur Bewertung der Gesamtqualität der Evidenz gewählt [11], definiert als Maß des Vertrauens in die Schätzungen des Behandlungsnutzens und der unerwünschten Wirkungen. Die Qualität wurde für jeden der 8 Endpunkte getrennt bewertet. Im Folgenden sind Faktoren aufgeführt, bei deren Vorliegen die Evidenzqualität um jeweils eine Stufe herabgesetzt wurde:

  • Einschränkungen des Studiendesigns: > 50% der Teilnehmer waren aus Studien mit niedriger Qualität.

  • Unstimmigkeit der Ergebnisse: I2 > 50 %

  • „Indirectness“: Wir prüften, ob die Fragestellung im systematischen Review von der verfügbaren Evidenz abwich und, in Bezug auf die Patientenpopulation im klinischen Alltag, ob bei ≥ 50% der Teilnehmer aller eingeschlossenen Studien gegeben war, dass Patienten mit klinisch relevanter körperlicher Erkrankung und/oder schwererer psychischer Erkrankung (Substanzmissbrauch oder „major depression“ in der Anamnese) ausgeschlossen wurden.

  • Ungenauigkeit: Vorliegen von nur einer Studie oder Gesamtzahl der Patienten < 400 bei Vorliegen von mehr als einer Studie

Die Evidenzqualität wurde folgendermaßen eingestuft:

  • Hohe Qualität (++++): Wir sind sehr sicher, dass der wahre Behandlungseffekt nahe unserer Schätzung des Behandlungseffekts liegt.

  • Moderate Qualität (+++): Wir sind mäßig sicher bezüglich des Behandlungseffekts: Der wahre Behandlungseffekt liegt wahrscheinlich nahe unserer Schätzung des Behandlungseffekts. Es besteht aber die Möglichkeit, dass ein erheblicher Unterschied besteht.

  • Niedrige Qualität (++): Unser Vertrauen in unsere Schätzung des Behandlungseffekts ist beschränkt. Der wahre Behandlungseffekt kann sich erheblich von unserer Schätzung unterscheiden.

  • Sehr niedrige Qualität (+): Wir haben sehr geringes Vertrauen in unsere Schätzung des Behandlungseffekts. Der wahre Behandlungseffekt unterscheidet sich wahrscheinlich erheblich von unserer Schätzung.

Einschätzung des Publikationsbias

Soweit ≥ 10 Studien verfügbar waren, beabsichtigten wir, den Egger-Intercept- [6] und den Begg-Rangkorrelationstest [1] bei einem Signifikanzniveau von p < 0,05 durchzuführen. Mithilfe des Begg-Tests wird die Rangkorrelation zwischen dem standardisierten Therapieeffekt und dessen Standardfehler überprüft. Ein asymmetrischer Funnel-Plot würde zu einer solchen Korrelation führen und kann auf einen Publikationsbias hinweisen [1]. Im Egger-Test wird eine Regression der Standardnormalvariable auf die Genauigkeit durchgeführt, definiert als der Kehrwert des Standardfehlers. Der Achsenabschnitt in dieser Regression entspricht der Steigung in einer gewichteten Regression der Effektgröße auf den Standardfehler [5].

Subgruppenanalyse

A priori wurden Subgruppen festgelegt, um Schwankungen in der Effektgröße (Heterogenität) beurteilen zu können: verschiedene Opioidklassen (reine Opioide und Opioide mit zusätzlichem Wirkmechanismus, wie Tramadol und Tapentadol); unterschiedliche Klassen von Nichtopioidanalgetika und verschiedene Typen chronischer Schmerzsyndrome. Voraussetzung war, dass mindestens 2 Studien für diese Analyse vorlagen.

Sensitivitätsanalyse

Eine Sensitivitätsanalyse für die beiden primären Endpunkte (Schmerz, Funktionsfähigkeit) wurde an gepoolten, a priori festgelegten Gruppen aller Opioidtypen im Vergleich zu gepoolten Nichtopioidanalgetikagruppen durchgeführt. Ausgeschlossen wurden dabei Studien, die eine Substitution von fehlenden Mittelwerten und/oder SD anhand von Abbildungsdaten erforderlich machten.

Software

Für die quantitative Analyse der Ergebnisse verwendeten wir Comprehensive Meta-Analysis (Biostat, Englewood, NJ, USA) und RevMan Analysis (RevMan 5.2; [38]).

Ergebnisse

Literatursuche

Nach Ausschluss von Duplikaten ergab die Literatursuche 12.601 Publikationen. Nach Sichtung wurden 12.589 Arbeiten ausgeschlossen. Zwölf Volltextartikel wurden auf ihre Eignung geprüft. Die Durchsicht des Volltexts führte zum Ausschluss von 3 Arbeiten (Infobox 1). In die Metaanalyse flossen letztlich 9 Beiträge mit 10 Studien ein (hauptsächlich gepoolte Ergebnisse berichtet; Abb. 1; [31, 32, 33, 34, 35, 36, 37, 39, 40]).

Abb. 1
figure 1

Preferred-Reporting-Items-for-Systematic-Reviews-and-Meta-Analyses(PRISMA)-Flussdiagramm

Eigenschaften der Studien

Wir schlossen 9 Publikationen mit 10 Studien ein, die insgesamt 3046 Teilnehmer umfassten. Die durchschnittliche Teilnehmerzahl pro Studie lag bei 304 (54–806). Die Studiendauer betrug im Median 6 Wochen (Spannweite: 4–12 Wochen). Mittel- oder langfristige Direktvergleiche ergab die Literatursuche nicht. Fünf Studien hatten ein paralleles, 5 ein Cross-over-Design. Zwei Studien wurden in Europa durchgeführt, die restlichen Arbeiten in Nordamerika. Die Finanzierung von 4 Studien erfolgte mit öffentlichen Geldern, 6 waren vom Hersteller des getesteten Arzneimittels gesponsert (Tab. 1 und Supplementary Material, Tab. 1).

Tab. 1 Überblick über die in die systematische Übersicht eingeschlossenen randomisierten, kontrollierten, doppelblinden Studien mit Direktvergleich eines Opioids mit einem Nichtopioidanalgetikum (gruppiert nach Opioidtyp und in alphabetischer Reihenfolge)

Teilnehmer

Einschlusskriterien waren neuropathischer Schmerz (in einer Studie Postzosterneuralgie und diabetische Polyneuropathie; in einer Studie Postzosterneuralgie; in einer Studie Postamputationsschmerz und in einer Studie lumbaler radikulärer Schmerz), Arthrose (4 Studien) und Kreuzschmerz (eine Studie). Patienten mit Substanzabusus in der Anamnese und mit klinisch relevanten Erkrankungen waren aus allen Studien ausgeschlossen. Eingeschlossen wurden in allen Fällen nur Erwachsene. Die Spannweite des Durchschnittsalters in den Studien lag bei 47–71 Jahren. Frauen waren leicht in der Überzahl. Die Teilnehmer waren überwiegend Weiße (Tab. 1 und Supplementary Material, Tab. 1).

Interventionen

In 5 Studien wurde bei Patienten mit Arthrose Tramadol mit NSAR verglichen (Celecoxib in 3, Diclofenac in 2 Studien), in einer Studie Tramadol mit dem Muskelrelaxans Flupirtin bei Kreuzschmerz. Morphin wurde bei neuropathischem Schmerz folgenden Direktvergleichen unterzogen: mit Antidepressiva (Nortriptylin oder Desipramin) bei lumbalem radikulärem Schmerz und Postzosterneuralgie (jeweils eine Studie); mit dem Antikonvulsivum Gabapentin bei Postzosterneuralgie und diabetischem Schmerz (eine Studie) und mit dem Antiarrhythmikum Mexiletin bei Postamputationsschmerz (eine Studie). Mit Ausnahme von 3 Studien wurde eine flexible Dosierung des Opioids als Retardpräparat angewendet. In 7 Studien war eine Bedarfsmedikation erlaubt (Paracetamol, NSAR, kurz wirksame Opioide), in 3 Studien fanden sich hierzu keine Angaben (Supplementary Material, Tab. 1).

Evidenzqualität

Das Risiko eines systematischen Fehlers konnte in keiner Studie befriedigend eingeschätzt werden, da die Methodik mangelhaft beschrieben war. Die Studienqualität war in einer Studie hoch, in 2 mäßig und in 7 gering. Eine grafische und zusammenfassende Darstellung des Risikos eines systematischen Fehlers findet sich in Abb. 2 bzw. Abb. 3 (nach [31, 32, 33, 34, 35, 36, 37, 39, 40]). Genauere Angaben zum Risiko eines systematischen Fehlers in den einzelnen Studien finden sich im Supplementary Material, Tab. 2.

Abb. 2
figure 2

Grafische Darstellung des Risikos eines systematischen Fehlers

Abb. 3
figure 3

Zusammenfassung des Risikos eines systematischen Fehlers

Zusammenführung der Ergebnisse

Die Ergebnisse werden mit 95 %-Konfidenzintervallen (KI) angegeben (Supplementary Material, Abb. 1–7; Tab. 1 und 2).

Acht Studien mit 1506 Teilnehmern wurden einer Analyse der durchschnittlichen Schmerzreduktion bei Studienende unterzogen. Es fand sich kein signifikanter Unterschied zwischen Opioiden und Nichtopioidanalgetika: SMD: 0,03 (−0,18 – 0,24); p = 0,76; I2 = 71 % (geringe Evidenzqualität; Supplementary Material, Abb. 1).

Zwei Studien mit 308 Teilnehmern flossen in eine Analyse der 50 %igen Schmerzreduktion bei Studienende ein. Es fand sich kein signifikanter Unterschied zwischen Opioiden und Nichtopioidanalgetika: RD: 0,03 (−0,30 – 0,35); p = 0,88; I2 = 87 % (sehr geringe Evidenzqualität; Supplementary Material, Abb. 2).

Mit 6 Studien (1198 Teilnehmer) wurde eine Analyse der körperlichen Funktionsfähigkeit bei Studienende durchgeführt. Nichtopioidanalgetika waren den Opioiden überlegen: SMD: 0,17 (0,02 – 0,32); p = 0,03; I2 = 31 % (geringe Evidenzqualität; Supplementary Material, Abb. 3). Gemäß den Kategorien nach Cohen war die Effektgröße unwesentlich.

Sechs Studien mit 2912 Teilnehmern flossen in eine Analyse der Abbruchraten wegen fehlender Wirksamkeit ein. Es fand sich kein signifikanter Unterschied zwischen Opioiden und Nichtopioidanalgetika: RD: 0,00 (−0,01 – 0,01); p = 0,94; I2 = 19 % (geringe Evidenzqualität; Supplementary Material, Abb. 4).

Mit 8 Studien (3080 Teilnehmer) wurde eine Analyse der Abbruchraten wegen unerwünschter Ereignisse durchgeführt. Patienten unter Opioidtherapie brachen die Studie signifikant häufiger wegen unerwünschter Ereignisse ab als Patienten unter Nichtopioidanalgetika: RD: 0,09 (0,06 – 0,13); p < 0,0001; I2 = 35 % (geringe Evidenzqualität; Supplementary Material, Abb. 5).

Acht Studien, die insgesamt 2728 Teilnehmer umfassten, flossen in eine Analyse schwerer unerwünschter Ereignisse ein. Es fand sich kein signifikanter Unterschied zwischen Opioiden und Nichtopioidanalgetika: RD: −0,01 (−0,02 – 0,00); p = 0,65; I2 = 0 % (geringe Evidenzqualität; Supplementary Material, Abb. 6).

Mit 6 Studien (2602 Teilnehmer) wurde eine Analyse der Todesfälle durchgeführt. In keiner der beiden Gruppen kam es zu Todesfällen: RD: −0,00 (−0,00 – 0,00); p = 1,0; I2 = 0 % (geringe Evidenzqualität; Supplementary Material, Abb. 7).

Subgruppenanalysen

Hinsichtlich neuropathischer Schmerzen fand sich eine Evidenz von geringer Qualität dafür, dass kein signifikanter Unterschied zwischen Opioiden und Nichtopioidanalgetika in Bezug auf Schmerz oder die körperliche Funktionsfähigkeit bestand. Von geringer Qualität war auch die Evidenz, dass die Abbruchrate wegen unerwünschter Ereignisse unter Opioiden höher war als unter Nichtopioiden (Tab. 2).

Tab. 2 Subgruppenvergleich für Arthrose (Tramadol vs. nichtsteroidale Antirheumatika) und neuropathischen Schmerz (Morphin vs. verschiedene Nichtopioidanalgetika)

In Bezug auf Arthrose bestand eine Evidenz von geringer Qualität dafür, dass Nichtopioidanalgetika Opioiden in Bezug auf Schmerz, die körperliche Funktionsfähigkeit und die Verträglichkeit überlegen waren. Gleiches gilt für den Befund, dass kein signifikanter Unterschied in der Häufigkeit schwerer unerwünschter Ereignisse bestand (Tab. 2).

Sensitivitätsanalyse

Die Durchführung der vordefinierten Sensitivitätsanalyse war nicht notwendig.

Publikationsbias

Das Kendall-τ des Begg-Rangkorrelationstests in Bezug auf die Abbruchraten wegen Nebenwirkungen war nicht signifikant (τ = 0,18; 2-seitiger p-Wert = 0,35). Das Egger-Intercept des Endpunkts Schmerz war ebenfalls nicht signifikant (Intercept = 1,02; 2-seitiger p-Wert = 0,59).

Diskussion

Zusammenfassung der wichtigsten Ergebnisse

In Kurzzeitstudien fanden wir keine Überlegenheit von Opioiden gegenüber Nichtopioidanalgetika in Bezug auf die Wirksamkeit, Verträglichkeit und Sicherheit. Folglich sprechen unsere Ergebnisse nicht für das Konzept eines „opioidpflichtigen“ CNTS. Für Arthroseschmerz ergab sich sogar, dass die beiden NSAR Diclofenac und Celecoxib hinsichtlich der Reduktion von Schmerz und Behinderung Tramadol überlegen waren. Aufgrund der kurzen Dauer der Vergleichsstudien zu Opioiden und Nichtopioidanalgetika lässt sich nicht schlussfolgern, welche Medikamentenklasse in der langfristigen Behandlung von CNTS-Syndromen bevorzugt werden sollte.

Vergleich mit anderen systematischen Übersichtsbeiträgen

Die kanadische Leitlinie zur Opioidtherapie von CNTS [8] schloss 8 Studien in eine Metaanalyse ein. Zwei dieser Studien [36, 37] gingen auch in unsere Analyse ein. Die weiteren von Furlan et al. berücksichtigten Arbeiten fanden in unserer aktuellen Übersicht keine Berücksichtigung, da Propoxyphen eingesetzt wurde (2 Studien), eine Kombination aus einem Opioid und Nichtopioid zur Anwendung kam (eine Studie), keine Randomisierung erfolgte (Infobox 1, ausgeschlossene Studien 2 und 3) oder weil die Studiendauer < 4 Wochen lag (eine Studie). In der Metaanalyse von Furlan et al. [8] war der Unterschied zwischen Opioiden und Nichtopioidanalgetika statistisch nicht signifikant: SMD: −0,05 (−0,32; 0,2). Die Subgruppenanalyse zeigte, dass sich diese Schlussfolgerung mit dem Typ der Vergleichsgruppe [NSAR oder trizyklische Antidepressiva (TCA)] oder mit der methodischen Qualität der Studie (hoch oder niedrig) nicht änderte. In Bezug auf funktionelle Ergebnisse waren Nichtopioidanalgetika signifikant wirksamer als Opioide: SMD: 0,16 (95 %-KI: 0,03; 0,30). Erklären ließ sich dies hauptsächlich mit den Ergebnissen einer Studie, die 74 % dieser Metaanalyse ausmachte und in der Dextropropoxyphen, ein schwaches Opioid, mit Diclofenac verglichen wurde. In den beiden anderen Vergleichen (Tramadol vs. Diclofenac und kontrolliert freigesetztes Morphin vs. Nortriptylin) waren die Unterschiede statistisch nicht signifikant [8]. Unsere Ergebnisse (kein signifikanter Unterschied in der Schmerzreduktion; Überlegenheit von Nichtopioidanalgetika bei Funktionsfähigkeit) stehen im Einklang mit dem kanadischen Review, obwohl wir neue Studien einschlossen.

In ein Cochrane-Review zu neuropathischem Schmerz wurden Studien eingeschlossen, die Opioide mit Placebo oder Nichtopioidanalgetika verglichen. Die Studiendauer spielte bei der Auswahl keine Rolle. Es fanden sich keine Unterschiede zwischen Opioiden und der aktiven Kontrolle in Bezug auf unerwünschte Ereignisse oder Drop-out-Raten [16]. Die Reviews des Oregon Evidence-based Practice Center zum Vergleich des Nutzens und der unerwünschten Wirkungen von Medikamenten bei Arthrose und neuropathischem Schmerz berücksichtigten bedauerlicherweise keine Opioide [5, 26]. Unsere Ergebnisse stützen nicht die US-Leitlinienempfehlung, TCA zur Erstlinientherapie und Opioidanalgetika zur Zweitlinientherapie chronischer neuropathischer Schmerzen zu verwenden [21].

Der Befund, dass NSAR gegenüber Opioiden eine bessere Verträglichkeit bei gleichwertiger Sicherheit haben, könnte im Widerspruch zu klinischen Erfahrungen stehen, insbesondere in der Langzeit-CNTS-Therapie. Die gastrointestinalen und kardiovaskulären Nebenwirkungen der langfristigen Gabe von NSAR wie auch die erhöhte Morbidität und Mortalität wurden gründlich untersucht [5]. Eine in das vorliegende Review eingeschlossene Studie berichtete über nichtsignifikante Unterschiede zwischen Diclofenac und Tramadol bei Arthrose. Allerdings kam es bei 2 Patienten unter Diclofenac zu schweren unerwünschten Ereignissen: Ein Patient wurde nach 45 Therapietagen wegen gastrointestinaler Blutungen stationär aufgenommen, der andere nach 14 Therapietagen wegen schwerer Pankreatitis [31]. Andererseits zeigte eine US-amerikanische Längsschnitt- und Kohortenstudie an Senioren mit Arthrose, dass die Verwendung von Opioiden, nicht aber die Gabe von COX-2-Hemmern im Vergleich zu nichtselektiven NSAR mit einem gesteigerten Risiko von Ereignissen assoziiert war, die eine Hospitalisierung erforderten. Unter COX-2-Hemmern und Opioiden war das relative Risiko für kardiovaskuläre Ereignisse höher als bei Verwendung nichtselektiver NSAR. Patienten, die COX-2-Hemmer einnahmen, hatten ein geringeres Risiko gastrointestinaler Blutungen, bei Einnahme von Opioiden war es dagegen vergleichbar. Das Frakturrisiko war unter Opioiden höher als unter nichtselektiven NSAR und COX-2-Hemmern [26].

Einschränkungen

Nur doppelblinde, randomisierte, placebokontrollierte Studien wurden in diese Metaanalyse eingeschlossen; das bedeutet ein hohes Niveau evidenzbasierter Medizin. Die methodische Qualität der Studien war jedoch mehrheitlich niedrig. Die Vollständigkeit der veröffentlichten Studiendaten war oft fraglich. Entsprechend war der systematische Fehler aufgrund des Verlusts von Teilnehmern hoch. Auch das Risiko einer selektiven Veröffentlichung von Daten war hoch mit dem Risiko eines nicht unerheblichen Publikationsbias. Es ist möglich, dass negative Studienergebnisse nicht veröffentlich wurden und dass daher der tatsächliche Therapieeffekt überschätzt ist. Die dahingehend durchgeführten Tests deuteten allerdings nicht auf einen Publikationsbias hin.

Eventuell haben wir mit unserer Suchstrategie nicht alle veröffentlichten Studien erfasst. Diese Feststellung gilt v. a. für Studien, die durchgeführt wurden, bevor Register klinischer Studien verfügbar waren. Die Studienqualität könnten wir zu niedrig eingeschätzt haben, da wir fehlende Daten nicht von den Autoren nachforderten.

Die Studie an Patienten mit Postamputationsschmerz klassifizierten wir als Studie zu neuropathischem Schmerz. Hier waren allerdings Patienten mit Stumpf- und Phantomschmerz eingeschlossen. In manchen Fällen könnte der Stumpfschmerz nozizeptiven Ursprungs gewesen sein. In der Mehrheit der Studien wurde Tramadol mit Nichtopioidanalgetika verglichen. Es bleibt offen, ob sog. starke Opioide, deren Morphinäquivalentdosen höher sind als die von Tramadol, in den hier überprüften Studien, wirksamer und sicherer – bzw. weniger wirksam und sicher – wären als Nichtopioidanalgetika.

Eine Netzwerkmetaanalyse der Direktvergleiche von Opioiden vs. Nichtopioidanalgetika wäre eine angemessenere Analysemethode der Daten gewesen.

Fazit für die Praxis

Die verfügbare Evidenz, die eingeschränkt und von geringer Qualität ist, stützt nicht das Konzept „opioidpflichtiger“ chronischer Kreuz-, Arthrose- oder neuropathischer Schmerzen. Es gibt keine RCT-basierte Evidenz für eine Überlegenheit von Opioiden gegenüber Nichtopioiden bei anderen chronischen Schmerzsyndromen.

Die folgenden klinischen Gesichtspunkte sollten bei der Wahl des Medikaments für die Therapie von CNTS in der klinischen Routine berücksichtigt werden:

  • Komorbiditäten, die eine Kontraindikation bestimmter Medikamente bedeuten, z. B. eine Niereninsuffizienz in Bezug auf NSAR oder ein bestehender Substanzmissbrauch in Bezug auf Opioide

  • Bedeutung spezifischer Nebenwirkungen für den einzelnen Patienten, z. B. eingeschränkte Fahrtauglichkeit bei Verwendung von zentral wirkenden Substanzen, wie Antikonvulsiva, Antidepressiva und Opioiden, oder Gewichtszunahme bei TCA

  • Vorausgegangenes Ansprechen auf andere Analgetika

  • Präferenzen der Patienten

Langzeitstudien, in denen verschiedene Analgetikatypen verglichen und/oder Analgetika nichtpharmakologischen Behandlungen gegenübergestellt werden, sind eine Voraussetzung, wenn die Rolle von Opioiden in der Langzeittherapie von CNTS genauer definiert werden soll. Gleiches gilt für Studien, die verschiedene kombinierte Therapieansätze vergleichen. Darüber hinaus sollte der Anteil chronischer Schmerzpatienten bestimmt werden, bei denen die Schmerzlinderung trotz angemessener Dosierung der Nichtopioidanalgetika ungenügend ist, die aber auf Opioide ansprechen. Ebenso sollte der Anteil der Patienten mit umgekehrtem Ansprechen ermittelt werden. Möglicherweise gibt es eine Form von CNTS, die nicht auf Nichtopioidanalgetika anspricht, sehr wohl aber auf Opioide und umgekehrt.