Hintergrund und Fragestellung

Lumbale Rückenschmerzen sind ein epidemiologisch, gesundheitsökonomisch und durch Arbeitsausfälle ein volkswirtschaftlich bedeutsames Gesundheitsproblem. Sie sind vom Sachverständigenrat 2001 explizit als ein Bereich benannt worden, in dem es ein Nebeneinander von Über-, Unter- und Fehlversorgung gibt [1]. Daher ist die Versorgung von Patienten mit Rückenschmerzen prädestiniert für Qualitätssicherungsmaßnahmen.

Die ersten Schritte dazu sind Monitoring und Bewertung der Qualität mit Qualitätsindikatoren (QI) in bestimmten Versorgungsbereichen. Kriterien für QIs sind in Tab. 1 wiedergeben [2]. Die Kassenärztliche Bundesvereinigung hat im Rahmen des Projekts Ambulante Qualitätsindikatoren und Kennzahlen (AQUIK®) Vorschläge zur Qualitätsmessung erarbeitet [3]. Ziel des Projektes ist die Erprobung und Etablierung eines validen, transparenten Satzes von QIs und Kennzahlen für die vertragsärztliche Versorgung. Als Grundlage wurden international verfügbare Indikatorensets recherchiert, in einer Datenbank erfasst, bewertet und hinsichtlich ihrer Übertragbarkeit auf das deutsche Versorgungssystem überprüft. Auf dieser Grundlage wurden 65 Indikatoren ausgewählt, die ein 2-stufiges Bewertungsverfahren durch Fachgruppenexperten (RAND/UCLA-Methode [4]) durchlaufen haben. Das so konsentierte Set umfasst 48 sowohl fachgruppenübergreifende als auch fachgruppenspezifische Indikatoren für die ambulante Versorgung, deren Relevanz und Machbarkeit durch die Experten bewertet wurde.

Tab. 1 Anforderungen an Eigenschaften von Qualitätsindikatoren [2]

Im Folgendem sollen die 3 AQUIK-Indikatoren im Bereich Rückenschmerzen kritisch in Bezug auf ihre Eignung zur Qualitätsmessung bewertet werden (Tab. 2;, [3]). Bei den Indikatoren wurde in Anlehnung an die Leitlinien [5, 6] der Begriff Kreuzschmerzen anstatt Rückenschmerzen gewählt.

Tab. 2 AQUIK®-Indikatoren zum Bereich Kreuzschmerzen

Material und Methoden

Die 3 vorgeschlagenen QIs werden in Bezug auf ihre Evidenzbasierung, Umsetzbarkeit und Epidemiologie bewertet. Dazu werden die den QIs zugrunde liegenden deutschen Leitlinien, Originalliteratur bzw. systematische Reviews sowie Ergebnisse von Surveys und Beobachtungsstudien zur Leitlinienadhärenz bei Rückenschmerzen herangezogen. Wenn immer möglich, werden deutsche Daten zur Versorgungsepidemiologie genutzt. Zusätzlich fließt die Erfahrung des Autors bei der Erfassung und Klassifizierung von Rückenschmerzen aus mehreren Forschungsprojekten ein. Auf den Einsatz eines formalen Instrumentes zur Evaluation von QIs, wie z. B. dem von der Bundesstelle für Qualitätssicherung (BQS) vorgeschlagenen QUALIFY-Instrument, wurde verzichtet, da mangels Studien zur Umsetzung der QIs in vielen Bereichen keine Aussage gemacht werden kann.

Ergebnisse

Indikator Kreuzschmerz – Alarmzeichen

Wichtigstes Ziel der Diagnostik bei akuten Rückenschmerzen ist es, schwere Pathologien mit raschem diagnostischem oder therapeutischem Handlungsbedarf zu erkennen. Da Rückenschmerzen häufig und schwere Pathologien in der ambulanten Versorgung selten sind, ist es notwendig, weiterführende Diagnostik durch Anamnese und körperliche Untersuchung sinnvoll zu begrenzen. Eine Ausschlussdiagnostik sensu stricto ist aus prinzipiellen Gründen nicht möglich. Es kann lediglich durch den Umfang der Untersuchungen die Wahrscheinlichkeit, dass eine bestimmte Erkrankung vorliegt, verringert werden. Dazu wurde von der Clinical Standards Advisory Group das Konzept der „red flags“ entwickelt und in fast allen nationalen und internationalen Leitlinien übernommen (Tab. 3; [5, 6]). Daher schlägt AQUIK die Erfassung der „red flags“ als QI vor und bewertet diesen Indikator als relevant und machbar (Tab. 2). Diese Einschätzung der Experten berücksichtigt die Epidemiologe und Evidenz leider nur unzureichend.

Tab. 3 Warnhinweise („red flags“) auf komplizierte/spezifische Rückenschmerzen

Das Konzept der „red flags“ beruht ausschließlich auf klinischen Überlegungen und ist epidemiologisch nicht ausreichend validiert [7, 8]. Was genau zu den „red flags“ zählt und wie die Randbedingungen definiert werden, wird in den Leitlinien ohne Begründung sehr unterschiedlich definiert. Bei der Auswahl der „red flags“ in Tab. 2 handelt es sich um eine Zusammenstellung aus mehreren Leitlinien. Als Beispiel für ein problematisches „red flag“ sei das Kriterium „Alter unter 20 Jahre und Alter über 50 Jahre“ genannt. Der klinische Hintergrund hierfür ist der, dass bei Kindern Entwicklungsstörungen vorliegen könnten und bei Erwachsenen mit zunehmendem Alter die Wahrscheinlichkeit steigt, dass Metastasen oder osteoporotische Frakturen vorliegen könnten. Studien zur Qualitätsbeurteilung der Versorgung von Rückenschmerzen, die verschiedene Altersgrenzen (50 bzw. 70 Jahre) als „red flag“ streng benutzen, kamen zu dem kritisierten Schluss, dass Patienten außerhalb dieses Altersbereich ohne Bildgebung keine ausreichende Versorgung erhalten hätten [9, 10]. Dieser Interpretation liegt die Fehlinterpretation der Leitlinien zugrunde, dass ein „red flag“ quasi automatisch zur weiterführenden Diagnostik verpflichtet. Rückenschmerzen sind sowohl bei Kindern als auch älteren Erwachsenen sehr häufig, daher ist Alter alleine als Kriterium zur Indikation weiterführender Diagnostik ungeeignet. Leitlinien empfehlen daher bei „red flags“ keinen Handlungsautomatismus, sondern nur eine erhöhte Aufmerksamkeit. Die Wertung der Befunde und Konsequenzen daraus bleibt dabei der individuellen ärztlichen Expertise überlassen.

Schwere Traumen oder gravierende Paresen werden bei uns im Regelfall sofort in spezialisierten Zentren behandelt und stellen auch kein diagnostisches Problem dar. Manche der „Red-flag-Pathologien“ sind sowohl in der ambulanten als auch der stationären Versorgung so selten, dass die meisten Hausärzte und Orthopäden diese selten oder nie sehen. Für das Cauda-equina-Syndrom wird eine Inzidenz (Neuerkrankungsrate) 1,5–3,4:1.000.000 geschätzt [11]. Die Inzidenz für die Spondylodiszitis wird auf 1:250.000 geschätzt, dürfte aber im ambulanten Bereich deutlich niedriger liegen [12]. Die dazu im Vergleich häufige ankylosierende Spondylarthritis hat eine Inzidenz von ca. 6–7:100:000 [13]. Wichtiges Kriterium ist hier der seit 12 Wochen anhaltende Schmerz. Die Forderung nach einer generellen Abklärung von Kreuzschmerzen auf das Vorliegen einer Spondylarthritis ist insofern problematisch, als sich der QI auf Patienten mit akuten Rückenschmerzen bezieht, definiert als weniger als 4 Wochen Schmerzen. Der Nutzen der Kombination mehrerer Kriterien für ein generelles Screening auf entzündliche Spondylarthropathien bei akuten Rückenschmerzen ist wegen der geringen Spezifität nicht belegt [14].

Die einzelnen „red flags“ haben nur eine geringe Sensitivität und Spezifität, oder aber die Erkrankungen, auf die sie sich beziehen, sind teilweise so selten, dass eine Angabe der Testgütekriterien nicht möglich ist. Bei ca. 10% der Patienten in der Primärversorgung werden „red flags“ vermutet, sie bestätigen sich dann aber nur bei deutlich weniger als 1% [15, 16]. Eine systematische Dokumentation z. B. von Blasen-, Mastdarmschwäche oder Fieber bei Rückenschmerzen ist derzeit nicht Standard in der ambulanten Versorgung. Eine Erfassung für eine Qualitätsmessung wäre nur bei elektronischer Datenerhebung möglich. Selbst wenn es z. B. wie bei den etablierten Disease-Management-Programmen elektronische Formulare gäbe, auf denen eine „Red-flag-Checkliste“ abgehakt werden könnte, wäre der Nutzen für die Qualität der Versorgung im Verhältnis zum Aufwand zweifelhaft. Sie würde angesichts der Epidemiologie von den meisten Ärzten als sinnleere bürokratische Übung erlebt werden. Daher kann der Schlussfolgerung des AQUIK-Experten-Panels auch in dem Punkt Machbarkeit nur eingeschränkt zugestimmt werden.

Die „red flags“ sind wichtige diagnostische Hinweise, die in Kombination mit nur schwer zu operationalisierender ärztlicher Erfahrung und Intuition helfen können, ernste Pathologien zu erkennen. Das Vorhandensein einzelner „red flags“ ist nur eingeschränkt handlungsbegründend. Der Nutzen und die Notwendigkeit der routinemäßigen Erfassung und Dokumentation von „red flags“ sind bisher nicht ausreichend belegt.

Indikator Kreuzschmerz – Bildgebung

Ein Nutzen routinemäßiger bildgebender Untersuchungen bei Rückenschmerzen ohne klinische Warnhinweise ist aufgrund der im Allgemeinen guten Prognose und der geringen Konsequenzen für die Therapiesteuerung in den ersten 6 Wochen nicht nachweisbar [17] und wird deshalb von Leitlinien nicht empfohlen [5, 6]. Bildgebung kann den Heilungsverlauf ungünstig beeinflussen [18]. Aus diesen sowie ökonomischen und strahlenhygienischen Gründen ist eine sinnvolle Begrenzung notwendig. Auch nach 6 Wochen ist der Nutzen für die Steuerung der Therapie durch Bildgebung gering [19]. Das in den Leitlinien verwendete Zeitkriterium 4 bzw. 6 Wochen, innerhalb derer ohne Vorliegen von Warnhinweisen keine Bildgebung empfohlen wird, wird oft missverstanden in dem Sinne, dass nach 6 Wochen eine Bildgebung zu erfolgen hat. Dafür gibt es keine Evidenz, darum wird diese Aussage so auch von keiner Leitlinie getroffen. Hier gilt wiederum die individuelle ärztliche Expertise um den Nutzen einer Bildgebung für die Therapiesteuerung abzuschätzen.

AQUIK schlägt den Anteil von Patienten mit akuten Rückenschmerzen, die keine Bildgebung bekommen, als QI vor, ohne diesen näher zu definieren (Tab. 2). Dies muss vor dem Hintergrund gesehen werden, dass der Anteil der Patienten, die eine Bildgebung bei Rückenschmerzen erhalten, in Deutschland im Vergleich mit anderen westlichen Industrienationen extrem hoch liegt [20]. Unterversorgung spielt bei der Bildgebung fast keine Rolle. Bei der Umfrage des Gesundheitsmonitors 2009 gaben von 199 Patienten, die in den letzten 3 Monaten wegen Rückenschmerzen beim Arzt waren, 78% an, ein Röntgenbild, 56%, eine Computertomographie, und 11%, ein MRT bekommen zu haben [21]. Klinische Faktoren wie Schmerzstärke, -dauer oder -ausstrahlung spielen bei der Bildgebung in einer großen deutschen Beobachtungsstudie nur eine untergeordnete Rolle [20]. Zum Vergleich: In einer spanischen Beobachtungsstudie erhielten innerhalb von 4 Monaten nur 15% ein Röntgenbild und 2% eine Computertomographie bzw. Magnetresonanztomographie [22], in einer niederländischen Studien nur 2% eine Bildgebung [23], in einer kanadischen Studie mit Patienten mit chronischen Rückenschmerzen nur 30% eine Bildgebung [20]. Auch unter Berücksichtigung der unterschiedlich strukturierten Gesundheitssysteme legt dies den Schluss nahe, dass eine strengere Indikationsstellung zur Bildgebung in Deutschland zu substanziellen Einsparungen führen könnte, ohne die Versorgung zu verschlechtern. Es ist daher nicht nachvollziehbar, warum die Relevanz dieses QIs von den AQUIK-Experten als unsicher eingestuft wurde.

Problematisch an diesem Indikator ist die Beschränkung auf akute Rückenschmerzen, definiert als 4 Wochen andauernde Schmerzen. Diese Schmerzdauer lässt sich in der Praxis nur schwer zuverlässig erfassen. Akute Rückenschmerzen, im engeren Sinne „erstmals neu aufgetretene Rückenschmerzen“, sind im ambulanten Bereich extrem selten. Die Mehrheit der konsultierenden Patienten hat rezidivierende Schmerzen mit schmerzfreien Intervallen oder chronische Schmerzen mit wechselnder funktioneller Beeinträchtigung. Viele Patienten haben schon lange vor der Konsultation Schmerzen, und es ist unklar, ab welchem schmerzfreien Intervall von einer neuen Schmerzepisode ausgegangen werden soll. Für die große Patientengruppe mit chronisch rezidivierenden Rückenschmerzen gibt es keine präzise Leitlinienempfehlung, ob überhaupt oder in welchen Zeitabständen eine Bildgebung empfehlenswert ist.

Daher ist nur eine globale Erfassung des Anteils der Patienten, die eine Bildgebung bei Rückenschmerzen erhalten, sinnvoll. Die notwendigen Abrechnungsdaten stehen bereits zur Verfügung und können leicht elektronisch auf Praxisebene ausgewertet werden. Als Orientierung für einen Zielbereich für den akzeptablen Anteil von Patienten mit bestimmten ICD-Codes, die eine Bildgebung erhalten, können sowohl nationale als auch internationale Daten der Versorgungsforschung genutzt werden. Abweichend vom AQUIK-Experten-Panel wird dieser QI als umsetzbar eingestuft. Er wird z. B. vom amerikanischen National Committee for Quality Assurance (NCQA) verwendet.

Indikator Kreuzschmerz – Arbeitsunfähigkeit

Ausfallzeiten durch Arbeitsunfähigkeit sind volkswirtschaftlich relevant, deshalb wird die Vermeidung von Arbeitsausfallzeiten als Indikator für Ergebnisqualität vorgeschlagen (Tab. 2). Arbeitsunfähigkeitsbescheinigungen gehören in den administrativen Bereich und werden daher von Leitlinien kaum thematisiert.

Die Annahme, dass eine qualitativ hochwertige (= evidenzbasierte) Versorgung von Rückenschmerzpatienten zu einer Reduktion der volkswirtschaftlich relevanten Arbeitunfähigkeitszeiten führt, ist nicht gut belegt [24]. Trotz der Erleichterung der Arbeitsplatzbedingungen in den Industrienationen in den letzten Jahrzehnten ist die Prävalenz von Rückenschmerzen nicht zurückgegangen [25]. Vergleichende Untersuchungen in verschiedenen Ländern zeigen deutlich, dass Rückenschmerzen überall auf der Welt häufig sind. Das Ausmaß der Beeinträchtigung der Erwerbsfähigkeit durch Rückenschmerzen wird jedoch wesentlich durch die sozialen Sicherungssysteme geprägt [26]. Die Arbeitsunfähigkeit wird neben der ärztlichen Versorgung stark von therapeutisch nicht beeinflussbaren Faktoren wie arbeitsplatzbezogenen Merkmalen, Persönlichkeitsstruktur und der gesamtwirtschaftlichen Lage sowie Geschlecht und Alter beeinflusst [27]. Im Regelfall ist es für Ärzte schwierig, die reale körperliche Leistungsfähigkeit eines Patienten, die exakten beruflichen Anforderungen und deren Verhältnis zueinander zu bestimmen. Insbesondere Arbeitsunzufriedenheit führt zu einer subjektiven Überschätzung der objektiven Arbeitsbelastung [28]. Das Behandlungsergebnis ist somit nur eingeschränkt durch Ärzte zu beeinflussen. Zu Recht wurde dieser QI von den AQUIK-Experten als nicht umsetzbar eingestuft.

Diskussion

Trotz umfangreicher Forschung auf dem Gebiet der Rückenschmerzen und mehrerer darauf aufbauender nationaler und internationaler evidenzbasierter Leitlinien ist die Ableitung valider und praktikabler QIs für die Versorgung schwierig. Die Expertenrunde hat 2 von 3 QIs als nicht umsetzbar beurteilt. Trotz des 2-stufigen Beratungsverfahrens wurden wichtige Aspekte der Epidemiologie, Operationalisierbarkeit und Nutzbarkeit von Routinedaten nicht ausreichend berücksichtigt, sodass der Autor bei 2 QIs zu einer abweichenden Bewertung kommt.

Unter Qualität der Versorgung von Patienten mit Rückenschmerzen wird im Allgemeinen Adhärenz an evidenzbasierte Leitlinien verstanden. Die Kriterien zur Beurteilung der Leitlinienadhärenz in Surveys und Beobachtungsstudien sind heterogen, oft unklar definiert oder sehr häufig nur negativ (z. B. keine Bildgebung oder keine Physiotherapie in den ersten 4–6 Wochen). Für viele Versorgungsaspekte von Rückenschmerzen machen Kreuzschmerzleitlinien mangels Evidenz keine präzise Aussage. Der angenommene Standardpatient der Leitlinien mit akuten Beschwerden und die daraus abgeleiteten Handlungsparadigmen sind auf die Versorgungsrealität nur eingeschränkt übertragbar und nur schwer in wenige eindeutige Kategorien operationalisierbar. Klinische Daten werden bei der Beurteilung der Adhärenz in Surveys und Beobachtungsstudien kaum berücksichtigt, weil sie nur schwer gut auswertbar zu erheben sind [29]. Der schon in Studien schwierig durchzusetzende Dokumentationsaufwand ist in die Routineversorgung nur schwer zu erreichen.

So wundert es nicht, dass die Surveys und Beobachtungsstudien zur Leitlinienadhärenz bei Rückenschmerzen den Ärzten meistens ein schlechtes Zeugnis ausstellen [29]. Nur Beobachtungsstudien mit umfangreicher Erfassung klinischer Parameter, die weit über die Routinedokumentation hinausgehen, konnten eine befriedigende Leitlinienadhärenz feststellen, da Abweichungen meist als klinisch begründet nachvollzogen werden konnten [23]. Daher ist nur die Nutzung von Routinedaten, wie sie bei der Bildgebung vorliegen, mit einem an Versorgungsdaten orientierten Zielbereich als QI für den Versorgungsprozess aussichtsreich.

Für das angestrebte Ziel des Qualitätsmanagements „Verbesserung der Versorgung von Patienten“ werden QIs, die sich auf Behandlungsergebnisse beziehen, benötigt. Zusätzlich werden Möglichkeiten für Praxen mit epidemiologischen Besonderheiten benötigt und um Sonderfälle unkompliziert als Ausnahmen („drop out“) zu markieren. Erfahrungen in Großbritannien haben gezeigt, dass Ärzte die Möglichkeit, diese Patienten so aus der Bewertung herauszunehmen, nicht missbrauchen. Der einzige von AQUIK vorgeschlagene Ergebnisindikator „Arbeitsunfähigkeitszeiten“ ist aber von den Gesundheitsversorgern nur eingeschränkt beeinflussbar. Angesicht der geringen Evidenz zur Effektivität einer leitlinienorientierten Versorgung auf andere Behandlungsergebnisse wie Schmerz und Funktionskapazität sind diese als QI nicht geeignet [24]. Einsparungen durch Reduktion von Über- und Fehlversorgung durch ein Benchmarking mit Prozessindikatoren wie Bildgebung sind ein erreichbares Ziel.

Schlussfolgerung

Die Messung der Versorgungsqualität von Rückenschmerzpatienten zur rationalen Steuerung ist angesichts der enormen Fehlversorgung und der damit assoziierten Kosten ein sinnvolles Ziel. Dies erfordert die Entwicklung von QIs, die sich auf relevante, operationalisierbare und von den Ärzten zu beeinflussende Gebiete beschränken. Pragmatische Zielbereiche mit definiertem Mindest- oder Höchstanteil sowie Basierung auf versorgungsepidemiologischen Daten sind aufwendigen und komplizierten Einzelfallbewertungen vorzuziehen. Der Nutzen von Indikatoren muss in Feldstudien gesichert sein, bevor sie zur Steuerung der Versorgung z. B. in Form von Zu- oder Abschlägen beim Honorar eingesetzt werden.

Fazit für die Praxis

  • Monitoring der Versorgungsqualität bei Rückenschmerzen ist aus versorgungsepidemiologischen Gründen notwendig.

  • Valide und praktisch umsetzbare Qualitätsindikatoren für die Versorgung von Rückenschmerzpatienten sind aus Leitlinien nur schwer abzuleiten.

  • Eine Einzelfallbewertung diagnostischer und therapeutischer Maßnahmen ist aus pragmatischen Gründen nicht sinnvoll.

  • Alarmzeichen („red flags“) sind für einen Qualitätsindikator nicht ausreichend gut operationalisierbar und in der ambulanten Versorgung zu selten.

  • Bildgebung bei Rückenschmerzen ist wegen der im internationalen Vergleich extremen Überversorgung und der bereits zur Verfügung stehenden Abrechnungsdaten ein geeigneter und umsetzbarer Qualitätsindikator.