Leitlinien haben sich zu einer wichtigen Informationsquelle entwickelt, um Ärzte bei diagnostischen und therapeutischen Entscheidungen zu unterstützen. Mit evidenzbasierten Managementstrategien helfen sie Ärzten, den Patienten eine hochwertige Versorgung anzubieten und damit letztendlich die Gesundheit der Patienten zu verbessern.

Dem Leser und Anwender fällt es oft schwer, die Entscheidungen der Leitliniengruppen nachzuvollziehen

Dass Leitlinien in der evidenzbasierten Medizin verankert sein sollten, ist heute Allgemeingut. Leitlinienorganisationen und medizinische Fachgesellschaften haben weltweit beträchtliche Energie, Zeit und Ressourcen investiert, um strukturierte Vorgehensweisen zur Erfüllung der gesteckten Ziele zu entwickeln [18]. Diese Bemühungen haben die Entwicklung einer wissenschaftlichen Methodik für die Leitlinienerstellung vorangetrieben und zu internationalem Konsens über die grundsätzlichen Anforderungen beigetragen, die „gute“ Leitlinien erfüllen sollten [1, 3, 4, 6, 20, 26, 30]. Allerdings werden noch sehr unterschiedliche Schemata zur Darstellung der Qualität der Evidenz und der daraus abgeleiteten Leitlinienempfehlungen verwendet, die weder in der Bewertung der Evidenz transparent sind, noch eine Trennung der Evidenzbewertung von der Empfehlung zulassen. Dies macht es dem Leser und Anwender schwer, Leitlinien verschiedener Arbeitsgruppen zu vergleichen oder die Entscheidungen der Leitliniengruppen nachzuvollziehen.

Diese Heterogenität und oft mangelnde Transparenz lieferte im Jahre 2000 den Ausschlag für die Entstehung der GRADE Working Group (Grades of Recommendation, Assessment, Development and Evaluation; http://www.gradeworkinggroup.org). Diese internationale Gruppe von Leitlinienexperten, Methodikern und Klinikern hatte sich die Entwicklung eines umfassenden und in sich konsistenten Konzepts zur Erstellung von Leitlinien auf die Agenda gesetzt [12]. Die Arbeitsgruppe war in der glücklichen Lage, sich bei der Entwicklung des GRADE-Systems auf die Erfahrung und Fachkenntnis von internationalen Leitlinienentwicklern zu stützen, die bei der Entstehung mitarbeiteten. Die inzwischen breite Akzeptanz des Konzepts und seine Aneignung von anerkannten Leitlinienorganisationen und medizinischen Fachgesellschaften wie der WHO, des National Institute of Health and Clinical Excellence (NICE), der Agency for Healthcare Quality and Research (AHRQ), der Canadian Agency for Drugs and Technology in Health (CADTH), des American College of Physicians, der American Thoracic Society, von Organisationen wie der Cochrane Collaboration oder Herausgebern prominenter Informationsquellen wie dem elektronischen Lehrbuch „UpToDate“ und „Clinical Evidence“ legen den Schluss nahe, dass die Leitlinienwelt (und hoffentlich auch die Ärzte und Patienten) das Konzept hilfreich findet.

In diesem Artikel beschreiben wir die Grundpfeiler und Hauptmerkmale des GRADE-Systems, verweisen den Leser aber auch auf detaillierte Darstellungen für Vertiefungsstudien [11, 12, 21, 22, 23, 24].

Grundlagen des Grade-Systems

Das GRADE-System beruht auf folgenden Prinzipien:

  • Explizite Unterscheidung zwischen der Qualität der Evidenz und der Stärke einer Empfehlung.

  • Bewusstsein, dass sich alternative Behandlungsstrategien auf vielfältige patientenrelevante Endpunkte auswirken. Diese Auswirkungen gehen fast immer mit Vorteilen und Nachteilen in den einzelnen Endpunkten einher.

  • Bewusstsein, dass Empfehlungen immer Wertvorstellungen beinhalten.

  • Betrachtungen von Kosten als Bestandteil der Abwägung zwischen den positiven und negativen Konsequenzen einer Maßnahme.

  • Entwicklung eines einfachen und gut handhabbaren Systems.

Das GRADE-System unterscheidet bei der Leitlinienentwicklung grundsätzlich 2 Schritte: Erstens die Betrachtung der Qualität der Datenlage, zweitens die Entwicklung von abgestuften Empfehlungen. Da Kliniker ihre Aufmerksamkeit insbesondere auf die Empfehlungen in einer Leitlinie richten, beginnen wir in diesem Artikel über das GRADE-System in Teil A mit den Empfehlungen und Empfehlungsstärken. In diesem Teil schildern wir unterschiedliche Empfehlungsstärken und wie man auf transparente Weise den Bogen von der Evidenz zur Empfehlung schlägt, gefolgt von einer Diskussion über die Qualitätsbewertung der Evidenz in Teil B. Wir veranschaulichen die Konzepte mit Beispielen aus der internistischen Praxis.

Teil A – Empfehlungen und Empfehlungsstärken

Das GRADE-System kennt 2 Kategorien: starke und abgeschwächte Empfehlungen. Jede Kategorie kann sich – im Vergleich zu einer alternativen Vorgehensweise – für oder gegen eine Maßnahme aussprechen.

Für GRADE bedeutet die Stärke einer Empfehlung: Wie sicher ist sich die Leitliniengruppe, dass die wünschenswerten Konsequenzen einer Behandlung ihre unerwünschten Folgen überwiegen? Wünschenswerte Konsequenzen reduzieren Mortalität und Morbidität, verbessern die Lebensqualität, reduzieren unangenehme Effekte, Nebenwirkungen oder den Ressourcenverbrauch (Kosten).

  • Mit einer starken Empfehlung drückt eine Leitliniengruppe ihre Zuversicht aus, dass die positiven Konsequenzen einer Maßnahme die unerwünschten klar überwiegen.

  • Eine abgeschwächte Empfehlung kommuniziert, dass die Abwägung weniger eindeutig ausfällt: Folgt man der Empfehlung, werden die positiven Konsequenzen die unerwünschten vermutlich überwiegen, aber der Gesamtnutzen ist weniger eindeutig.

Dabei ist natürlich die Wortwahl „stark“ und „abgeschwächt“ zweitrangig, vielmehr ist die Kategorisierung in 2 Stufen entscheidend.

Viele Leitliniengruppen stufen ihre Empfehlungen in 3, 4 oder mehr Kategorien ab und integrieren manchmal sogar eine zusätzliche Kategorie für eine Expertenmeinung. Warum begrenzt sich GRADE auf 2 Stufen? Klarheit und Einfachheit hatten eine hohe Priorität bei den selbst gesetzten Vorgaben, und die GRADE-Gruppe empfand es als sehr schwierig, die vorhandenen Nuancen von Unsicherheit zwischen den einzelnen Stufen in konkrete Handlungskonsequenzen für Ärzte und Patienten zu übersetzen.

Faktoren mit Einfluss auf Stärke einer Empfehlung

Viele Leitlinienorganisationen teilen die Ansicht, dass hochwertige Evidenz nicht automatisch in eine starke Empfehlung münden muss. Wenige jedoch machen den Prozess, wie man Evidenz in eine Empfehlung übersetzt, transparent. Das GRADE-System hat 4 Schlüsselfaktoren identifiziert, die zu berücksichtigen sind, um Richtung wie Stärke einer Empfehlung zu bestimmen.

Faktor 1: Qualität der Evidenz

Die Evidenz von Studien mit robuster Studienmethodik mündet mit größerer Wahrscheinlichkeit in eine starke Empfehlung. Zum Beispiel zeigt eine Metaanalyse aus hochwertigen randomisierten kontrollierten Studien (RCT) bei Patienten mit Herzinfarkt (n=54.234) eine Senkung der Langzeitmortalität von 23% (95%-KI: 15–31%) infolge einer β-Blockertherapie im Vergleich zur Placebobehandlung [8]. Diese direkte konsistente Evidenz mit engem Konfidenzintervall und geringem Risiko für Publikationsbias verleiht großes Vertrauen in den geschätzten Effekt und die Qualität der Evidenz. Dagegen ist zum Beispiel die Evidenzlage für den Nutzen von Kompressionsstrümpfen zur Prophylaxe von tiefen Beinvenenthrombosen bei Langstreckenflügen trotz des großen Effekts viel schwächer [5]: In den analysierten Studien waren die Randomisierung nicht maskiert, die Diagnose der Thrombosen nicht reproduzierbar und die Studien nicht verblindet. Diese methodischen Schwächen stellen die Glaubwürdigkeit der Effektschätzung in Frage und bedingen nur eine abgeschwächte Empfehlung. In Teil B werden wir verschiedene Aspekte der Qualitätsbewertung weiter vertiefen.

Faktor 2: Abwägung wünschenswerter und unerwünschter Behandlungsfolgen

Gelegentlich sprechen Leitliniengruppen starke Empfehlungen aus, obwohl nur Evidenz von niedriger Qualität vorliegt, wie z. B. die Empfehlung der Anwendung von Oseltamivir bei Patienten mit bestätigter oder sehr wahrscheinlicher Infektion mit Influenza A H5N1 (Vogelgrippe). Trotz der sehr schwachen Evidenzlage für den Nutzen des Oseltamivir bedeutet die (wenn auch geringe) Möglichkeit, eine Erkrankung mit sehr hoher Mortalität zu behandeln, einen erheblichen Nutzen, während Kosten und Risiko der einmaligen Behandlung im Einzelfall in Abwesenheit einer Pandemie vernachlässigbar sind. Dies begründet eine starke Empfehlung, welche insbesondere auch wahrscheinliche Wertvorstellungen der betroffenen Patienten berücksichtigt.

Faktor 3: (Un)sicherheit bei den Werten und Präferenzen

Eine dritte Determinante für die Stärke einer Empfehlung sind Wertvorstellungen und Präferenzen der von der Empfehlung Betroffenen. Patienten können die Folgen einer Erkrankung, die Komplikationen einer Therapie, die Bürde der Behandlung oder die entstehenden Kosten sehr unterschiedlich bewerten. Denken Sie z. B. an eine schwangere Frau mit tiefer Beinvenenthrombose, die eine Vollantikoagulation benötigt. Die Standardtherapie mit Phenprocoumon (Marcumar®) bedeutet für den Feten in der frühen Schwangerschaft ein leicht erhöhtes Risiko für relativ geringfügige Entwicklungsabnormalitäten. Die Alternative, die Prophylaxe mit Heparin, beseitigt das Risiko für das Kind, allerdings mit dem Nachteil von Schmerzen durch die Injektionen, Unannehmlichkeiten und Kosten. Vor diesem Hintergrund entscheidet sich die überwältigende Mehrheit der informierten Frauen für Heparin, um fetale Komplikationen zu vermeiden. Diese einheitliche Wertvorstellung der Patientinnen rechtfertigt eine starke Empfehlung zugunsten der Heparinprophylaxe.

Anders dagegen die Situation bei einem 40-jährigen Mann mit idiopathischer tiefer Beinvenenthrombose. Nach 6- bis 12-monatiger Antikoagulation stellt sich die Frage nach langfristiger Prophylaxe. Eine langfristige Antikoagulation senkt sein absolutes Risiko für ein Rezidiv für mehrere Jahre, wenn auch weniger ausgeprägt als in der frühen Phase. Die Nachteile der Behandlung sind jedoch unverändert: tägliche Tabletteneinnahme, Diätvorschriften zur konstanten Vitamin-K-Aufnahme, regelmäßige Bluttests und das ständige Bewusstsein eines erhöhten Blutungsrisikos. Patienten, die das Risiko eines Thromboserezidivs als belastend empfinden, werden die Vorteile der Phenprocoumon- (Marcumar®-) Therapie ausreichend hoch einschätzen, um die Nachteile in Kauf zu nehmen. Patienten, welche die Nachteile der Antikoagulation in ihrer Lebensqualität sehr beeinträchtigt, werden eher das Risiko eines Thromboserezidivs akzeptieren. Die unterschiedlichen Patientenpräferenzen führen – trotz hochwertiger Evidenzlage – zu einer abgeschwächten Empfehlung zugunsten der langfristigen Antikoagulation.

Die zu berücksichtigenden Patientenpräferenzen sollten systematisch erfasst werden

Aus diesem Grund sollten vor der Entwicklung von besonders wertsensitiven Leitlinienempfehlungen die zu berücksichtigenden Patientenpräferenzen systematisch erfasst und explizit dargelegt werden. Bei der Anwendung von Leitlinienempfehlungen in der Behandlungsroutine (s. unten) profitieren Patienten möglicherweise von strukturierten Entscheidungshilfen, um die Behandlung zu finden, die ihren persönlichen (Wert-) Vorstellungen am besten entspricht [16].

Faktor 4: Auswirkungen auf die Ressourcen

Der letzte Faktor, der die Stärke einer Empfehlung beeinflusst, ist der Verbrauch an Ressourcen, bzw. die Kosten der Intervention. Verglichen mit den anderen Kriterien sind Kosten über einen Zeitraum oder geographische Regionen hinweg viel weniger stabil, und die Bedeutung eines gegebenen Kosten-Nutzen-Verhältnisses kann zwischen Gesundheitssystemen erheblich variieren. Entsprechend sind Empfehlungen, bei denen Kosten eine wichtige Rolle spielen, sehr kontext-sensitiv, und Leitliniengruppen, die Kosten berücksichtigen, sollten explizit den Kontext der Empfehlung und die zugrunde gelegte Perspektive benennen.

Starke und abgeschwächte Empfehlungen

  • Starke Empfehlungen in Leitlinien drücken aus, dass die wünschenswerten Behandlungsfolgen mit hoher Wahrscheinlichkeit potenzielle unerwünschte Effekte überwiegen.

  • Bei abgeschwächten Empfehlungen ist sich die Leitliniengruppe in ihrer Einschätzung weniger sicher.

Welche Konsequenzen haben diese Aussagen für die Patientenbehandlung in der Routine? Für Patienten bedeutet eine starke Empfehlung, dass die Leitlinienautoren davon ausgehen, dass die überwiegende Mehrzahl der Betroffenen bei voller Informiertheit die gleiche Wahl treffen würde. Für Ärzte beinhaltet eine starke Empfehlung, dass die Leitlinienautoren davon überzeugt sind, dass die betroffenen Patienten die Intervention erhalten sollten und die Patienten entsprechend zu beraten sind. Selbstverständlich gilt auch hier – wie bei allen Leitlinienempfehlungen –, dass im Einzelfall zu entscheiden ist, ob der individuelle Patient in seiner spezifischen Situation von einer „starken Empfehlung“ profitiert.

Entscheidungsträger auf der Systemebene können aus einer starken Empfehlung schließen, dass ihre Befolgung als Qualitätsindikator geeignet wäre und dass die Leitlinienautoren davon überzeugt sind, dass die betroffenen Patienten die Intervention erhalten sollten und die Patienten entsprechend zu beraten sind.

Im Gegensatz dazu bedeutet eine abgeschwächte Empfehlung, dass nach Vorstellung der Leitlinienautoren zwar die Mehrheit der Patienten die Empfehlung übernehmen, aber ein nicht unerheblicher Anteil eine andere Behandlung wählen würde.

Für Ärzte und weitere professionelle Adressaten bedeuten abgeschwächte Empfehlungen, dass bei der vorhandenen Evidenzlage zwar eine Mehrheit der Patienten die Empfehlungen befolgen würde, die verbleibende Unsicherheit und die möglicherweise weit auseinander gehenden Wertvorstellungen informierter Patienten jedoch Abweichungen in größerem Umfang rechtfertigen würden.

Entscheidungsträger auf der Systemebene sollten eine abgeschwächte Empfehlung nur insofern als Qualitätskriterium übernehmen, als dass eine dokumentierte Diskussion über die Handlungsalternativen, die von der Empfehlung beschrieben werden, im Einzelfall zwischen Arzt und Patient stattgefunden haben sollte.

Teil B – Qualitätsbewertung der Evidenz

Ausgangspunkt für die Qualitätsbewertung der einer Leitlinienempfehlung zugrunde liegenden Evidenz ist eine strukturierte Frage im PICO-Format, welche die Population, die Intervention(en), die Vergleichsintervention(en) (Comparisons) und die zu betrachtenden Endpunkte beschreibt [13]. Idealerweise findet eine Leitliniengruppe die Antworten in einem aktuellen systematischen Review. Fehlt ein geeignetes systematisches Review, muss sich die Gruppe selbst bemühen, die vorhandene Evidenz zu identifizieren, in systematischer Weise zusammenzustellen und zu bewerten.

Bereits vor Beginn des Bewertungsprozesses legt die Leitliniengruppe die patientenrelevanten Endpunkte fest, die sie für die Bewertung der Intervention heranziehen möchte. Physiologische Endpunkte, Surrogat- und Prozessparameter werden den patientenrelevanten Endpunkten als indirekte Evidenz (s. unten) beigeordnet. Das GRADE-System differenziert zwischen

  • Endpunkten, die für die Entscheidungsfindung essenziell sind,

  • Endpunkten, die wichtig sind,

  • Endpunkten, die von begrenzter Bedeutung sind.

„Essenziell für die Entscheidungsfindung“ bedeutet, dass die sorgfältige Abwägung dieser Endpunkte den Ausschlag über Stärke und Richtung der Empfehlung gibt. „Wichtige Endpunkte“ werden bei der Empfehlung zwar berücksichtigt, sie sind aber nicht letztendlich bestimmend. Die Bewertung der Qualität der Evidenz erfolgt im ersten Schritt getrennt für jeden als relevant ermittelten Endpunkt. Die sich dabei ergebende getrennte Darstellung der Evidenzbewertung in „benötigte Information“ und „vorhandene Evidenz“ hilft, wesentliche Evidenzlücken zu benennen. Ein Beispiel für eine Hierarchie von patientenrelevanten Endpunkten für Nutzen und Nebenwirkungen zeigt Tab. 1.

Tab. 1 Hierarchie von patientenrelevanten Endpunkten für die Entscheidungsfindung: Nutzen und Nachteile von phosphatsenkenden Medikamenten bei Patienten mit chronischer Niereninsuffizienz [28]

Hierarchie der Qualitätsbewertung

Das GRADE-System klassifiziert die Evidenz für wünschenswerte wie für unerwünschte Effekte in 4 Stufen: in Evidenz hoher, mittelwertiger, niedriger und sehr niedriger Qualität (Tab. 2).

Tab. 2 Bedeutung der verschiedenen Qualitätsstufen der Evidenz

Die Definitionen in Tab. 2 reflektieren das Ausmaß unserer Sicherheit, dass der beobachtete Behandlungseffekt („die Effektschätzung“) tatsächlich zutrifft. Leitliniengruppen müssen darüber hinaus zusätzlich ein Urteil über die Qualität der Evidenz in Bezug auf den jeweiligen klinischen Zusammenhang abgeben, wodurch sich die ursprüngliche Klassifizierung verändern kann. Damit hat „Qualität der Evidenz“ im Kontext von Leitlinien eine weitergehende Definition: Die Qualität der Evidenz spiegelt wider, inwieweit unser Vertrauen in die Effektschätzung ausreicht, um eine bestimmte Empfehlung zu unterstützen.

Qualität der Evidenz

Wie andere Systeme zur Klassifikation der Evidenz beginnt die Qualitätsbewertung von GRADE beim Studiendesign: Ergebnisse von RCT werden als glaubwürdiger und robuster betrachtet und starten deshalb als hochwertige Evidenz, während Ergebnisse von Beobachtungsstudien als weniger valide und robust betrachtet werden und deshalb als Evidenz von niedriger Qualität starten. Darüber hinaus hängt die Qualität der Evidenz nicht nur von Studiendesign und -durchführung ab, sondern auch von der Ähnlichkeit („Konsistenz“) der Ergebnisse in vergleichbaren Studien, ihrer Direktheit und Genauigkeit und der Wahrscheinlichkeit für Publikationsbias. Schwächen in diesen Punkten können die Qualität der Evidenz herabstufen. Darüber hinaus können Studien – vor allem Beobachtungsstudien – mit großen oder sehr großen Behandlungseffekten oder einer eindeutigen Dosis-Wirkungs-Beziehung die Glaubwürdigkeit der Evidenz verbessern und ihre Qualität hochstufen. Weitere Beispiele zu den Kriterien, die die Qualität der Evidenz abwerten oder aufwerten können, liefert Tab. 3.

Die entscheidende abschließende Bewertung der Qualität der Evidenz bezieht sich auf die Qualität aller patientenrelevanten Endpunkte. Diese Evidenz kann von verschiedenen Studiendesigns und systematischen Übersichtsarbeiten stammen, wenn nicht alle relevanten Endpunkte gleichmäßig erfasst und beschrieben werden. Als Beispiel dient insbesondere die Erfassung von wichtigen Nebenwirkungen, die häufig auf anderen Studiendesigns beruht als die der primären Endpunkte, aber für die Entscheidungsfindung von kritischer Bedeutung sein können [12, 24].

Tab. 3 Kriterien für das Herabstufen der methodischen Qualität von randomisierten kontrollierten Studien (RCT) und das Hochstufen von Beobachtungsstudien

Diskussion

In der schnelllebigen Welt der Medizin greifen Ärzte bei der Patientenbetreuung immer häufiger auf aktuelle Empfehlungen von Fachgesellschaften und anderen Organisationen zurück, die sie als glaubwürdig erachten. Patienten nutzen zunehmend die Gelegenheit des unbegrenzten Zugriffs auf Gesundheitsinformationen über das Internet, möchten aber sicher sein, dass die gefundenen Informationen hochwertig und zuverlässig sind. Klinische Leitlinien können prinzipiell diese Erwartungen und Ansprüche erfüllen, müssen dazu aber klare und transparente Empfehlungen enthalten, die einfach und präzise sind, auf aktuellen wissenschaftlichen Erkenntnissen beruhen, gut verständlich präsentiert und kommuniziert werden und die organisatorischen Rahmenbedingungen des jeweiligen Gesundheitssystems angemessen berücksichtigen. Aufbauend auf der breiten Erfahrung internationaler Leitliniengruppen hat die GRADE Working Group diese Anforderungen aufgegriffen und ein System für die Erstellung hochwertiger, evidenzbasierter Leitlinien entwickelt.

Manche Leitlinienexperten vertreten die Meinung, dass Leitlinien, die auf der selben Evidenz beruhen, obligatorisch zu den gleichen Empfehlungen kommen sollten. Das ist nicht unsere Meinung. GRADE bestätigt die vielen Grauschattierungen der Evidenz, die oft erheblichen Spielraum für die Interpretation der Evidenz eröffnen. Die Berücksichtigung von lokalen und regionalen Umständen, Präferenzen und Wertvorstellungen zwischen Gruppen und Jurisdiktionen führt ebenfalls dazu, dass die gleiche Evidenz zu verschiedenen Empfehlungen führen kann. Aus diesen Gründen ist die Transparenz bei der Entscheidungsfindung ein elementarer Bestandteil der Leitlinienentwicklung. Diese Forderung nach Transparenz bezieht sich auch auf die Darstellung von nachvollziehbaren Begründungen der Entscheidungen und Wertvorstellungen, die schlussendlich zu den Empfehlungen geführt haben. Die Brücke von der Evidenz zur Empfehlung muss sichtbar werden.

Die Transparenz bei der Entscheidungsfindung ist ein elementarer Bestandteil der Leitlinienentwicklung

Zusammenfassend lässt sich sagen, dass GRADE ein methodisches Gerüst vorgibt, dessen Berücksichtigung zu mehr Transparenz und einer international einheitlichen Systematik bei der Bewertung der Evidenz und ihrer Übersetzung in Leitlinienempfehlungen beiträgt. Damit werden erstmals subjektive Anteile der Evidenzbewertung und der Entscheidung systematisch bei der Formulierung einer Empfehlung berücksichtigt. Darüber hinaus werden explizite Kriterien vorgegeben, z. B. für die Beurteilung der Relevanz von Studienendpunkten, für die Einschätzung des Nutzen-Risiko-Verhältnisses einer Intervention, die oft auf der Basis unterschiedlicher Evidenzstärken für Nutzen und Risiko erfolgen muss, sowie für die Einbeziehung der Präferenzen und Wertvorstellungen der Patienten. Eine Leitlinie ist immer das Ergebnis von Selektionsprozessen – von der Eingrenzung des Aufgabenbereichs der Leitliniengruppe (adressierte Fragestellungen) über die Auswahl relevanter Studienendpunkte bis hin zur Festlegung geeigneter Überprüfungskriterien (Qualitätsindikatoren) der Leitlinie in der Praxis.

Die Anwendung der GRADE-Methode macht deutlich, dass auf dem Weg von der Evidenz zur Empfehlungen an vielen Stellen Werturteile enthalten sind. Diese sollten im Rahmen formaler Konsensustechniken getroffen werden, um qualitativ hochwertige Ergebnisse zu erreichen [10, 15, 17]. Wichtig ist dabei die Beteiligung der verschiedenen professionellen Gruppen aus dem Bereich der potenziellen Leitlinienanwender und der betroffenen Patienten [9]. Charakteristisch für die Techniken der strukturierten Konsensusfindung ist die strukturierte Interaktion, in deren Rahmen individuelle Beiträge und Einschätzungen der Teilnehmer systematisch erfasst, transparent gemacht und zusammengeführt werden. Dabei spielen individual- und gruppenpsychologische Einflussfaktoren eine wichtige Rolle.

Leitlinien betreffen meist nicht nur therapeutische, sondern auch diagnostische Maßnahmen. Während diagnostische Interventionen oder Maßnahmen insgesamt mit diesem System behandelt werden können, gibt es für die Beurteilung der diagnostischen Genauigkeit konkrete Vorschläge der GRADE-Arbeitsgruppe [25]. Das gleiche gilt für die Integration von Evidenz über Ressourcenverbrauch bzw. Kosten in Leitlinien.

Das grundlegende Prinzip der GRADE-Arbeitsgruppe ist das der Zusammenarbeit und Offenheit gegenüber interessierten Gruppen und deren Erfahrungen mit dem System, die zu kontinuierlicher Verbesserung führen werden. Wie die direkte Forschung in der Patientenversorgung findet sich auch dieses methodologische Forschungsgebiet im Fluss. Diese Erkenntnis sollte die breite Anwendung des Systems und seine Evaluation sowie Weiterentwicklung aber nicht beeinträchtigen.

Fazit für die Praxis

Mit der GRADE-Methodik wurden vorhandene Konzepte zur Leitlinienentwicklung weiterentwickelt. Die Methodik integriert u. a. die Werturteile, die auf dem Weg von der Evidenz zur Empfehlung an vielen Stellen gefällt werden, und bildet sie explizit ab. Dem trägt auch die Unterscheidung von „Qualität der Evidenz“ auf der einen Seite und „Stärke einer Empfehlung“ auf der anderen Seite Rechnung. Wegen seiner Konsistenz und seinem hohen Grad an Transparenz wurde das System international bereits von zahlreichen Leitlinienorganisationen und Fachgesellschaften für den eigenen Gebrauch übernommen, auch wenn eine Weiterentwicklung des Systems zur Integration von Fragen der Diagnostik und der Ressourcen im Gange sind.