Hintergrund

Edward L. Kaplan und Paul Meier haben im Jahr 1958 einen bedeutenden Artikel zum Umgang und der Auswertung inkompletter Beobachtungen verfasst [1]. In der Medizin stellen seither Kaplan-Meier-Kurven und Schätzungen von Überlebenszeiten gängige Methoden zur Präsentation von unterschiedlichen Überlebensdaten dar. Unabhängig von Überlebensanalysen werden Kaplan-Meier-Kurven generell auch zur graphischen Darstellung anderer zeitgebundener Ereignisse („time to event“) in der Medizin, aber auch anderen Bio- und Naturwissenschaften, verwendet.

Bei Literaturrecherchen in der Urologie begegnet uns die Kaplan-Meier-Analyse nahezu täglich: Überlebenskurven bei urologischer Tumorentitäten, Steinaustreibungszeit bei Urolithiasis, fieberfreie Zeit nach Antirefluxeingriffen oder Dauer der Inkontinenz nach Schlingenimplantation sind nur wenige Beispiele. Die korrekte Interpretation von Kaplan-Meier-Analyseergebnissen stellt somit eine essentielle Grundvoraussetzung für die tägliche urologische Praxis dar, um eine adäquate Patientenberatung zu gewährleisten, neue Erkenntnisse umzusetzen und somit die evidenzbasierte Urologie zu verbessern. Dieser Artikel erläutert anhand eines klinischen Fallbeispiels die Basisprinzipien der Kaplan-Meier-Analyse. Im Weiteren werden mögliche Analysevarianten sowie Schwierigkeiten bei der Interpretation zusammengefasst.

Fallbeispiel

Ein 63-jähriger, im Wesentlichen gesunder Mann wird für ein Prostatakarzinom (Gleason-Score 3 + 4; PSA = 10,2 ng/ml) mit einer bilateral nerverhaltenden radikalen Prostatektomie und bilateral pelviner Lymphadenektomie therapiert. Trotz eines klinisch organbegrenzten Tumors erbringt der endgültige histologische Befund den Nachweis einer extraprostatischen Tumorausdehnung am linken lateralen Resektionsrand auf einer Länge von ca. 3 mm. Während sie als behandelnder Urologe bei anderen Patienten mit einer ähnlichen Befundkonstellation früher lediglich eine regelmäßige Kontrolle auf Anzeichen eines Rezidivs durchgeführt haben, haben sie zuletzt vermehrt von Kollegen gehört, dass diese Patienten in solchen Fällen zu einer adjuvanten Strahlentherapie überweisen. Da sie wissen, dass kürzlich eine randomisierte klinische Studie die Effektivität der adjuvanten Strahlentherapie untersucht hat, entscheiden Sie sich, die gegebene Evidenz nachzulesen, um den Patienten besser beraten zu können.

Studienauswahl und Zusammenfassung der Evidenz

Zur Beantwortung der klinischen Frage, ist eine randomisierte kontrollierte Studie mit langfristigem Follow-up geeignet. Um einen entsprechenden Artikel zu finden, wird eine PubMed-basierte Literaturrecherche mit den Suchbegriffen „prostatectomy“, „extraprostatic“, „adjuvant radiotherapy“ und „metastasis“ wie zuvor beschrieben durchgeführt [2]. Die Suchanfrage (04.06.2012) erbringt 5 Treffer. Eine Studie von Thompson et al. [3] beschreibt die Ergebnisse einer gut durchgeführten, randomisierten, prospektiven Studie mit langfristigem Follow-up, in der Männer mit einem pT3N0M0-Prostatakarinom entweder einer adjuvanten Strahlentherapie oder einer Observation zugeführt wurden. Aufgrund des Studiendesigns darf man erwarten, dass die Ergebnisse lediglich einem kleinen Risiko für Bias unterliegen und daher gut geeignet zur Beantwortung unserer klinischen Frage erscheinen.

Es wurden 214 Männer einer adjuvanten Strahlentherapie und 211 Männer einer Observation zugeführt. Das mediane Follow-up betrug 12,5 Jahre mit dem primären Endpunkt metastasenfreies Überleben. Das Ergebnis ist in einer Kaplan-Meier-Kurve dargestellt (Abb. 1). Die Studie kam zu dem Ergebnis, dass Patienten mit radikaler Prostatektomie und adjuvanter Strahlentherapie ein signifikant besseres Überleben hatten, als Patienten die lediglich eine radikale Prostatektomie erhielten [Hazard Ratio (HR) = 0,71; 95 %-Konfidenzintervall (95 %-KI) = 0,54–0,94; p =  0,016]. Zum adäquaten Verständnis und der Interpretation der Studienergebnisse bedarf es jedoch einem Grundverständnis der Kaplan-Meier-Analyse.

Abb. 1
figure 1

Kaplan-Meier-Kurve von 425 pT3N0M0-Prostatakarzinompatienten nach radikaler Prostatektomie, die mit adjuvanter Strahlentherapie oder Observation behandelt wurden. (Entnommen aus [3] mit freundl. Genehmigung von Elsevier und des Autors)

Was ist eine Kaplan-Meier-Analyse?

Die Kaplan-Meier-Analyse ist eine „Time-to-event-Analyse“ meist kombiniert mit graphischer Darstellung der Ergebnisse als sog. Kaplan-Meier-Kurve. Grundvoraussetzung für diese Analyse ist eine akkurate Zeiterfassung für jeden Studienteilnehmer. Die Zeit wird dabei seriell erfasst, das bedeutet der Eintrittszeitpunkt in die Studie wird als Null definiert (im Gegensatz zur kalendarischen Zeit, die mit einem Datum belegt ist) und bis zum Erreichen des Endpunktes („event“) kontinuierlich, numerisch aufgezeichnet.

Für die eigentliche Kaplan-Meier-Analyse sind mindestens zwei Variablen erforderlich: der Zeitraum vom Studienbeginn bis zum definierten Ereignis („event“) und der Status des Studienteilnehmers am Ende der Erfassungsperiode (Eintritt des Ereignisses, das den Endpunkt definiert, oder Zensur).

Da die Analyse oft zwei oder mehrere Gruppen vergleicht, wird in diesen Fällen zudem der Vergleichsfaktor, der die zu vergleichenden Gruppen definiert, benötigt. Zur Analyse der Daten und Erstellung der Kaplan-Meier-Kurven erfolgt eine aufsteigende Sortierung nach serieller Zeit, unabhängig vom tatsächlichen Eintrittsdatum in die Studie. Dadurch wird gewährleistet, dass alle Studienteilnehmer zum Zeitpunkt null beginnen und die längste erfasste Studiendauer für jeden Teilnehmer ausgewertet wird. Zwei mögliche Endpunkte sind für jeden Studienteilnehmer denkbar: 1) der Teilnehmer hat das definierte Ereignis (die Zeit wird nur bis zum Eintritt dieses Ereignisses gewertet) oder 2) der Teilnehmer wird zensiert [4]. Im günstigen Fall hat der Teilnehmer die gesamte Studiendauer abgeschlossen und bis zum Zeitpunkt der Zensur (in diesem Fall Abschluss der Studie) kein Ereignis erlebt.

Da klinische Studien jedoch oft über einen Zeitraum von mehreren Jahren Patienten rekrutieren, ist es insgesamt unwahrscheinlich, dass alle erforderlichen Daten für alle Studienteilnehmer vom Beginn bis zum Abschluss der Studie vorliegen. Zensur bedeutet daher meist, dass bei dem Teilnehmer ein negatives Ereignis für die Studie vorliegt. Grund für eine Zensur kann jegliches Ereignis sein, dass zum Studienabbruch zwingt, oder auch dass die erforderlichen Daten nicht erfasst wurden [4].

Überlegungen bei der Auswertung von Kaplan-Meier-Analysen

Einige Überlegungen sollten bei der Beurteilung von Kaplan-Meier-Analysen berücksichtigt werden. Die Kaplan-Meier-Analyse erlaubt es, dass Teilnehmer mit unterschiedlich langem Follow-up Informationen zu einer Studie beisteuern. In der Studie von Thompson et al. [3] z. B. hatten Patienten, die 1997 einer Therapie zugeführt wurden, ein kürzeres Follow-up, als Patienten, die bereits 1988 therapiert wurden [5]. Teilnehmer, die zu einem späteren Zeitpunkt in eine Studie aufgenommen werden, haben per se eine geringere Chance, ein Ereignis zur Studie beizutragen, als Teilnehmern, die ein längeres Follow-up haben. Die Chance, das Ereignis zu bekommen, sollte jedoch bei zensierten und nicht-zensierten Patienten gleich sein [6, 7]. Dieser Aspekt ist besonders bei Studien mit einem langen Erhebungszeitraum zu berücksichtigen. Bei einer Kaplan-Meier-Analyse wird daher auch idealerweise angegeben, wie viele Patienten pro Gruppe zu jedem Zeitpunk „at risk“ waren und wie viele insgesamt zensiert wurden.

Eine weitere Schwierigkeit stellen Kaplan-Meier Analysen in Kohorten mit einer hohen Wahrscheinlichkeit und Anzahl an sog. „competing events“ (konkurrierende Ereignisse) dar [8]. Ein „competing event“ führt zum vorzeitigen Ausschluss eines Teilnehmers aus der Analyse, bevor dieser das eigentlich definierte Ereignis bekommen konnte. Ein Beispiel sind Prostatakarzinompatienten, bei denen der primäre Studienendpunkt karzinomspezifisches Überleben darstellt. Aufgrund des oft sehr langsamen Krankheitsverlaufs beim Prostatakarzinom ist das Risiko, dass diese Patienten an einer anderen, nicht karzinomspezifischen (z. B. kardiovasuklären) Ursache versterben deutlich erhöht. In diesen Fällen kann die Kaplan-Meier-Methode die tatsächliche Überlebenswahrscheinlichkeit überschätzen, so dass eine Competing-risk-Analyse als statistische Technik in Erwägung gezogen werden sollte [6, 10].

Auswertung einer Kaplan-Meier-Analyse

Die Beurteilung einer Kaplan-Meier-Kurve wird anhand der Abb. 1 passend zum Fallbeispiel erläutert. Die x-Achse stellt die Dauer des Follow-up (0–20 Jahre) dar, auf der y-Achse wird die metastasenfreie Überlebenswahrscheinlichkeit (0–100 %) angezeigt. Die Autoren geben akkurat die Anzahl der Ereignisse für den Therapie- und Observationsarm der Studie an und berichten für jeden angegebenen Zeitpunkt (hier alle 5 Jahre) die Anzahl der Patienten, die sich noch in der Analyse befanden und damit dem Risiko ausgesetzt waren, Metastasen zu entwickeln. Darüber hinaus wird das mediane metastasenfreie Überleben für jeden Therapiearm sowie die prozentuale metastasenfreie 10-Jahres-Überlebenswahrscheinlichkeit berichtet. Eine Darstellung der Analyseergebnisse in dieser Form macht die Resultate transparent und verständlich [8].

Da etwa die Hälfte aller Patienten in beiden Therapiearmen kein Ereignis hatte, wurden diese Patienten in der Analyse zensiert. Das ist akzeptabel, wenn die Zensur unabhängig vom Risiko ein Ereignis zu haben ist, wie zuvor diskutiert. Beim Betrachten der beiden Kurven fällt auf, dass diese ab einem Zeitpunkt von etwa 4 Jahren sich voneinander entfernen, wobei die Kurve des Obseravtionsarms schneller abfällt als die des Strahlentherapiearms. Zur Beurteilung des Unterschieds zwischen beiden Gruppen bedarf es einer statistischen Analyse, um eine konkrete Aussage treffen zu können, ob sich die Gruppen signifikant voneinander unterscheiden, d. h. größer ist als sich per Zufall ergeben könnte. Der hierzu verwendete Test ist der sog. Log-rank-Test. Das Testergebnis wird im Manuskript angegeben und zeigt durch einen p-Wert von 0,016 einen statistisch signifikanten Unterschied an [9].

Eine potentielle Falle in der Auswertung von Kaplan-Meier Analysen stellen insignifikante p-Werte im Log-rank-Test dar. Diese führen nämlich meist irreführender Weise zu der Annahme, dass tatsächlich kein Unterschied existiert. Diese potentiell falsche Schlussfolgerung (Typ-2-Fehler) ist meist durch eine zu geringe Power der Studie bedingt [11]. Zu einer besseren Beurteilung und Einschätzung von Studienergebnisse ist daher das Konfidenzintervalle hilfreich [9], das ebenfalls im Manuskript von Thompson et al. [3] berichtet wurde.

Die vorhandene Evidenz suggeriert, dass die Anwendung einer adjuvanten Strahlentherapie bei Patienten mit einer extraprostatischen Ausdehnung eines Prostatakarzinoms mit einer reduzierten Wahrscheinlichkeit für Metastasen einhergeht. Bei der Patientenberatung muss selbstverständlich das Nutzen-Risiko-Potential gegeneinander abgewägt werden. Dazu muss neben dem individuellen Risiko einer Metastasenentwicklung des vorliegenden Prostatakarzinoms (basierend auf den klinischen Parametern sowie histopathologischen Befunden) auch das Risiko von unerwünschten Begleiterscheinungen einer Strahlentherapie abgewägt werden.

Fazit für die Praxis

Die Kaplan-Meier-Analyse ermöglicht eine graphische Darstellung von zeitgebundenen Studienergebnissen insbesondere bei Kohorten mit einem Follow-up unterschiedlicher Länge. Die Präsentation von Ergebnissen in Kaplan-Meier-Kurven ist gängig in therapeutischen und prognostischen urologischen Studien. Ein grundlegendes Verständnis der Interpretation, möglicher Schwierigkeiten und der Einschätzung, wann alternative statistische Verfahren besser angebracht wären, ist essentiell, um die urologische Literatur in der täglichen Praxis verstehen und bewerten zu können. Eine angemessene Bewertung von Kaplan-Meier-Analyseergebnissen kann zu einer besseren Umsetzung dieser in der täglichen Praxis die evidenzbasierte Urologie verbessern.