die Kaplan-Meier-Kurve Erklärt | Was ist die Kaplan-Meier-Kurve?

Share

Facebook
Twitter
WhatsApp

Beigesteuert von: Patrick

In unserem Alltag stoßen wir auf viele Time-to-Event-Beispiele. Was bedeutet Time-to-Event?, Es ist eine Kursdauer Variable für jeden Fall / Thema von Interesse mit einem Anfang und ein Ende überall entlang der Zeitleiste der vollständigen Studie. Einige häufige Beispiele sind klinische Studien für ein Medikament, Wickets, die in ein Innings eines Cricket-Matches fallen,Überholung einer Maschine, bevor sie stillgelegt wird, usw., Haben Sie bemerkt, es gibt etwas gemeinsam unter den Beispielen? Ja, es ist das Studium des Überlebens.

Eine effektive Methode zur Schätzung der Überlebensfunktion ist die Verwendung der KM-Analyse. Die Kaplan-Meier-Kurve ist ein Schätzer, der zur Schätzung der Überlebensfunktion verwendet wird., Die Kaplan-Meier-Kurve ist die visuelle Darstellung dieser Funktion, die die Wahrscheinlichkeit eines Ereignisses in einem jeweiligen Zeitintervall anzeigt. Die Kurve sollte sich der wahren Überlebensfunktion für die untersuchte Population nähern, sofern die Stichprobengröße groß genug ist.

Lassen Sie uns in diesem Artikel im Detail sehen, was KM-Analyse ist, wie die Kaplan-Meier-Kurve aufgebaut ist, die Mathematik hinter der Berechnung der Überlebenswahrscheinlichkeiten. Aber bevor wir direkt in die KM-Analyse eintauchen, werden wir einen schnellen und kurzen Spaziergang über die Überlebensanalyse und grundlegende Notationen machen, die in der Analyse verwendet werden.,

Überlebensanalyse

Die Überlebensanalyse ist ein statistisches Verfahren zur Datenanalyse, bei dem die interessierende Ergebnisvariable die Zeit bis zum Auftreten eines Ereignisses ist. Die Zeit kann eine beliebige Kalenderzeit sein, z. B. Jahre, Monate, Wochen oder Tage vom Beginn der Nachverfolgung bis zu einem Ereignis. Unter Ereignis verstehen wir Erholung, Tod, Ausfall einer Maschine, Pforten in einem Innings oder eine bestimmte Erfahrung von Interesse, die dem Fall/Subjekt passieren kann.,

Ziele der Überlebensanalyse

Die Überlebensanalyse hat drei Ziele:

  1. Zur Schätzung und Interpretation von Überlebens – und / oder Gefahrenfunktionen aus Überlebensdaten
  2. Zum Vergleich von Überlebens-und/oder Gefahrenfunktion
  3. Zur Beurteilung der Beziehung von erklärenden Variablen zur Überlebenszeit

Ich hoffe, Sie haben ein Bild davon, was die Überlebensanalyse ist und ihre Ziele. Als nächstes werden wir die in der Analyse verwendeten Notationen und eine grundlegende Interpretation der KM-Kurve verstehen (eine detaillierte Erklärung, die befolgt werden muss).,

Grundlagen der Kaplan-Meier-Kurve

Bei der Verwendung der Kaplan-Meier-Analyse sollten wir uns auf drei Variablen konzentrieren:

  1. Serielle Zeit des Probanden
  2. Ihr Status am Ende ihrer seriellen Zeit (Ereignis auftreten oder zensiert)
  3. Die Gruppe der Studie, zu der sie gehören

Die serielle Zeit für die einzelnen Probanden sollte unabhängig vom Zeitpunkt ihres Studiums von der kürzesten bis zur längsten angeordnet sein. Die serielle Zeitdauer des bekannten Überlebens wird durch das interessierende Ereignis beendet. Dies wird als Intervall bezeichnet., Nur ein Auftreten des Ereignisses definiert bekannte Überlebenszeitintervalle. Während zensierte Probanden das Intervall nicht beenden. Hier besteht die Möglichkeit, dass zwei Dinge passieren.

1. Ein Thema kann das Ereignis von Interesse haben.

2. Sie werden zensiert. Während wir oben besprochen haben, welches Ereignis gerade stattfindet, werden wir diesmal definieren, was zensierte Daten sind.

Lesen Sie auch: Multinomial Naive Bayes Erklärt

Zensierte Daten

Die direkte Definition zensierter Daten ist, dass die Informationen über die Überlebenszeit eines Subjekts unvollständig sind. Dies ist ein Problem, unter dem die meisten Überlebensanalysen leiden., Dies kann passieren, wenn etwas Negatives für die Studie passiert, wie zum Beispiel:

  1. Eine Person erlebt das Ereignis nicht, bevor die Studie endet
  2. Eine Person geht verloren, um während des Studiums nachzugehen
  3. Eine Person zieht sich aus irgendeinem Grund aus der Studie zurück

Verstehen der KM-Analyse

Nach so viel Theorie und Erklärungen zur KM-Analyse werden wir in die Erstellung und Interpretation der KM-Kurve übergehen.

Betrachten wir dazu ein Beispiel, bei dem ein Medikament an zwei Personengruppen (männlich und weiblich) getestet wird., Es gibt sechs Themen in jeder Gruppe (zum leichteren Verständnis). Die serielle Zeit und der Status zur seriellen Zeit sind in der folgenden Tabelle angegeben. Status zum seriellen Zeitpunkt von 1 bedeutet das Auftreten eines Ereignisses und 0 bedeutet, dass das Subjekt zensiert wird. Ziel ist es, die kumulative Überlebenswahrscheinlichkeit zu ermitteln und festzustellen, ob zwischen den Gruppen ein signifikanter Unterschied im Medikament besteht.,

Tabelle 1-Erste sortierte Tabelle für KM-Analyse

Wie bereits erläutert, sind die für die Analyse erforderlichen Grundelemente 1. Serial Zeit, 2. Status zur seriellen Zeit und der Gruppe, zu der das Subjekt gehört. Die Daten werden in eine Tabelle eingegeben und nach aufsteigenden seriellen Zeiten sortiert, beginnend mit den kürzesten Zeiten für jede Gruppe. Beachten Sie, dass jede Gruppe ein zensiertes Thema hat., In einer Gruppe, die männlichen Probanden, es ist am Ende des Prozesses, und in der anderen Gruppe, das Thema zensiert wurde im Rahmen der Studie timeline.

Nach dem Erstellen der Tabelle können wir alle statistischen Tools wie SPSS, Sigmaplot, R, Excel verwenden, um die KM-Kurve zu zeichnen. Lassen Sie uns zuerst sehen, wie Sie die KM-Kurve zeichnen und die Ergebnisse mit der R-Software analysieren, und dann einen kurzen Spaziergang durch die Statistiken und Berechnungen hinter der Berechnung der Überlebenswahrscheinlichkeiten machen.

KM-Analyse mit R

Schritt 1: Die für die Analyse verwendeten Pakete sind Survival und survminer. Verwenden installieren.,packages (), um diese Bibliotheken nur für den Fall zu installieren, dass sie nicht in Ihrem R Workspace vorinstalliert sind.

Step2: Der nächste Schritt besteht darin, den Datensatz zu laden und seine Struktur zu untersuchen. Die Daten, die wir für diese Analyse verwenden, sind die gleichen wie oben gezeigt. Die Daten werden als CSV-Datei gespeichert und für die Analyse in R importiert.,

Schritt 3: Danach sind wir bereit, das Überlebensobjekt mit der Funktion Surv des Überlebenspakets. Das Objekt wird im surv_object als Ziel gespeichert. Das Objekt ist im Grunde eine kompilierte Version der seriellen Zeit und des Status. Ein + – Zeichen hinter der Überlebenszeit zeigt zensierte Datenpunkte an.,

Schritt 4: der nächste Schritt ist Die Passform der kaplan-Meier-Kurven. Dazu müssen wir die Überlebensfunktion an das Überlebensobjekt und die Interessengruppe anpassen. Diese Anpassung kann mit der survfit-Funktion der Survminer-Bibliothek erfolgen. Das im vorherigen Schritt erstellte Überlebensobjekt wird als Funktion der Gruppe angegeben, die wir für die Analyse berücksichtigt haben.,

Die Zusammenfassung des resultierenden fit_1-Objekts zeigt unter anderem Überlebenszeiten, den Anteil überlebender Patienten zu jedem Zeitpunkt.

Die folgende Tabelle ist die Tabellenausgabe der Überlebensanalyse., Es zeigt den Zeitpunkt an, zu dem das Ereignis stattgefunden hat, die Anzahl der gefährdeten Personen nach jedem Ereignis, die kumulativen Überlebenswahrscheinlichkeiten, den Standardfehler, der mit jeder Wahrscheinlichkeit verbunden ist, und die oberen und unteren 95% – Konfidenzintervalle für beide Gruppen (die Berechnung hinter der Tabelle und die Statistiken werden später in diesem Artikel diskutiert).

Tabelle 2 – Überlebensanalyseausgabe

Schritt 5: Nach dem obigen Schritt ist es nun an der Zeit, die KM-Kurve zu zeichnen., Die entsprechende Überlebenskurve kann untersucht werden, indem das Überlebensobjekt mit pval = TRUE an die Funktion ggurvplot() übergeben wird. Dieses Argument ist sehr nützlich, da es auch den p-Wert eines Log-Rank-Tests darstellt, was uns hilft, eine Vorstellung davon zu bekommen, ob sich die Gruppen signifikant unterscheiden oder nicht.

In Tabelle 2 ist ersichtlich, dass dem letzten Subjekt der weiblichen Gruppe keine kumulative Überlebenswahrscheinlichkeit zugewiesen ist und die Wahrscheinlichkeit für das dritte Subjekt plötzlich sinkt., Während in der anderen Gruppe das letzte Subjekt eine damit verbundene Wahrscheinlichkeit hat und der Rückgang der Wahrscheinlichkeit etwas geringer ist als in der früheren Gruppe. Dies liegt daran, dass es in der weiblichen Gruppe ein Subjekt gibt, das in der Mitte (nach dem zweiten Ereignis) zensiert wurde, und daher am Ende kein Subjekt mehr übrig ist, um die Wahrscheinlichkeitswerte zu berechnen. Aus diesem Grund ist die Wahrscheinlichkeit nach dem zweiten Ereignis steil gesunken. Im Falle der männlichen Gruppe ist das Thema, das zensiert wurde, nur am Ende, und daher nähert sich die Wahrscheinlichkeit nicht Null.,

Ich weiß, das ist ein wenig verwirrend, aber keine Sorge, wir werden es in den kommenden Seiten gelöscht.

Dekodierung der KM-Kurve und Analyse

Betrachten Sie die KM-Kurve in der Abbildung. Die Überlebensdauer eines Subjekts wird durch die Länge der horizontalen Linien entlang der X-Achse der seriellen Zeiten dargestellt. Das Auftreten des Ereignisses beendet das Intervall. Die vertikalen Linien sind das Ereignis von Interesse, und die vertikalen Abstände zwischen Horizontalen sind wichtig, da sie die Änderung der kumulativen Überlebenswahrscheinlichkeit einer bestimmten Zeit veranschaulichen, wie sie in der Y-Achse zu sehen ist., Zum Beispiel, wenn Sie zu einer Gruppe gehören männlich, Ihre Überlebenswahrscheinlichkeit von 11 Monaten beträgt 100% (x-Achse in Jahren); Umgekehrt, wenn Sie in der anderen Gruppe sind, ist Ihre Überlebenswahrscheinlichkeit etwas mehr als 66%. Die Steilheit der Kurve wird durch die Überlebensdauern bestimmt.

Wenn man sich die zensierten Objekte ansieht, hat das eine Subjekt, das in der Gruppe zensiert wurde, das kumulative Überleben zwischen den Intervallen materiell reduziert. Während das terminal zensierte Subjekt in der männlichen Gruppe die Überlebenswahrscheinlichkeit nicht änderte und das Intervall nicht durch ein Ereignis beendet wurde.,

Tabelle 3 – Berechnungstabelle

Die obige Tabelle zeigt, was hinter der Erzeugung der KM-Kurve passiert. Wenn die obige Tabelle mit der KM-Kurve vernetzt ist, ist es offensichtlich, dass Intervalle und die damit verbundenen Wahrscheinlichkeiten nur für Ereignisse von Interesse und nicht für zensierte Themen konstruiert werden. Da ein Ereignis ein Intervall beendet und ein anderes Intervall beginnt, sollte es mehr Intervalle als Ereignisse geben.

Die Tabelle erklärt, wie die Kurven Ende., In der Gruppe männlich endet die Kurve, ohne ein weiteres Intervall darunter zu erstellen. Die kumulative Überlebenswahrscheinlichkeit wird durch das letzte horizontale, sechste Intervall bestimmt und beträgt 0,166. In der anderen Gruppe fällt die Kurve nach dem fünften Intervall auf Null ab, wodurch sich das sechste Intervall horizontal auf der X-Achse befindet.

Wenn man sich die Überlebenswahrscheinlichkeiten ansieht, könnte es etwas verwirrend sein, dass es zwei Wahrscheinlichkeiten gibt 1. Kumulative Wahrscheinlichkeit 2. Intervall-Wahrscheinlichkeit. Die kumulative Wahrscheinlichkeit definiert die Wahrscheinlichkeit zu Beginn und während des gesamten Intervalls., Dies ist entlang der Y-Achse der Kurve grafisch dargestellt. Die Intervallüberlebensrate definiert die Überlebenswahrscheinlichkeit nach dem Intervall. d.h. überlebt immer noch nach dem Intervall und beginnt mit dem nächsten.

Zensur beeinflusst Überlebensraten. Zensierte Beobachtungen, die mit einem Ereignis zusammenfallen, werden normalerweise unmittelbar nach dem Ereignis als fallen angesehen. Zensur entfernt das Thema vom Nenner, d. H. Personen, die noch gefährdet sind. Zum Beispiel gab es in Gruppe 2 drei überlebende Intervalle vier und verfügbar, um in Intervall fünf gefährdet zu sein., Während des Intervalls vier wurde jedoch einer zensiert; Daher waren nur zwei in Intervall fünf gefährdet, d. H. Wie in Tabelle II zu sehen, ging der Nenner von vier in Intervall vier auf zwei in Intervall fünf.

Schlussfolgerung

Daher berechneten wir die Überlebenswahrscheinlichkeiten jedes Subjekts aus zwei verschiedenen Gruppen. Obwohl es so aussieht, als hätte die männliche Gruppe eine größere Überlebenswahrscheinlichkeit als die weibliche Gruppe, sagt uns der p-Wert des Log-Rank-Tests von 0.19, dass es keinen signifikanten Unterschied zwischen den Gruppen gibt., Die Nullhypothese ist, dass es keinen Unterschied gibt, und die alternative Hypothese ist, dass sich die Gruppen signifikant unterscheiden. Da der p-Wert größer als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Dies bringt uns zum Ende des Blogs über Kaplan Meier Curve. Wir hoffen, es hat Euch gefallen. Wenn Sie mehr über solche Konzepte erfahren möchten, nehmen Sie noch heute an den kostenlosen Kursen der Great Learning Academy teil.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.