den Kaplan-Meier-Kurve Forklarte | Hva er Kaplan-Meier-Kurven?

– >

Int

Facebook
Twitter
WhatsApp

Bidratt av: Patrick

I vår hverdag, vi kommer over mange tid-til-event eksempler. Hva betyr tid til hendelsen betyr?, Det er et kurs varighet variabel for hvert enkelt tilfelle/emne av interesse å ha en begynnelse og en slutt hvor som helst langs tidslinjen av den komplette studien. Noen vanlige eksempler er klinisk studie for et stoff, gjerder faller i en omgang av en cricket kamp, overhale en maskin før det er utrangerte, etc. Har du legger merke til, det er noe i vanlig blant eksemplene? Ja, det er studiet av overlevelse.

En effektiv måte å beregne overlevelse funksjon er ved hjelp KM analyse. Den Kaplan-Meier-Kurven er en estimator som brukes til å beregne overlevelse og funksjon., Den Kaplan-Meier-Kurven er den visuelle representasjonen av denne funksjonen som viser sannsynligheten for at en hendelse på en tilsvarende tidsintervall. Kurven bør nærme seg den sanne overlevelse funksjon for befolkningen under etterforskning, forutsatt at prøven størrelsen er stor nok.

I denne artikkelen, la oss se i detalj hva KM analyse er, hvordan Kaplan-Meier-Kurven er bygget, matematikk bak beregne sannsynlighetene for å overleve. Men før dykking direkte inn i KM-analyse, skal vi ha en rask og kort spasertur rundt på hva som er overlevelse analyse og grunnleggende merknader brukt i analysen.,

Overlevelse Analyse

Overlevelse analyse er en statistisk prosedyre for data-analyse, der utfallet variable av interesse er tiden det tar før en hendelse inntreffer. Tiden kan være en hvilken som helst kalender tid, for eksempel år, måneder, uker eller dager fra begynnelsen av oppfølging før en hendelse inntreffer. Etter hendelse, mener vi utvinning, død, sammenbrudd av en maskin, gjerder i en omgang eller en angitt opplevelse av interesse som kan skje i den saken/emnet.,

Mål for Overlevelse Analyse

Overlevelse analysen har tre mål for å bli adressert:

  1. for Å beregne og tolke overlevende og/eller fare funksjoner fra data om overlevelse
  2. for Å sammenligne overlevende og/eller fare funksjon
  3. for Å vurdere forhold av forklarende variabler for å overleve tid

jeg håper du har fått et bilde av hva overlevelse analyse og sine mål. Neste, skal vi forstå de merknader som brukes i analyse og en grunnleggende tolkning av KM-kurve (en detaljert forklaring skal følges).,

Grunnleggende av Kaplan-Meier-kurve

Ved hjelp av Kaplan-Meier analyse, vi bør konsentrere seg om tre variabler:

  1. Seriell tid av motivet
  2. Sine status på slutten av sin seriell tid (hendelse hendelse eller sensurert)
  3. gruppen av studiet de tilhører

Den serielle tid for de enkelte fag bør ordnes fra den korteste og den lengste, uavhengig av når de ble med i studien. Serial tid varigheten av kjente overlevelse er avsluttet ved arrangementet som er av interesse. Dette er kjent som et intervall., Bare en forekomst av hendelsen definerer kjent overlevelse tidsintervaller. Mens, sensurert fag ikke avslutte intervallet. Her er det en mulighet for to ting til å skje.

1. Et emne kan ha arrangementet av interesse.

2. De er sensurert. Som vi diskuterte hva tilfelle bare ovenfor, denne gangen vil vi definere hva sensurert data.

Les Også: Multinomial Naive Bayes Forklart

Sensurert data

Den rette definisjonen av sensurert data er informasjon om et emne, er overlevelse tid er ufullstendig. Dette er et problem som de fleste overlevelse analyser lider av., Dette kan skje når noe negativt for studiet skjer, for eksempel:

  1. En person opplever ikke tilfelle før studiet avsluttes
  2. En person som er tapt, for å følge opp i løpet av studieperioden
  3. En person trekker seg fra studien på grunn av noen grunn

Forstå KM Analyse

Etter så mye teori og forklaringer på KM analyse, vi skal flytte inn i opprettelse og tolkning av KM-kurven.

For dette, la oss se på et eksempel der et stoff som blir testet på to grupper av mennesker (mannlige og kvinnelige)., Det er seks fag i hver gruppe (for enkel forståelse). Serial tid og status i det serielle tid er gitt i tabellen nedenfor. Status i det serielle tid på 1 betyr at forekomsten av en hendelse, og 0 betyr at emnet er sensurert. Målet er å finne den kumulative sannsynligheten for å overleve og for å finne, er det noen vesentlig forskjell i stoffet mellom gruppene.,

Tabell 1 – Innledende sortert tabell for KM analyse

Som diskutert tidligere, er de grunnleggende elementene som kreves for analysen er 1. Serial tid, 2. Status i det serielle tid og gruppen emnet tilhører. Dataene er lagt inn i en tabell, og er sortert etter stigende seriell ganger begynner med kortest ganger for hver gruppe. Legg merke, og hver gruppe har en sensurert emnet., I en gruppe som har mannlige studiedeltakere, det er på slutten av rettssaken, og i den andre gruppen, motivet ble sensurert i studien tidslinjen.

Etter bygging av tabellen, kan vi bruke noen statistiske verktøy, som for eksempel SPSS, Sigmaplot, R, Excel til å plotte KM kurve. Først, la oss se hvordan plotte KM kurve og analysere resultatene med R-programvare, så la oss ta en rask spasertur rundt gjennom statistikk og beregning bak beregning av overlevelse sannsynligheter.

KM Analyse med R

Trinn 1: pakkene som er brukt for analyse er å overleve og survminer. Bruk installere.,pakker( ) for å installere disse bibliotekene bare i tilfelle hvis de ikke er forhåndsinstallert i din R-arbeidsområdet.

Trinn 2: Det neste trinnet er å laste datasettet og undersøke dens struktur. De data vi vil bruke for denne analysen er den samme som vist ovenfor. Dataene lagres som en csv-fil, og det samme er importert for analyse i R.,

Trinn 3: Etter dette er vi klar til å lage overlevelse objekt ved hjelp av funksjonen Leg av overlevelse pakken. Objektet er lagret i surv_object som et reisemål. Overlevelse objektet er i utgangspunktet en kompilert versjon av den serielle tid og status. Et + tegn bak overlevelse tid indikerer sensurert data poeng.,

Trinn 4: Det neste trinnet er å passe kaplan-Meier-kurver. For å gjøre dette trenger vi for å passe overlevelse funksjon med overlevelse objekt og gruppen av interesse. Denne tilpasningen kan gjøres ved hjelp av survfit funksjon av survminer bibliotek. Overlevelsen objektet ble opprettet i forrige trinn er gitt som en funksjon av den gruppen vi har ansett for analyse.,

oppsummering av den resulterende fit_1 objekt-programmer, blant andre ting, overlevelse ganger, andelen av overlevende pasienter på ethvert tidspunkt.

tabellen nedenfor er bordet utgang av overlevelse analyse., Det viser klokkeslettet for når hendelsen har funnet sted, antall personer i fare etter hver hendelse, kumulative overlevelse sannsynligheter, standard feil knyttet til hver av sannsynlighet og det er øvre og nedre 95% konfidensintervall for begge gruppene (beregningene bak tabell og statistikk er beskrevet senere i denne artikkelen).

Tabell 2 – overlevelse analyse utgang

Trinn 5: Etter ovenstående trinn, er det nå tid for å plotte KM kurve., Tilsvarende overlevelse kurve kan bli undersøkt ved å sende overlevelse objekt til ggurvplot () – funksjonen med pval = SANT. Dette argumentet er veldig nyttig, fordi det plott p-verdien av en log rank test så vel som vil hjelpe oss å få en idé om gruppene er signifikant forskjellig eller ikke.

I tabell 2, kan det ses at siste gjenstand for kvinnelige konsernet har ingen kumulativ sannsynlighet for å overleve som er tilordnet til, og det er en plutselig nedgang i sannsynligheten for det tredje emnet., Mens i den andre gruppen, den siste emnet har en sannsynlighet som er forbundet med det, og fallet i sannsynlighet er litt mindre enn den tidligere gruppen. Det er fordi i den kvinnelige gruppe det er et emne som ble sensurert i midten (etter den andre hendelsen) og det er derfor ikke underlagt venstre på slutten for å beregne sannsynligheten score. Det er på grunn av at sannsynligheten har falt kraftig etter den andre hendelsen. I tilfelle av den mannlige gruppen, motivet som fikk sensurert er bare på slutten, og dermed er det stor sannsynlighet vil ikke nærme null.,

jeg vet dette er litt forvirrende, men fortvil ikke vi vil få det fjernet i de kommende sidene.

Dekoding KM kurve og Analyse

Se på KM kurven i figuren. Overlevelsen varigheten av et motiv som er representert ved lengden av den horisontale linjer langs X-aksen seriell ganger. Forekomsten av arrangementet avsluttes intervallet. De vertikale linjene er arrangementet av interesse som skjer, og den vertikale avstander mellom vannrett er viktige fordi de illustrerer endringen i den kumulative sannsynligheten for å overleve en tid som er sett i Y-aksen., For eksempel, hvis du tilhører en gruppe mannlige, din sannsynlighet for å overleve 11 måneder er 100% ( x-aksen i år); i motsatt fall, hvis du er i den andre gruppen, din sannsynlighet for å overleve samme tid er litt mer enn 66%. Den steepness av kurven bestemmes av overlevelse varighet.

Ser på sensurert ting, en gjenstand som sensurert i gruppe kvinnelige vesentlig redusert den kumulative overlevelse mellom intervallene. Mens, terminalt sensurert emne i den mannlige gruppen gjorde ikke endre overlevelse sannsynligheten for og intervallet var ikke sies opp av en hendelse.,

Tabell 3 – beregning tabell

tabellen over viser hva som skjer bak produksjonen av KM-kurven. Når tabellen ovenfor er kryss-referert med KM-kurve, det er tydelig at intervaller og tilhørende sannsynligheter er bare konstruert for hendelser av interesse og ikke sensurert for fag. Fordi en hendelse ender ett intervall og begynner et annet intervall, bør det være mer intervaller enn hendelser.

tabellen forklarer hvordan kurver slutten., I gruppe mannlige, den kurven ender uten å opprette en annen intervall nedenfor. Den kumulative sannsynligheten for å overleve dette lenge er bestemt av den siste horisontal, sjette intervall og er 0.166. I den andre gruppen, den kurven synker til null etter den femte intervall for å føre den sjette intervall horisontal å være på X-aksen.

Ser på sannsynligheten for å overleve, det kan være litt forvirrende at det er to sannsynligheter 1. Kumulativ sannsynlighet 2. Intervall sannsynlighet. Den kumulative sannsynligheten definerer sannsynlighet ved begynnelsen og i hele intervallet., Dette er plottes langs Y-aksen av kurven. Intervallet overlevelse angir sannsynligheten for å overleve siste intervallet. dvs. fortsatt overlevende etter intervall-og begynnelsen av neste.

Sensurere påvirker overlevelse. Sensurerte observasjoner som sammenfaller med en hendelse er vanligvis ansett for å falle umiddelbart etter hendelsen. Sensur fjerner emnet fra nevneren, dvs., enkeltpersoner fortsatt i fare. For eksempel, i Gruppe 2 var det tre overlevende intervaller fire og tilgjengelig å være i risiko i intervall på fem., Men, i løpet av intervallet fire var sensurert, og derfor er det kun to som var igjen for å være på risiko i intervall på fem, dvs. som vist i Tabell II nevneren gikk fra fire i intervallet fire til to i intervallet fem.

Konklusjon

Derfor, vi beregnet overlevelse sannsynlighetene for hver gjenstand for to ulike grupper. Selv om det virker som den mannlige gruppen har større sannsynlighet for å overleve enn de kvinnelige gruppe, log-rank test er p-verdi på 0,19 forteller oss at det er ingen signifikant forskjell mellom gruppene., Nullhypotesen er at det er ingen forskjell, og den alternative hypotesen er at gruppene er signifikant forskjellige. Siden p-verdien er større enn 0,05, er vi ikke klarer å forkaste nullhypotesen. Dette bringer oss til slutten av bloggen på Kaplan-Meier-Kurven. Vi håper du likte den. Hvis du ønsker å lære mer slike konsepter, bli God Læring Academy er gratis kurs i dag.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *