Kaplan Meier Analizi Nedir?

Kaplan Meier Analizi ve İstatistiksel Uygulamaları

Biyoistatistik alanında çalışan araştırmacılar, bir hastalığın ölümle sonuçlanmasını etkileyen faktörleri belirlemek için sağkalım analizlerini kullanıyor. Kaplan Meier analizi, sağkalım analizlerinin bir alt dalı olarak biyoistatistik araştırmalarında yoğun olarak uygulanıyor.

Bu yazımızda, biyoistatistiğe ilgil duyan her araştırmacının merak ettiği Kaplan Meier analizinin detayları üzerinde duracağız.

İlk olarak, analiz tekniğine ismini veren iki mümtaz araştırmacıya değinelim: Edward L. Kaplan (1920–2006) ve Paul Meier (1924–2011).

Bu iki yazar, Journal of the American Statistical Association dergisinde “Nonparametric estimation of survival from incomplete observations” başlıklı bir makale kaleme alıyor.

Önerilen yöntemi basitliği ve uygulamacılar açısından pratik olması, sağkalım analizlerinde yaygın olarak kullanılmasına imkan sunuyor.

Kaplan Meier analizinin esas amacı, sağkalım sürelerine ilişkin eğrileri karşılaştırmak.

Pratikte bu durum, sağkalım sürelerinin ortalamalarını-medyanlarını karşılaştırmaktan farklı değil.

Sağkalım süreleri üzerinde etkisi olduğunu düşündüğümüz cinsiyet, yaş grupları, spesifik bir kronik hastalığın varlığı gibi çeşitli değişkenlerin grupları arasında, sağkalım süreleri açısından fark olup olmadığını inceliyoruz.

İstatistiksel hipotezlerimizi de şu şekilde kurguluyoruz:

Ho: Faktörün grupları arasında sağkalım süreleri açısından istatistiksel olarak anlamlı bir fark yoktur.

Hı: Faktörün grupları arasında sağkalım süreleri açısından istatistiksel olarak anlamlı bir fark vardır.

Klasik istatistiksel analizlerde gruplar arasında ortalamaları kıyaslamak için t-testi, ANOVA vb. hipotezlerinde faydalandığımız gibi, Kaplan-Meier analizinde de bir takım özel testlerden faydalanıyoruz.

Söz konusu testlerin bazıları şunlardır:

  • Log-rank testi
  • Gehan-Breslow testi
  • Tarone-Ware testi
  • Prentice testi
  • Prentice-Marek testi
  • Andersen-Borgan-Gill-Keiding testi
  • Fleming-Harrington testi
  • Gaugler-Kim-Liao testi

Araştırmacıların bilimsel yayınlarda en çok tercih ettiği Log-rank testi; ancak bunun yanında diğer testleri de kullanabiliriz.

Genelde Türkiye’deki araştırmacılar SPSS programı üzerinden Kaplan-Meier analizini uyguladıkları için, programın elverdiği ölçüde test sonuçlarını alabiliyoruz.

SPSS’de ise yalnızca üç test mevcut: Log-rank testi, Gehan-Breslow testi ve Tarone-Ware testi.

Diğer testlerin sonuçlarını elde etmek isteyen araştırmacılar SAS, R, Jamovi vb. daha gelişmiş istatistik yazılımlarından faydalanabilir.

Kaplan Meier Analizinin Sınırlılıkları

Kaplan Meier analizi son derece elverişli ve yaygın olmasına karşın, birtakım sınırlılıklar içeriyor.

En başta gelen sınırlılık ise, kullanılacak olan faktör sayısı.

Kaplan Meier analizinde sadece ve sadece bir faktörün etkisini test edebiliyoruz.

Örneğin; akciğer kanserine yönelik sağkalım süreleri üzerine bir araştırma gerçekleştirdiğimizi düşünelim.

Akciğer kanseri hastalarının sağkalım süreleri üzerinde cinsiyet (kadın-erkek), sigara tüketimi (kullanmıyor, 2 paket altı, 2 paket ve üzeri), yaşanılan bölge (köy, kasaba, şehir) gibi çeşitli faktörlerin etkili olup olmadığını belirlemek istiyoruz.

Bunun için tek bir analiz içerisinde, yalnızca tek bir faktörün etkisini sınayabiliriz. Hem cinsiyet hem sigara tüketimi hem de yaşanılan bölge değişkenlerini aynı anda analize dahil edemiyoruz.

Her aşamada ayrı ayrı Kaplan Meier analizi uygulayıp cinsiyet için ayrı, sigara tüketimi için ayrı, yaşanılan bölge değişkeni için ayrı bir analiz uygulamamız gerekiyor.

Bir diğer sınırlılığı ise tahminsel model oluşturamamak; yani analiz sonucunda istediğimiz bir faktörün gruplarını tanımladığımızda, yaşam sürelerine ilişkin gelecek tahminlerini elde edemiyoruz.

Bunun için Cox regresyon analizi gibi bir modelleme tekniğine başvurmalıyız.

Analiz sonucunda tek yapabildiğimiz; gruplar arası ortalama sağkalım sürelerinin anlamlı ölçüde değişip değişmediğini test edebilmekten ibaret.

Log-rank vb. testin sonucunda p değerimiz hata payından (genelde 0.05 alıyoruz) düşük çıkarsa, ilgilendiğimiz faktörün grupları arasında sağkalım süreleri açısından fark olduğunu söyleyebiliriz.

Bahsedilen sınırlılıkların dışında, Kaplan Meier analizinde sayısal bir değişkenin etkisini test edemiyoruz.

Örneğin; sayısal olarak verilen lenfosit düzeylerinin akciğer kanseri hastalarındaki sağkalım süreleri üzerindeki etkilerini test edemiyoruz.

Bunun için veriyi gruplanmış şekilde düzenlememiz gerekiyor. Bu da verideki değişimin (yani varyansın) göz ardı edilmesine ve bilgi kaybına yol açabilmektedir. Cox regresyon analizi, bu sınırlılığı aşmamıza yardımcı olabilir.

Son olarak, analizin sonucunda elde edilen sağkalım sürelerinin tanımlayıcı istatistiklerinin hesaplanması üzerine: Bazı durumlarda sağkalım sürelerinin medyan değerleri hesaplanamıyor.

Etkisini test ettiğimiz faktörün bir grubundaki sansürlü veri oranı yüksek olduğunda (%50’nin üzeri) sağkalım sürelerinin medyan değerleri hesaplanamıyor ve istatistik programları bu değeri boş olarak veriyor.

Bu yazımızda Kaplan-Meier analizine genel hatları ile değindik.

Gelecek yazılarımızda Kaplan Meier analizinin hangi programlarla nasıl uygulanabildiği, çoklu karşılaştırma sonuçlarının (post-hoc) nasıl elde edilebileceği gibi farklı konuların üzerinde duracağız.