Cox regresyon analizi, yaşam süreleri üzerinde belirleyici bir role sahip faktörlerin (sigara kullanımı, kan grubu vb.) etkilerini modellemek için kullanılan eşsiz bir istatistiksel analiz tekniğidir. Özellikle sağkalım verilerine sahip biyoistatistik araştırmacıları için vazgeçilmezdir, eşsizdir.
Bu yazımızda Cox regresyon analizi için ihtiyacımız olan temel bilgilere değineceğiz.
Kimi araştırmacılar tarafından Cox orantılı tehlike (proportinal hazard) modeli olarak da adlandırılıyor.
Öncelikle biyoistatistiğe gönül veren yeni araştırmacılarımız için kısaca sağkalım analizlerine bir göz gezdirelim.
Sağkalım analizleri kapsamında aklımıza ilk gelen yöntem Kaplan Meier analizidir.
Yalnız Kaplan Meier analizi, çoğu zaman sorularımıza yanıt verme noktasında yetersiz kalıyor.
İlk göze çapran konu, bağımsız değişken sayısı.
Kaplan Meier analizinde sadece ve sadece bir bağımsız değişken kullanabiliyoruz.
Örneğin; akciğer kanseri hastalarının yaşam süreleri üzerinde patolojik evrenin, tümör boyutunun ve patolojik evrenin etkilerini gözlemlemek istediğimizi düşünelim.
Bunun için üç farklı Kaplan Meier analizini ayrı ayrı uygulamamız gerekecektir.
İstatistik bilgisine sahip tüm araştırmacılar olarak şunu da çok iyi biliyoruz ki, değişkenleri ayrı ayrı analiz etmekle birlikte analiz etmek arasında büyük fark var. Ayrı ayrı yapılan sonuçlar, bizleri çoğu zaman yanıltabilir.
Bir diğer sorun, tahminsel model oluşturma ve doğrudan etki gözlemleme noktasında karşımıza çıkıyor.
Kaplan Meier analizinde teorik düzlemde yapılan şey, iki farklı sağkalım eğrisini kıyaslamaktan ibarettir.
Bir nevi ortalama karşılaştırma testi gibi düşünebiliriz.
Ancak biz biyoistatistik araştırmalarında, elimizdeki bağımsız değişkenleri kullanarak bağımlı değişkeni, yani sağkalım durumlarını açıklamak isteriz. Aynı zamanda tahmin edecek bir model de kurmayı arzularız.
Bu sayede hangi değişkenler sağkalım durumlarını nasıl etkiliyor, bu değişkenlerin değerlerini girdiğimizde sağkalım sürelerinin tahmini değeri ne olur gibi sorularımıza da yanıt bulacak teknikleri kullanmayı amaçlarız.
İşte tüm saydığımız özellikler, Kaplan Meier analizinde olmadığı için, bilim bizi Cox regresyon analizine sürüklüyor.
Şimdi analizin genel amacına değinelim.
Bahsettiğimiz hususlardan hareketle, Cox regresyon analizinin iki büyük avantajının olduğu sonucuna varabiliyoruz.
1) Girdileri tanımladığımızda sağkalım sürelerini tahmin edebilecek bir model oluşturmak.
2) Bağımsız değişkenlerin sağkalım süreleri üzerindeki doğrudan etkisini odds oranları ile gözlemleyebilmek.
Şimdi analiz sürecinde ne tür değişkenlere ihtiyaç duyacağımız üzerinde duralım.
– Hastaların yaşam süreleri
– Hastaların öldü/yaşıyor şeklinde sağkalım durumları
– Bağımsız değişkenler (Kategorik veya sayısal olabilir)
Eğer sadece hastaların sağkalım durumlarını ya da sağkalım sürelerini alırsak; analizi uygulama ihtimalimiz sıfıra düşer.
Çünkü Cox regresyon analizi için kullanacağımız tüm paket programlar (SPSS, R, Minitab vb.) bizden bir süre (Time) değişkeni ve bir durum (Status) değişkeni istiyor.
Bu tekniğin bir diğer güzel tarafı da bağımsız değişkenlerin yapısı.
Sağkalım eğrilerini kıyaslamaya dayalı temel yaklaşımlarda sadece kategorik, yani sayısal olmayan grup değişkenlerini kullanabiliyoruz.
Örneğin elimizde Nötrofil/Lenfosit oranı ölçümlerimiz var ve bu ölçümlerin akciğer kanserine dayalı yaşam süreleri üzerindeki etkisini incelemek istiyoruz.
Kaplan Meier analizini kullanamayız.
Cox regresyon analizini uygularken, tıpkı lineer/lojistik bir regresyon modelinde olduğu gibi katsayılar hesaplanıyor. Hesaplanan regresyon katsayıları, birebir lojistik regresyon analizine benzer şekilde üstel dönüşüme (exp) uğratılıyor.
Sonunda da o meşhur odds oranlarını hesaplıyoruz.
Odds oranları üzerinden bağımsız değişkenin yapısına göre sağkalım durumları üzerindeki etkileri yorumluyoruz.
Elbette anlamsız katsayılar için odds oranlarının yorumlanmasına ihtiyaç bulunmuyor.
Eğer etkisini ölçümlemek istediğimiz bağımsız değişken kanser evresi gibi kategorik bir yapıya sahipse, belirlediğimiz herhangi bir grubu referans alarak sonuçları yorumluyoruz.
Uygulama aşamasında diğer tüm istatistiksel analizde olduğu gibi, paket programları veya kod tabanlı özel yazılımları kullanabiliriz.
Araştırmacılar Cox regresyon analizi için aşağıdaki programlar arasından dilediğini tercih edebilir:
Özellikle SPSS programı Cox regresyon analizi uygulamalarında, yoğunlukla tercih ediliyor.
Cox regresyon analizine dair konuşulacak çok fazla konu var. Çünkü bu tekniğin farklı varyantları (kernel, non-parametrik vb) ve farklı detay konuları (orantısal hazard varsayımı, istatistiksel dağılımlar vb.) bulunuyor.
İstatistiksel analiz programlarında nasıl uygulanacağı konusu bile başlı başına bir dünya…
Gelecek yazılarımızda bu muazzam analizin detaylarına eğilmeye devam edeceğiz.