Çok Terimli Lojistik Regresyon Analizi

çok terimli lojistik regresyon

 

Çok Terimli Lojistik Regresyon Analizi Nedir?

İstatistiksel analiz süreçlerinde kategorik bağımlı değişkenlerimiz ile regresyon modeli oluşturabiliriz. Bağımlı değişkenimizin k>2 gruptan oluştuğu durumlarda kullanabildiğimiz regresyon modellerinden birisi de, çok terimli lojistik regresyon analizi tekniğidir.

Şimdi kısaca kategorik bağımlı değişkenlere yönelik tanımlamalar ile başlayalım.

Bilimsel araştırmalarımızın büyük bir bölümü, bizler için önem arz eden bağımlı değişkenlerimiz üzerinde, bağımsız değişkenlerin etkilerini incelemektir. Araştırma alanımıza göre gerçekleştireceğiz istatistik analizi uygulamalarımız nicel ya da kategorik değişkenlerden oluşabilir.

Örneğin; kandaki WBC miktarı, kalp krizi geçirme durumu (geçirdi, geçirmedi) ya da kanser evreleri (1. evre, 2. evre, 3. evre) gibi değişkenleri bağımlı değişken olarak seçebiliyoruz.

Seçilen bağımlı değişkenlerimizin dağılımlarına ve ölçme türlerine göre kullanılacak olan regresyon modelleri de değişkenlik göstermektedir.

Kategorik bir bağımlı değişken ile çalıştığımız durumlarda üç olası durum ile karşılaşıyoruz:

     1) İki gruplu değişkenler

     2) En üç gruplu ve sıralama ölçme düzeyine sahip değişkenler

     3) En üç gruplu ve adlandırma ölçme düzeyine sahip değişkenler

Yukarıda tanımlı 3. maddenin kapsamına giren durumlarda çok terimli lojistik regresyon analizini kullanıyoruz.

Çok terimli lojistik regresyon analizini uygulayabilmek için kısaca şu üç koşulun sağlanması gerekli:

     1) Bağımlı değişkenin kategorik olması

     2) En az üç gruba sahip olması

     3) Gruplar arasında doğası gereği sıralama olmaması

Gruplar arasında sıralama olmamasından ne anlıyoruz? Aslında son derece basit. Bağımlı değişkeninimiz “Kesinlikle katılmıyorum, Katılmıyorum, Kararsızım, Katılıyorum, Kesinlikle katılıyorum” şeklinde beş kategoriden oluşuyorsa, burada bir sıralamanın olduğu çok belli. Benzer şekilde eğitim durumu, takdirde görme düzeyi gibi değişkenlerde de sıralama söz konusu.

Bağımlı değişkenimiz Türkiye’nin bölgeleri, tuttuğumuz takım, meslek grupları gibi değişkenleri içeriyorsa, grupları arasında doğal bir sıralama bulunmamaktadır. Elbette bazı özellikler açısından sıralamalar olabilir. Örneğin nüfus açısında Marmara bölgesi Karadeniz Bölgesinden daha yüksek değere sahip olabilir. Benzer şekilde A futbol takımının şampiyonluk sayısı B takımından fazla olabilir. Ama bunlar sadece belli özellikler için geçerlidir.

Sıralamanın olabilmesi için bir özellik açısından değil, doğal olarak gruplar arasında bir sıralama olması gerekir. Eğitim durumunda bu böyledir. Lise mezunun eğitim düzeyi, Doktora mezunundan daha düşüktür.

Tıpkı sıralı ya da ikili lojistik regresyon analizinde olduğu gibi, çok terimli lojistik regresyon analizinde de yorumlarımızın temelinde odds oranları (OR) bulunuyor. Yani katsayılarımızın üstel (exp) değerlerini alarak değişkenlerimizin etkilerini istatistiksel açıdan yorumluyoruz.

Çok terimli lojistik regresyon analizini pratikte uygulayabilmek için R-Project, SPSS, Stata gibi yazılımlardan yararlanabiliriz. Sonuç olarak bağımlı değişkenimiz kategorik, en az üç gruplu ve sıralamalı gruplar içeriyor ise, doğru yöntem çok terimli lojistik regresyon analizidir, lineer regresyon analizi değil!