Aşamalı Regresyon Analizi

aşamalı regresyon analizi

 

Aşamalı Regresyon Analizi

İstatistiksel analiz uygulamalarında regresyon analizi en çok kullandığımız modelleme tekniği. Regresyon analizini uygularken, belirlediğimiz bağımsız değişkenler arasından en uygun olan değişken kümesini seçerek modelimizi oluşturmamız gerekiyor. Aşamalı regresyon analizi, en uygun bağımsız değişkenleri seçmek için kullanılan elverişli bir analiz yöntemidir.

Aşamalı regresyon analizi “stepwise” seçim yöntemi olarak da adlandırılıyor.

Öncelikle regresyon analizinde değişken seçimi işlemlerine kısaca bir göz atalım.

En uygun bağımsız değişken kümesini seçerek bir regresyon modeli oluştururken, temelde uygulayabileceğimiz üç yaklaşım kullanılabilir:

1) Gereksiz değişkenleri modelden çıkarmak

2) Çıkarılan değişkenleri tekrar modele eklemek

3) 1. ve 2. işlemi birlikte uygulamak

Aşamalı regresyon analizi 3. seçeneği tercih ediyor. Yani değişken seçimi sürecinde modele katılan bir değişken, tekrar modelden çıkarılabiliyor.

Hemen şu soru aklımıza gelebilir: İyi de; modelden çıkarılan bir değişkeni neden tekrar modele katıyoruz? Bu adım mantıksız değil mi? Değil.

Çünkü regresyon analizinde değişkenler arasındaki korelasyon sebebi ile, tek başına anlamlı olan bir değişken bir başka değişken ile birlikte anlamsız hale gelebiliyor. Benzer şekilde birlikte anlamsız bulunan değişken kümesinden bir ya da birkaç değişkeni çıkardığımızda geriye kalan değişkenler anlamlı hale gelebiliyor.

Karışık mı geldi? Aslında hiç karmaşık değil. Bu işin formülü bir cümlede saklı: Regresyon analizinde değişkenlerin bir arada bulunma durumlarına göre modelin performansı değişiyor.

Tıpkı futbol takımlarında olduğu gibi. Kimi zaman en yıldız futbolcuları transfer edersiniz ama takım bir arada hiç iyi futbol oynayamaz. Kimi zaman da orta düzeyli oyuncular bir araya gelir ve uyum içerisinde futbol resitali sergilerler. Aynı olgu regresyon analizinde de geçerli.

Teorik düzlemde aşamalı regresyon analizi bağımsız değişkenleri modele eklerken ya da modelden çıkarırken kısmi F-testine göre karar veriyor. F-testini uygularken anlamlılık düzeyini de belirlememiz gerekiyor.

Aşamalı regresyon analizi sırasında modele değişken eklerken ayrı; modelden değişken çıkarırken ayrı hata payları kullanılabiliyor. Genelde modele değişken eklerken α=0.05, değişken çıkarırken  α=0.10 anlamlılık düzeyinde seçim gerçekleştiriyoruz. Bu değerler kullanıcının beklentilerine göre değiştirilebilir.

Genelde hata payının modele değişken ekleme aşamasında daha düşük olması, modele değişken eklemenin daha kolay, çıkarmanın da daha zor olması anlamına geliyor. Aşamalı regresyon analizinde modele eklenen değişkeni çıkarmak istemiyoruz.

Peki bu harika veri analizi yöntemini nasıl uygulayabiliriz? SPSS, R-Project, Stata gibi istatistiksel analiz programları ile aşamalı regresyon analizini uygulama olanağına sahibiz. SPSS anket araştırmaları için bu değişken seçimini kısmı F-testleri ile seçmemize yardımcı oluyor.

R-Project ile hem kısmi F-testi, hem de bilgi kriterlerine göre seçim yaparak veri analizi süreçlerini tamamlayabiliyoruz. Bu açıdan R-Project daha esnek yaklaşımlar sağlıyor.

Sonuç olarak; çok sayıda bağımsız değişkenin bulunduğu veya  modelde anlamsız değişkenlerin var olduğu durumlarda aşamalı regresyon analizi ile değişken seçimi yapılabiliyor.