Düzeltilmiş R-kare, regresyon analizinde modelin performansını değerlendirmek için kullandığımız istatistiksel bir ölçüttür. Bu ölçütün en büyük özelliği, farklı regresyon modellerini karşılaştırmak için son derece elverişli olmasıdır.
İstatistiksel analiz süreçlerinde en çok kullandığımız analiz tekniklerinin başında regresyon analizi geliyor. Kurduğumuz modelin performansını değerlendirmek de en doğal isteğimiz ve bu durumda belirtme katsayısını, yani R-kare ölçütünü kullanıyoruz.
Ancak klasik R-kare, kendi içerisinde problemler barındıran bir ölçüt. Şimdi bu problemlere göz atalım.
Regresyon analizinde açıklayıcı değişken sayısının artması, modelin R-kare ölçütünü de her koşulda artırmaktadır. Çok çok düşük bir değer de olsa, bu artışın olması kaçınılmazdır. Peki bu bir sorun yaratır mı? Evet. Çünkü bağımlı değişkenimiz ile ilişkisiz olan bir değişken de eklediğimiz zaman, R-kare değeri artmaktadır.
Bu durum, hatalı bir şekilde model ile uyumsuz olan değişkenlerin de performans artırması gibi bir duruma yol açıyor. Model ile ilişkisiz olan değişkenlerin R-kareyi sahte bir biçimde artırması, hatalı bir şekilde modelin performansını artırdığı sonucuna varmamıza sebep oluyor. Bu sorunu ortadan kaldırmak için alternatif bir ölçüte gereksinim duyuyoruz.
İşte tam bu noktada düzeltilmiş R-kare imdadımıza yetişiyor.
Klasik R-kare ölçütünün sahte artış problemini ortadan kaldırmak üzere, bu ölçütü cezalandırma yaklaşımı tercih ediliyor. Buna göre modelde yer alan değişken sayısı ve gözlem sayısı göz önüne alınarak aşağıda gösterilen şekilde bir cezalandırma yoluna gidiyoruz:
Bu formülasyona göre, klasik R-kare değerini hem N (gözlem sayısına) hem de k (açıklayıcı değişken sayısı) niceliklerine göre cezalandırarak düzeltilmiş R-kare değerini elde ediyoruz.
Elde edilen bu yeni ölçüt sayesinde farklı değişken ve farklı gözlem sayılarına sahip olan modellerin performansını karşılaştırabiliyoruz. Dolayısı ile, model seçiminde klasik R-kare yerine düzeltilmiş R-kare değerlerini kullanmalıyız.
R-kare için klasik ile düzeltilmiş değerler arasında sayısal olarak yüksek farkın bulunması da, tahmin edilen regresyon modelinde bir problemin olduğuna işaret etmektedir.
Ancak şunu özellikle vurgulamakta fayda var; düzeltilmiş R-kare, normal dağılıma sahip bağımlı değişkenler ile kurduğumuz normal lineer regresyon analizi için kullanılabilen bir ölçüt.
Sonuç olarak; düzeltilmiş R-kare ölçütünü lineer regresyon analizinde değişken seçimi ve model karşılaştırmaları kullanabiliyoruz. Bu ölçütü hesaplayabilmek için R-Project, SPSS, Minitab gibi programlardan yararlanabiliyoruz.