Belirtme Katsayısı Nedir?

belirtme katsayısı

Belirtme Katsayısı ve Genel Tanımı

Belirtme katsayısı istatistik analizi uygulamalarında regresyon analizi aşamalarında sıkça karşılaştığımız bir istatistiksel ölçüdür. Dilimize doğrudan coefficient of determination teriminin çevirisi şeklinde giriş yapmıştır. Bu ölçüyü genelde R-kare şeklinde görmekteyiz. Şimdi bu ölçünün genel yapısına bir göz atalım.

Öncelikle regresyon analizine ait bazı aşamalardan bahsetmekte fayda var.

Regresyon analizinde bir ya da birden çok bağımlı ve bağımsız değişkenler ile çalışmaktayız. Burada sezgilerimiz bize hemen şu soruyu sorduruyor: Acaba seçtiğimiz bağımsız değişkenler, bağımlı değişkenimizi ne ölçüde temsil etmektedir? Seçtiğimiz bu değişkenler gerçekten uygun mudur? Kurduğumuz model gerçekten elverişli midir?

Bu sorularımızı yanıtlayabilmemiz için bazı ölçütlere ihtiyacımız olacağı açıktır. Tıpkı günlük hayatta kullandığımız ölçütlerde olduğu gibi. Örneğin; kan şekerimizin 70’in üzerinde ve 110’un altında olmasının da bir ölçüt olması gibi, bizim de regresyon analizi kapsamında bir takım ölçütlere ihtiyacımız var.

Bu ölçütlerin başında belirtme katsayısı, yani R-kare gelmektedir.

Belirtme katsayısı, bağımsız değişkenlerin açıklama oranını göstermektedir. Bir diğer ifade ile, bağımlı değişkenin bağımsız değişkenler tarafından açıklanan varyans oranını temsil etmektedir.

Değer Aralığı ve Yorumlanışı

R-kare ölçüsü, [0,1] aralığında yer almaktadır. Regresyon modellerinde çoklu korelasyon katsayısının karesi biçiminde hesaplanıyor. R-kare değeri her ne kadar bir ifadenin karesi olarak tanımlansa da, bazı özel durumlarda negatif çıkabilmektedir.

Belirtme katsayısının sıfır olması bağımsız değişkenlerin bağımlı değişkeni hiç açıklayamadığını; bir olması ise tam olarak açıklayabildini gösterir. Burada sıfır olması modelin %0, bir olması da modelin %100 açıklayıcılığa sahip olduğuna işaret etmektedir. Hesaplanan R-kare değerine göre bağımsız değişkenlerin bağımlı değişkeni yüzde kaç düzeyinde açıklayabildiğini söyleyebiliriz.

Bu değerin 1’e yakın olması istenen bir durumdur. Ancak kesin bir sınır olmamakla birlikte, R-kare değerinin en az 0.40 olması beklenmektedir.

Belirtme katsayısını kullanabileceğimiz biricik alan, lineer regresyon analizidir. Ancak yalnızca lineer regresyon analizinde değil; panel veri analizi, lojistik regresyon analizi, Poisson regresyon analizi gibi çok sayıda modelleme tekniği içerisinde de kullanabiliriz. Yine de teorik özellikler açısından R-kare, normal dağılıma uygunluk varsayımı altında kurulan lineer regresyon modellerinde kesin olarak yorumlanabilme özelliğine sahiptir.

İstatistiksel analiz ve ekonometrik modelleme dahilinde, diğer birçok farklı regresyonda alışıldığı şekilde yorumlanamaz ve kullanılamaz. Bunun için sahte (Pseudo) R-kare ölçüleri önerilmiştir.

Belirtme katsayısına dair söylenecek çok şey var. Model karşılaştırma, düzeltilmiş versiyonları, sahte versiyonları gibi farklı konular üzerinde duracağız.