Korelasyon ve Regresyon Analizi Arasındaki Farklılıklar, Benzerlikler

korelasyon ve regresyon analizi

Korelasyon ve Regresyon Analizi Kavramlarını İnceleyelim

Korelasyon ve regresyon analizi, istatistiksel analiz raporlarımızda ilişkileri sınamak ve bağımlı değişkenimizi modellemek için kullandığımız tekniklerin başında geliyor. Her iki tekniğin birbirine yakın yönlerinin olması, araştırmacılarda zihin karışıklığı yaratabiliyor.

Bu yazımızda korelasyon ve regresyon analizi arasındaki farklılıkları ve benzerlikleri ele alacağız.

Önce tekniklerin en temelinden başlayalım. Esasen geçmiş yazılarımızda her iki tekniğin üzerinde fazlası ile durduk; ama farklı ve benzer olguları şimdi inceleyeceğiz.

Korelasyon analizi dediğimizde ilk aklımıza gelecek olan şey, araştırma değişkenlerimizin arasındaki ilişkilerin sınanmak ve bu ilişkilerin anlamlılıklarını test etmek olacaktır.

İster sayısal, ister kategorik olsun. Her tür veri için korelasyon analizini uygulayabiliyoruz. Yeter ki doğru değişken tipi için doğru korelasyon katsayısını kullanalım. 

Korelasyon analizi ile birlikte (kimi durumlar için) değişkenler arasındaki ilişkilerimizin yönünü ve ilişkilerin gücünü ölçebiliyoruz.

Regresyon analizinde ise durum biraz daha farklı. Regresyon analizinde de değişkenler arası ilişkilere yönelik çıkarımlarda bulunabiliyoruz. Yani bağımlı değişkenimizi etkileyen bağımsız değişkenlerin etkilerini test edebiliyoruz.

Peki korelasyon ve regresyon analizi arasındaki farklar nelerdir?

En temel farkların başında ilişkilerin nedensellik durumu geliyor.

Korelasyon analizinde değişkenler arasındaki ilişkilerin nedensellik durumları ile ilgilenmiyoruz. İlgilendiğimiz konular değişkenler arası ilişkilerin anlamlılığı, yönü ve derecesi. Dolayısı ile bağımlı-bağımsız değişken gibi tanımlamalar korelasyon analizi için yapılmıyor. Nedensellik olgusunu korelasyon analizi için dikkate alamıyoruz. Korelasyon analizi bize yalnızca değişkenler arasındaki ilişkinin yönünü ve derecesini verebilir. Hangi değişkenin hangi değişken üzerinde etkisi olabileceğine, alan deneyimlerimize göre ancak biz araştırmacılar karar verebiliriz.

Örneğin; bir beslenme uzmanı, vücut kitle indeksinin kandaki lipit değerleri üzerinde etkisi olduğunu baştan bilmektedir.

Regresyon analizinde durum biraz daha farklı. Artık bağımlı-bağımsız değişken kavramları devreye giriyor ve amacımız bizim için önemli rol oynayan bir bağımlı değişken ile onun üzerinde etkisi olduğu düşündüğümüz bağımsız değişkenleri bir arada modellemek haline dönüşüyor!

Yani ilişkilerin  nedensel açıdan yönünü, regresyon analizinde dikkate almamız gerekiyor.

Regresyon analizini uygularken bağımlı değişkenimiz ile bağımsız değişken(ler)imiz arasında nedensellik bağının olması da şart değil. Amacımız, bağımlı değişkenimizi bağımsız değişken(ler)imizden hareketle tahmin edecek bir model oluşturmak.

Oldukça teknik gibi gözükse de ayrım oldukça basit. Korelasyon analizinde değişkenlerin yönüne bakmaksızın salt ilişkilere bakarız, regresyon analizinde ise ilişkilerin yönü çoğunlukla bellidir. Nedensellik olmasa bile, bağımsız değişkenlerimizi kullanarak bağımlı değişkenimizi tahmin edebiliyoruz.

Bu olguyu şöyle örneklendirelim:

Babası akciğer kanseri olmuş bir yetişkinin akciğer kanseri olma olasılığı, kuşkusuz genetik faktörlerden etkilenir. Biz de bu gözlemlerimizden hareketler annesi ya da babası akciğer kanseri olan bir yetişkinin de akciğer kanseri olabileceğini söyleyebiliriz.

Burada nedensellik anne ya da babadan çocuğa doğrudur.

Çocuğun akciğer kanseri olması anne ya da babanın akciğer kanseri olmasını etkiler mi? Elbette etkilemez!

Peki çocuğun akciğer kanseri olmasından hareketle annesi ya da babasını görmeden akciğer kanseri olabilecekleri hakkında bir fikir yürütebilir miyiz? Tabi ki yapabiliriz.

Gördüğümüz gibi, nedensellik olmasa bile tahmin yapabiliyoruz.

Dünya ekonomilerine yönelik faiz ve enflasyon arasındaki ilişkiyi modellemek için şöyle bir regresyon modeli kurduğumuzu düşünelim:

ENFLASYON = 0.01 + 1.2 x FAİZ

Bu modelden hareketle faiz oranı belli olduğu durumlar için enflasyon oranını tahmin edebiliriz. Mesela faiz oranı %10 olan bir ülkenin enflasyon oranı da %12.1 olarak kolayca tahmin edilebilir.

Korelasyon analizinde tahmin yapmak gibi bir amacımız yoktur. Yaptığımız tek şey, ilişkiler hakkında genel bir değerlendirmede bulunmaktır.

Ayrıca regresyon analizinde değişken seçimi, modelin lineer-nonlineerliği gibi pek çok farklı olguyu dikkate almamız gerekirken, korelasyon analizinde böyle bir zorunluluğumuz da yoktur.

korelasyon ve regresyon

Peki korelasyon ve regresyon analizinin benzer yönleri yok mu? Tabi ki var.

Öncelikle ilişkilerin anlamlılığı noktasında bu iki analiz uzlaşırlar.

Hem korelasyon, hem de regresyon analizinde de değişkenler arası ilişkilerin anlamlılığını test edebiliriz. Regresyon analizinde bağımsız değişkenlerin bağımlı değişkenler üzerinde anlamlı etkisinin olup olmadığı incelenirken, korelasyon analizinde tüm değişkenler için ilişkilerin anlamlılığına bakılır.

Burada bir nüans farkı olmasına rağmen, her iki analiz de bu noktada birbirine hizmet eder.

Korelasyon analizi sayesinde bağımsız değişkenler arasındaki ilişkileri inceleyerek çoklu bağlantı probleminin varlığını araştırabiliyoruz. Ayrıca değişken seçimi için de bir ön adım olarak korelasyon analizini kullanabiliyoruz.

Korelasyon ve regresyon katsayılarının işaretleri konusunda da iki analiz ortak bir noktada buluşurlar.

Korelasyon analizinde negatif çıkan katsayılar, regresyon analizinde elde edilen beta katsayıları için de negatif çıkar. Benzer şekilde pozitif olan korelasyon katsayıları için de regresyon katsayıları pozitif olmalıdır.

Bu durum her zaman sağlanmayabilir ve bunun ilk sebeplerinin başında da yine çoklu bağlantı belası gelir!

Ancak korelasyon ve regresyon analizinin bu birlikteliği sayesinde yine potansiyel problemleri teşhis edebiliyoruz.

Korelasyon ve regresyon analizi hem paket programlarda, hem de ücretsiz açık kaynak kodlu yazılımlarda da uygulanabilir. Örneğin; SPSS programında farklı korelasyon ve regresyon analizi teknikleri uygulanabilmektedir. R yazılımında da, Minitab programında da, Stata yazılımında da her iki tekniğe yönelik çözümler mevcuttur.

Ancak analizlerin uygulama menüleri ve kodlamaları birbirlerinden oldukça farklıdır. Bu olgu hem menü, hem de kod tabanlı istatistiksel programlar için geçerlidir.

SPSS’de regresyon analizi için Analyze -> Regression adımlarını seçerken, korelasyon analizi için Analyze -> Correlate adımlarını kullanıyoruz.

R yazılımında da lineer regresyon analizi için  lm() fonksiyonunu kullanırken, korelasyon analizi için de cor() fonksiyonunu kullanıyoruz.

Korelasyon ve regresyon analizinin kullandığı teknikler de oldukça farklıdır. Mesela iki ordinal kategorik değişken arası ilişkiler korelasyon için Spearman korelasyon katsayısı ile değerlendirilebilirken, regresyon için de ordinal lojistik regresyon analizi ile değerlendirilebilir.

Özetle nedensellik, tahmin ve modelleme açısından korelasyon ve regresyon analizi arasında ciddi farklılıklar varken; değişkenler arası ilişkilerinin sınanması noktasında ortak yönler bulunmaktadır.