Kategorik Değişkenler Arası Korelasyon Mümkün mü?

kategorik değişkenler korelasyon

 

Kategorik Değişkenler Arası İlişki Dereceleri

Klasik istatistik analizi ile ilgili kaynaklarda, korelasyon analizi bölümü nicel değişkenler için ayrılmıştır. Ancak araştırmalarımızda yalnızca nicel değil, kategorik değişkenler de kullanılmaktadır. Kategorik değişkenler sayısal olarak ifade edemediğimiz ve birimlerin grup şeklinde tanımlandığı verilerden oluşmaktadır.

Sayısal değişkenler arasında olduğu gibi, kategorik veriler arasındaki ilişkileri de incelemek isteyebiliriz. Bu ilişkileri örneklendirelim:

  • Cinsiyet grupları ile koronavirüse yakalanma durumları arasında ne ölçüde bir ilişki var?
  • Eğitim grupları ile aşıya karşı tutum düzeyleri arasında ne derece bir ilişki var?

Söz konusu soruları genişletebiliriz. Sıralayıcı (ordinal) veya adlandırma (nominal) ölçekli değişkenler arasındaki ilişkilerin derecesini merak edebiliriz. İstatistiksel analiz üzerine yazılmış kaynaklarda ilişkilerin derecelerini korelasyon analizi ile ölçümlerken ve yalnızca sayısal değişkenlere vurgu yapıldığını biliyoruz. Peki kategorik veriler için bunu yapabilir miyiz? Yanıt: Evet. Kategorik değişkenler arası korelasyon analizi mümkün.

Kategorik Veriler İçin Korelasyon Katsayıları

Nasıl ki sayısal veriler arasındaki korelasyonu inceleyebiliyorsak, kategorik değişkenler için de korelasyon katsayılarını hesaplayabiliriz. Ancak sayısal verilerde olduğu gibi, katsayının işaretini tek bir istisna dışında aynı-ters yönlü ilişki şeklinde yorumlayamıyoruz.

İstatistik analizi literatüründe kategorik veriler için korelasyon yerine ilişki katsayıları kavramı kullanılabilmektedir.

Kategorik veriler arası korelasyon ölçülerini etkileyen iki temel faktör söz konusudur:

              1) Değişkenler arasındaki ölçme düzeyleri

              2) Değişkenlerin grup sayıları

Kategorik veriler arasındaki korelasyon ölçüleri, değişkenlerin ölçme düzeyine bağlı olarak adlandırma-adlandırma, sıralayıcı-sıralayıcı ve adlandırma-sıralayıcı şeklinde üç farklı kombinasyona göre değişebilmektedir.

Kategorik değişkenlerin gruplarına göre r x c boyutlu çapraz tablo oluşturuyoruz. Burada r satırdaki değişkenin grup sayısını, c ise sütundaki değişkenin grup sayısını temsil etmektedir. Çapraz tablonun boyut sayısına göre farklı korelasyon ölçülerinden yararlanıyoruz. Boyutların 2 x 2 veya r x r olmasını dikkate almalıyız.

İstatistiksel analiz programlarında kategorik değişkenler korelasyon ölçülerini hesaplayabiliyoruz. R-Project, SPSS vb. programlar bu noktada yardımımıza koşuyor. Ancak kategorik veriler arası korelasyon ölçüleri noktasında en güçlü veri analizi programı tartışmamız R-Project.

Kategorik veriler için Phi katsayısı, Cramer-V katsayısı, Sakoda katsayısı, Polikorik korelasyon, Tetrakorik korelasyon gibi çok sayıda farklı ölçü kullanılabiliyor. Söz konusu ölçüleri tek bir yazıya sığdırmak mümkün olmadığı için, gelecek yazılarda bu ölçülerin özel noktalarına değineceğiz.