Kategorik Veri Analizi ve İstatistiksel Analiz Teknikleri

kategorik veri analizi istatistiksel analiz

İstatistiksel analiz noktasında kategorik verilerin rolü

Kategorik veriler, istatistiksel analiz alanında çok önemli role sahiptir. Kategorik veri analizi tekniklerini bu açıdan yoğun olarak kullanmaktayız.  Sayı olarak ifade edemediğimiz onlarca veri ile karşılaşıyoruz ve tüm bu veriler kategoriktir. Bazı kaynaklarda nitel veri olarak da adlandırılsa da; son zamanlarda yeni gelişmeye başlayan nitel veri analizi ile karıştırılmaması adına bu deyimi kullanmak yerindedir.

Araştırmalarda sıklıkla rastladığımız cinsiyet, eğitim, yaş grubu, medeni durum gibi değişkenlerin tamamı kategorik verilerin kapsamında değerlendiriliyor. Anket çalışmalarında da sıklıkla kullandığımız likert tipli ölçek maddeleri de kategoriktir.

İstatistiksel hipotezlerimizi kurgularken, çoğunlukla söz konusu kategorik değişkenler arasındaki ilişkileri sınamaya yöneliyoruz.

Kategorik veri analizi için temel teknikler

Kategorik değişkenler arasındaki ilişkileri test etmek veya kategorik bağımlı değişkenli bir regresyon modeli kurmak için kategorik veri analizi tekniklerine başvuruyoruz. İstatistiksel analiz teknikleri arasında onlarca teknik mevcut; ancak bilimsel çalışmalarda yoğun olarak kullandığımız kategorik veri analizi tekniklerini şu şekilde tanımlayabiliriz:

  • Ki-kare bağımsızlık testleri
  • Lojistik regresyon analizleri
  • Log-lineer modeller

Yukarıda bahsedilen teknikler arasından ki-kare bağımsızlık testleri vazgeçilmez bir yaklaşımdır. Onlarca makale, onlarca tez çalışmasında ki-kare bağımsızlık testinin kullanıldığını görebiliriz. Bağımsız testini uygularken dikkat etmemiz gereken birçok özel noktanın da olduğunu belirtmek gerekiyor.

Ki-kare bağımsızlık testlerinde çapraz tablo bulgularına göre klasik ki-kare, Yates düzeltmesi veya Fisher testini seçmemiz gerekiyor. Farklı veri türlerinde farklı testlerin seçimi için de önerilmiş özel testler bulunuyor.

Örneğin, ordinal bir değişkeni kullanarak ilişkileri test etmek istediğimizde Mantel–Haenszel testini kullanmamız, klasik ki-kare testlerine kıyasla çok daha doğru.

Bağımsızlık testlerinin yanı sıra değişkenler arası ilişkilerin derecesini de belirlemek isteyebiliriz. Bunun için de Phi Katsayısı, Cramer-V katsayısı gibi özel ölçüleri kullanabiliriz.

Yine ordinal veriler için özel korelasyon katsayılarının hesaplanabildiğini gözden kaçırmayalım.

Kategorik bir bağımlı değişken üzerinden regresyon analizi uygulamak üzere ikili (binary), sıralı (ordinal) ve çok gruplu (multinominal) lojistik regresyon analizi tekniklerini kullanabiliyoruz.

Birden çok kategorik değişken arasındaki daha kompleks ilişkileri analiz edebilmek için de log-lineer analizi tekniğini uygulayabiliyoruz. Ancak yayınlarımızda log-lineer analizi göreli nadir uygulanan bir istatistiksel analiz tekniğidir.

Kategorik veri analizi uygulamaları için R-Project, SPSS, Minitab gibi bir istatistiksel analiz programını kullanmayı öğrenmek gerekiyor. Son söz olarak bu tekniklerin kategorik veri analizi alanında sadece temel istatistiksel analiz teknikleri olduğunu; bu tekniklerin dışında da çok sayıda yöntemin mevcut olduğunu söyleyelim.