KMO İstatistiği Nedir?

kmo istatistiği nedir

KMO İstatistiği Ne Anlama Geliyor?

İstatistiksel Bilgilendirme

KMO istatistiği açıklayıcı faktör analizinde örneklem yeterliliğini değerlendirmek için kullanılan bir katsayıdır. Bu katsayı, alt boyut belirlemek için açıklayıcı faktör analizinin uygulandığı her çalışmada istisnasız karşımıza çıkmaktadır.

Şimdi bu istatistiği yakından inceleyelim.

KMO istatistiği, Kaiser Meyer Olkin ifadesinin baş harflerinin kısaltmasından geliyor.

Profesör Ingram Olkin’in de katkısıyla normalize formunda, KMO istatistiği son halini alıyor.

Kaiser (1970) tarafından Psychometrika dergisinde yayınlanmış “A second generation Little Jiffy” isimli makalesi, bu muhteşem istatistiği bilim hayatımıza kazandırmış.

KMO istatistiğinin önerilme sebebi örneklem yeterliliğinin ölçülmesine dayanıyor.

İşte tam da bu nedenle orjinal çalışmada “Measures of Sampling Adequacy” şeklinde tanımlanmış bir ifade ile karşılaşıyoruz.

Bazı kaynaklarda KMO katsayısı şeklinde de bahsediliyor. Her iki kullanım da bilimsel açıdan uygun.

Bu duruma dikkat çekmek için aşağıdaki başlığı kullanalım.

KMO Katsayısı (İstatistiği) Nasıl Hesaplanıyor?

İlk olarak matematiksel hesaplanışına kısaca göz atalım.

KMO istatistiği hesaplanırken iki temel ölçüye ihtiyacımız var:

1.) Değişkenler arası ham korelasyon katsayıları

2.) Değişkenler arası kısmi korelasyon katsayıları

Yukarıda bahsedilen ham ve kısmi korelasyon katsayıları her değişken çifti için ayrı ayrı hesaplanıyor.

KMO istatistiğinin matematiksel hesaplanışını aşağıdaki formülde gösteriyoruz.

kmo-istatistiği

Formülde gösterdiğimiz rxij değişkenler arası korelasyonları; pxij ise değişkenler arası kısmi korelasyonları göstermektedir.

Programların göz açıp kapayıncaya kadar verdiği KMO istatistiğinin arkasında işte bu formülasyon yatıyor.

KMO istatistiğini hem genel formu ile hem de maddeler için ayrı ayrı hesaplayabiliyoruz.

Anket çalışmalarımızda esasen tıpkı komünalitelerde olduğu gibi ayrı ayrı tüm maddeler için örneklem yeterliliğini bu istatistikle sınayabiliriz.

Bilimsel çalışmalarda bu yoldan ziyade genel KMO istatistiği verilmektedir.

Hesaplanma aşamasında araştırmacıların ıskaladığı, ancak kritik role sahip bir istatistiğimiz var:

Korelasyon katsayısı

Paket programlar bu formülasyon için genelde Pearson korelasyon katsayısını kullanıyor.

Literatürde bazı kaynaklar alternatif korelasyon katsayılarının da kullanılabileceğine işaret etmektedir.

kmo istatistiği

Özellikle anket çalışmalarında KMO istatistiği karşımıza sıkça çıkıyor.

Çünkü araştırmacılar anketler aracılığı ile ölçek geliştiriyor veya uyarlıyor.

Ölçek geliştirme/uyarlama süreçlerinde alt boyutları belirlemek için de açıklayıcı faktör analizi uyguluyorlar.

Açıklayıcı faktör analizi uygulanırken de yukarıda bahsettiğimiz gibi Pearson korelasyon katsayıları baz alınıyor.

Halbuki anket verilerinde farklı ölçme düzeylerinde değişkenler ile çalışıyoruz ve bu değişken türlerine uygun farklı farklı korelasyon katsayıları geliştirilmiş.

Maalesef bu özel katsayılar literatürde hak ettiği yeri bulmuyor ve klasik Pearson korelasyon ölçüsü baskın geliyor.

Halbuki bu noktada yapabileceğimiz değişiklikler örneklem yeterliliği başta olmak üzere anket sonuçlarımızda harika değişimler yaratabilme potansiyeline sahip.

Ah şu alışkanlıklar…

KMO İstatistiği Kaç Olmalı?

Araştırmalarda çeşitli sınırlar olmakla birlikte, derlenen sonuçlar üzerinden sınırları şu şekilde gösterebiliriz:

KMO>0.90 Mükemmel
0.80<KMO<=0.90 Çok iyi
0.70<KMO<=0.80 İyi
0.60<KMO<=0.70 Orta

0.60’ın altında bir değer örneklem yeterliliğinin kötü olduğunun göstergesidir. Çalışmalar da zaten 0.60’ın altında bir değeri “miserable”, yani acınası, berbat olarak tanımlıyor!

Yapılan benzetim (simülasyon) çalışmalarında, çok düşük korelasyonlu verilerde dahi 0.50-0.60 arasında değerlerin elde edildiği görülmüş.

Bu da açıklayıcı faktör analizi için uygun olmayan veri setlerinde, KMO katsayısının 0.60’ın altında olduğuna ve dolayısıyla uygun sonuçlar alınamayacağına işaret ediyor.

İstatistiksel analiz çalışmalarına genel anlamda bakıldığında, araştırmacıların bulguları üzerinden şu sonuca varabiliriz:

İyi bir analiz sonucunda KMO istatistiği en az 0.7 olmalı

Pratikte elde ettiğimiz veriler zaten belirli bir örneklem sayısına ve ilişkisel yapılara göre hazırlanıyor.

Seçtiğimiz sorular mutlaka kendi aralarında ilişkili olacak biçimde seçiliyor ve örneklem hacmimiz de madde sayısının en az 5 ila 10 katı arasında değişiyor.

Soru yapılarımız ve örneklem hacmimiz üzerinde aldığımız tedbirler, KMO katsayısının sorunsuz çıkmasını sağlıyor.

Bu nedenle, uygulamada KMO katsayısının 0.70’in altında çıkması gibi bir problemle karşılaşılması, çok nadir bir durum.

Ayrıca ilk etapta düşük katsayılar elde edilse bile, düşük korelasyonlu maddeler açıklayıcı faktör analizi esnasında veriden atıldıkça, 0.70’in üzerinde bir değere (çok ekstrem bir durum olmadıkça) eninde sonunda ulaşıyoruz.

Bu yazımızda, araştırmacıların Google‘da yoğun olarak arattığı KMO istatistiğine ilişkin birtakım bilgiler sunduk.

Özellikle ölçek geliştirmek veya uygulamak isteyen anket araştırmacıları için yazımızın faydalı olmasını umuyoruz.