R İLE FAKTÖR ANALİZLERİ

“Faktör Analizi” ifadesini birçok araştırmacı ilk duyduğunda yüzleri pek de güleç bir hal almıyor olsa gerek. Bir de üstüne R programını ekleyince tadından değil de acıdan yenmeyecek bir yemek misali oluyor. Bu durumda iş başa düşüyor ve bu konuyu en anlaşılır kılmanın yolu İSTMER ekibine düşüyor.

İlk olarak temel teorik bilgi ile başlayalım.

Faktör analizleri, gözlenen değişkenler arasındaki korelasyon modellerini açıklayan, faktörler olarak bilinen, altta yatan gizli değişkenleri (örtük, latent) ortaya çıkarmak için kullanılan istatistiksel tekniklerdir.

Bir dizi gözlemlenen değişken arasındaki ilişkileri anlamak ve bu ilişkilere katkıda bulunan temel boyutları veya yapıları belirlemek için psikoloji, sosyoloji, ekonomi ve pazar araştırması gibi alanlarda yaygın olarak kullanılır.

Açıklayıcı faktör analizi (AFA) ve doğrulayıcı faktör analizi (DFA) başta olmak üzere farklı faktör analizi yöntemleri vardır. AFA, amaç verilerdeki temel faktör yapısını keşfetmek ve ortaya çıkarmak olduğunda kullanılır.

Faktör sayısını belirlemeye ve değişkenler ile faktörler arasındaki ilişkileri anlamaya yardımcı olur. DFA ise önceden belirlenmiş bir faktör yapısını teorik bilgilere veya hipotezlere dayalı olarak test etmek ya da doğrulamak için kullanılır.

Durum böyle olunca AFA ölçek geliştirmenin, DFA ise ölçek uyarlamanın mihenk taşıdır desek yeridir. Dolayısıyla bu temel faktör analizi yöntemlerinin günümüzdeki R gibi güçlü bir programdaki işlevleri ya da fonksiyonları önem arz etmektedir.

R ile Açıklayıcı Faktör Analizi

Malumunuz istatistiğin testler açısından ilk olgusu varsayımlardır. Dolayısı ile R ile Açıklayıcı Faktör Analizi (AFA) yapabilmenin ilk adımı da varsayımların sağlayıp sağlamadığı kontrol etmek ile başlar. Bunlardan ilki tanımlayıcı istatistiklerdir. Tanımlayıcı istatistikleri elde etmek için pastecs paketindeki stat.desc fonksiyonu kullanılabilir (Grosjean ve Ibanez, 2018).

Daha sonra sırasıyla VIF (Variance Inflation Factor), TV (Tolerance Value) ve CI (Conditional Index) değerlerinin maksimum ve minimum değerleri hesaplanır. Çoklu bağlantı durumunu incelemek için mctest paketi kullanılabilir (Ullah vd., 2019).

Üçüncü olarak Mahalanobis uzaklığının istatistiksel olarak anlamlılık durumuna bakılır.

Dördüncü sırada, aykırı değerlerin sayısı vardır ve çok değişkenli aykırı değerleri incelemek için stats paketi kullanılır. Son olarak Mardia’nın (1970) çok değişkenli basıklık değeri ve p değeri bulunur ve çok değişkenli normalliği incelemek için psych paketi kullanılır (Revelle, 2018).

AFA için gerekli varsayımlar kontrol edildikten sonra veri setindeki değişkenler arasındaki korelasyonlar incelenir.

Korelasyonları göstermenin birçok yolu vardır. Tablo gösterimleri muhtemelen en yaygın olanlarıdır.

R programında 5 değişkenli bir veri setinin cor fonksiyonunun çıktısı aşağıdaki gibi dikdörtgen bir matris biçimindedir.

Aynı veri setinin grafiksel gösterimi için cor.plot fonksiyonu kullanıldığında elde edilecek görsel ise aşağıdaki gibi olur.

Değişkenler arasındaki korelasyonlar incelendikten sonra AFA için örneklem büyüklüğünün KMO (The Kaiser, Meyer, Olkin Index) değeri değerlendirilir. Daha sonra korelasyon matrisinin birim matristen farklı olup olmadığı hakkında bilgi veren Bartlett testi yapılır. KMO değerini hesaplamak ve Bartlett testini yapmak için değişkenler arasındaki korelasyonlar kullanılır ve pscyh paketinin sırasıyla KMO ve cortest.bartlett fonksiyonları ile sonuçlar elde edilir (Revelle, 2018).

AFA dahilinde faktör sayısını belirlemek için kullanılan başlıca yöntemler şunlardır:

  • Kaiser Kuralı
  • Joliffe Kriteri
  • Yamaç Birikinti Grafiği (Scree Plot)
  • Paralel Analizi (PA)
  • Minimum Kısmi Ortalama (MAP)

Yamaç Birikinti Grafiğini oluşturmak için öncelikle özdeğerler hesaplanır. Ardından ggplot2 paketi aracılığıyla özdeğerler-faktör sayısı grafiği oluşturulur (Wickham, 2016).

PA ve MAP analizi yapmak için psych paketinin sırasıyla fa.parallel ve vss fonksiyonları (Revelle, 2018) kullanılır. PA’yı yürütmek için Pearson çarpım momenti korelasyon matrisi ya da polikorik korelasyon matrisi hesaplanabilir.

Farklı faktör sayısı bulma yöntemleri dikkate alınarak boyut sayısının belirlenmesinin ardından psych paketinin fa fonksiyonu kullanılarak AFA analizi için R kodu yazılır.

Aşağıda korelasyon matrisi olarak polikorik, faktör sayısı olarak 2 , faktör çıkarma yöntemi olarak asal eksen faktör yöntemi ve döndürme yöntemi olarak Oblimin seçilmiş bir veri setine ait AFA kodları ve sonuçları verilmiştir. 

Yine farklı bir veri setinin 3 boyut altında toplanmış AFA sonuçlarına ait tablo, aşağıda örnek olarak sunulmuştur.

R ile Doğrulayıcı Faktör Analizi

DFA, gözlenen veriler ile varsayılan bir faktör yapısı arasındaki uyumu değerlendirdiği için doğrulayıcı bir tekniktir.

Genellikle bir modelin uyumunun iyiliğini değerlendirmek, faktörler ve gözlenen değişkenler arasındaki ilişkileri belirlemek ve gruplar arasında ölçüm değişmezliğini incelemek için kullanılır.

R’de çeşitli paketler kullanılarak DFA yapılabilir. Yaygın olarak kullanılan bir paket, yapısal eşitlik modellemesi için kapsamlı bir dizi işlev sağlayan lavaan paketidir. “lavaan” paketinin sözdizimini ve gösterimini kullanarak DFA modelinizi tanımlayabilir; DFA modelini verilerinize uydurmak için de cfa fonksiyonunu kullanabiliriz.

Model belirtimini ve veri kümesini fonksiyona bağımsız değişken olarak sağlayın. İsteğe bağlı olarak ek parametreler belirleyebilirsiniz.

Bazı yaygın fonksiyonlar arasında özet istatistikleri görüntülemek için summary, parametre tahminlerini elde etmek için parameterEstimates ve model uyumunu değerlendirmek için fitMeasures bulunur.

DFA sonuçlarında gizli faktörler ve gözlemlenen göstergeler arasındaki ilişkileri anlamak için parametre tahminleri, standart hatalar ve p-değerlerini incelenir.

Ki-kare test istatistiği (χ2) karşılaştırmalı uyum indeksi (CFI), ortalama karesel yaklaşım hatası (RMSEA) vb. gibi uyum indekslerini kullanarak model uyumunu değerlendirebiliyoruz.

Tüm bu bilgiler ışığında bir örnek çalışma ile anlatılanları uygulamalı tanımlamak oldukça faydalı olacaktır.

Orijinali vd. 2008 yılında revize edilmiş olan Tiksinme Ölçeği-Revize Edilmiş Form (TÖ-R) 2013 yılında C. Ekin Eremsoy ve Müjgan İnözü tarafından Türkçe’ye uyarlanmıştır. Ölçeğin üç faktörlü yapısına ilişkin standardize sonuçlar aşağıdaki şekilde verilmiştir.

TÖ-R’nin orijinal versiyonun da kullanılmış olan üç faktörlü yapının Türk örneklemden elde edilen veri ile ne derece uyuştuğunu test etmek amacıyla DFA uygulanmıştır. Bu amaç doğrultusunda test edilecek olan model 25 gözlenen ve üç örtük (latent) değişken kullanılarak oluşturulmuştur.

Söz konusu ölçme modeli için uyum indeksi değerleri, χ2=557.22, p < .001, CFI = .96, RMSEA = .05 olarak bulunmuştur. DFA sonucunda, uyum indeksi değerleri model ile verinin yüksek düzeyde uyum gösterdiğine işaret etmektedir.

Tabi ki bu indeksler verilen örneklerdekinden daha fazla sayıdadır ve her birinin sonucunun yorumlanmasına yönelik sınırlar değişmektedir. Bu konuyu ayrı bir yazımızda ele alacağız.

Sonsöz

R ile, çeşitli farklı teknikler kullanarak kolayca faktör analizleri yapabilirsiniz. Çizimleri ve grafikleri kullanarak sonuçlarınızı görselleştirebilirsiniz.

Bu, verilerinizin altında yatan yapıyı anlamanıza ve önemli kalıpları ve ilişkileri belirlemenize yardımcı olabilir. AFA ve DFA analizlerinin uygulandığı diğer analiz programları hakkında bilgi edinmek için “Açımlayıcı Faktör Analizi – Doğrulayıcı Faktör Analizi” başlıklı yazımızı okumanızı tavsiye ederiz.