Klasik tekniklerin ötesine geçme zamanı!
İleri istatistiksel analiz teknikleri, veri setlerinde değişkenler arası karmaşık ilişkileri ortaya koyabilmek adına temel düzey testlerin ve modellemelerin ötesine geçen analizler bütünüdür. Araştırmacılar olarak bizler temel istatistiksel analiz teknikleri noktasında pek zorluk yaşamazken; ileri yöntemlere gelince bilimsel bir korkuya kapılıyoruz.
Bu korkularımızda haklı mıyız? Gerçekten ileri istatistiksel analiz tekniklerinden korkmalı mıyız?
Aslında hayır.
Sadece ismindeki “ileri” kelimesi, bizlerde gereksiz bir endişe, korku veya çekinme duygusu yaratıyor.
Bu özlü sözün başındaki kısmı, “İstatistiği öğrenmenin tek yolu vardır” şeklinde güncellesek hiç de yanlış yapmış olmayız.
Hangi teknik olursa olsun, istatistik alanında öğrenilemeyecek analiz yoktur.
Bu, ileri teknikler için de geçerli.
Yapmamız gereken iki işlem var:
Klasik istatistik yöntemlerini biliyoruz: Tanımlayıcı veri analizi uygulamaları (frekans analizleri, ortalama, mod, medyan, standart sapma, minimum-maksimum) ve temel ortalama karşılaştırma testleri (ANOVA, t-testi, Mann-Whitney U testi, Kruskal-Wallis testi vb.) gibi istatistiksel analiz tekniklerini kullanıyoruz.
Temel istatistik uygulamalarımız için kullandığımız değişken sayısının çok olması gibi bir zorunluluk yok.
Ancak ileri istatistiksel analiz tekniklerinden bahsettiğimizde, artık elimizdeki değişken sayısının da fazla olması gerekiyor. Bunun için kesin sınırlarımız yok.
Elbette az sayıda değişken kullanarak da ileri istatistiksel analizleri uygulayabiliriz; ama elde edeceğimiz sonuçlar da değişken sayımızla orantılı şekilde sınırlı olabilir.
Artık hepimizin duymak istediği şu meşhur teknikleri genel hatları ile belirtmenin vakti geldi.
Yukarıda genel hatları ile ileri istatistiksel analiz olarak tanımladığımız yöntemleri gruplandırdık.
Şimdi bir soru daha ortaya atalım: Bu teknikleri elimizdeki değişken sayısının fazla olduğu her durumda kullanmak mümkün müdür?
Cevap: Hayır.
İleri istatistiksel analiz yöntemlerini, araştırma hipotezlerimize ve elimizdeki veri yapılarına bağlı olarak kullanabiliriz.
Süreci biraz örneklendirelim.
Örneğin; elimizde 3 adet ölçek var ve bu ölçeklerin ifade ettiği kavramlar arasındaki nedensel ilişkileri sınamak istiyoruz: Psikolojik sermayenin iş doyumu ve iş tatmini üzerinde anlamlı bir etkisi var mıdır?
Sorumuzun yanıtını alabilmek adına yapısal eşitlik modellemesini kullanabiliriz.
Bu sorunun yanıtını almak için Cox regresyon analizi kullanamayız, ANCOVA uygulayamayız.
Çünkü araştırma problemimiz ve elimizdeki veriler buna uygun değildir.
Bir grup kanser hastasının yaşam süreleri üzerinde cinsiyet, yaş grupları, sigara kullanımı gibi çeşitli faktörlerin etkisini test etmek istediğimizde Cox regresyon analizi kullanırız, yapısal eşitlik modellerini değil.
Cinsiyet ve yaş gruplarının etkisini arındırdıktan sonra, spor yapma durumlarının kandaki glikoz üzerindeki etkisini değerlendirmek için ANCOVA kullanabiliriz, açıklayıcı faktör analizi değil.
Yeni bir tutum ölçeği geliştiriyoruz ve ölçeğin alt boyutlarını belirlemek istiyoruz. Alt boyutlarda yer alan maddeleri belirlemek için açıklayıcı faktör analizini kullanabiliriz, MANOVA değil.
Geliştirdiğimiz veya uyarladığımız herhangi bir ölçeğin yapı geçerliliğini ortaya koymak için doğrulayıcı faktör analizini kullanabiliriz, Poisson regresyon analizi değil.
OECD ülkelerindeki 2021 yılına ait boşanma sayılarının bağımlı değişken olarak alıp çeşitli bağımsız değişkenlerle bir regresyon modeli kurmak istediğimiz Poisson regresyon analizini kullanabiliriz, Polikorik korelasyon analizi değil.
İşte tüm bu örneklerde gördüğümüz gibi, ileri istatistiksel analiz tekniklerinin seçimi kendi isteğimize bağlı değildir.
Tüm bu saydığımız ileri istatistiksel analiz tekniklerini uygulayabilmemiz için istatistik programlarını yetkin bir şekilde kullanabilmemiz gerekiyor.
Bu kapsamda ülkemizdeki araştırmacıların başvurabileceği popüler programları şu şekilde sıralayabiliriz:
Söz konusu istatistik programları, kendilerine has birçok farklı özelliği ve analiz yapabilme kapasitesine sahip. Geçmiş makalelerimizde yazılımlara ilişkin karşılaştırmalı bilgiler sunmuştuk. İlgilenen araştırmacıları geçmiş yazılarımızı incelemeye davet ediyoruz!
Bu yazımızda, ileri istatistiksel analiz yöntemlerine özetle değindik ve en gözde teknikleri sizlere kısaca tanıttık. Kuşkusuz, tanıttığımız tekniklerin dışında daha onlarca ileri istatistiksel analiz metodu var.
İstatistik şirketleri tarafından verilen hizmetlere bakıldığında, son yıllarda klasik tekniklerin yanı sıra ileri istatistiksel analiz tekniklerini de portföylerine katma çabasında olduklarını gözlemliyoruz.
İstatistik danışmanlık hizmetlerinden yararlanmak isteyen araştırmacıların en çok problem yaşadığı ileri istatistiksel analiz konusu, tek bir yazıya sığmayacak kadar geniş bir alanı kapsıyor.
Gelecek yazılarımızda istatistik bilimine yönelik tekniklere değinmeye ve aklınıza takılan soruların cevaplarını aramaya devam edeceğiz