İstatistiksel analiz aşamasında sayısal verilerin bulunduğu her uygulama için normallik testlerini kullanıyoruz. Özellikle hipotez testlerinin seçiminde normallik testleri aracılığı ile uygun testleri belirliyoruz.
Ortalama karşılaştırmaları için t-testi ya da Mann-Whitney U; ANOVA ya da Kruskal Wallis testinin uygulanacağını belirleten temel etmen, verilerin normal dağılıma uygun olup olmadığıdır. Yalnızca ortalama karşılaştırma testlerinde değil; korelasyon-regresyon analizi sürecinde de verilerin normalliğine göre uygun tekniğe başvuruyoruz.
Kısacası istatistiksel analiz için sayısal verilerin olduğu her aşamada normallik testleri vazgeçilmezdir.
Verilerin normal dağılıma uygun olup olmadığı için istatistik literatüründe grafiksel yöntemler, tanımlayıcı istatistikler ve hipotez testleri kullanılıyor. Söz konusu yaklaşımlar arasında en sık kullandığımız yaklaşım hipotez testleridir.
Verilerimizin normal dağılıma uygun olup olmadığını belirlemek için Shapiro-Wilk, Kolmogorov-Smirnov gibi testlere başvuruluyor. Normallik testlerini uygularken kurguladığımız istatistiksel hipotezler şu şekilde tanımlanmaktadır:
Ho: Veriler normal dağılıma uygundur.
Hı: Veriler normal dağılıma uygun değildir.
Görüldüğü üzere normallik hipotezlerimizi kurgularken sıfır hipotezimiz verilerin normal dağılıma uygun olduğu, alternatif hipotezimiz ise verilerin normal dağılıma uygun olmadığı şeklinde oluşturuyoruz.
Test sonucunda anlamlılık değerimiz hata payımızdan düşükse (genelde p<0.05) Ho hipotezi reddedilir ve normal dağılım koşulunun sağlanmadığı sonucuna ulaşılır. Ancak anlamlılık değerimiz hata payına eşit veya daha büyükse, verilerin normal dağılıma uygun olduğu sonucuna varılır.
Bazı durumlarda Ho ve Hı hipotezlerinin konumlarında bir karmaşıklık yaşanıyor. Örneğin; sıfır hipotezi verilerin normal dağılıma uygun olmadığı şeklinde tanımlanabiliyor.
Sonuçların yorumlanış şeklinde görüldüğü üzere, normallik varsayımının sağlanıp sağlanmadığına karar verirken Ho ve Hı hipotezlerimizi doğru şekilde oluşturmamız istatistiksel analiz açısından son derece önemlidir. Çünkü doğru testin seçimine karar verirken sayısal ölçümlerimizin normal dağılıma uygunluğunu göz önünde bulundurmak durumundayız.
Normallik testlerini uygulamak için de R-Project, SPSS, Minitab, STATA gibi çok sayıda istatistiksel analiz programını kullanabiliriz. Ancak hangi istatistiksel analiz yazılımını seçersek seçelim; normallik sınamaları için doğru kurgulanmamış hipotezlerin bizleri yanlış sonuçlara sürükleyebileceğini ve yanlış analiz tekniklerinin seçimine yol açacağını unutmayalım.