İstatistik analizi uygulamalarında sayısal verilerimizin normallik durumunu belirlememiz, uygun istatistiksel analiz tekniğinin seçimi için son derece önemlidir. Normal dağılım varsayımının sağlanıp sağlanmadığını test etmek için çok sayıda test önerilmiştir. Şimdi verilerin normal dağılıma uygunluğunu test etmek için geliştirilen Anderson-Darling normallik testini inceleyelim.
Anderson-Darling normallik testini uygulayabilmemiz için verilerimizin aralıklı veya oransal ölçekli olması gerekiyor. Verilerimizi skor puanı şeklinde tanımlayacak olursak, en azından sıralayıcı ölçekli olması bekleniyor.
Öncelikle istatistiksel hipotezlerimizi oluşturalım:
Ho: Veriler normal dağılmaktadır.
Hı: Veriler normal dağılmamaktadır.
Yukarıda tanımladığımız hipotezlere göre karar verebilmemiz için bir test istatistiği hesaplamamız gerekiyor. Anderson-Darling normallik testi için hesaplanan test istatistiği aşağıdaki şekilde hesaplanıyor:
Test istatistiğinde p ile gösterilen nicelikler, verilerin z-dönüşümlerinin kümülatif dağılım fonksiyonundaki değerlerine karşılık geliyor. Esas olarak test istatistiği hesaplanırken normal dağılıma ilişkin kümülatif dağılım fonksiyonundan yararlanıyoruz.
Test aşamasında verilerin aritmetik ortalama ve standart sapmaları üzerinden söz konusu dönüşümler uygulanıyor.
Formüldeki In doğal logaritmik dönüşümü, n ise gözlem sayısını gösteriyor.
Anderson-Darling normallik testi için istatistiksel analiz literatüründe önerilmiş farklı çalışmalar da var. Özellikle küçük örneklemler için modifiye edilmiş test istatistiklerine başvuruluyor. Modifiye edilmiş test istatistiğine göre gözlem sayısı arttıkça Ho hipotezini reddetme ihtimalimiz de azalıyor.
Tüm normallik testlerinde olduğu gibi, test istatistiği belirli bir hata payı için (genelde %5) kritik değeri aştığı durumlarda verilerin normal dağılıma uymadığı sonucuna varıyoruz (p<0.o5).
Anderson-Darling normallik testi birçok farklı istatistiksel analiz programı ile uygulanıyor. Bu sınama için R-Project, Minitab, JMP, EViews yazılımlarından herhangi birisini kullanabiliriz. Ancak Anderson-Darling testi mevcut SPSS programları ile uygulanamıyor. Stata içerisinde de en küçük kareler (EKK) için önerilmiş özel bir modül geliştirilmiş.
Anderson-Darling testi özellikle ekonometrik analiz uygulamalarında sıkça kullanılıyor. Elbette istatistiksel hipotez testlerinin seçiminde de kullanılabilir. Anderson-Darling testi, normal dağılım dışındaki (Poisson, üstel vb.) diğer farklı dağılımların da uygunluğunu test etmek için de gerçekleştirilebiliyor.
Ancak verilerimizde aykırı değerlerin var olduğu durumlarda normallik testi sonucunda yanlış çıkarımlarda bulunabiliriz.
Sonuç olarak, verilerimizin normal dağılıma uygun olup olmadığını sınamak için bilimsel araştırmalarımızda alternatif olarak Anderson-Darling testini kullanabiliriz.