Neden t-Testi Değil, Tukey Testi?

Çoklu Karşılaştırmalarda Tukey Testi’ni Uygulamak

İstatistiksel analizlerimizde ortalama karşılaştırma testlerini hemen her sayısal veri için kullanıyoruz. Özellikle k>2 grubun ortalamalarını karşılaştırırken, ANOVA testi sonucunu anlamlı bulduğumuzda, Tukey testine sıklıkla başvuruyoruz.

Ünlü araştırmacı Tukey tarafından 1953 yılında kaleme alınmış “The Problem of Multiple Comparisons” isimli eserinde, kendi adını verdiği bu teste ilk kez rastlıyoruz.

Peki Tukey testini ne zaman uygulayabiliriz?

Öncelikle, en az üç grup arasında, seçtiğimiz sayısal değişkenin ortalamalarını karşılaştırmak gibi istatistiksel bir amacımızın olması gerekiyor.

O halde bu testi uygulamak için gerekli iki bileşenimiz şunlar olmalı:

1) En az üç gruba sahip kategorik bir bağımsız değişken(X)

2) Oransal veya aralıklı ölçme düzeyine sahip sayısal bir bağımlı değişken (Y)

Ancak bu noktada da bir ön koşul var:

Sayısal değişkenimizin normal dağılım varsayımını sağlaması gerekiyor.

Tabi bu normallik testini, kullandığımız bağımsız kategorik değişkenin gruplarına göre incelememiz gerekiyor.

Yani gruplara göre sayısal ölçümlerimizin normal dağılışlı olması gerekiyor. Sayısal değişkenin tamamı için normal dağılım varsayımına bakmıyoruz, bu noktaya özellikle dikkat!

Örneğin; sağlık alanında bir araştırma yürütürken, üç farklı tansiyonun ilacı arasında kişilerde oluşan kan basıncındaki ortalamaları test etmek istiyoruz.

Amacımızın da üç farklı tansiyon ilacı arasında kan basıncı ortalamalarına göre istatistiksel açıdan anlamlı bir farkın olup olmadığını test etmek olsun.

Bu amacı gerçekleştirebilmek için, ilk aşamada her tansiyon ilacı için kan basıncı ölçümlerinin normal dağılıma uygunluklarını test etmeliyiz.

Eğer normal dağılım koşulu sağlanıyorsa, bu durumda varyans analizi (ANOVA) testi ile, artık ortalamaları karşılaştırabiliriz.

Farz edelim, F-istatistiğimize göre en az iki grup arasında anlamlı farkın olduğunu belirledik.

Artık sıra, çoklu karşılaştırmalara geldi.

Elbette, arada bir de varyans homojenliği varsayımı var; bu varsayımın da sağlanmış olduğunu saptadığımızda, artık Tukey testini kullanabiliriz.

Özetle, Tukey testini kullanabilmek için üç koşulun da sağlanmış olması gerekiyor:

  • Sayısal verilerin gruplara göre normal dağılıma sahip olması
  • Sayısal verilerin varyanslarının gruplar arasında homojen dağılması
  • ANOVA testi sonucunda gruplar arası anlamlı farkın bulunması

Peki Neden t-testi Yerine Tukey Testini Tercih Ediyoruz?

Anlamlı bulunan bir ANOVA testi sonucunda, doğal olarak aklımıza şu soru gelmektedir:

Neden ayrı ayrı bağımsız örneklemler t-testi yerine Tukey testi kullanıyoruz?

Evet, normalde ikili ikili t-testleri ile çoklu karşılaştırmaları gerçekleştirebiliriz.

Ancak bu durumda, istatistikte tip-1 hata olarak tanımladığımız bir hataya düşmüş olabiliriz.

Tip-1 hata, doğru olan bir Ho hipotezini reddetme hatası olarak tanımlanabilir.

Bizim Ho hipotezlerimiz, ortalama karşılaştırma testlerinde şu şekilde kuruluyor:

Ho: Gruplar arası ortalamalara göre istatistiksel olarak anlamlı fark yoktur.

Hı: Gruplar arası ortalamalara göre istatistiksel olarak anlamlı fark vardır.

Bu hataya yakalandığımız takdirde, ortalamalar arası fark yokken fark varmış gibi yanlış bir sonuca erişebiliriz.

Peki ayrı ayrı t-testi yapmak, bizi neden bir hataya sürüklemektedir?

Çünkü her bir testin, istatistiksel açıdan bir maliyeti vardır ve bu maliyet de hata olarak karşımıza çıkar.

Araştırmamızda hata payını alfa=0.05 alırsak (ki genelde bu değeri alırız) bunu aşağıdaki şekilde formülize edebiliriz:

Burada m, uyguladığımız test sayısını gösterir. Eğer tek adımda çoklu karşılaştırma gerçekleştirmek yerine ayrı ayrı t-testi uygularsak, m, yani test sayısına bağlı olarak hata olasılığımız da artacaktır.

Bu formülasyona göre m=3 test uyguladığımızda, P(Hata olasılığı) artık 0.05 değil; yaklaşık 0.143 olur.

Matematiksel denklemde de açıkça gördüğümüz üzere, ikişerli çok sayıda farklı t-testi uygulamak, tip-1 hata düzeyimizi artırıyor.

Çalışmamızdaki grup sayısı arttıkça tip-1 hata olasılığımız da üstel olarak artış gösterecektir, bu kesin.

Örneğin; grup sayımızın k=6 olduğunu düşündüğümüzde, ortaya çıkacak anlamlı fark sonuçlarının da doğruluğundan şüphe etmemiz kaçınılmaz olacaktır.

İşte Tukey testinin istatistiksel formülasyonu, bizi bu tür bir hata olasılığından koruyor ve bu nedenle çok sayıda t-testi uygulamak yerine, Tukey testini kullanıyoruz.

Kuşkusuz Tukey testinden farklı olarak bizi tip-1 hataya düşmekten kurtaracak farklı hipotez testleri de mevcut. Alternatif olarak Scheffe, Duncan, Tamhane, Games-Howell gibi çok sayıda hipotez testine başvurabilir ve çoklu karşılaştırmalarımızı gerçekleştirebiliriz.

R, SPSS, Minitab, SAS gibi istatistiksel programlar sayesinde bu testleri kolaylıkla uygulayabiliyoruz.

Gelecek yazılarımızda çoklu karşılaştırma testleri üzerinde durmaya devam edeceğiz.