Ortalamalar Açısından Bağımsız İki Grubun Karşılaştırılması: T-Testi mi Z-Testi mi?

Bağımsız iki grubun karşılaştırılması

Parametrik teknikler ile ortalamalara göre bağımsız iki grubun karşılaştırılması

Ortalamalar açısından bağımsız iki grubun karşılaştırılması, istatistiksel analiz süreçlerinde sıkça karşımıza çıkan bir durumdur. Kalp hastası olan ve olmayan kişilerin ortalama beyaz kan hücreleri sayılarını, obez ve obez olmayan bireylerin ortalama TV izleme sürelerini karşılaştırırken; ortalamalara göre bağımsız iki grubun karşılaştırılması için parametrik testler kapsamında t-testi veya z-testine başvuruyoruz.

Kısaca, normal dağılım varsayımı altında, sayısal ortalamalar açısından bağımsız iki grubun karşılaştırılması için bağımsız örneklemler t-testini ya da z-testini tercih etmek durumundayız.

İstatistiksel analiz kaynaklarında bu testler ayrı başlıklar halinde veriliyor. Ancak pratik uygulamalarda genelde t-testi kullanılıyor. Bu noktada z-testi ile t-testi arasındaki temel farklılıkları ve benzerlikleri inceleyelim.

Temel Soru: Ne Zaman T-Testi, Ne Zaman Z-Testi?

Bu sorunun cevabını verebilmek adına birazcık istatistik teorisine değinmemiz gerekiyor. Formül yapısı gereği, bağımsız örneklemler t-testini uygularken örneklemin varyansını kullanıyoruz. Yani, topladığımız verilerimizin standart sapmasından hareketle bir test istatistiği elde ediyoruz.

Peki z-testinde değişen ne? En büyük değişim anakütle varyansını kullanmakta yatıyor. Eğer geçmiş çalışmalardan veya önsel bilgimizden kaynaklı olarak anakütle varyansını bildiğimiz varsayıyorsak, bu durumda bağımsız örneklemler z-testini tercih etmeliyiz.

Elbette pratikte anakütle varyansı hakkında bilgi sahibi olmak hiç kolay bir iş değil. Geçmiş çalışmalardan ciddi bir bilgi birikimimizin veya anakütleye dair güçlü bir öngörümüzün olması gerekiyor. Araştırmacılar da haklı olarak bu zor varsayıma değinmeksizin hali hazırdaki veriler üzerinden t-testini uygulayarak istatistik analizi sürecini yürütüyorlar.

Gruplara göre gözlem sayıları yeterince yüksek (n≥30) olduğunda da z-testini kullanabiliriz. Pratikte gözlem sayılarımız yükseldikçe, t-testine dair kullandığımız Student-t dağılımı ile z-testinde kullandığımız standart normal dağılıma ait kritik noktalar da birbirine yaklaşıyor. Özetle, her iki teste dair istatistiksel dağılım farksızlaşıyor.

Hipotez testleri kapsamında ortalamalara göre bağımsız iki grubun karşılaştırılması için kullandığımız t-z testlerini istatistiksel veri analizi programları aracılığı ile uygulayabiliyoruz. Örneğin SPSS programında t-testini kullanırken, Minitab programında hem t-testini hem de z-testini kullanabiliyoruz. R-Project içerisinde de farklı paketler sayesinde her iki testi uygulama imkanına sahibiz. Yazılımdan yazılıma değişkenlik gösteren bu durumu bağımsız örneklemler t-z testlerinde de gözlemliyoruz.