Parametrik Testler ve İstatistiksel Özellikleri – İSTMER

Parametrik Testler ve İstatistiksel Özellikleri

 

Parametrik Testler Nelerdir ve Ne Zaman Kullanılır?

Parametrik testler, istatistiksel hipotez testleri arasında çokça başvurduğumuz dağılım varsayımına dayalı tekniklerdir. İstatistiksel analiz raporlarımızda yoğun olarak kullandığımız bu testleri hem teorik, hem de pratik açıdan inceleyeceğiz.

Öncelikle hipotez testlerinden başlayalım ve parametrik testlerin nerede-ne zaman kullanıldığına doğru uzanalım.

Bildiğimiz gibi, bilimsel araştırmalarımızda birtakım demografik faktörler ile sayısal değişkenler – ya da çok sayıda sayısal değişken arasındaki ilişkilerin istatistiksel olarak anlamlı olup olmadıklarını test etmeye çalışıyoruz.

Dikkat ederseniz, mutlaka sayısal değişken kavramından söz ettik. Çünkü değişken türümüzün sayısal olması, seçeceğimiz test türünü de doğrudan etkiliyor.

Örneğin; araştırmamızda biyoistatistik ile ilgili glikoz, kan basıncı, nötrofil, lenfosit gibi değişkenleri kullandık. Kullandığımız tüm bu değişkenlerin istatistiksel dağılımları hakkında bilgi sahibi olmamız gerekiyor.

İstatistiksel analiz uygulamalarımızda en çok üzerinde durduğumuz istatistiksel dağılımın normal dağılım olduğunun da altını çizelim.

Bizim için istatistik analizinde en önemli dağılım normal dağılım ve birçok istatistiksel analiz tekniği bu dağılıma dayandırılıyor. Haliyle sayısal ölçüme sahip olan değişkenlerimizin de normal dağılıma uygun olup olmadıklarını belirlememiz gerekiyor.

İşte bu nokta çok önemli: Normal dağılmak, ya da dağılmamak…

İstatistiksel hipotez testi aşamasında normal dağılım varsayımına bağlı kaldığımızda, parametrik testler üzerinden analizlerimizi gerçekleştiriyoruz. Kısaca sayısal ölçümlerimiz normal dağılıma uygun olduğunda parametrik testleri kullanacağız.

Bunun için de elbette çarpıklık-basıklık değerleri ya da normallik testleri üzerine başvuruyoruz.

Peki parametrik testlerde asıl istenilen şey nedir? Aslında teorik açıdan bakarsak, bu testlerde sağlanması gereken asıl koşulun istatistiklerin normal dağılması olduğunu görürüz.

Yani verilerimiz normal dağıldığında, otomatik bir şekilde istatistikler de normal dağılıyor. Ancak verilerimiz normal dağılıma uymadığında da parametrik testlerden yararlanabiliyoruz.

Bunun için de Merkezi Limit Teoremi dediğimiz bir yaklaşımdan yararlanıyoruz. Bu teoreme göre, gözlem sayılarımız 30 ya da daha yüksekse, verilerimiz normal dağılıma uygun olmasa bile parametrik testleri kullanabiliyoruz.

Hatta aritmetik ortalamanın standart sapmadan düşük olması durumunda bile, verilerimiz normal dağılıyormuşçasına parametrik testlere başvurmamız mümkün. Çünkü verilerin normal dağılma şartı yok.

İstatistiksel analiz sürecimizde parametrik testler denildiğinde hangi testleri düşünmemiz gerekir? Örnek olarak en sık kullandığımız şu testleri gösterebiliriz:

  • T-testleri
  • Varyans analizi (ANOVA)
  • Çok değişkenli varyans analizi (MANOVA)
  • Tekrarlı ölçüm analizi
  • Kovaryans analizi (ANCOVA)
  • Pearson korelasyon anlamlılık testleri
  • Normal lineer regresyon analizi

Söz konusu örnek testlerin hepsinde sayısal değişkenler üzerinden çalışıyoruz. Kategorik değişkenleri kullandığımızda ise verilerimizin normal dağılıma uygunluğuna bakmayız.

Örneğin; ki-kare testi için parametrik olup olmadığını sorgulamayız. Çünkü ki-kare testinde sayısal olmayan, kategorik değişkenler ile analiz gerçekleştiriyoruz.

Dolayısı ile t-testi, ANOVA, ANCOVA gibi teknikleri kullanıyorsak, normallik varsayımının sağlanmış olduğunu garanti etmemiz gerekiyor.

Bunun için en sık kullandığımız yaklaşım ise normallik testleridir. Shapiro-Wilk, Anderson-Darling, Jarque-Bera, Kolmogorov-Smirnov gibi testler ile normallik varsayımının sağlanıp sağlanmadığını kontrol edebiliriz.

Güç açısından incelediğimizde, parametrik testlerin parametrik olmayan testlere göre daha güçlü olduğunu görmekteyiz. Bu neden parametrik olmayan testlerden olabildiğince kaçınmamız gerekir.

Örneğin; iki değişken için Spearman korelasyon analizi uygularken birinci değişkenin n. gözlemi 40, ikinci değişkenin ise 45 olduğunu düşünelim. İkinci değişkende yer alan gözlemin daha yüksek olduğu açıktır. Parametrik olmayan testler açısından baktığımızda, gözlemin sayısal olarak yüksek olması tek ölçüt olarak yeterlidir.

Yani parametrik olmayan bir test kullandığımızda 45’in yerine 450, 4500 ya da 45000 olması bir şeyi değiştirmez. Çünkü bu tür dağılıma dayanmayan testler sıra puanları üzerinden hareket eder. Dolayısı ile bu noktada çok ciddi bir olguyu göz ardı ederler: Homojenlik!

Gözlem değerimiz 45 yerine 45000 olsa, varyans değerimiz de bir o kadar yükselecektir. Parametrik bir test kullandığımızda varyanstan dolayı oluşan bu değişim test sonuçlarına büyük ölçüde etki eder.

Hipotez testlerinde parametrik teknikleri kullandığımız da tanımlayıcı istatistikleri sunarken dikkatli olmamız gerekiyor. ANOVA, t-testi gibi bir ortalama karşılaştırma testi uygularsak aritmetik ortalama, standart sapma gibi istatistikleri sunmalıyız. Parametrik olmayan testler kullandığımızda da medyan, kartiller arası açıklık gibi istatistikleri veriyoruz.

Birçok istatistik raporunda bu hataların ısrarla yapılmakta olduğunu üzülerek görüyoruz. [İstatistik şirketlerinin] bu tür basit hatalarda ısrarcı olması bilimsel itibarımız açısından da son derece üzücü.

Parametrik testleri kullanabilmemiz için çok sayıda istatistik yazılımını da kullanabiliyoruz. R, SPSS, Minitab, Stata, SAS gibi tüm istatistiksel programlar parametrik teknikleri barındırıyor.

Bu yazımızda istatistik ile ilgilenen tüm araştırmacıların başvurduğu parametrik testler ile ilgil merak edilen temel noktalara değinmeye çalıştık. Gelecek yazılarımızda bu tür testleri detaylıca incelemeye devam edeceğiz.