Güven Aralığı Nedir?

güven aralığı nedir

Güven Aralığı Nedir? İstatistiksel Açıdan Nasıl Yorumlanır?


Güven aralığı, istatistiksel çıkarım için çok çok önemli bir kavram olmasına karşın, istatistik raporlarında büyük ölçüde ıskalanıyor. Güven aralığı nedir sorusu, tahmin ettiğimiz istatistiklerin yorumlanması açısından doğru bir şekilde yanıtlanması gereken soruların başında geliyor.

Güven aralığı nedir dediğimizde, önce parametre ve tahminci (istatistik) arasındaki ayrıma dikkat çekerek başlamalıyız.

Bildiğimiz üzere, araştırmalarımızda çalışmak istediğimiz birimlerin tamamına, yani anakütleye erişme şansımız olmadığı için örneklemler üzerinden çıkarımda bulunmaya çalışıyoruz. Dolayısı ile üzerinde çalıştığımız istatistiksel ölçüleri ancak ve ancak tahmin edebiliriz.

Şimdi hemen bir başka soruyu soralım: Bilimsel hayatımızda bizler için böylesine önemli olan, üzerinde çalıştığımız istatistiksel ölçüler neler olabilir? Aritmetik Ortalama, Standart Sapma, Oran, Korelasyoni Regresyon Katsayıları gibi istatistikleri tahmin etmeye çalışırız.

Dikkat ederseniz, istatistiksel ölçülere dair ısrarla tahmin kavramını vurguladığımız hemen belli olacaktır. Çünkü zaman ve maliyetler yüzünden anakütlemizin tamamına asla erişemiyoruz. Anakütleye belirli bir dönem için erişsek bile söz konusu birimler çok hızlı değişeceği için sabit bir çıkarımda bulunmamız imkânsız…

Örneğin; Türkiye’de yaşayan 65 yaş üstü bireylerin kolestrol ölçümünü araştırmak istiyoruz. Ortalama kolestrol ölçümünü kesin olarak bulabilmemiz için tüm 65 yaş üstü kişilere erişmemiz şarttır ancak bu da gerçekleşmesi mümkün olmayan bir hayal. Bu yüzden biz sınırlı sayıda bir örneklem (mesela 1000 kişi) üzerinden genele yönelik bir çıkarımda bulunabiliriz, yani ortalama kolestrol ölçümünü tahmin edebiliriz.

Ancak yine de bu tahmin değerine güvenme şansımız yok. Çünkü örneklem ile çalıştığımızda mutlaka bir bilgi kaybımız olacaktır. Asla doğru değeri bulduğumuzdan emin olamayız.

Tam anlamıyla bir kaos!

İşte bunca belirsizliğin içerisinde, güven aralığı nedir sorusu ile imdadınıza yetişiyoruz!

Güven aralığı nedir dediğimizde ilk aklımıza gelmesi gereken şey, belirli bir hata payını da göze alarak hesaplayabileceğimiz sınırlardır. Yani tahmin ettiğimiz istatistiklerin hangi aralıkta yer alacağını, güven aralıkları sayesinde belirleyebiliriz.

Yukarıdaki örneğimize geri dönelim.

Elde ettiğimiz 1000 örneklemin ortalama kolestrol değeri 320 olsun. Madem bu değerden emin olamıyoruz, o halde güven aralıkları sayesinde en azından ortalama kolestrol değerinin hangi değerler arasında yer alabileceği hakkında bilgi edinebiliriz. Güven aralığı %5 hata payı ile, kolestrol ortalamasının [230,410] arasında yer alır dediğimiz zaman, ortalamanın hangi aralıkta yer alabileceğine dair bir yorumda bulunabiliriz.

Güven aralıkları da tıp hipotez testlerinde olduğu gibi iki gruba ayrılıyor:

  • Tek yönlü güven aralıkları
  • Çift yönlü güven aralıkları
güven aralığı nedir

Tek yönlü güven aralıkları için anakütle parametresinin belirli bir değerden küçük veya büyük olduğunu söyleyebiliyoruz. Çift yönlü güven aralıkları için de anakütle parametresinin belirli bir değerden küçük ve belirli bir değerden büyük olduğunu eşanlı söyleyebiliyoruz.

Kolestrol örneğimizdeki tek ve çift yönlü güven aralığı örneklerini sunalım:

Tek yönlü güven aralıkları

μ>280

μ<400

Çift yönlü güven aralığı

230<μ<410

(μ, anakütle aritmetik ortalamasını temsil ediyor.)

Yukarıdaki örneklerde kolestrol değerlerine ait anakütle ortalamaları için güven aralıklarını görebiliyoruz.

Elbette, güven aralıkları yalnızca ortalamalar için değil, farklı istatistikler için de hesaplanabilir. Şimdi de 20 yaş altı sigara içen gençlerin oranları için güven aralığı örnekleri sunalım:

Tek yönlü güven aralıkları

p>0.15

p<0.75

Çift yönlü güven aralığı

0.10<p<0.85

(p, anakütle aritmetik ortalamasını temsil ediyor.)

Bu örneklere göre tek yönlü güven aralıkları için (p<0.05 için) sigara içme oranının en az %15, en çok %75 olduğunu görebiliriz. Çift yönlü güven aralıklarına göre de sigara içme oranı %10 ile %85 arasında değişmektedir.

Bu yorumlar kabaca güven aralıklarının değerlendirilmesi için yapılabilir. Ancak istatistiksel açıdan tam olarak yorum yapabilmemiz, güven aralığı nedir sorusunu farklı bir şekilde yorumlamamız gerekir.

İstatistiksel yorumu tam olarak şöyledir: Sürekli olarak anakütleden 100’er örneklem çektiğimizde, (%5 hata payı için) 95’inin parametre değeri bu aralıkta yer alır.

Yani kolestrol ortalaması ve sigara oranı örnekleri için güven aralığı nedir sorusunu kesin olarak yanıtlamak istediğimizde, çok sayıda 100’er birimlik çektiğimiz örneklemlerin 95’inin, elde edilen güven aralığında yer almasını beklenir şeklinde bir çıkarımda bulunabiliriz.

Karmaşık mı? Evet oldukça karmaşık. Güven aralığı için en kesin yorumu Bayesci istatistiksel analiz olduğunu söyleyelim. Bayesci bir perspektif ile yorumladığımızda, söz konusu parametrenin (p<0.05 için) %95 olasılıkla hesaplanan güven sınıfları içerisinde yer alacağı görüşünü sunabiliriz.

Güven aralıkları bize özellikle hipotez testleri için büyük ölçüde yardımcı olabiliyor. Özellikle t-testi, ANOVA gibi ortalama karşılaştırma testlerinde farklılığın istatistiksel olarak anlamlı olup olmadığını doğrudan güven aralıkları ile birlikte değerlendirebiliyoruz.

Ayrıca korelasyon analizinde korelasyon katsayısının anlamlılığını, regresyon analizinde de beta katsayılarının anlamlılığını sadece güven aralıkları üzerinden yorumlayabiliriz.

güven aralığı nedir

Güven aralıkları sıfır değerini kapsadığında ilgili katsayısının istatistiksel olarak anlamsız olduğunu söyleyebiliyoruz. Benzer şekilde ortalama karşılaştırma testlerinde de güven aralığı sıfır değerini kapsadığında farkın anlamı olmadığı sonucuna varıyoruz. Özetle güven aralığı sıfırı kapsadığında Ho hipotezi reddedilemiyor ve ilgili katsayı/farklılık istatistiksel olarak anlamsız hale geliyor.

Güven aralığı nedir dediğimizde, ilgili istatistiğin hangi aralıklara erişebileceği sorusunun da yanıtını arıyoruz demektir.

Güven aralıklarının alt ve üst sınırlarının erişebileceği sınırlar, analizlerimiz hakkında büyük ölçüde bilgi sağlamaktadır. Örneğin; bir tıbbi ölçümün alabileceği en üst ortalama ya da oran değeri, ilgili ölçümün sağlık üzerinde yaratabileceği tahribat hakkında bize fikir sunabilir.

Bir doktor için hba1c ortalamasının üst sınır değerinin 8.2 olması başka, 18.2 olması bambaşkadır. Yine bir psikolog için gençler arasında depresyon vakalarına rastlanma oranının üst sınırının %60 olması ile %90 olması arasında ciddi bir farklılık oluşacaktır.

Aynı durum hipotez testlerinde de geçerlidir. Cinsiyet gruplarına göre nötrofil değerlerinin ortalama farklarına dair alt sınırın 0.3 ve 300 olması arasında, tıp araştırmacıları için büyük bir farklılık vardır! Halbuki her iki durumda da gruplar arası fark istatistiksel olarak anlamlı bulunur.

Dolayısı ile güven aralığı nedir dediğimizde salt bir değer aralığından çok, kendi bilimsel alanımız için farklı yorumlarda bulunabileceğimiz gerçeğini göz önünde bulundurmamız gerekir.

İstatistik programlarının tamamında güven aralıklarının hesaplanması için çözümler bulunmaktadır. R, SPSS, Minitab, SAS gibi istatistik programlarında gerek aritmetik ortalama, gerek oran, gerek varyans, gerekse regresyon-korelasyonlarına yönelik çok sayıda güven aralığı hesaplama yaklaşımı mevcut.

Mesela SPSS programında bağımsız örneklemler t-testi için ortalamalar arası farklılığın güven aralıklarını hesaplayabiliyoruz. R programında oran tahmini için güven aralıklarını elde edebiliyoruz. SAS programında lojistik regresyon analizinde hesapladığımız odds oranları için güven aralıklarını oluşturabiliyoruz.

Diğer istatistik testleri için de güven aralıklarını hesaplayabilmemize rağmen, araştırmacıların bilimsel makalelerde özellikle lojistik regresyon analizleri için güven aralıklarını sıkça raporladığını gözlemliyoruz. En çok odds oranları için güven aralıklarının yayınlarda yer aldığını söylemek mümkün.

Ayrıca istatistik literatüründe güven aralığı hesaplamalarına yönelik Bootstrap, Jackknife gibi yeniden örnekleme tekniklerine dayalı farklı yaklaşımlar da kullanılabiliyor. Konu son derece derinleşmeye müsait olduğu için bu noktada tamamlayalım.

Sonuç olarak, bu yazımızda güven aralığı nedir sorusuna yanıt aramaya ve bu önemli kavramı derinleştirmeye çalıştık. Tüm araştırmacılara bu faydalı istatistikleri kendi bilimsel araştırmalarında kullanmaya ve kendi alanlarına özgü çıkarımlarda bulunmaya çağırıyoruz!