Örneklem Büyüklüğü Hesaplama Yaklaşımları ve 3 Alternatif Strateji

örneklem büyüklüğü hesaplama

 

Örneklem Büyüklüğü Hesaplama ve İstatistik Açısından Önemi

Araştırmalara başlamadan önce kaç birimlik örneklem ile çalışacağımızı, istatistik biliminin öngördüğü ölçütlere göre belirlememiz gerekiyor. Örneklem büyüklüğü hesaplama işlemleri için istatistiğin bizlere sunduğu alternatif çözüm yolları bulunuyor.

Bu yazımızda, örneklem büyüklüğü hesaplama yaklaşımlarını istatistiksel bir bakış açısı ile değerlendireceğiz.

İlk aşamada örneklem büyüklüğüne ilişkin genel bilgilere göz atalım.

Örneklem, bir anakütle içerisinden seçtiğimiz bir alt kümedir. Bilimsel araştırmalarımızda anakütlenin tamamına erişemediğimiz için örneklemler üzerinden çıkarımlar yapıyoruz.

Diyabet hastalığı üzerine bir araştırma kurguladığımızı düşünelim. Türkiye’de kabaca 7 milyon diyabet hastasının var olduğu biliniyor. Araştırmamızın güvenilir olması için tüm hastalar (yani 7 milyon kişi!) üzerinden veri toplamak son derece cazip.

Gönül ister ki, tüm diyabet hastalarına ulaşalım ve bu hastalar üzerinden araştırmamızı sürdürelim. Peki bu mümkün mü? Elbette değil. 7 milyon hastanın tamamına ulaşmak ne zamanımız, ne de paramız yeter.

Her bir dakikada bir hasta bulsak (ki pek mümkün değil) yaklaşık 13.5 yıl durmaksızın (sürekli hasta bularak) hastalara ulaşmamız gerekir.

Bu yüzden bütün hastalar ile çalışmak yerine araştırma amacımıza uygun olacak şekilde bir örneklem üzerinden genel sonuçlar bulmaya çalışıyoruz.

Burada kaç birimlik bir örneklem ile çalışacağımızı çok iyi belirlememiz şart.

Gerektiğinden az sayıda bir örneklem, çalışmamızın yetersiz ve genellenebilir olmaktan uzak olmasına yol açacaktır. Ayrıca çalışmanın istatistiksel gücünü azaltacağı için de anlamsız sonuçların ortaya çıkmasına sebep olacaktır.

Bu durumda gerektiğinden düşük örneklem sayıları ile çalıştığımızda ortalamalar arası farklılıkların, korelasyon katsayılarının, regresyon katsayılarının istatistiksel olarak anlamsız olduğu sonuçlara hazır olalım!

Bir de tam tersini düşünelim.

Örneklem büyüklüğü hesaplama süreci sonunda gerektiğinden fazla bir örneklem seçtiğimizde, bu durum bize para ve zaman maliyeti olarak geri dönecektir. Bir hastanın verisine erişebilmek için 5$ harcasak (ki bu rakam çok iyimser) ek 100 gözlem bize 500$ olarak yansıyacaktır.

Bu durumda yapmamız gereken basit: Ne az, ne çok; optimum örneklem büyüklüğünü hesaplamamız gerekiyor.

Örneklem Büyüklüğü Hesaplamaya Yönelik 3 Temel Strateji

Örneklem büyüklüğünü belirleyebilmemiz için kullanabileceğimiz üç temel yaklaşım var:

1) İstatistiksel güç analizi (diğer deyişle power analizi)

2) Örnekleme formülleri

3) Genel kabul gören örnekleme kuralları

İstatistiksel güç analizi

İstatistiksel güç analizi klinik araştırmalarında ve sağlık çalışmalarında en sık başvurduğumuz örnekleme tekniklerinin başında geliyor. Etik kurul raporlarında örneklem büyüklüğü hesaplamak için öngördüğümüz güç değerinin verilmesi, raporumuzun bilimsel açısından önem taşıyor. En az %80 güç değerine ulaşmamız bekleniyor.

örnekleme büyüklüğü hesaplama

Bu aşamada farklı örneklem büyüklükleri üzerinden güç değerlerini hesaplayarak bir sayı belirleyebiliyoruz. Güç analizi sırasında referans bir çalışma, pilot çalışma verileri ya da hazır etki değerlerinden (Cohen-d) yararlanıyoruz.

Örnekleme formülleri

Örneklem büyüklüğü hesaplama aşamasında tanımlayıcı istatistiklere ya da test istatistiklerine dayalı örnekleme formüllerini de kullanabiliriz. Bu noktada araştırmaya ilişkin bir hata payı (alfa, z-değeri) ve duyarlılık (d) değerlerini mutlaka belirlemeliyiz. Tanımlayıcı istatistiklerden de referans bir çalışmadan alınan oran ya da standart sapma (s) ölçüsünü kullanabiliyoruz.

Aşağıda en sık kullanılan iki örnekleme formülleri gösterilmektedir:

örneklem büyüklüğü hesaplama

Bu formüllerde eğer anakütle hacmini (N) biliyorsak, 2. formüle geçiş yapıyoruz. Standart sapma için oran değeri kullandığımızda s=p(1-p) eşitliğini ikame ediyoruz.

Deney hayvanlarına yönelik düşük örneklemli çalışmalarda ise alternatif örnekleme formüllerine başvurabiliriz.

Aşağıda tek grup için klinik deney hayvanlarına yönelik araştırmalarda kullanabileceğimiz elverişli bir formülü gösterelim:

örneklem büyüklüğü hesaplama

Bu formülde β istenilen güç değerini, p ise araştırılan oran değerini gösterir.

Deney hayvanları üzerinde kanser araştırması yaptığımızı düşünelim. Kanserli hasta oranını %40 olacak şekilde %90 güç değerine ulaşmak için en az 4.51=~5 gözlem ile çalışmamız gerekir.

Bu formül deney hayvanlarının kullanıldığı bilimsel araştırmalarında minimum maliyet özelliği sayesinde tercih edilebilir.

Bu tür örnekleme formülleri diğer istatistiksel analiz yöntemlerine göre de değişkenlik gösterir. Yapısal eşitlik modellemesi, kümeleme analizi gibi çeşitli istatistiksel analiz tekniklerinde yöntemlere özgü formülasyonlar mevcuttur.

Genel örnekleme kuralları

Bu kategoriye giren örneklem büyüklüğü hesaplama yaklaşımları genel literatürde kabul görmüş referans sayılara dayanmaktadır. Bu tür kurallar, araştırmacıların kendi simülasyon çalışmalarından ya da deneysel bulgularından hareketle ortaya atılmıştır.

En çok kabul gören yaklaşım, anket araştırmalarında bir soruya karşılık beş, on ya da yirmi gözlem toplama kuralıdır. Yani bu kurala göre soru sayısının en az 5 katı, 10 katı ya da 20 katı kadar örneklem elde edilmelidir.

Genel kabule göre en az 1:5 oranında örneklem ile çalışılması beklenmektedir.

Bazı araştırmacılar doğrudan en az 300 ya da 400 gözlem ile çalışılabileceğini öngörmektedir.

Genel örnekleme kuralları bazında istatistik literatüründe çok sayıda farklı subjektif yaklaşımın var olduğunu belirtelim.

Örneklem büyüklüğü hesaplama yaklaşımlarını G*Power, Minitab, Stata, R-Project gibi istatistik yazılımları aracılığı ile uygulayabiliriz. Gelecek yazılarımızda bu konuyu derinlemesine inceleyeceğiz.