Klasik istatistik analizi süreçlerinde araştırma sorularımızı değerlendirmek amacı ile çeşitli veriler toplar, bu veriler üzerinden çıkarımlar gerçekleştiririz. Bayesci istatistik, veri analizi süreçlerinde ise aşamalar klasik istatistikten oldukça farklıdır.
Öncelikle Bayesci istatistiğin çıkış noktalarına göz atalım.
Ünlü İngiliz bilim insanı Thomas Bayes‘in (1701-1761) koşullu olasılık teoreminden yola çıkılarak, Bayesci istatistik alanı keşfedilmiştir. Bazı araştırmacılar Türkçe literatürde Bayesyen veya Bayesgil şeklinde kullanımları da benimsemektedir. Ancak Bayesci kullanımı, İngilizce Bayesian çevirisine karşılık gelen en uygun ifade olarak gözüküyor.
Peki Bayesci istatistiği klasik istatistikten farklı kılan şey nedir? Klasik istatistikten hangi noktalarda ayrışmaktadır?
Aslında yanıt hiç de karmaşık değildir. Bayesci istatistikte, araştırma verilerinin dışında dışşal bilgilerden de yararlanıyoruz. Yani salt verilerin söyledikleri değil, bir uzman görüşünden veya geçmiş çalışmalardan elde edilen bilgiler de örneklem verilerine dahil edilmektedir.
İşte bu uzman görüşü veya geçmiş çalışmalardan elde edilen bilgilere önsel bilgi (prior) diyoruz. Bayesci istatistiğin kilit noktası bu önsel bilgide yatmaktadır. Örneklemden elde edilen bilgileri de olabilirlik (likelihood) olarak tanımlıyoruz.
Önsel bilgimizi verilerden elde edilen bilgi (olabilirlik) ile birleştirerek bir sonsal bilgi (posterior) elde ediyoruz. Tüm çıkarımlarımız, sonsal bilgiler üzerinden elde ediliyor. Bayesci istatistiğin temel kurgusuna dair formülasyon en basit biçimde aşağıdaki şekilde gösterilebilir:
Sonsal = Önsel x Olabilirlik
Bu formülden de görüleceği üzere, önsel bilgi tüm istatistiksel analiz sonuçlarımız üzerinde doğrudan etkilidir. Örneğin; basit bir t-testi uygulamasında bile önsel bilgimiz test sonucunu anlamlı iken anlamsız; ya da anlamlı iken anlamlı olarak değiştirebilir. Benzer şekilde varyans analizi, regresyon analizi, faktör analizi, yapısal eşitlik modellemesi gibi çok sayıda istatistiksel analiz uygulamasında da önsel bilgilerimizin etkisi, analiz sonuçlarında doğrudan değişikliğe yol açabilir.
Bayesci istatistik kapsamında önsel bilginin kaynağının yanı sıra önsele dair fonksiyonların seçimi de son derece önemlidir. Uygulamada bilgilendirici olmayan bir önsel seçimi klasik istatistikle benzer bir sonucun ortaya çıkmasına yol açacaktır. Ancak eşlenik önsel gibi bilgilendirici bir önsel seçildiğinde, parametrelerin değerlerine göre sonuçlar bambaşka olabilir.
Elbette önsel bilginin kullanımı manipülasyona da son derece açık olduğu için analizlerimizde dikkatli olmamız şart.
Bayesci istatistiğin muhteşem cazibesi batı dünyasında kendini gösterdi ve göstermeye de devam ediyor. Ülkemizde de son yıllarda az sayıda da olsa bu alanda yapılan çalışmalarda bir artış olduğunu gözlemliyoruz.
SPSS programı da bu alandaki gelişmeyi dikkate alarak güncel sürümlerine Bayesci istatistiğe dair modüller eklemiş. Bu amaçla temel hipotez testi ve regresyon analizlerini SPSS ile uygulayabilmemiz mümkün.
Ancak ileri seviyeli Bayesci istatistik uygulamaları gerçekleştirmek istiyorsak, başvuracağımız en güçlü istatistiksel analiz programı kuşkusuz R-Project. İçerisinde Bayesci yaklaşımlarda dair onlarda paket bulunuyor.
Gelecek yazılarımızda bu geniş alana dair konuları derinlemesine incelemeye devam edeceğiz.