fbpx

İstatistik Yazılımı Seçenekleri ve Genel Kullanımları

istatistik yazılımı

İstatistik Yazılımı Seçeneklerimiz Neler? Nasıl Kullanılırlar?

İstatistik yazılımı, istatistiksel analiz uygulamalarımızı gerçekleştirebilmemiz için teknolojinin bizlere sunduğu büyük bir nimet. Tüm araştırmacılar, bu yazılımlar aracılığı ile verileri üzerinden anlamlı sonuçlar edinebiliyor. Bu yazımızda söz konusu yazılımların türlerine ve temel kullanımlarını inceleyeceğiz.

İstatistik yazılımı denildiğinde hemen aklımıza şu belli başlı programlar geliyor: SPSS, Minitab, Stata, R. Ekonometrik araştırmalarda da E-views, Gauss gibi programları biliyoruz.

Bu yazılımları kullanabilmek temelde iki seçeneğe sahibiz:

1) Menüler aracılığı ile kullanım

2) Kod yazarak kullanım

Kuşkusuz, araştırmacılar için en kolay kullanım şekli istatistik yazılımını menüler aracılığı ile kullanmak. Seçtiğimiz menüler üzerinde karşımıza yeni pencereler açılıyor ve buradan istediğimiz seçenekleri tıklayarak kolayca sonuçlarımı alabiliyoruz.

Kod yazmak , araştırmacılar için diğer bir seçenek; ancak kod kelimesi geçtiği anda bile araştırmacıların çoğunu bir ürperti sarıyor. Dolayısı ile, çoğunluk kod yazmaktan kaçınıyor. Yine de şimdilik en gelişmiş istatistiksel analiz tekniklerini kod yazarak uygulayabileceğimizi bir yere not edelim.

İstatistik Yazılımı Grupları ve Özellikleri

İstatistik yazılımları için SPSS, Minitab, Stata gibi programlar menüler aracılığı ile kullanılan başlıca araçlar olarak öne çıkıyor. Ancak tüm bu yazılımların içerisinde kendilerine özgü kod yazma seçenekleri mevcut. SPSS için özel sentakslar, Minitab için MTB şeklinde özel bir kodlama; Stata için de özel bir kodlama seçeneği mevcut.

Stata, menülerin dışında da kodlara ihtiyaç duyabileceğimiz gelişmiş analiz tekniklerini barındırıyor. Yani Stata içerisinde panel veri analizi, etkinlik analizi gibi tekniklere yönelik farklı algoritmaları uygulamak istiyorsak, Stata içinde kod yazmayı öğrenmeliyiz.

Hatta Stata Journal isimli ayrı bir dergi yayınlanıyor ve bu dergide Stata içerisinde uygulanabilen, yeni geliştirilmiş veri analizi teknikleri bulunabiliyor. Bu dergide hiç görmediğimiz en modern, en gelişmiş analizlere erişebiliyoruz.

Özetle Stata kendisine özel bir dünya kurmuş ve bu dünyayı kendi özel dergisi ile besliyor.

SPSS ve Minitab programları ise istatistik ve analiz aşamalarının büyük çoğunluğunu menüler ile gerçekleştirme kapasitesine sahip. SPSS için sentakslar; menülerin yapamadığı çoklu normallik, Horn paralel analizi gibi farklı yaklaşımları uygulama olanağı sağlıyor. Minitab’ın kendine özel kod sistemi de temel matematiksel işlemler dahil, istediğimiz analizi uygulayabiliyoruz.

Hatta Minitab’da en basit matris çarpımı gibi işlemleri bile yapılabiliyor.

Piyasada var olan bu programların dışında SAS’ın bir ürünü olan JMP gibi çok güçlü programlar da var. Örneğin; JMP’de istatistiksel hipotez testi uygularken, verilerin varsayımlarına göre uygun olmayan teknikleri uygulama seçenekleri aktif olmuyor. Yani JMP, varsayımlara uymayan tekniklerin uygulanmasına kendiliğinden izin vermiyor!

İstatistik yazılımı seçeneklerimizde R, Matlab, SAS gibi kod tabanlı programlar da var.

R’nin resmi adı R-Project. R’de yapılamayacak analiz tekniği yok gibi desek abartmış olmayız. Program paketler aracılığı ile çalışıyor ve her pakette çok sayıda analiz fonksiyonu bulunuyor. Şu an 16 bin’den fazla R paketi var. Her pakette örnek kodlar bulunuyor ve bu hazır kodlar sayesinde söz konusu analiz hakkında fikir edinebiliyoruz.

Matlab programı her ne kadar mühendisler tarafından kullanılsa da, sınırlı olarak veri analizi için de tercih ediliyor. Matlab daha çok mühendisler tarafından tercih ediliyor. Ücreti mukabilinde, Matlab modülleri eklenti şeklinde satın alınarak kullanılabiliyor. Ancak Matlab’in istatistik analizi aşaması için çok kullanışlı olmadığını belirtelim.

Bir diğer kod tabanlı istatistik yazılımı da SAS. SAS programı son derece güçlü analiz tekniklerini ustaca uygulayabiliyor. Ancak programı kurma zorluğu ve kodları çalıştırma mantığının kavranması, araştırmacılar için zorluk teşkil edebiliyor.

İstatistik Yazılımlarının Analiz Kapasiteleri

İstatistik yazılımlarının analiz yapabilme kapasiteleri açısından da değerlendirilmesi gerekiyor. Yukarıdaki satırlarda belirttiğimiz SPSS, R, Minitab, Stata gibi programların tamamında istatistiksel hipotez testlerini uygulayabiliyoruz. Yani temel olarak kullandığımız tanımlayıcı istatistikleri, frekans tablolarını, ANOVA tablolarını ve daha birçok test sonucunu istatistik programlarının hepsi bize sunabiliyor.

SPSS, Minitab ve Stata’nın içerisinde faktör analizi, kümeleme analizi, uyum analizi gibi çok değişkenli istatistiksel analiz tekniklerini gerçekleştirebileceğimiz menüler var. Stata’da ekstra doğrulayıcı faktör analizi ve yapısal eşitlik modellemesi de uygulanabiliyor. Ayrıca bu yazılımlar; kalite kontrol analizleri ve zaman serisi analizleri gibi farklı yaklaşımları da gerçekleştirebiliyor.

Stata’da ek olarak panel veri analizi seçeneği var. Minitab kalite kontrol analizlerinde son derece başarılı. SPSS temel Bayesci istatistik testleri ile atağa geçmiş durumda.

Ancak kod tabanlı programlarda temel analizlerin yanı sıra klasik ve gelişmiş onlarca veri analizi tekniği yapılabiliyor. Güç açısından R ve SAS, diğer istatistik yazılımları ile kıyas kabul edilemeyecek derecede fazla olanağa sahip. R ve SAS’ın içerisinde Bayesci veri analizleri, farklı faktör analiz tahmincileri, dayanıklı (robust) istatistiksel analiz yöntemleri dahil sayısız güncel ve yeni yaklaşım bulunuyor.

R’nin veri görselleştirme tarafında da rakipsiz grafikleri var. Bir bakışta kayıp veri analizi ile eksik gözlemlerin dağılımlarını yorumlayabilecek, aykırı değerlerin olup olmadığını algılayabilecek, hipotez testi sonuçlarını yorumlayabilecek muhteşem veri analizi grafiklerini R sayesinde kolayca oluşturabiliyoruz.

Ücret anlamında değerlendirdiğimizde R hariç tüm istatistik yazılımlarının ücretli olduğunu görüyoruz. SPSS, Minitab, Stata gibi lisans zorunluluğu olan programlar araştırmacılar tarafından crackli versiyonları ile kullanılıyor, bu bir gerçek. Ancak bu olgu, illegal bir kullanım şeklinin var olduğu gerçeğini değiştirmiyor.

Son zamanla bazı bilimsel dergilerin kullanılan istatistik programına dair lisans numarası talep ettiği de bir gerçek. Programa dair lisans numarası sunmadığımız durumda illegal kullanıcı durumuna düşme olasılığımız var. Hukuki yaptırımlar karşımıza çıkabilir.

Tüm bu sorunları yaşamamak ve daha güçlü analizleri kolayca uygulayabilmek için kod tabanlı R programını kullanabiliriz. Kod yazım mantığını çözdükten sonrası son derece kolay. Hem daha güçlü, hem tamamen ücretsiz bir seçeneğe R sayesinde sahibiz.

Batılı ülkelerde lisansüstü öğrencilerin yoğun olarak R programını kullanmaya başladığına şahit oluyoruz. Çünkü gelişmiş ülkelerin akademisyenleri, temel tekniklerin dışında bilimsel çalışmalarında yeni ve güçlü yaklaşımların kullanması konusunda son derece titizler. Kanada, Amerika Birleşik Devletleri, İngiltere gibi ülkelerde R’nin ne ölçüde yaygın kullanıldığını yayınlanan bilimsel araştırmalardan anlayabiliyoruz.

Bu yazımızda bilimsel araştırmalarda en sık kullanılan istatistiksel analiz yazılımlarına dair bir bilgilendirme denemesi yapmaya çalıştık. Elbette bu yazılım listesi farklı programlar ile genişletilebilir. Klasik istatistik ve analiz tekniklerinin yanında ekonometrik yazılımlara da değinilebilir. Bu noktada güncel yazılımlar ile bir sınırlandırma yoluna gitmek durumundayız.

Gelecek yazılarımızda istatistik yazılımlarının içerisinde bulunan teknikler, güçlü-zayıf yanlar, olası problemler gibi değişik konular üzerinde durmaya ve araştırmacılarımızı bilgilendirmeye devam edeceğiz.