SPSS istatistik analiz uygulamalarımızda, farklı amaçlar doğrultusunda yaygın olarak kullanılıyor. O zaman aklımıza hemen şu soru gelmelidir: Bir kullanıcı SPSS programı ile neler yapabilir?
Bu yazımızda yukarıdaki sorunun cevabını derinlemesine inceleyeceğiz.
SPSS programının istatistik analiz ile ilgili çözümlerini, klasik yaklaşımların yanı sıra farklı olarak neleri uygulayabildiğini alt başlıklar halinde değerlendireceğiz.
SPSS programının açılımını biliyoruz:
Statistical Package for the Social Sciences.
Görüldüğü gibi bu istatistik yazılımı, kısaltmasının baş harflerinden oluşuyor. Program Sosyal Bilimciler için geliştirilmiş.
Ancak öylesine yoğun bir talep görmüş ki, fen bilimlerinde faaliyet gösteren araştırmacılar da SPSS’ten vazgeçemiyor.
Genel bilgiler sonrasında bu programı neler yapabileceği ile ilgili konuları incelemeye başlayalım.
SPSS programı kayıp veri analizi, aykırı değer tespiti, veri standardizasyonu gibi temel işlemleri gerçekleştirebiliyor. Verilerimizde yer alan kayıp veri sayısını, oranını ve kayıp verilerin dağılımlarını gözlemleyebiliyoruz.
Eksik olan gözlemlerimizi kayıp veri atama teknikleri ile telafi etme şansına da sahibiz. İster nicel, ister kategorik olsun; kayıp veri analizi aşamasında eksik gözlemlerimizi tamamlayabilecek hem çok değişkenli, hem de tek değişkenli teknikler bulunuyor.
Aykırı değerlerimizi de Z-skorlarını hesaplayarak tespit edebiliyoruz. Tek değişkenli Z-skorları yaklaşımının yanı sıra regresyon analizi içerisinde yer alan Mahalanobis uzaklığı seçeneğini de çok değişkenli aykırı değer tespiti için kullanabiliyoruz.
Farklı ölçü birimlerine sahip olan değişkenlerimizi ortak bir ölçüm aralığına taşımak için veri standardizasyonu tekniklerini SPSS içerisinde kullanabiliyoruz. Bunun için verilerimizi Z-skorlarını kullanarak standardizasyon işlemini uygulayabilir, ya da matematiksel hesaplama menüleri üzerinden [0,1] aralığına taşıyabiliriz.
Veri ön işleme süreçlerinin yanı sıra SPSS ile gruplara göre işlem yapma, verileri gruplandırma, anket sorularını ters çevirme, örneklem seçme gibi farklı veri manipülasyonlarını da gerçekleştirebilmemiz mümkün.
SPSS programı ile verilerimize ait çok sayıda farklı tanımlayıcı istatistiği de hesaplayabiliyoruz. Değişkenlerimiz için aritmetik ortalama, budanmış (trimmed) ortalama, standart sapma, mod, medyan, standart hata, kartiller, minimum-maksimum değerler ve çarpıklık-basıklık değerlerini elde edebiliyoruz.
Tanımlayıcı istatistiklerin bir kısmına yönelik güven aralıklarını da bulabilmemiz mümkün. Örneğin; aritmetik ortalamaya ait güven aralığı doğrudan çıktılarda yer alabiliyor. Ancak çarpıklık ve basıklık değerleri için de standart hatalar üzerinden güven aralıklarını bulabiliyoruz.
Hatta ortalamalar arası fark değerlerine ilişkin güven aralıkları da test aşamalarında hesaplanabiliyor.
Tanımlayıcı istatistiksel analizler içerisinde verilerimize yönelik frekans analizlerini de gerçekleştirebiliyoruz. Frekans, yüzde, geçerli yüzde ve kümülatif yüzde değerleri ile frekans analizlerimizi tamamlayabiliyoruz.
SPSS’in Compute menüsü üzerinden çeşitli dönüşümler de uygulayarak farklı istatistikleri (geometrik ortalama, harmonik ortalama vb.) elde edebilmek mümkün.
SPSS istatistik analiz aşamalarında son sürümlerine kadar güç analizine hiç yer ayırmadı. Bunun için ayrı bir modül olarak SPSS SamplePower yazılımını öne sürdü.
Ancak son güncellemeler ile birlikte SPSS’in içerisinde güç analizi de uygulanabiliyor. SPSS istatistik analizlerinin yanı sıra hipotez testleri, korelasyon-regresyon analizleri kapsamında güç analizi yapma fırsatı da sunuyor.
Bunun için Analyze -> Power Analysis adımlarını kullanıyoruz.
Eski SPSS sürümlerinde bulamazsanız şaşırmayın! İstatistiksel güç analizi, SPSS’in 27. sürümünde mevcut olan bir özellik.
SPSS istatistik analiz uygulamalarının vazgeçilmez bölümlerini oluşturan hipotez testlerine dair çok sayıda farklı çözüm sunabiliyor. SPSS programında parametrik ve parametrik olmayan 2o’yi aşkın istatistik testi bulunuyor. Hem kategorik veriler arası ilişkiler, hem ortalamalar arası farklılıklar istatistiksel hipotez testleri ile SPSS menüleri üzerinden uygulanabiliyor.
Genel olarak incelediğimizde en göze çarpan hipotez testleri bağımlı-bağımsız örneklemler t-testleri, tek ve çok değişkenli varyans analizleri (ANOVA-MANOVA), Mann-Whitney U testi, Wilcoxon testleri, Kruskal-Wallis testi, Friedman testi, ki-kare testleri olarak gözüküyor.
Hipotez testleri için Tukey, Duncan, Tamhane gibi çoklu karşılaştırma sonuçlarını da SPSS menüleri üzeriden bulabiliyoruz. Testlerimizde (gerektiği takdirde) Bonferoni düzeltmesini de uygulayabiliyoruz.
Bu testlerin yanı sıra korelasyon ve regresyon katsayılarının anlamlıklarına dönük hipotez testi sonuçları da SPSS üzerinden elde edilebiliyor.
Klasik hipotez testlerinin yanında Bayesci hipotez testi teknikleri de SPSS’de araştırmacılar tarafından kullanılmayı bekliyor!
SPSS ile birlikte korelasyon-regresyon analizlerine yönelik farklı çözümleri de kullanabiliyoruz.
SPSS istatistik uygulamalarında Pearson, Spearman ve Kendall korelasyon analizi teknikleri ile sayısal verilerimiz arasındaki ilişkileri sınayabiliyoruz.
Regresyon analizi için sayısal bağımlı değişkenlerimiz için lineer, Poisson, Gama, negatif-binomial, twediee regresyon modellerini; kategorik bağımlı değişkenlerimiz için de ikili, sıralı ve çok terimli lojistik regresyon modellerini kullanabiliyoruz.
Regresyon analizi aşamalarında değişken seçimi gibi farklı yaklaşımlardan da yararlanabiliyoruz.
Biyoistatistik alanında spesifik olarak başvurabileceğimiz Kaplan-Meier ve Cox-regresyon modelleri de SPSS ile uygulanabiliyor.
Son güncellemeleri ile birlikte SPSS artık kantil regresyon analizini de uygulayabiliyor.
Çok değişkenli istatistiksel veri analizi alanında SPSS’in tatmin edici çözümleri bulunuyor.
SPSS’yi kullanarak açıklayıcı faktör analizi, güvenilirlik analizleri, kümeleme analizleri, uyum analizi, kanonik korelasyon analizi, çok boyutlu ölçekleme analizi, MANOVA gibi çok değişkenli analiz yöntemlerini menüler üzerinden kolayca uygulayabiliyoruz.
SPSS istatistik analiz uygulamalarının özellikle anket çalışmaları kapsamında çok değişkenli istatistiksel analiz seçenekleri ile bize destek oluyor.
SPSS istatistik analizlerin yanı sıra veri madenciliği ve makine öğrenimine dönük teknikler de barındırıyor. Bu kapsamda çok değişkenli istatistiksel analiz teknikleri ve regresyon modellerinde de kullandığımız yöntemler, bu kategoriye giriyorlar.
SPSS’yi kullanarak k-ortalamalar, hiyerarşik kümeleme ve iki aşamalı kümeleme yöntemlerini uygulayabiliyoruz. Modelleme için lineer ve lojistik regresyon modellerini ve özellik seçim algoritmalarını; özel olarak da diskriminant analizi ve yapay sinir ağı modellerini kullanabiliyoruz.
Özellikle yapay sinir ağları, sınıflandırma analizleri bağlamında etkin çözümler sunuyor.
SPSS’yi zaman serisi analizleri için de kullanabiliyoruz. Zaman serisi analizlerinde durağanlık analizi, çapraz korelasyon analizi, otokorelasyon analizi ve çok sayıda öngörü tekniğini uygulayabiliyoruz.
Özellikle öngörü amacı ile ARIMA, üstel düzleştirme ve hareketli ortalamalar gibi tekniklerden yararlanabiliyoruz. Hatta SPSS bize en uygun öngörü modeli seçme konusunda da otomatik bir seçim önerisinde bulunuyor. Bu sayede SPSS’nin zeki çalışma sistemi, kendi ölçütleri içerisinde verilerimiz için en uygun öngörü modelini bulup çıkarıyor.
SPSS istatistik analiz uygulamalarının yanı sıra altı sigma teknikleri kapsamında kalite kontrol analizlerini de gerçekleştirebiliyor. SPSS programı ile birlikte alt-üst sınırları eşliğinde kontrol grafiklerini çizdirebiliyoruz. Kalite kontrol analizleri için X-bar, S-bar, U-bar, S-bar gibi farklı grafikleri elde edebiliyoruz.
SPSS programı ile veri görselleştirme tekniklerini de uygulayabiliyoruz. En temelde, tek değişkenli verilerimiz için kutu-bıyık, dal-yaprak, QQ-grafiği, histogram gibi tanımlayıcı görselleri elde edebiliyoruz.
Veri görselleştirme teknikleri kapsamında istatistiksel analiz yöntemlerine ait özel çizimler de oluşturabiliyoruz. SPSS istatistik uygulamalarına özgü veri görselleştirme araçlarını içeriyor.
Örneğin bir ki-kare analizi uyguladık. Analizin içerisinde SPSS bize bir bar grafiğinin çizimini öneriyor. Bu sayede çapraz tabloların grafiksel bir gösterimini elde edebiliyoruz.
Benzer biçimde korelasyon analizine yönelik serpilme diyagramını çizerek sayısal değişkenlerimiz arasındaki ilişkileri de değerlendirebiliyoruz. Serpilme diyagramı korelasyon analizi içinde bize büyük ölçüde destek sağlıyor.
Regresyon analizi sonuçlarımız için de veri görselleştirme tekniklerinden yararlanabiliriz. Özellikle regresyon analizleri için temel varsayımların (hataları bağımsızlığı vs.) sağlanıp sağlanmadığına dönük çok sayıda özel grafiği kontrol edebiliriz.
Zaman serisi analizi sonuçlarımızı da veri görselleştirme teknikleri ile yorumlayabiliyoruz. Örneğin zamana göre verilerimizin dalgalanmalarını, otokorelasyon grafiklerini, öngörü tekniklerinin sonuçlarını SPSS’nin bize sunduğu grafikler ile değerlendirebiliyoruz.
Özetle, SPSS istatistik analizi ve alternatif veri bilimi tekniklerine ait birçok farklı yaklaşımı içerisinde barındıryor. Bu yazımızda bu teknikleri genel anlamda değerlendirmeye çalıştık. Bu anlamda, SPSS’de bulunan tüm teknikleri kategorize etmeye; araştırmacıların kolayca anlayabileceği bir şekilde bu teknikleri sunmaya özen gösterdik.
SPSS istatistik alanında farklı çözümleri bünyesine (geç de olsa) katmaya başladı. Bu yazıda en son eklenen bazı yaklaşımlara da değindik.
Elbette bu yazımızda SPSS’nin yapabildiği herşey bulunmuyor. Ancak araştırmacıların en çok işine yarayabilecek istatistiksel analiz teknikleri ve farklı veri bilimi algoritmaları, SPSS bağlamında bu yazıda yer alıyor.
Kısaca; SPSS’ye kuşbakışı baktığımızda neler görülebileceğini bu yazıda görebilmekteyiz.