SPSS ile Uç Değer Analizi Nasıl Yapılır?

Veri setlerinde diğer gözlemlerden aşırı ölçüde sapma gösteren, çok yüksek veya çok düşük değerlere sahip olan verileri uç değer olarak adlandırıyoruz. Uç değerleri aykırı değer olarak da tanımlayabiliriz.

Uç değerlerin en belirgin özelliği, veri setinde olağan dışı gözlemlere sahip olmasıdır.

Hatta bir tanıma göre uç değerler, verilerin çoğunluğundan farklı bir dağılıma sahip olan gözlemleri içermektedir.

İstatistiksel analiz sonuçlarımız, büyük ölçüde uç değerlerden etkilenmektedir.

Peki uç değerler bizim için neden bu kadar önemli ve bu değerleri nasıl tespit edebiliriz?

Bugün sizinle, SPSS programı ile uç değer analizinin nasıl yapılacağı üzerinden durarak bu sorunun yanıtını birlikte bulacağız.

Uç Değer Analizi Hangi Tür Veriler İçin Yapılabilir?

İstatistikte uç değer analizini sadece sayısal ölçümler için yapabiliriz. Aşağıdaki veri örneklerinde uç değer analizleri gerçekleştirilebilir:

  • Diyabet hastalarının açlık kan şekeri ölçümleri
  • Postpartum dönemdeki kadınların emzirme yeterlilik ölçeği puanları
  • Yeme bozukluğu olan bireylerin günlük aldığı protein miktarları
  • Karaciğer yağlanması olan yaşlı bireylerin SGOT değerleri
  • Mesleki deneyimi 10 yıldan fazla olan hemşirelerin örgütsel bağlılık ölçeği puanı

Yukarıdaki örnekleri çoğaltmamız mümkün.

Hepsinde ortak olan şey; söz konusu verilerin sayısal olmasıdır.

Kategorik veriler için uç değer analizi yapamayız.

SPSS ile Uç Değer Analizi Nasıl Yapılır?

SPSS ile uç değer analizini 2 farklı şekilde yapabiliriz:

1. Grafiksel yöntemler

2. İstatistiksel skor puanları

SPSS’te istatistiksel skor puanları ile uç değerleri, iki farklı şekilde tespit edebiliriz:

  • Z-skorları
  • Kantil değerleri

Şimdi bu teknikler üzerinde yoğunlaşalım.

SPSS ile Grafiksel Teknikler ile Uç Değer Analizi

SPSS ile uç değer analizi için grafiksel yöntemler üzerinden, iki temel veri görselleştirme tekniğini kullanabiliriz:

  • Kutu grafikleri
  • Normal Q-Q grafikleri

SPSS ile Kutu Grafikleri ile Uç Değer Tespiti

SPSS ile kutu grafiklerini üç adımda çizebiliriz:

Analyze -> Descriptive Statistics -> Explore

Açılan pencereden değişkenimizi Dependent List bölümüne aktarıyoruz.

Şimdi 20 farklı vücut kitle indeksi değeri üzerinden kutu grafiklerini çizelim. Verileri SPSS formatında aşağıdaki ekranda görebiliriz.

Bu veri setinde son iki gözlem, diğer verilerden büyük ölçüde sapmaktadır. Şimdi kutu grafiğini çizerek uç değerleri tespit edelim.

SPSS’in çizdiği kutu grafiğinde, 19. ve 20. gözlemler bariz bir şekilde yıldız sembolü ile üst sınırın dışında yer alıyor.

İşte bu sınırların dışına çıkan ve yıldız sembolü ile ifade edilen gözlemler, uç değer olarak belirleniyor.

SPSS ile Normal QQ Grafikleri ile Uç Değer Tespiti

SPSS ile normal QQ grafikleri, verilerin normal dağılıma uygunluğunu incelemenin yanı sıra uç değer analizi için de kullanılabilmektedir.

SPSS ile uç değer analizi yapabilmek için normal QQ grafiklerini yine bir önceki yoldan üç adımda çizebiliriz:

Analyze -> Descriptive Statistics -> Explore

Burada yine bir önceki grafikte olduğu gibi, değişkenimizi Dependent List alanına aktarıyoruz.

Şimdi ufak bir işlemimiz daha var.

Açılan pencerede Plots seçeneğine tıklıyoruz ve Normality plots with tests bölümünü seçiyoruz.

Sonrasında OK butonuna basarak normal QQ grafiğini aşağıdaki şekilde görebiliriz.

Çizilen grafikte, en sağ tarafta kalan iki gözlem değerinin diğerlerinden büyük ölçüde farklı bir konumda olduğunu rahatlıkla görebiliriz.

Diğer tüm gözlemler doğrunun sağ bölümünde konumlanırken; sadece iki gözlem değeri eğrinin sağ alt kısmında diğer verilerden ayrışmaktadır.

İşte bu veriler, bizim içi uç değerler olarak karşımıza çıkmaktadır.

SPSS’te Z-Skorları ile Uç Değer Analizi

SPSS ile uç değerleri grafikler üzerinden tespit edebileceğimiz gibi, somut istatistiksel ölçüler üzerinden de tespit edebiliriz.

Grafiksel teknikler her ne kadar bize yardımcı olsa da; sezgisel sonuçlar vermekten kaçamazlar. Öyle veri setleri ile karşılaşabiliriz ki; herkes kendi bakış açısına göre gözlemleri uç değer olarak tanımlayabilir.

Bu nedenle en objektif sonuçları alabilmemiz için, istatistiğin somut sayısal ölçülerinden yararlanmak en doğru tercih olacaktır.

İşte tam bu noktada karşımıza son derece basit ve muhteşem bir ölçü çıkıyor:

Z-skorları!

SPSS ile z-skorlarını hesapladıktan sonra uç değerleri tespit etmek çok kolay:

Mutlak değerce z-skorları belirlediğimiz eşik değerden yüksek olan z-skorlarını uç değer olarak belirleyebiliriz.

Bu eşik değeri için aşağıdaki sınır değerlerinden herhangi birini seçebiliriz:

  • Z=3.29 (p<0.001 önem düzeyi)
  • Z=3
  • Z=2.58 (p<0.01 önem düzeyi)
  • Z=2

Şimdi z-skorlarının SPSS’te nasıl hesaplanabileceğine göz atalım.

Toplam üç adımda z-skorlarını hesaplamamız mümkün:

Analyze -> Descriptive Statistics -> Descriptives

Karşımıza açılan pencereden değişkenimizi Variables(s) sekmesine aktaıp, Save standardized values as variables seçeneğini tıkladığımızda, z-skorlarını Data View bölümünde görebiliriz.

Artık z-skorlarını aşağıda görebiliriz.

Elde edilen z-skorlarına göre eşik değeri Z=2.58 alırsak; her iki gözlemi de uç değer olarak tanımlamış oluruz.

Ancak eşik değerimizi Z=3 veya Z=3.29 aldığımızda, bu son iki veri uç değer değildir.

İstatistiksel sonuçlarda da gördüğümüz gibi, seçtiğimiz eşik değer, verinin gidişatını tayin ediyor!

Peki uç değerleri tespit ettikten sonra ne yapabiliriz?

Önümüzde iki yol var:

  1. Bu uç değerleri analizden çıkartabiliriz ve klasik istatistiksel analiz tekniklerine başvurabiliriz.
  2. Dayanıklı (robust) bir analiz tekniği ile yolumuza devam edebiliriz.

Sonsöz

Bu yazımızda, sizlerin isteği üzerine SPSS ile uç değeri analizinin nasıl yapılabileceğine yönelik önemli bilgiler paylaştık.

Gelecek yazılarımızda uç değerlere karşı alternatif dayanıklı istatistik teknikleri tanıtarak, sizlere nitelikli akademik bilgiler sunmaya devam edeceğiz.

NOT: SPSS programını ücretsiz bir şekilde indirmek için tıklayınız. Karşınıza çıkan Try it now bölümünü seçerek SPSS’i 30 gün boyunca tüm özellikleri açık şekilde kullanabilirsiniz.