Betimsel İstatistik Nedir?

Betimsel istatistik, istatistik biliminin temel yapı taşını oluşturan kavramların topluluğudur.

Nedir peki bu kavramlar?

Ne kadar dokunuyor bu kavramlar günlük hayatımıza?

Ne denli ilgiliyiz bu kavramlarla? Öğrenelim!

Tanımlayıcı istatistik olarak da bilinen betimsel istatistiğin temelini oluşturan kavramlar ile başlayalım:

Betimsel İstatistik İçin İlk Adım: Verilerin Toplanması

İstatistiksel sonuçların kalitesi ilk olarak veri kalitesine bağlıdır.

Burada veri kalitesinden kasıt, hatalı (uygun olmayan) verilerle yapılmayan analizlerdir.

Hatalı verilerle yapılan analizlerden elde edilecek sonuçlar ve bu sonuçlara dayalı oluşturulacak yorumlar istatistik açısından geçerli ve güvenilir olmayacaktır.

Dolayısıyla, betimsel istatistik için önemli olan verinizi anket, gözlem, görüşme, deney, tarama vb. yollardan hangisi ile elde ettiğiniz değil, bu yolları kullanarak veriyi toplarken ne denli doğru, geçerli, şeffaf ve güvenilir davrandığınızdır.

Betimsel İstatistik İçin Tablolarının Oluşturulması: Seriler ve Frekans

Toplanan verilerden serilerin oluşturulması, verinin özetlenmesi açısından oldukça önem arz etmektedir. Veri setinizin büyüklüğü belki çalıştığınız konu açısından önemli olabilir.

Ancak 1000 gözlemden oluşan bir veri seti ile 10000 gözlemden oluşan bir veri seti arasında, uygun bir seri ya da frekans tablosu ile özetleme yapmadıkça büyüklük açısından pek de bir fark yoktur.

İstatistiksel seriler gözlem değerlerinin büyüklüklerine göre sıralanmasıyla oluşturulur.

Frekans tabloları ise değişik ölçütler temel alarak istatistik seriyle ilgili farklı sınıflandırmalar yapabilir.

Betimsel istatistik de en çok kullanılan seri tiplerinden bazıları ve özellikleri aşağıda sıralanmıştır.

Zaman ve Mekan Serisi: Gözlem sonuçları yıl, ay, hafta, gün ya da saat gibi bir zaman değişkeninin şıklarına göre oluşturuluyorsa “zaman serisi”; ülke, bölge, şehir ya da köy gibi mekân değişkeninin şıklarına göre sıralanırsa “mekan serisi” adı verilir.

Dağılma Serileri: Basit Seri, Frekans Serisi ve Gruplandırılmış (Sınıflandırılmış) Seriler olarak üç farklı biçimde gösterilir. Her birinin diğerine göre avantaj ya da dezavantajları bulunabilmektedir. Örneğin; frekans serilerinde gözleme dair bilgi kaybı yokken, gruplandırılmış seri de gözleme dair bilgi kaybı olabilmektedir.

Birikimli Seri: Bir frekans dağılımında, her sınıfın frekansına bir önceki sınıfın frekans eklenerek oluşturulan seriye denir. Birikimli seriler küçükten büyüğe doğru oluşturulmuşsa “-den az”, büyükten küçüğe doğru oluşturulmuşsa “-den çok” olarak isimlendirilirler.

Bileşik Seri: Gözlemlerin birden fazla değişkene göre dağılımlarını bir arada gösteren serilere denir.

Betimsel İstatistiğin Dalları: Merkezi Eğilim ve Yayılım Ölçüleri

Betimleyici istatistik kendi içinde merkezi eğilim ve yayılım ölçüleri olmak üzere iki gruba ayrılır. Bu ölçümlerin hesaplamaları ise yukarıda bahsettiğimiz seri tiplerine göre değişkenlik arz edebilmektedir.

İstatistiksel serilerin toplandığı merkezi bir değeri gösterirken merkezi eğilim ölçüleri kullanılırken, serideki bir değişkenin aldığı gözlem değerlerinin birbirinden ne kadar farklı olduğunun gösterilmesinde merkezi yayılım ölçüleri kullanılır.

Merkezi eğilim ve yayılım ölçüleri için verinin dağılımının bilinmesi olmazsa olmaz bir husustur. Merkezi eğilim ölçüleri ortalamalardan oluşmaktadır.

Veri seti belli bir dağılıma uygunluk gösteriyorsa parametrik ortalamalar, göstermiyorsa da parametrik olmayan ortalamalar kullanılır.

Parametrik ortalamalar (aritmetik, geometrik, harmonik, kareli vb.) ve parametrik olmayan ortalamalar (mod, medyan, kartiller vb.) olmak üzere ikiye ayrılır.

Bu ayrım aslında parametrik ve parametrik olmayan testlerin sonuçları verilirken hangi betimsel istatistiklerin kullanılması gerektiğinin de önemli bir göstergesidir.

En sık kullanılan merkezi yayılım ölçüleri ise varyans, standart sapma, standart hata, değişim aralığı ve değişim katsayısıdır.

Merkezi yayılım ölçüsü için parametrik dağılıma uygun olan verilerde varyans, standart sapma kullanılırken, parametrik dağılıma uygun olmayan verilerde kartiller arası açıklık, değişim aralığı veya minimum-maksimum kullanılır.

Betimsel İstatistik İçin Grafiksel Gösterimler

Betimsel istatistiğin makyajlanarak araştırmacılara sunulmuş hali grafiksel gösterimlerdir.

Çoğu zaman haber takibi yapan bir kitle içinde, belli bir konuda araştırma yapan araştırmacı için de, değişen kur endekslerini takip eden ekonomist için de çok satırlı ve sütunlu tabloları yorumlamak ya da uzun rapor sonuçlarını okumak oldukça sıkıcı olabiliyor.

İşte tam da bu noktada grafikler adeta imdada yetişiyor.

Grafikler sade, anlaşılır ve görsel doyuruculuk açısından tatmin edici araçlar olarak kullanılıyorlar. Tabii ki her bir grafiğinde kullandığı istatistiksel seri, merkezi eğilim ölçüsü, merkezi yayılım ölçüsü değişkenlik gösterebiliyor.

Peki! Betimsel istatistiğin temellerini attığımız bu kavramlar ne kadar günlük hayatımızın içindeler bir düşünelim! Bir diyetisyen için danışanının günlük, haftalık ya da aylık ortalama kaç litre su tükettiği oldukça önemlidir.

Herhangi bir anabilim dalındaki doktor için hastasının kan sonuçlarındaki değerlerin referans aralığının nasıl değiştiği ise neredeyse hayati önem taşımaktadır.

Bir öğretmen sınıfındaki öğrencilerin kardeş sayısını, hatta ve hatta iki kardeşi olan kişilerin sayısını, daha da ileri gidecek olursak en çok tekrar eden kardeş sayısının kaç olduğunu merak edebilir.

Bir beden eğitimi öğretmeni için küçükten büyüğe boy sırasına koyduğu öğrencilerin içinden boy uzunluğuna bağlı bir seçim yaparken tam ortada kalan öğrenci nasıl da önemli bir konuma sahiptir.

Hiç düşündünüz mü? Böyle sayısız örnek, durum ya da vaka örneği verebiliriz.

Ancak burada asıl dikkat etmemiz gereken nokta: betimsel istatistiğin günlük hayatımıza ne denli girdiği ve sonuçlarıyla da ne denli hayatımıza dokunduğudur.

Unutmayın ki! Betimsel istatistik, araştırmacılar için çalıştıkları veri setinin kalbi niteliğindedir.

Kalbinizin iyi çalışması için temiz kanın kalbe gelmesini sağlayan bazı unsurların önemi ne ise, betimsel istatistiğinde hesaplanmasında ve sunulmasında kullandığınız verinin doğruluğunun, seri tipinin, eğilim ve dağılım ölçülerinin, grafiklerin önemi o dur…