Bilimsel araştırmalarımızda kavramlar aracılığı ile tanımlamak istediğimiz değişkenleri ölçekler üzerinden tanımlıyoruz. Ölçek puanları, tanımlamış olduğumuz ölçülemeyen kavramları sayısal bir forma dönüştürmemizi sağlamaktadır.
Ölçek puanlarından önce ölçek kullanımlarına göz atalım.
Anketlerimiz içerisinde genelde demografik faktörler ve ölçekler olmak üzere iki ayrı bölüm yer alıyor. Ölçekler, doğrudan ölçülemeyen gizil faktörleri temsil ettiği için anket çalışmalarımızın vazgeçilmez bir parçasını oluşturuyor.
Ölçülemeyen gizil faktör… Tanımı son derece zor görünse de aslında oldukça basit.
Şimdi kaygı kavramını bir düşünelim. Kaygı dediğimizde, kaygı düzeylerimizi doğrudan boyumuz, cebimizdeki paramız ya da evimizdeki oda sayısı gibi ölçemeyiz. Bunu ancak empati yolu ile hissedebiliriz.
İstatistik, sezgiler üzerinden değil matematiksel veriler üzerinden çalıştığı için kaygı kavramını da bu şekilde ifade etmemiz gerekir.
Şimdi de kaygımızı basit bir ölçüm aracına dönüştürelim ve kaygı düzeylerimizi algılayabilmek için likert tipli (1=Kesinlikle katılmıyorum, …, 5=Kesinlikle katılıyorum) üç farklı soru oluşturalım:
Artık kaygı kavramını üç soru altında birleştirdik. Gördüğümüz gibi, kaygı kavramını tek bir ölçüm ile ifade edemiyoruz ve birden çok soruyu bir araya getirerek genel bir kaygı değişkeni oluşturuyoruz. İşte bu oluşturulan değişken doğrudan ölçülemeyen, gizil bir faktör, bir gizil değişken olarak temsil edilebilir duruma gelmiş oldu.
İşte bu tür genel kavramları betimlemek için ölçekleri kullanıyoruz. Hatta kullandığımız ölçeklerin bile alt ölçekleri (alt boyutları) oluşabiliyor.
Örneğin; cep telefonu operatörlerinin hizmet kalitesi düzeylerine yönelik bir ölçeğimizin olduğunu ve hizmet kalitesini de iki alt boyuttan oluşturduğumuzu düşünelim.
Turkcell, Vodafone gibi farklı operatörlerin genel hizmet kalitelerini iki alt boyut oluşturabilir:
Dolayısı ile operatörleri hem kapsama alanı, yani bağlantının çekim gücü açısından; hem de internete hızlı bağlanma durumu açısından değerlendirebiliyoruz.
Ölçeklerimiz her zaman alt boyutlar içermek zorunda değil. Bazı ölçekler tek bir boyut tarafından da temsil edilebiliyor.
Anket araştırmamıza dair ölçeklerimizi (varsa alt boyutları ile) birlikte belirledik. Şimdi de her katılımcı için bu ölçeklere yönelik birtakım istatistiksel analizler uygulamak isteriz. Bunun için de her gözlem için sayısal olarak tanımlanmış ölçek puanlarına ihtiyaç duyarız.
Araştırmalarımızda ölçek puanı hesaplamamızın asıl amacı, kavramlarımız üzerinde hangi demografik faktörlerin istatistiksel olarak anlamlı etkisi olduğunu belirlemektir.
Anket formunda yer alan demografik faktörlerimiz ile hesapladığımız ölçek puanları arasındaki ilişkileri istatistiksel hipotez testleri ile değerlendiriyoruz.
Kaygı düzeyleri üzerinde cinsiyet faktörünün etkili olup olmadığını belirlemek için (normal dağılımı koşulu altında) bağımsız örneklemler t-testini kullanabiliriz. Eğitim grupları ile kaygı düzeyleri arasında anlamlı bir farkın olup olmadığını da (normal dağılımı koşulu sağlanmadığı durumlarda) Kruskal-Wallis testi ile inceleyebiliriz.
İşte bu tür hipotez testlerini kullanabilmemiz için ölçek puanlarını hesaplıyoruz ve bu skor puanlarını bağımlı değişken olarak alarak farkı istatistik analiz tekniklerini uygulayabiliyoruz.
Yalnızca hipotez testleri değil; regresyon analizi, yol analizi gibi modelleme tekniklerinden de yararlanabiliriz.
Ölçek puanlarını hesaplayabilmemiz için genelde ölçeğin toplam puanı alınmaktadır. Sosyal bilimlerin geleneksel yaklaşımı budur.
Ancak bu yaklaşımın bir takım problemler içerdiğini belirtmemiz gerekiyor.
Bu problemleri hemen örneklendirelim.
Farz edelim; 5’li likert maddelerden oluşan ve toplam puanı maksimum 150 olan 30 maddelik bir ölçeği kullanıyoruz. Kullandığımız ölçeğin kendi örneklemimiz üzerinden içsel tutarlılığını ölçmek için Cronbach Alfa güvenilirlik analizi tekniğine başvuruyoruz.
Güvenilirlik analizi sonucunda ölçeğin güvenilirlik katsayısını düşüren bazı maddeleri ölçekten çıkartabiliriz. Madde çıkarıldığında güvenilirlik katsayısında bir artış gözlenirse, doğal olarak o maddeleri analiz dışı bırakırız.
Bazı maddeleri analizden çıkardığımızda toplam puan artık 150 olmayacaktır. Analizden 4 maddeyi çıkarsak, toplam puan maksimum 130 olacaktır.
Artık normal şartlarda 150 puan üzerinden değerlendirme yaparken üst sınırımız 130 olacak ve bu durumda alt-üst sınırlara göre objektif bir yorumlama yapmamızı engelleyecektir.
Ancak toplam puan yerine aritmetik ortalama kullandığımızda her şey daha da kolay hale geliyor.
Artık katılımcı başına hesaplamış olduğumuz puanlar ortalama şeklinde hesaplanınca, yorumlarımız da son derece basit hale geliyor.
Örneğin bir katılımcının ortalama puanı 4.7 olduğunda 5’e yakın olduğu için “Kesinlikle Katılıyorum” ifadesine çok büyük ölçüde yakın bir cevap verildiğini anlayabiliyoruz.
Ölçekten kaç soru çıkarılırsa çıkarılsın, ölçek puanları 1-5 arasında konumlanacağı için toplam puanda olduğu gibi bir yorumlama problemi ortadan kalkmış oluyor.
Ölçek puanları hesaplanırken toplam yerine aritmetik ortalamayı kullandığımızda istatistik testlerimizin sonuçlarında da hiçbir değişiklik olmuyor. Yani ne test istatistiklerimiz, ne de p-değerlerimiz değişmiyor ve test sonuçlarındaki yorumlarımız da aynı kalıyor.
Tek değişen şey, tanımlayıcı istatistikler ve belirsiz çıkarımlardır!
Zaten ortalama kullandığımızda sadece toplam puanı soru sayısına bölmüş oluyoruz.
Şunu asla unutmayalım ki; güvenilirlik analizi sonuçları örneklemden örnekleme her zaman değişebilir ve bazı maddeler ölçeklerden çıkartılabilir.
Akademik yayınlarda bu olgu hiç yokmuşçasına doğrudan toplam puanların hesaplandığına da şahit oluyoruz. İçsel tutarlılıkları değerlendirmek için mutlaka ama mutlaka güvenilirlik analizi uygulanmalı ve gereklilik varsa bazı soru(lar) çıkartılmalıdır.
Son söz olarak, ölçek puanları hesaplanırken toplam puan yerine aritmetik ortalamalarının hesaplanması gerektiğini vurgulayalım. Bu sayede olası soru çıkarımlarının yaratacağı ölçek puanları için yorumlama problemini ortadan kaldırmış oluruz.