İstatistik ve Analiz Süreçlerinin 6 Adımda Tasarlanması

istatistik ve analiz

 

İstatistik ve Analiz Süreçlerinin Planlanmasına Yönelik 6 Adım

İstatistik ve analiz süreçleri, bilimsel araştırma verilerimizin değerlendirilerek anlamlı sonuçlar ortaya konulması bakımından son derece önemlidir. İstatistik ve analiz uygulamaları kapsamında sistemli bir yol izlemek, araştırmalarımızı etkin bir şekilde tamamlamızı sağlayacaktır.

Araştırmacıların zihninde istatistik ve analiz süreci yalnızca verilerin istatistiksel analiz metotları ile analiz edilmesi olarak algılanıyor. Elbette analiz aşaması hayati bir aşama; ancak bu noktaya gelene kadar titizlikle uymamız gereken birtakım kurallar var.

Bu kuralların doğrultusunda istatistik ve analiz sürecini bir bütün olarak düşünmeliyiz. Araştırmanın başlangıcından istatistiksel analiz raporunun oluşturulmasına kadar doğru adımları izlemeliyiz.

Bu yazımızda istatistik ve analiz süreçlerini sistemli bir şekilde tamamlamak için uymamız gereken 6 önemli adımdan bahsedeceğiz.

istatistik ve analiz

İlk adım, araştırma amaçlarımızı belirlemektir.

istatistik ve analiz

İstatistik ve analiz süreçlerinin ilk aşamasında araştırmamızı hangi amaçlar doğrultusunda gerçekleştireceğimizi belirlememiz gerekiyor. Biz bu araştırmayı hangi amaçla tasarladık? Sonuç olarak neyi elde etmeyiz hedefliyoruz?

Bu soruları, daha en başında açık bir şekilde tespit etmeliyiz.

Peki amaçlarımızı nasıl belirleyebiliriz?

Bunun için araştırma yapmak istediğimiz alana yönelik bol bol literatür taraması yapmalıyız. Geçmişte yapılmış çok sayıda çalışmayı titizlikle tarayıp, kendi alanımızda ne tür açıkların var olduğunu keşfedebiliriz. Bu açıklara yönelik araştırma amaçlarımızı cümle cümle not etmemizde fayda var.

Araştırmamızda şu tarz amaçlar kurgulayabiliriz:

  • Sağlık çalışanlarının iş doyumu üzerinde hangi demografik faktörlerin etkili olduğunu belirlemek istiyorum.
  • Öğretmenlerin entelektüel sermaye düzeyleri ile mesleki tatmin ve mesleki imaj düzeyleri arasındaki ilişkileri değerlendirmek istiyorum.
  • Psikiyatr alanında yeni geliştirdiğim bir terapi eğitiminin şizofren hastalarının saldırganlık düzeyi üzerindeki etkisini ölçümlemek istiyorum.
  • Covid-19 hastalığı üzerine yeni geliştirdiğim aşının hastalık üzerinde anlamlı ölçüde etkisinin olup olmadığını analiz etmel istiyorum.

İşte bu tür araştırma amaçlarımızı baştan ortaya koymalıyız.

Amaçlarımızın spesifik ve yenilikçi olması, bilimsel kalite açısından çok çok önemli. Birbirinden kopuk onlarca amacı bir çalışmaya sığdırmak yerine, gerçekten literatüre katkı sunabileceğimiz belirli amaçların peşinde koşmamız en iyisi.

Tez çalışmalarımızda birden fazla amaç üzerinde yoğunlaşabiliriz. Ancak yine de bu amaçlar ortak bir üst amaca hizmet etmeli.

Bu alanda söylenebilecek farklı olgular üzerinde durabilmemiz mümkün; şimdilik bu madde için burada noktayı koyalım.

 

İkinci adım, araştırmamıza ait bir model tasarlamaktır.

istatistik ve analiz nedir

Buradaki modelden kastımız şu: Araştırmamızın türünü tasarlamak.

Araştırma sürecini nasıl yürütebileceğimizi bu adımda net bir şekilde ortaya koyuyoruz. Esas olarak bu aşama, bize verilerimizi nasıl toplayabileceğimiz hakkında da bilgi sunuyor.

Örneğin; geçmiş çalışmaların istatistiksel bilgilerinden hareketle meta analizi yapmak istiyorsak, meta-analitik bir model kurgulamalıyız.

Betimleyici bir araştırma modeli seçersek, anket ya da vaka çalışması gibi bir yol izlemeliyiz.

İlişkisel bir araştırma modeli seçersek, gözlemsel ya da vaka-kontrol türünde bir çalışma yürütmeliyiz.

Deneysel bir araştırma modeli tercih edersek, o zaman kontrollü deney ya da alan deneyi gibi bir yolu takip etmeliyiz.

Seçilen araştırma modeli; çalışacağımız örneklem verilerini nasıl toplayacağımıza göre belirlenebiliyor. Bunun için ilgili alanda çalışan uzmanların görüşlerinin de mutlaka alınması şart.

Hangi modeli kullanırsak kullanalım; kitleyi olabildiğinde temsil edebilecek yansız bir sistematik yapıyı takip etmeliyiz.

Tüm bu modeller başlı başına derinlemesine bilgiler içeriyor. Kısaca çalışmamızın önemli bir parçasını araştırma modelini belirlemek oluştuyoruz. Bu noktada amacımıza dönük doğru modeli tercih etmemiz bir gereklilik değil, zorunluluk olarak görülmeli.

 

Üçüncü adım araştırma değişkenlerini ve yöntemleri belirlemektir.

istatistik ve analiz

İstatistik ve analiz sürecinin bu aşamasında çalışmada kullanacağımız değişkenleri artık tam olarak belirlememiz gerekiyor. Anket çalışması hazırlıyorsak hangi demografik faktörlerin ve hangi ölçeklerin yer alacağını seçiyoruz.

Deneysel bir araştırma yürütüyorsak, deneklerimiz üzerinden hangi klinik ölçümlerin yapılacağını önceden kararlaştırıyoruz.

Meta-analitik bir araştırmanın içinde isek, referans çalışmalardan hangi test istatistiklerini kullanacağımızı tespit ediyoruz.

Bu aşama, tamamen araştırmacının objektif amaçlarına göre şekillendiriliyor.

Araştırmada hangi değişkeni kullanacağımız; ne tür sonuçlara ulaşacağımız da tayin ediyor.

Değişkenlerimiz amaçlarımızı mutlaka doğru bir şekilde temsil etmeli. Örneğin; kronik hastalar üzerinde bir araştırma yapıyorsak vakaların hastalık geçmişlerine dair sorular yöneltmemiz gerekebilir.

Seçeceğimiz değişken türünü de doğru bir şekilde betimlemeliyiz. Örneğin; hastaların tokluk kan şekeri ölçümleri sayısal olarak verilmiş olsun. Biz bu veriyi gruplandırırken kendi uzman görüşümüze de dahil ederek gruplandırma yapmalıyız. Kan şekerleri için 200 kritik bir sınırsa; gruplarımızı 200’ün altı – 200 ve üzeri şeklinde oluşturabiliriz. Buna uzmanın karar vermesi en doğrusu.

İstatistik ve analiz süreçlerinde değişken oluştururken, kendimizi bir aşçı gibi değerlendirebiliriz. Doğru bir şekilde değişkenlerimizi belirledik. Yani yapacağımız yemeğin ana malzemeleri tamam; şimdi sıra yemeği nasıl pişireceğimizi belirlemekte; yani istatistik ve analiz ile ilgili bilimsel tekniklere karar verme zamanı geldi.

Bu noktada elimizde çok sayıda farklı seçenek bulunuyor. Ancak çalışmaların ezici çoğunluğunda istatistiksel hipotez testlerinden yararlanıyoruz. Belirlediğimiz araştırma sorularına göre t-testi, ANOVA, Friedman testi, Kruskal-Wallis testi gibi bir yöntemi kullanıyoruz.

İstatistiksel analiz yönteminin seçimi tamamen değişkenlerin türlerine bağlı.

Tanımlayıcı istatistiksel analizler verinin olduğu her yerde olmazsa olmaz bulgularımızı kapsıyor.

Normal dağılım varsayımına uygun sayısal verilerimiz için aritmetik ortalama ve standart sapma; normal dağılıma uygun olmayan sayısal verilerimiz için de medyan (bazen sıra ortalaması) ve değişim aralığı (ya da kartiller arası açıklık) gibi istatistikleri muhakkak raporlarımızda paylaşıyoruz.

Kategorik olarak tanımladığımız demografik faktörler için frekans analizi bulgularını daima sunuyoruz. Sayısal verilerden oluşan (yaş, gelir, vb.) demografik faktörlerimiz için de ortalama ve standart sapmaları verebiliyoruz.

Anket çalışmalarında da çok sayıda ölçek ile çalıştığımız için geçerlilik-güvenilirlik analizlerini kullanıyoruz. Cronbach Alfa Güvenilirlik Analizi ve Doğrulayıcı Faktör Analizi ölçek analizleri için en sık kullanılan tekniklerin başında geliyor.

Eğer geliştirdiğimiz ölçeğin alt boyutlarını bilmiyorsak ya da mevcut bir ölçeğin alt boyutlarını yeniden düzenlemek istiyorsak Açıklayıcı Faktör Analizi uyguluyoruz.

Anket çalışmalarımızda çok değişkenli istatistiksel analiz tekniklerine başvuruyoruz.

Peki çalışmamızda zaman faktörü devreye girerse?

İşte o zaman, ekonometrik yöntemleri ya da  zaman serisi analiz tekniklerini tercih ediyoruz. Topladığımız verinin türüne göre farklı ekonometrik teknikleri kullanabiliriz. Örneğin; 10 firmanın 5 yıllık verileri üzerinden bir modelleme gerçekleştireceksek; veri yapısı dolayısı ile mecburen panel veri analizi yöntemlerine müracaat etmemiz gerekiyor.

Eğer çalışmamızda geleceğe yönelik tahminler gerçekleştirmek istiyorsak, ARIMA, Üstel Düzleştirme, SARIMA, ARFIMA, Yapay Sinir Ağları gibi öngörü modellerini kullanıyoruz.

Biyoistatistik alanı ile ilgili nicel bir değişkenimiz ve bağlı olduğu bir tanı grubuna göre kesim noktası tespit etmek istediğimizde ROC Analizi tekniğinden yararlanıyoruz.

Ancak yine biyoistatistik araştırmalarımızda yaşam sürelerine yönelik çıkarımlar ya da modellemeler gerçekleştirmek istediğimizda Kaplan-Meier ya da Cox Regresyon Analizi gibi bir yöntemi kullanıyoruz.

Özetle bu aşamada değişkenlerimizi belirliyoruz ve hangi analiz tekniklerini kullanacağımızı hipotezlerimiz ve araştırma sorularımız doğrultusunda tespit ediyoruz.

İstatistik ve analiz uygulamalarımız için R, SPSSStata, Minitab gibi bir veri analizi programını seçebiliriz. Programlar da  seçeceğimiz yönteme bağlı olarak değişebilir. Örneğin; SPSS panel veri analizi için uygun bir yazılım değil; bunun için Stata programını kullanabiliriz. Minitab ile doğrulayıcı faktör analizini uygulayamayız. Bunu da R programı ile aşabiliriz.

 

Dördüncü adım veri toplama işlemlerini tamamlamaktır.

istatistik ve analiz

Değişkenlerimizi belirledik, yöntemlerimizi seçtik, şimdi sıra verileri toplamaya geldi.

Burada öncelikle araştırmamızda kaç gözlem ile çalışacağımızı belirlememiz gerekiyor. Bunun için örneklem büyüklüğü hesaplama yaklaşımlarını ya da güç analizi tekniklerini uygulamalıyız. Bu süreçler ile ilgili kapsamlı bilgileri geçmiş yazılarımızda paylaşmıştık. Ancak kısaca yine de bahsedelim.

Örneklem hacmini hesaplamak için istatistiğin gerektirdiği birtakım örnekleme formüllerini kullanabiliriz. Bu formüller için de yine pilot verilerimiz ya da geçmiş araştırmaların istatistiklerinden hareket ediyoruz.

Güç analizi için de yine bir pilot çalışma üzerinde uygulayacağımız hipotez testi bulgularını ya da referans araştırmalarımızın test istatistiklerini baz alarak; minimum %80 güç değerine ulaşan en uygun örneklem sayısını seçiyoruz.

Verilerimizi toplamak için de ulaşacağımız kitleye ya da deneklerimize göre en uygun yola karar veriyoruz.

Örneğin; bir anket çalışmasını Google Formlar aracılığı ile sosyal medya üzerinden çok sayıda kişiye ulaştırabiliriz. Bunun yerine doğrudan kağıt şeklinde hazırladığımız anket formlarını katılımcılara yönelterek yanıtlar alabiliriz.

Topladığımız tüm bu verileri de bilgisayar ortamına aktarmayı ve uygun bir dosya formatında verilerimizi saklamayı da ihmal etmiyoruz.

 

Beşinci adım toplanan veriler üzerinde istatistiksel analiz yöntemlerini uygulamaktır.

istatistik ve analiz

Amaçlarımız hazır, değişkenlerimiz hazır, verilerimiz hazır; artık istatistiksel analiz yöntemlerini uygulama aşamasına geldik. Bu noktada belirlediğimiz teknikleri araştırma sorularımıza uygun olarak uyguluyoruz.

Tam anlamı ile uzmanlık gerektiren bir aşama ile karşı karşıyayız. Çok ciddi bir veri analizi birikimi ve alan uzmanlığı eşliğinde, verilerimizin hünerli ellerde anlamlı bilgilere dönüşmesi gerekiyor.

Bu aşamada yapacağımız hatalar; makalemizin ya da tezimizin bilimsel bir şaheser mi, bilimsel bir çöp mü olacağını tayin ediyor.

İstatistiksel analiz aşaması çalışmalara göre farklılık göstereceği için bu analiz deryasına burada dur diyelim.

 

Altıncı ve son adım ise istatistiksel analiz sonuçlarını yorumlamak ve temel bulguları ortaya koymaktır.

istatistik ve analiz

İstatistik ve analiz sürecinin son aşamasına geldik. Her adımı doğru şekilde takip ettik, verilerimizi topladık, analiz ettik. Artık istatistiksel analiz teknikleri ile elde ettiğimiz bulguları alanımıza uygun bir bakış açısı ile yorumluyoruz.

Sonuçlarımızı salt “Anlamlı fark vardır”  ya da “Anlamlı ilişki vardır”  şeklinde yorumlamak yerine; farklılığın kaynaklarına da dikkat çekmeliyiz.

İstatistiksel analiz bulgularının yorumlanması analizin türüne göre büyük ölçüde değişecektir. Yalnız her analiz tekniğinin kendi içerisinde bazı kilit noktaları vardır. Bu noktalara hem varsayımların kontrolü, hem de nihai sonuçların yorumlanması aşamasında dikkat etmemiz gerekir.

Her istatistiksel bulguyu yorumlarken o analizin ürettiği çıktıların bilimsel yorumunu doğru yapmalıyız. Örneğin; bağımsız örneklemler t-testine ait anlamlılık değeri p=0.005 için istatistiksel olarak fark yoktur dersek; çalışmanın bilimsel niteliğini mahvetmiş oluruz.

Benzer şekilde açıklayıcı faktör analizi sonucunda varyans açıklama oranını %30 olarak hesaplayıp bunun yeterli olabileceğini öne sürersek (bunu savunan Türkçe kitaplar var) istatistiksel bir cinayet işlemiş oluruz.

Yorumladığımız bulguları da araştırmamızın raporlama formatına uygun olarak tablolar eşliğinde sunuyor; istatistik ve analiz sürecimizi nihayete erdiriyoruz!

İstatistik ve Analiz Süreçlerine Dair Son Söz

Bu yazımızda istatistik ve analiz süreçlerini 6 aşamada tanımlamaya çalıştık. Farklı kaynaklarda bu aşamalar farklı şekillerde tanımlanabiliyor; ancak yaptığımız tüm çıkarımların istatistik bilimi ile örtüştüğünü ve araştırmalara büyük ölçüde yön gösterebileceğini gönül rahatlığı ile ifade edebiliriz.

İstatistik ve analiz dediğimizde artık yalnızca t-testi, faktör analizi, regresyon analizi gibi istatistikel teknikleri düşünmek yerine; süreci bir bütün olarak değerlendirmemiz gerektiğini unutmayalım. Bu sürecin her aşaması çok çok değerli, her bir noktası çalışmamızın bilimsel değerini korumak adına çok önemli.

Artık veri ile ilgili olan tüm araştırmalarımızın istatistik ve analiz sürecini 6 adıma tasarlayabilir; bilimsel çalışmamızın istatistiksel analiz bölümünün nasıl başlayıp nasıl sonlanacağını 6 adımda planlayabiliriz.