Uygulamalı disiplinlerde birimlerin göreli performanslarını belirlemek için veri zarflama analizini uyguluyoruz. Veri zarflama analizinde girdi ve çıktı değişkenleri üzerinden gözlemlerimizin etkinlik skorlarını hesaplayarak, etkin ve etkin olmayan birimleri sınıflandırabiliyoruz.
Veri zarflama analizini uygulamadan önce en uygun girdilerin ve çıktıların belirlenmesi son derece önemlidir. Sağlık, enerji, çevre, finans gibi farklı alanlara özgü araştırmalarda, konu ile ilişkileri girdi ve çıktıları seçtikten sonra etkinlik analizi sonuçlandırılmaktadır.
Buna göre öncelikle araştırma konumuza uygun olan ve kendi aralarında anlamlı bir korelasyona sahip girdi-çıktı değişkenlerini tespit etmeliyiz. Girdi ve çıktılarımız arasında pozitif korelasyonun olmasına da dikkat etmeliyiz. Girdilerimiz, yani kaynaklarımız arttıkça performans değerimiz, yani çıktılarımız da artmalıdır. Benzer şekilde girdilerdeki azalış, çıktılardaki azalışa yol açmalıdır.
Değişkenlerimiz arası beklediğimiz ilişki sağlanmadığında farklı dönüşümler veya alternatif modeller ile veri zarflama analizini tamamlayabiliriz.
Farz edelim; alanımız ile ilişkili girdi ve çıktı değişkenlerini belirledik. Peki tüm değişkenleri kullanabilir miyiz? Maalesef hayır. Gözlem sayımız ile toplam girdi-çıktı sayılarımız arasında bir sınır olmalıdır. Söz konusu kısıtlara dair detayları incelemek için “VERİ ZARFLAMA ANALİZİNDE GÖZLEM SAYISININ SINIRLARI” başlıklı yazımıza erişebilirsiniz.
Artık veri zarflama analizinde girdi ve çıktı sayımızın istediğimiz kadar çok olamayabileceğini biliyoruz.
Peki çok sayıda girdi ve çıktı kullanımının sakıncası nedir?
Başlıca sakıncası; karar verme birimlerimizin çoğunluğunun etkin olarak hesaplanmasıdır. Yani çok sayıda girdi ve çıktı kullanarak uyguladığımız veri zarflama analizi sonucunda, gözlemlerimiz genel olarak etkin olarak hesaplanacaktır. Bu durumda gözlemlerin performanslarını kıyaslamak zorlaşacaktır.
Herkesin başarılı olduğu bir ortamda karşılaştırma yapmak ne kadar zorsa; gözlemlerin çoğunluğunun etkin olduğu durumda da karşılaştırma yapmak o ölçüde zordur. Kısacası veri zarflama analizinde girdi ve çıktı değişkeni sayısının yüksek olması, gözlemlerin performanslarını ayrıştırma gücünü azaltıcı bir etmendir.
Bunun için literatürde çok sayıda alternatif yaklaşım geliştirilmiştir. Veri zarflama analizinde girdi ve çıktı değişkenlerinin seçimi için kullanılan başlıca yaklaşımlar şu şekilde gruplandırılabilir:
1) Etkinlik skorlarının değişkenliğini ölçme tabanlı yaklaşımlar
2) Regresyon-korelasyon analizi tabanlı yaklaşımlar
3) Optimizasyon tabanlı yaklaşımlar
Veri zarflama analizinde girdi ve çıktı seçimi kapsamında önerilmiş çok sayıda teknik mevcuttur. Bunların başında etkinlik katkı ölçüsünün (ECM) değerlendirilmesidir. Ayrıca literatürde girdi ve çıktılar üzerinden etkinlik skorlarını hesaplayarak ve hesaplanan bu skorları bağımlı değişken seçerek gerçekleştirilen regresyon-korelasyon tabanlı teknikler de bulunmaktadır.
Güncel çalışmalarda da lasso regresyon ve optimizasyon tabanlı teknikler de önerilmiştir.
Veri zarflama analizinde girdi ve çıktı seçimi için kullanılabilecek en iyi istatistiksel yazılımların başında R-Project ve Matlab programları gelmektedir.
Sonuç olarak; veri zarflama analizini uygularken en uygun girdi ve çıktı değişkenlerimizin seçimi için istatistiksel tekniklerden ve özelleşmiş ölçülerden yararlanabilmekteyiz.