Zamana göre değişen veriler ile hayatımızın her noktasında karşılaşıyoruz. Firmaların, ülkelerin, hastanelerin; kısacası çok sayıda birimin farklı zamanlarına ait değişkenlerini analiz etmek istiyoruz. Panel veri analizi, zamana göre elde ettiğimiz değişkenler üzerinden analiz yapmamızı sağlayan biricik ekonometrik yöntemler topluluğunu içeriyor.
Öncelikle panel verinin ne olduğuna örneklendirmeler ile bir göz atalım.
Farz edelim, ülkemizde faaliyet gösteren tekstil alanındaki 5 firmanın net satışlarına yönelik bir araştırma gerçekleştirmek istiyoruz. 2019 yılında 5 firmaya ait net satış değerlerini tek tek elde edelim.
Yalnızca 2019 yılındaki 5 firmanın net satış verileri çapraz kesitsel veriler olarak tanımlanır.
Kısacası yalnızca tek bir zaman periyoduna ait verilerimiz çapraz kesitsel verilerdir. Aşağıda çapraz kesitsel verilere dair örneğimizi görüyoruz.
Tekstil alanında faaliyet gösteren 5 firma yerine tek bir firmanın 3 yıllık verilerine de odaklanabiliriz. Buna göre F3 firmasının 2017, 2018 ve 2019 yıllarına ait net satış rakamlarını ele alalım. Artık topladığımız veriler zaman serisi olarak tanımlanır.
Şimdi de 5 firmaya ait 2017, 2018 ve 2019 net satış verilerini kullanalım. Bu durumda hem çapraz kesitsel, hem de zaman serisi şeklindeki yapıların birleşimini görüyoruz.
Kısacası zamana göre çapraz kesitsel verilerin birleşiminden oluşan veri türlerine panel veri; bu tür verileri analiz etmek için kullandığımız ekonometrik-istatistiksel analiz tekniklerinin birleştiği alana da panel veri analizi diyoruz.
Panel veri analizi hangi alanlarda uygulanıyor? Özellikle ekonomi ve finans alanında yoğun olarak kullanıldığını görüyoruz. Bu alanların dışında da sağlık, endüstri, işletme gibi alanlarda da panel veri analizi karşımıza çıkıyor.
Panel veri analizi için bazı uygulamalar şunlardır:
Panel veri analizini uygulamak için farklı ekonometrik analiz programlarından yararlanabiliriz. Yaygın olarak kullanılan yazılımdan söz edebiliriz:
Stata yazılımında çok sayıda farklı seçenek bulunuyor. Programda hem sayısal, hem de kategorik bağımlı değişkene sahip olan panel veriler için analiz seçenekleri bulunuyor.
Kategorik bağımlı değişkenlerin yer aldığı panel veri analizi yaklaşımları için Stata’da Probit tahminci seçeneği mevcut.
Stata programında ister kod yazarak, ister menüler üzerinden panel verilerimizi analiz edebiliyoruz. Stata’da kod yazarak alternatif modellere yönelik panel veri analizlerini uygulamak mümkün.
E-Views programında da farklı analiz seçeneklerini kullanabiliyoruz. Sabit etki modeli, rassal etki modeli, birleştirilmiş (pooled) tahmin modeli gibi alternatif teknikleri kullanabiliriz.
R Programında da panel verilerimizi analiz edebilmek için kullanacağımız onlarca farklı yaklaşım bulunuyor. Diğer programlarda olan tahmin teknikleri, varsayımsal sınamaları ve alternatif modelleri R programı sayesinde kolaylıkla uygulayabiliyoruz.
Örneğin; (0,1) aralığındaki oran türü bağımlı değişkenler ile bir panel regresyon modeli tahmin etmek istediğimizde, fraksiyonel panel modellerini kullanabileceğimiz biricik yazılım R.
Ayrıca R programında bağımlı değişkenin farklı dağılımları için Genelleştirilmiş Lineer Modeller kapsamında panel veri analizi yöntemleri bulunuyor.
Bu tür farklı teknikler için tasarlanmış plm, pglm gibi muhteşem R paketlerini kullanabiliyoruz. Ancak R programı henüz yaygın olarak kullanılmadığı için araştırmacılar tarafından pek tanındığını söyleyemeyiz.
Şu an Türk araştırmacılar için en favori yazılım Stata gibi gözüküyor. Türkçe yayınlanan makalelerin büyük çoğunluğunda, panel veri analizi sonuçlarının Stata tarafından alındığını gözlemliyoruz.
Stata ile panel veri analizi, özellikle akademik makalelerde dikkat çekiyor.
Stata, E-Views ve R dışında Gauss gibi farklı yazılımları da kullanabiliriz. Stata ile panel veri analizi tekniklerinin uygulanması, en sık başvurulan yolların başında geliyor.
Ancak Minitab, SPSS gibi klasik istatistiksel analiz programlarında panel verilere özgü yaklaşımlar mevcut değil. Bu tür klasik yazılımlar için sentaks kullanmak da faydasız…
Panel veri analizi oldukça kapsamlı bir konu ve model seçiminden varsayımların test edilmesine değin uzanan farklı konu başlıkları bu analiz kapsamında yer alıyor.
Panel veri analizine başlamadan önce durağanlık, otokorelasyon, değişen varyans gibi çeşitli varsayımların da test edilmesi gerekiyor. Söz konusu varsayımların sağlanmadığı durumlar için de ekonometri literatüründe özel dayanıklı (robust) tahmin teknikleri öneriliyor. Dayanıklı teknikler kapsamında Driscoll-Kraay gibi mükemmel sonuçlar verebilen tekniklere başvurabiliyoruz.
Etki türünün seçimi de panel veri analizinde önemli bir yer tutuyor. Hausman testi, Lagrange Çapranı testi gibi farklı test isimleri bu noktada bilimsel yayınlar içerisinde görülebiliyor. Panel verilerin dengeli mi, dengesiz mi olduğu da analiz noktasında önem arz ediyor. Özetle zamana bağlı kesitsel veriler ile çalıştığımızda, dikkat etmemiz gereken çok nokta var.
Bu yazımızda panel veri analizine ilişkin kısa bir giriş yapmak istedik ve bu analiz teknikleri ile ilgili başlıca ekonometrik analiz programlarını tanıtmaya çalıştık.
Panel veri analizinin başlı başına bir analiz dünyasına sahip olduğunu söylesek, abartmış sayılmayız. Gelecek yazılarımızda Haussman testi, Breusch-Pagan testi, en uygun modelin seçimi ve modellerin yorumlanması üzerine farklı içerikleri paylaşmaya devam edeceğiz.