Regresyon Analizi ve MARS Yöntemi – İSTMER

Regresyon Analizi ve MARS Yöntemi

regresyon analizi ve mars yöntemi

 

Regresyon Analizinde Mars Yöntemi ve Avantajları

Regresyon analizi, bilimsel araştırmalarda bağımlı değişken(ler)imizi modellemek için kullandığımız bir istatistiksel analiz tekniğidir. Regresyon analizi kendi içerisinde onlarca alternatif modeli barındırıyor. Regresyon modelleri arasında en güçlü tekniklerden biris de MARS yöntemi olarak karşımıza çıkıyor.

MARS yönteminin detaylarına girmeden önce bazı ön bilgileri paylaşalım.

Regresyon analizi denildiğinde ilk akla gelen normal dağılım varsayımına dayalı lineer regresyon analizi geliyor. Hemen şu iki soru aklımıza geliyor:

  • Bağımlı değişkenimiz normal dağılıma uymak zorunda mı?
  • Lineerlik; yani bağımsız değişken(ler) ile bağımlı değişken(ler) arasında doğrusal bir ilişki olmak zorunda mı?

İki soru için de cevabımız ortak: Elbette hayır!

İstatistik analizi uygulamalarındaki alışkanlıklarımız sebebi ile, literatürde başka regresyon modeli yokmuşçasına düşünüyoruz. Ama onlarca model var.

MARS yöntemi de regresyon modelleri arasında var olan mükemmel bir teknik.

Açılımı da tam olarak Multivariate Adaptive Regression Splines, yani Çok Değişkenli Uyarlamalı (ya da Adaptif) Regresyon eğrileri.

MARS yöntemi, bağımsız değişkenler ile bağımlı değişkenler arasındaki regresyon modelini oluştururken, doğruların birleşimi ile hem lineer-hem de non-lineer bir model kurabiliyor. Bu nedenle daha doğru tahmin sonuçları elde etmemizi sağlayabilecek esnek bir yapıya sahip.

Modelleme aşamasında MARS yönteminin yararlandığı temel iki aşaması var:

1) İleriye doğru (Forward) seçim aşaması

2) Geriye doğru (Backward) seçim aşaması

İlk aşamada MARS, verinin belirli noktaları üzerinden hata kareler ortalamasını minimize eden aşırı uyumlu bir model kuruyor; ikinci aşamada ise seçilen vektörleri model dışı bırakarak eleme süreci ile analizi tamamlıyor.

Geriye doğru seçim aşamasında  MARS’ın bir kritere ihtiyacı var. Bunun için geleneksel yaklaşım GCV-(Genelleştirilmiş Çapraz Geçerlilik) kriterini kullanmak.

Bunlar size çok teorik gelebilir ancak genel hatları ile MARS yönteminin çalışma mantığını bilmek çok önemli.

MARS yöntemi iki temel avantaja sahip:

1) Modeli kurarken değişken seçimi yapabiliyor

2) Non-lineer ilişkileri modelleyebiliyor.

3) Parametrik olmayan bir yöntem olduğu için normallik varsayımı sağlanmadığı takdirde de kullanılabiliyor.

4) Birden fazla bağımlı değişkenin olduğu durumda da uygulanabiliyor.

Türkçe literatürde MARS regresyon analizinde ıskalanmış bir teknik. Çünkü özel yazılımlar gerektiriyor. SPSS’te de olmadığı ve gelişmiş bir teknik olduğu için maalesef fazla da rağbet görmemiş. Ancak yabancı literatürde oldukça fazla kullanıldığını görmekteyiz.

MARS’ı pratikte uygulayabilmek için R-Project yazılımını veya Salford Üniversitesinin geliştirdiği SPM yazılımını kullanabiliriz. Ancak ücretsiz bir şekilde uygulamak istersek R programını tercih edebiliriz.

Bilimsel araştırmalarında hem modern veri madenciliği ve regresyon analizi tekniklerini uygulamak, hem de meslektaşlarından bir adım öne geçmek isteyen tüm araştırmacıları bu eşsiz yöntemi kullanmaya davet ediyoruz.