Geri Dön

Optimal parametre ve özellik seçimi ile destek vektör makinesi kullanılarak finansal başarısızlık tahmini

Financial distress prediction using support vector machine with optimal parameter and feature selection

  1. Tez No: 623690
  2. Yazar: SEYYİDE DOĞAN
  3. Danışmanlar: PROF. DR. ŞENOL ALTAN
  4. Tez Türü: Doktora
  5. Konular: Ekonometri, Econometrics
  6. Anahtar Kelimeler: Finansal Başarısızlık, Destek Vektör Makinesi, Özellik Seçim, Parametre Optimizasyonu, Financial Distress, Support Vector Machine, Feature Selection, Optimal Parameter
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Ekonometri Bilim Dalı
  13. Sayfa Sayısı: 172

Özet

Firmaların finansal başarısızlığa uğraması gerek firmayı ve firma paydaşlarını gerekse genel ekonominin işleyişini etkisi altına alan son derece maliyetli ve yıkıcı bir olaydır. Finansal başarısızlığın doğru bir şekilde tahmin edilmesi yatırımcılar, ortaklar, çalışanlar, kredi sağlayan kuruluşlar ve devlet gibi paydaşların zamanında gerekli önlemleri alabilmesi açısından kritik öneme sahiptir. Finans, ekonomi ve muhasebe alanının oldukça önemli bir konusu olan bu probleme ilk olarak istatistiksel tahmin yöntemleri ile çözüm getirilmiş ve başarılı erken uyarı modelleri geliştirilmiştir. Bir takım katı varsayımlara sahip olan istatistiksel yöntemlerin yerini son yıllarda teknolojik gelişmelerin de hız kazanmasıyla makine öğrenmesi yöntemleri almıştır. Bu çalışmanın amacı, finansal başarısızlık tahmini için Destek Vektör Makinaları (Support Vector Machine -SVM) ile kullanışlı ve güçlü bir tahmin modeli geliştirebilmek ve yöntemin tahmin başarısını artırabilmektir. SVM'nin tahmin başarısını artırmanın bir yolu SVM parametrelerinin optimize edilmesidir. Bu aşama için kolay ve etkili bir yöntem olan Grid- arama tekniği tercih edilmiştir. Bir diğer yol ise tahminciye daha faydalı bilgi sunan optimal özellik setinin (girdi değişkenlerin) belirlenmesidir. Özellik seçim aşaması için filtre yöntemler olarak bilinen bağımsız örneklem t-testi, Temel Bileşenler Analizi (TBA) ve Lojistik Regresyon Analizi (LRA) gibi üç farklı istatistiksel yöntem tercih edilmiş ve bunların tahmin başarısına katkıları araştırılmıştır. Payları Borsa İstanbulda işlem gören 172 İmalat firması ile gerçekleştirilen gerçek zamanlı uygulamanın deneysel sonuçlarına göre; parametre optimizasyonu karşımıza bir gereklilik olarak çıkmış ve özellik seçim aşaması SVM'nin doğruluk oranını (accuracy) yaklaşık %4 oranında artırmıştır. Aynı araştırma tasarımı sonuçların geçerliliğini daha nesnel olarak gözlemlemek için iyi bilinen test veri setleri üzerinde de gerçekleştirilmiştir. Özellik seçim metotları arasında en az katkıyı sağlayan hatta bazı veri setlerinde tahmincinin bilgi kaybetmesine neden olan yöntem TBA olmuştur. Diğer taraftan, t- testi ve LRA tüm veri setlerinde benzer performans göstermiştir.

Özet (Çeviri)

The financial distress of firms is an extremely costly and destructive event that affects both the firm and its stakeholders and the operation of the general economy. To predict financial distress accurately is critical to stakeholders such as investors, employees, lenders and the government to take the necessary measures in a timely manner. This financial decision-making problem, which is a very important subject in the field of finance, economics, and accounting, was first addressed by statistical prediction methods and successful early warning models were developed. Machine learning methods have been replaced by statistical methods, which have some strict assumptions, with the acceleration of technological developments in recent years. The aim of this study is to develop a useful and robust prediction model with the Support Vector Machines (SVM) for financial distress prediction and to increase the prediction success of the method. One way to increase SVM's prediction accuracy is to optimize SVM parameters. The grid-search technique, which is an easy and effective method, was preferred for this stage. Another way is to determine the optimal feature set (input variables) that provides more useful information to the predicator. Three different statistical methods such as independent sample t-test, Principal Component Analysis (PCA) and Logistic Regression Analysis (LRA), which are known as filter methods for the feature selection stage, were preferred and their contribution to the predictive success was investigated. According to the experimental results of the real-time application performed on 172 manufacturing firms whose shares are traded on the Istanbul Stock Exchange; parameter optimization appeared as a requirement and the feature selection phase increased the accuracy rate of SVM by approximately 4%. The same research design was carried out on well-known test datasets to objectively observe the validity of the results. The method that counts the least contribution among feature selection methods and even causes the predictor to lose information in some data sets was PCA. On the other hand, the t-test and LRA performed similarly across all data sets.

Benzer Tezler

  1. Antenna design for breast cancer detection and machine learning approach for birth weight prediction

    Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı

    HALUK KIRKGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ONUR KURT

  2. Deep feature transfer from deep learning models into machine learning algorithms to classify COVID-19 from chest X-ray images

    Göğüs röntgeni görüntülerinden COVID-19 sınıflandırması yapmak amacıyla derin öğrenme modellerinden makine öğrenmesi algoritmalarına derin öznitelik aktarımı

    OZAN GÜLDALİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÜL İNAN

  3. Destek vektör regresyonu ile PID kontrolör tasarımı

    Design of PID controller via support vector regression

    KEMAL UÇAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜLAY ÖKE

  4. Ortofoto haritalardan ağaç türlerinin otomatik olarak bölütlenmesi

    Tree species classification from high resolution digital orthophoto maps

    AKHTAR JAMIL

    Doktora

    Türkçe

    Türkçe

    2018

    Jeodezi ve FotogrametriYıldız Teknik Üniversitesi

    Harita Mühendisliği Ana Bilim Dalı

    PROF. DR. BÜLENT BAYRAM

  5. Hızlı moda sektöründe makine öğrenmesi yöntemleri ile satış miktarlarının tahmin edilmesi

    Forecasting of sales quantities by machine learning methods in fast fashion sector

    SİNEM ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEDA UĞURLU