Optimal parametre ve özellik seçimi ile destek vektör makinesi kullanılarak finansal başarısızlık tahmini

Financial distress prediction using support vector machine with optimal parameter and feature selection

PDF İndir

Tez No: 623690
Yazar: SEYYİDE DOĞAN
Danışmanlar: PROF. DR. ŞENOL ALTAN
Tez Türü: Doktora
Konular: Ekonometri, Econometrics
Anahtar Kelimeler: Finansal Başarısızlık, Destek Vektör Makinesi, Özellik Seçim, Parametre Optimizasyonu, Financial Distress, Support Vector Machine, Feature Selection, Optimal Parameter
Yıl: 2020
Dil: Türkçe
Üniversite: Gazi Üniversitesi
Enstitü: Sosyal Bilimler Enstitüsü
Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
Bilim Dalı: Ekonometri Bilim Dalı
Sayfa Sayısı: 172

Özet

Firmaların finansal başarısızlığa uğraması gerek firmayı ve firma paydaşlarını gerekse genel ekonominin işleyişini etkisi altına alan son derece maliyetli ve yıkıcı bir olaydır. Finansal başarısızlığın doğru bir şekilde tahmin edilmesi yatırımcılar, ortaklar, çalışanlar, kredi sağlayan kuruluşlar ve devlet gibi paydaşların zamanında gerekli önlemleri alabilmesi açısından kritik öneme sahiptir. Finans, ekonomi ve muhasebe alanının oldukça önemli bir konusu olan bu probleme ilk olarak istatistiksel tahmin yöntemleri ile çözüm getirilmiş ve başarılı erken uyarı modelleri geliştirilmiştir. Bir takım katı varsayımlara sahip olan istatistiksel yöntemlerin yerini son yıllarda teknolojik gelişmelerin de hız kazanmasıyla makine öğrenmesi yöntemleri almıştır. Bu çalışmanın amacı, finansal başarısızlık tahmini için Destek Vektör Makinaları (Support Vector Machine -SVM) ile kullanışlı ve güçlü bir tahmin modeli geliştirebilmek ve yöntemin tahmin başarısını artırabilmektir. SVM'nin tahmin başarısını artırmanın bir yolu SVM parametrelerinin optimize edilmesidir. Bu aşama için kolay ve etkili bir yöntem olan Grid- arama tekniği tercih edilmiştir. Bir diğer yol ise tahminciye daha faydalı bilgi sunan optimal özellik setinin (girdi değişkenlerin) belirlenmesidir. Özellik seçim aşaması için filtre yöntemler olarak bilinen bağımsız örneklem t-testi, Temel Bileşenler Analizi (TBA) ve Lojistik Regresyon Analizi (LRA) gibi üç farklı istatistiksel yöntem tercih edilmiş ve bunların tahmin başarısına katkıları araştırılmıştır. Payları Borsa İstanbulda işlem gören 172 İmalat firması ile gerçekleştirilen gerçek zamanlı uygulamanın deneysel sonuçlarına göre; parametre optimizasyonu karşımıza bir gereklilik olarak çıkmış ve özellik seçim aşaması SVM'nin doğruluk oranını (accuracy) yaklaşık %4 oranında artırmıştır. Aynı araştırma tasarımı sonuçların geçerliliğini daha nesnel olarak gözlemlemek için iyi bilinen test veri setleri üzerinde de gerçekleştirilmiştir. Özellik seçim metotları arasında en az katkıyı sağlayan hatta bazı veri setlerinde tahmincinin bilgi kaybetmesine neden olan yöntem TBA olmuştur. Diğer taraftan, t- testi ve LRA tüm veri setlerinde benzer performans göstermiştir.

Özet (Çeviri)

The financial distress of firms is an extremely costly and destructive event that affects both the firm and its stakeholders and the operation of the general economy. To predict financial distress accurately is critical to stakeholders such as investors, employees, lenders and the government to take the necessary measures in a timely manner. This financial decision-making problem, which is a very important subject in the field of finance, economics, and accounting, was first addressed by statistical prediction methods and successful early warning models were developed. Machine learning methods have been replaced by statistical methods, which have some strict assumptions, with the acceleration of technological developments in recent years. The aim of this study is to develop a useful and robust prediction model with the Support Vector Machines (SVM) for financial distress prediction and to increase the prediction success of the method. One way to increase SVM's prediction accuracy is to optimize SVM parameters. The grid-search technique, which is an easy and effective method, was preferred for this stage. Another way is to determine the optimal feature set (input variables) that provides more useful information to the predicator. Three different statistical methods such as independent sample t-test, Principal Component Analysis (PCA) and Logistic Regression Analysis (LRA), which are known as filter methods for the feature selection stage, were preferred and their contribution to the predictive success was investigated. According to the experimental results of the real-time application performed on 172 manufacturing firms whose shares are traded on the Istanbul Stock Exchange; parameter optimization appeared as a requirement and the feature selection phase increased the accuracy rate of SVM by approximately 4%. The same research design was carried out on well-known test datasets to objectively observe the validity of the results. The method that counts the least contribution among feature selection methods and even causes the predictor to lose information in some data sets was PCA. On the other hand, the t-test and LRA performed similarly across all data sets.

Benzer Tezler

Tez No
846535
Antenna design for breast cancer detection and machine learning approach for birth weight prediction
Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı
HALUK KIRKGÖZ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR KURT
Tez No
688973
Deep feature transfer from deep learning models into machine learning algorithms to classify COVID-19 from chest X-ray images
Göğüs röntgeni görüntülerinden COVID-19 sınıflandırması yapmak amacıyla derin öğrenme modellerinden makine öğrenmesi algoritmalarına derin öznitelik aktarımı
OZAN GÜLDALİ
Yüksek Lisans
İngilizce
2021
Matematik İstanbul Teknik Üniversitesi
Matematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜL İNAN
Tez No
310564
Destek vektör regresyonu ile PID kontrolör tasarımı
Design of PID controller via support vector regression
KEMAL UÇAK
Yüksek Lisans
Türkçe
2012
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜLAY ÖKE
Tez No
926545
Koroner arter bypass operasyonlarında risk değerlendirmesi için makine öğrenimi tabanlı hibrit bir sistemin geliştirilmesi
Development of a machine learning based hybrid system for risk assessment in coronary artery bypass operations
AYŞE BANU BİRLİK
Doktora
Türkçe
2025
Endüstri ve Endüstri Mühendisliği İstanbul Medipol Üniversitesi
Sağlık Sistemleri Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN TOZAN
DR. ÖĞR. ÜYESİ KEVSER BANU KÖSE
Tez No
959203
Makine öğrenmesi kullanarak Türkiye'de elektrikli araç şarj istasyonlarının potansiyel kullanım performansının mekânsal tahmini
Spatial estimation of potential utilization performance of electric vehicle charging stations in Türkiye using machine learning methods
SERKAN TANRIVERDİ
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametri İstanbul Teknik Üniversitesi
Geomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ADALET DERVİŞOĞLU

Geri Dön