Optimal parametre ve özellik seçimi ile destek vektör makinesi kullanılarak finansal başarısızlık tahmini
Financial distress prediction using support vector machine with optimal parameter and feature selection
- Tez No: 623690
- Danışmanlar: PROF. DR. ŞENOL ALTAN
- Tez Türü: Doktora
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Finansal Başarısızlık, Destek Vektör Makinesi, Özellik Seçim, Parametre Optimizasyonu, Financial Distress, Support Vector Machine, Feature Selection, Optimal Parameter
- Yıl: 2020
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Ekonometri Bilim Dalı
- Sayfa Sayısı: 172
Özet
Firmaların finansal başarısızlığa uğraması gerek firmayı ve firma paydaşlarını gerekse genel ekonominin işleyişini etkisi altına alan son derece maliyetli ve yıkıcı bir olaydır. Finansal başarısızlığın doğru bir şekilde tahmin edilmesi yatırımcılar, ortaklar, çalışanlar, kredi sağlayan kuruluşlar ve devlet gibi paydaşların zamanında gerekli önlemleri alabilmesi açısından kritik öneme sahiptir. Finans, ekonomi ve muhasebe alanının oldukça önemli bir konusu olan bu probleme ilk olarak istatistiksel tahmin yöntemleri ile çözüm getirilmiş ve başarılı erken uyarı modelleri geliştirilmiştir. Bir takım katı varsayımlara sahip olan istatistiksel yöntemlerin yerini son yıllarda teknolojik gelişmelerin de hız kazanmasıyla makine öğrenmesi yöntemleri almıştır. Bu çalışmanın amacı, finansal başarısızlık tahmini için Destek Vektör Makinaları (Support Vector Machine -SVM) ile kullanışlı ve güçlü bir tahmin modeli geliştirebilmek ve yöntemin tahmin başarısını artırabilmektir. SVM'nin tahmin başarısını artırmanın bir yolu SVM parametrelerinin optimize edilmesidir. Bu aşama için kolay ve etkili bir yöntem olan Grid- arama tekniği tercih edilmiştir. Bir diğer yol ise tahminciye daha faydalı bilgi sunan optimal özellik setinin (girdi değişkenlerin) belirlenmesidir. Özellik seçim aşaması için filtre yöntemler olarak bilinen bağımsız örneklem t-testi, Temel Bileşenler Analizi (TBA) ve Lojistik Regresyon Analizi (LRA) gibi üç farklı istatistiksel yöntem tercih edilmiş ve bunların tahmin başarısına katkıları araştırılmıştır. Payları Borsa İstanbulda işlem gören 172 İmalat firması ile gerçekleştirilen gerçek zamanlı uygulamanın deneysel sonuçlarına göre; parametre optimizasyonu karşımıza bir gereklilik olarak çıkmış ve özellik seçim aşaması SVM'nin doğruluk oranını (accuracy) yaklaşık %4 oranında artırmıştır. Aynı araştırma tasarımı sonuçların geçerliliğini daha nesnel olarak gözlemlemek için iyi bilinen test veri setleri üzerinde de gerçekleştirilmiştir. Özellik seçim metotları arasında en az katkıyı sağlayan hatta bazı veri setlerinde tahmincinin bilgi kaybetmesine neden olan yöntem TBA olmuştur. Diğer taraftan, t- testi ve LRA tüm veri setlerinde benzer performans göstermiştir.
Özet (Çeviri)
The financial distress of firms is an extremely costly and destructive event that affects both the firm and its stakeholders and the operation of the general economy. To predict financial distress accurately is critical to stakeholders such as investors, employees, lenders and the government to take the necessary measures in a timely manner. This financial decision-making problem, which is a very important subject in the field of finance, economics, and accounting, was first addressed by statistical prediction methods and successful early warning models were developed. Machine learning methods have been replaced by statistical methods, which have some strict assumptions, with the acceleration of technological developments in recent years. The aim of this study is to develop a useful and robust prediction model with the Support Vector Machines (SVM) for financial distress prediction and to increase the prediction success of the method. One way to increase SVM's prediction accuracy is to optimize SVM parameters. The grid-search technique, which is an easy and effective method, was preferred for this stage. Another way is to determine the optimal feature set (input variables) that provides more useful information to the predicator. Three different statistical methods such as independent sample t-test, Principal Component Analysis (PCA) and Logistic Regression Analysis (LRA), which are known as filter methods for the feature selection stage, were preferred and their contribution to the predictive success was investigated. According to the experimental results of the real-time application performed on 172 manufacturing firms whose shares are traded on the Istanbul Stock Exchange; parameter optimization appeared as a requirement and the feature selection phase increased the accuracy rate of SVM by approximately 4%. The same research design was carried out on well-known test datasets to objectively observe the validity of the results. The method that counts the least contribution among feature selection methods and even causes the predictor to lose information in some data sets was PCA. On the other hand, the t-test and LRA performed similarly across all data sets.
Benzer Tezler
- Antenna design for breast cancer detection and machine learning approach for birth weight prediction
Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı
HALUK KIRKGÖZ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR KURT
- Deep feature transfer from deep learning models into machine learning algorithms to classify COVID-19 from chest X-ray images
Göğüs röntgeni görüntülerinden COVID-19 sınıflandırması yapmak amacıyla derin öğrenme modellerinden makine öğrenmesi algoritmalarına derin öznitelik aktarımı
OZAN GÜLDALİ
Yüksek Lisans
İngilizce
2021
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜL İNAN
- Destek vektör regresyonu ile PID kontrolör tasarımı
Design of PID controller via support vector regression
KEMAL UÇAK
Yüksek Lisans
Türkçe
2012
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜLAY ÖKE
- Ortofoto haritalardan ağaç türlerinin otomatik olarak bölütlenmesi
Tree species classification from high resolution digital orthophoto maps
AKHTAR JAMIL
Doktora
Türkçe
2018
Jeodezi ve FotogrametriYıldız Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
PROF. DR. BÜLENT BAYRAM
- Hızlı moda sektöründe makine öğrenmesi yöntemleri ile satış miktarlarının tahmin edilmesi
Forecasting of sales quantities by machine learning methods in fast fashion sector
SİNEM ÖZTÜRK
Yüksek Lisans
Türkçe
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEDA UĞURLU