Comparison of machine learning algorithms for financial evaluations
Finansal değerlendirmeler için makine öğrenmesi algoritmalarının karşılaştırılması
- Tez No: 604319
- Danışmanlar: ASSOC. DR. MEHMET GÖKTÜRK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Gebze Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 61
Özet
Bu tez çalışmasında makine öğrenmesi teknikleri ile kurumsal franchise şube açılışı için yapılan kurumsal başvurulara yönelik kredi skorlama çalışması yapılmıştır. Özellikle risklerin fazla olduğu alanlarda finansal değerlendirme, kredi notları, iş başvuruları ya da imtiyaz onaylanması gibi başvuranların iki gruba a) iyi b) kötü olarak ayrılmasıdır. Finansal ve diğer ticari sektörler arttıkça, Başvuru sahiplerini değerlendirme yöntemlerinin önemi gün geçtikçe artmaktadır. Ortaya çıkan problem çoğunlukla bir sınıflandırma problemidir ve modellerin performansı verilerin nasıl organize edildiğine bağlıdır. Bu çalışmada ilk önce özel bir firmadan anonim olarak temin edien 20880 örnek ve 72 özellik içeren bir“Franchise Mağaza”açılış başvuru onay veri kümesi kullanılmıştır. Ancak, sonuçların karşılaştırılması amacıyla açık, 1000 örnek, 24 özellik sahip olan Alman kredi veri kümesi adı verilen ikinci bir veri kümesi daha karşılaştırmalar için de aynı algoritmaların üzerinde test edilmiştir. Kredi kabul veri kümelerinde görülen dengesiz pozitif/negatif yapı bizi veri kümelerinin dengesiz ve dengeli formları olarak iki tür veri kümesi ile algoritmaları test etmeye yönlendirmiştir. Bu tez, başarılı ve doğru bir finansal değerlendirme için kredi puanlama ve franchise onay işlemlerine odaklanmaktadır. Normal şartlarda bu operasyonlarda, birkaç özellik seçilmekte ve sınıflandırmada kullanılmaktadır. Tez kapsamında bunun için PCA ve SVD gibi iki boyutlu azaltma teknikleri incelenmiştir. Ardından, altı adet güncel NB, LR, DT, RF, MLP, SVM artı taban seviyesi olarak dummy bir sınıflayıcı olarak bilinen yenilikçi öğrenme algoritmaları, bir ağ araştırması kullanarak hiperparametre optimizasyonu araştırılmıştır. Ayrıca, modellerin veri kümelerin gerçekten iyi performans gösterdiğinden emin olmak için hassasiyet, hatırlama ve f-ölçüsü de göz önünde bulundurulmuştur. Elde edilen sonuçlar, algoritmaların Franchise onay veri setinin en iyi sonucu olan veri kümelerinde gösterdiğini ve PCA altındaki MLP ve SVM'nin sırasıyla % 99,8 ve% 99,7 ile en iyi performansı gösterdiği, verilerin dengeli değerlendirilebildiğini ortaya koymuştur. Her veri kümesinde de % 100 recall oranı ile sonuçlar elde edilmiştir. Alman kredi verilerinin en iyi sonucu, PCA kapsamında % 86.4 ile en iyi recall değeri % 73 ile Random Forest yönetmi en iyi sonucu vermiştir.
Özet (Çeviri)
Evaluation in any form is a crucial aspect in any business, especially in finances where risks are involved. Evaluation be it in credit scoring, job application or franchise approval is the grouping of applicants in to two classes, a) good and b) bad. As the financial and other business sectors increases, a method to evaluate applicants becomes a challenging task that needs to be addresses wisely and effectively. This is mostly a classification problem and the performance of the models is highly dependent on how the data is organized. The study first used a franchise approval dataset with 20880 instances and 72 features, but with the impressing nature of the results a second dataset called the German credit Dataset with 1000 instances and 24 features was also applied for better comparisons. The unbalanced nature of our datasets triggered us to use two forms of data namely unbalanced and balanced forms of the datasets. This thesis focuses on credit scoring and franchise approval operations for a sound financial evaluation. In these operations normally, fewer features are selected and used in classification, for this, two dimensionality reduction techniques like PCA and SVD were used. Then, six (6) state of the art machine learning algorithms namely NB, LR, DT, RF, MLP, SVM plus a dummy classifier as baseline were investigated and hyperparameter optimization using grid search, since even a bit of increase in accuracy is a huge accomplishment for any business. Furthermore, precision, recall, and f-measure were also considered, to make sure the models really performed well on our datasets. Generally, results indicated that the algorithms performed well on our datasets with the best result for the Franchise approval dataset going to the balanced form of the data where MLP and SVM under PCA performed the best with 99.8% and 99.7% respectively, with a recall rate of 100% for both. The best result for the German credit data on the other hand goes to RF under PCA with 86.4% with the best recall rate of 73%.
Benzer Tezler
- Miyelodisplastik sendromu hastalığında erken ve ayırıcı teşhis için makine öğrenmesi yöntemlerinin performans kıyaslaması ve hibrit bir model önerisi
Performance comparison of machine learning methods for early and differential diagnosis in myelodysplastic syndrome disease and a hybrid model proposal
NAZLI ÖZDEMİR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent ÜniversitesiBilgisayar Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ATINÇ YILMAZ
- Finansal teknoloji alanında kullanıcı deneyimlerinin makine öğrenmesi yöntemleri ile incelenmesi
Examining user experiences in the field of financial technology with machine learning methods
GİZEM ZENGİN
Yüksek Lisans
Türkçe
2022
İstatistikYıldız Teknik Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ERSOY ÖZ
- Internal audit decision support framework using spherical fuzzy ELECTRE
Küresel bulanık ELECTRE tabanlı iç denetim karar destek çerçevesi
AKIN MENEKŞE
Doktora
İngilizce
2022
İşletmeİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. HATİCE CAMGÖZ AKDAĞ
- Comparison of machine learning and standard credit risk models' performances in credit risk scoring of buy now pay later customers
Şimdi al sonra öde müşterilerinin kredi riski puanlamasında makine öğrenimi ve standart kredi riski modellerinin performanslarının karşılaştırılması
CANER TAŞ
Yüksek Lisans
İngilizce
2023
BankacılıkOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. ALEV ATAK
PROF. DR. SEVGİ ÖZKAN YILDIRIM
- Yapay sinir ağları ve makine öğrenmesi ile otomobil satış tahmininin yapılması ve zaman serileri analizi ile karşılaştırılması
Forecasting automobile sales using artificial neural networks and machine learning and comparison with time series analysis
BEYZA KURTGERİ
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. MERVE CENGİZ TOKLU