Makine öğrenmesi yaklaşımı ile banka müşterilerinin kredi riski tahmini ve kural çıkarımı
Bank customers' credit risk estimation and rule extraction with the machine learning approach
- Tez No: 953165
- Danışmanlar: DR. ÖĞR. ÜYESİ MERT BAL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Matematik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 121
Özet
Bu çalışma, kredi riski sınıflandırma problemini ele almaktadır. Makine öğrenmesi modelleriyle bankanın geçmiş müşteri kitlesinin risk sınıflarından yola çıkarak, aday müşteriler için kredi riski sınıflandırmasına ve beraberinde hem açıklanabilir hem de denetlenebilir kurallar çıkarmaya odaklanmaktadır. Lojistik Regresyon, K-En Yakın Komşular, Naive Bayes, Karar Ağaçları, SVM ve Rastgele Orman gibi denetimli öğrenme algoritmaları, Alman kredi veri kümesi üzerinde değerlendirilmiştir. Veri kümesindeki dengesiz sınıflar problemine çözüm sunmak için SMOTE tekniği uygulanmış, algoritmaların her biri için aynı özellik mühendisliği çalışmaları gerçekleştirilmiştir. En iyi sonuç %83 doğruluk ve F1 puanı ile Random Forest algoritmasından elde edilmiştir. Bu çalışmayla, Random Forest modellerinin karar mekanizmalarını açıklamaya yönelik yeni bir kural çıkarım algoritması olan“Children of the Tree (Ağacın Çocukları)”geliştirilmiştir. Bu algoritma, model çıktılarını anlamlı ve yorumlanabilir IF-THEN kuralları biçiminde sunarak, aday müşterilerin kredi riskini şeffaf biçimde değerlendirmeyi amaçlamaktadır. Kuralların geçerliliği, doğruluğu, genellenebilirliği, yaygınlığı;“support”,“confidence”,“lift”,“leverage”ve“conviction”gibi birliktelik kural madenciliği metrikleriyle sınanmıştır. Ayrıca algoritma içerisinde kullanılan Minimum Açıklama Uzunluğu (MDL) tekniği sayesinde, kural setlerinin basitliği sağlanmış ve modelin karmaşıklığı azaltılmıştır. Gerçekleştirilen uygulamalar sonucunda, Ağacın Çocukları algoritması, geçmiş verilerden türetilmiş açıklanabilir kurallarla riskli ve risksiz müşteri ayrımını başarılı şekilde gerçekleştirmiştir. Çalışma, kredi riski analizi alanında açıklanabilir yapay zekâ ve karar denetlenebilirliği açısından yenilikçi bir katkı sunmaktadır.
Özet (Çeviri)
This study addresses the problem of credit risk classification. It focuses on predicting credit risk for prospective bank customers by leveraging supervised machine learning models trained on historical risk profiles, while also extracting both explainable and auditable rules. Supervised learning algorithms such as Logistic Regression, K-Nearest Neighbors, Naive Bayes, Decision Trees, Support Vector Machines (SVM), and Random Forest were evaluated using the German Credit dataset. To overcome the class imbalance issue in the dataset, the SMOTE technique was applied, and the same feature engineering steps were carried out for each algorithm. The best result was obtained from the Random Forest model, achieving 83% accuracy and F1-score. As part of this work, a novel rule extraction algorithm called“Children of the Tree”was developed to explain the decision mechanisms of Random Forest models. The algorithm aims to transparently assess credit risk for new customers by expressing model outputs in the form of meaningful and interpretable IF-THEN rules. The validity, accuracy, generalizability, and prevalence of the rules were evaluated using association rule mining metrics such as support, confidence, lift, leverage, and conviction. Furthermore, the Minimum Description Length (MDL) principle was incorporated into the algorithm to ensure simplicity of rule sets and reduce model complexity. As a result of the experiments, the Children of the Tree algorithm successfully distinguished between risky and non-risky customers through explainable rules derived from historical data. This study offers a novel contribution to the field of credit risk analysis by enhancing explainability and decision auditability in machine learning models.
Benzer Tezler
- Comparative study of federated learning for credit risk assessment and fairness evaluation
Federe öğrenmenin karşılaştırmalı çalışması: Kredi risk değerlendirmesi ve adalet ölçümü
MUSTAFA AKTAŞ
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
DR. RUŞEN HALEPMOLLASI
- Overcoming payment behavior challenges: Classifying buy now pay later users with machine learning
Ödeme alışkanlığı zorluklarını aşmak: Makine öğrenimi ile şimdi al sonra öde kullanıcılarını sınıflandırma
ÖMÜR ÖZDOĞAN
Yüksek Lisans
İngilizce
2024
Bankacılıkİstanbul Teknik ÜniversitesiBüyük Veri ve Veri Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN
- Vadeli mevduat hesabı aboneliği tahmini makine öğrenmesi yaklaşımı
Machine learning approach to time deposit account subscription prediction
HİKMET SELİM TALU
Yüksek Lisans
Türkçe
2023
BankacılıkYıldız Teknik Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. FATMA NOYAN TEKELİ
- Müşteri ilişkileri açısından çapraz satış performansı ölçümü ve bir araştırma
Measurement of cross selling performance from customer relationship perspective
NEVİN CENAL
- A scheme proposal for the development of machine learning-driven agent-based models through case studies
Makine öğrenmesi destekli etmen tabanlı modellerin geliştirilmesine yönelik bir plan önerisi: Örnek modeller
YAKUP TURGUT
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CAFER ERHAN BOZDAĞ