Ağaç tabanlı sınıflandırma tekniklerinin dengeli olmayan veri setlerinde incelenmesi: Kredi risk örneği
Examination of tree-based techniques in imbalanced data sets: The example of credit risk
- Tez No: 700025
- Danışmanlar: DR. ÖĞR. ÜYESİ SERKAN ARAS
- Tez Türü: Yüksek Lisans
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Ekonometri Bilim Dalı
- Sayfa Sayısı: 238
Özet
Kredi riski, kredi müşterisinin bankadan ödünç aldığı fonu belirlenen vadede ödeyememesi sonucunda, bankanın varlığını tehlikeye sokabilecek bir risk türüdür. Bu nedenle kredi riskine sebep olabilecek müşterilerin doğru tespiti, bankanın faaliyetlerinin devamlılığı açısından büyük önem taşır. Bu noktada müşterilerini kredilendirmek için harekete geçen bankalar, olası kredi riskini bertaraf etmek için kredilendirme süreçlerini büyük bir titizlikle yürütmesi gerekir. Aksi takdirde, süreçte oluşacak bir zafiyet veya ihmal, kredi riskinin doğmasına ve bankanın finansal faaliyetlerinin aksamasına veyahut durmasına sebep olabilir. Özellikle teknolojinin gelişmesiyle beraber kullanımı yaygınlaşan makine öğrenmesi teknikleri, bankacılık sektöründeki kredilendirme faaliyetlerine entegre edilmiş ve kredi talebinde bulunan müşterilerin risk taşıyıp taşımadığına otomatik olarak karar veren mekanizmaların geliştirilmesine yardımcı olmuştur. Bu kapsamda müşterinin krediyi ödeyip ödeyememesinin doğru tespiti, bankanın finansal ve fiziki varlığını açısından önemli olmasına istinaden, oluşturulan karar mekanizmalarını daha güvenilir ve daha etkin hale getirmek için zamanla farklı istatistiksel ve makine öğrenmesi tekniklerinin arayışına girilmiştir. Bu çalışmada, bankaların kredilendirme faaliyetlerini otomatik olarak gerçekleştirebileceği ve aynı zamanda kredi riskini azaltarak karlılığını arttıracağı bir karar mekanizmasının oluşturulması hedeflenmiştir. Çalışma açık kaynaklı Alman, Avustralya ve HMEQ (Home Equity) kredi veri setleri üzerinde gerçekleştirilmiştir. Hedeflenen mekanizmayı oluşturmak için on bir farklı makine öğrenmesi sınıflandırma tekniği, dokuz farklı yeniden örnekleme tekniği ve bir adet değişken seçim tekniği kullanılmıştır. Sonuç olarak çalışmada en iyi performans gösteren modeller, ağaç tabanlı modeller olarak tespit edilmiştir. Bu doğrultuda, kredi riski sorununa karşılık olarak geliştirilecek mekanizmaları yukarı yeniden örnekleme tekniği ve ağaç tabanlı model kombinasyonlarıyla hazırlamak ve aynı zamanda bu mekanizmayı değişken seçim tekniği uygulanmayan veri setleriyle çalıştırmak, bankaların kredilendirme süreçlerinde daha doğru kararlar almasına olanak sağlayacağı bulgusuna ulaşılmıştır.
Özet (Çeviri)
Credit risk is a type of risk that may endanger the existence of the bank as a result of the loan customer's failure to pay the funds borrowed from the bank in the specified time. For this reason, the correct identification of customers that may cause credit risk is of great importance for the continuity of the bank's activities. At this point, banks that take action to lend their customers must carry out their lending processes with great care in order to eliminate the possible credit risk. Otherwise, a weakness or negligence that will occur in the process may cause the credit risk to arise and the financial activities of the bank to be interrupted or stopped. Machine learning techniques, which have become widespread especially with the development of technology, have been integrated into lending activities in the banking sector and have helped to develop mechanisms that automatically decide whether customers who request credit carry a risk or not. In this context, different statistical and machine learning techniques have been sought over time to make the decision mechanisms created more reliable and more effective, based on the fact that the correct determination of the customer's ability to pay the loan is important for the financial and physical existence of the bank. In this study, it is aimed to create a decision mechanism in which banks can perform their lending activities automatically and at the same time increase their profitability by reducing the credit risk. The study was conducted on open source German, Australian and HMEQ (Home Equity) loan datasets. Eleven different machine learning classification techniques, nine different resampling vii techniques and one feature selection technique were used to create the targeted mechanism. As a result, the best performing models in the study were determined as tree-based models. In this direction, it has been found that preparing the mechanisms to be developed in response to the credit risk problem with combinations of over-sampling technique and tree-based model and at the same time operating this mechanism with datasets that do not apply the feature selection technique will enable banks to make more accurate decisions in their lending processes.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Yüksek çözünürlüklü uydu görüntüleri kullanarak benzer spektral özelliklere sahip doğal nesnelerin ayırt edilmesine yönelik bir metodoloji geliştirme
Developing a methodology for discriminating natural objects having spectrally similar features using very high resolution satellite imagery
İSMAİL ÇÖLKESEN
Doktora
Türkçe
2015
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. TAHSİN YOMRALIOĞLU
- Makine öğrenmesi yöntemleri ile bıtcoın trend dönüşlerinin tahmin edilmesi
Predicting bitcoin trends reversals with machine learning methods
SERGÜL ÜRGENÇ
Yüksek Lisans
Türkçe
2023
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. BARIŞ AŞIKGİL
- Siber güvenlikte makine öğrenimi tabanlı zararlı yazılımların algılanması ve analizi
Detection and analysis of malicious software in cybersecurity using machine learning
AHMET ÖZTÜRK
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SELMAN HIZAL
- Kolektif makine öğrenmesi tabanlı ağ saldırı tespiti
Collective machine learning based network intrusion detection
ŞURA EMANET
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖNDER DEMİR
DR. ÖĞR. ÜYESİ GÖZDE KARATAŞ BAYDOĞMUŞ