Geri Dön

Sınıf dengeleme yöntemlerinin makine öğrenmesi teknikleri üzerine etkisi: Kredi risk örneği

The effect of class balancing methods on machine learning techniques: Example of credit risk

  1. Tez No: 747979
  2. Yazar: MİGRAÇ ENES FURKAN MİLLİ
  3. Danışmanlar: PROF. DR. İPEK DEVECİ KOCAKOÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bankacılık, Ekonometri, Banking, Econometrics
  6. Anahtar Kelimeler: Kredi Riski, Makine Öğrenmesi, Topluluk Öğrenmesi, Sınıflandırma Algoritmaları, Yeniden Örnekleme, Sınıf Dengeleme, Credit Risk, Machine Learning, Ensemble Learning, Classification Algorithms, Resampling, Class Balancing
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Ekonometri Bilim Dalı
  13. Sayfa Sayısı: 168

Özet

Kredi riski, bankalar tarafından geri ödenmek üzere müşterilere verilen fonların belirlenen vade sonunda yükümlülüklerin yerine getirilmemesi sonucunda oluşmaktadır. Bu durum, kredi müşterisinin temerrüde düşmesine ve itibarını olumsuz etkilemesine sebep olmaktadır. Gelişen teknoloji ile birlikte farklı alanlarda kullanılan makine öğrenmesi yöntemleri, bankaların kredilendirme sürecine uyarlanan sistem ile riskli müşterilerin tespit edilmesini kolaylaştırmıştır. Böylece, kredi talebinde bulunan müşterilerin risk durumu, hızlı ve daha doğru bir şekilde belirlenebilmesi söz konusu olmuştur. Söz konusu riskli müşterilerin belirlenmesi hem kredi riskini azaltması hem de bankaların finansal faaliyetlerine devam etmesi açısından önem arz etmektedir. Bu çalışmada, bankaların kredibilite açısından en uygun değerlendirmeyi yapabilmeleri için dengeli olmayan veri kümelerinde karşılaşılan sınıf dengesizliği sorununa çözüm bulmak için farklı yeniden örnekleme yöntemleri ile veri kümeleri dengeli hâle getirilerek makine öğrenmesi üzerindeki etkilerinin araştırılması amaçlanmıştır. Çalışmanın uygulama aşamasında, açık kaynaklı site üzerinden alınan Alman, Avustralya ve HMEQ gerçek hayat problemlerine ait kredi veri setleri kullanılmıştır. Çalışmada, riskli müşterilerin saptanması için K-En Yakın komşu, Naive Bayes, Lojistik Regresyon, Destek Vektör Makineleri, Çok Katmanlı Algılayıcı, Karar Ağaçları, Rassal Ormanlar, Gradyan Artırma Karar Ağaçları, Extra Ağaçlar, Sert ve Yumuşak Oylama gibi farklı makine öğrenmesi sınıflandırma teknikleri kullanılmıştır. Sınıf dengesizliği problemi; RUS, ROS, SMOTE-ENN, SMOTE-Tomek Links ve Balanced Bagging Classifier gibi yeniden örnekleme ve hibrit yöntemleri ile dengeli hâle getirilmiştir. Bu doğrultuda, üç farklı kredi veri kümesi üzerinde dört farklı senaryo ile inceleme yapılmıştır. Sonuç olarak, sınıf dengeleme problemi için aşağı ve yukarı örnekleme yöntemlerinin bir arada kullanıldığı hibrit yöntemin makine öğrenme tekniklerinin en iyi sınıflandırma performansına ulaşmasında yardımcı olabileceği gözlemlenmiştir. Bu yöntem, bankaların riskli müşterileri saptanmasında büyük avantaj sağlayarak kredi riskini azaltmasına yardımcı olabilecektir.

Özet (Çeviri)

Credit risk arises as a result of defaulting on liabilities at the end of the specified maturity of funds ceded to customers to be reimbursed by banks. This situation causes the credit customer to default and negatively affects their reputation. With technological development, machine-learning methods used in different areas facilitated the identification of risky customers with the system adapted to the lending process of banks. Thus, the risk situation of customers applying for loans can be determined quickly and more accurately. The Identification of these risky customers is important in terms of both reducing the credit risk and maintaining the financial activities of the banks. In this study, it is aimed to investigate the effects on machine learning by balancing the datasets with different resampling methods in order to find a solution to the class imbalance problem encountered in unbalanced datasets so that banks can make the most appropriate assessment in terms of credibility. In the implementation phase of the study, German, Australian and HMEQ real-life problem credit datasets obtained from an open source website were used. In the study, different machine learning classification methods such as K-Nearest Neighbor, Naive Bayes, Logistic Regression, Support Vector Machines, Multilayer Perceptron, Decision Trees, Random Forests, Gradient Boosting Decision Trees, Extra Trees, Voting Hard and Soft were used to detect risky customers. The class imbalance problem has been balanced with resampling and hybrid methods such as RUS, ROS, SMOTE-ENN, SMOTE-Tomek and balanced bagging Classifier. In this direction, four different scenarios were examined in three different sets of credit data. As a result, it was observed that the hybrid method, in which over-and-under sampling methods are used together for the class balancing problem, can help machine learning techniques to achieve the best classification performance. This method will provide a great advantage in identifying risky customers and will help banks to reduce their credit risk.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Dengesiz veri setlerinde aşırı örnekleme teknikleri ile makine öğrenmesi yaklaşımlarının karşılaştırılması

    Comparison of machine learning approaches by using oversampling techniques on imbalanced datasets

    ÜMİT DİLBAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik Üniversitesi

    Akıllı Mühendislik Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA ÖZGÜR CİNGİZ

  3. Using machine learning techniques to enhance teaching and performance prediction of students with autism spectrum disorders

    Yapay öğrenme yöntemleri ile otizm spektrum bozukluğu olan öğrencilerin öğretiminin ve öğretim performansı tahmininin iyileştirilmesi

    AKRAM M.M. RADWAN

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA ÇATALTEPE

  4. Fraud detection on the time series data with machinelearning and deep learning techniques

    Makine öğrenimi ve derin öğrenme teknikleri ile zaman serisi verileri üzerinde sahtekarlık tespiti

    EMAN MOHAMEDRAMZI ABDULKARIM ABDULKARIM

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ULUTAŞ

  5. Essays on electricity price modeling and forecasting

    Elektrik fiyatlarının modellenmesi ve tahmini üzerine makaleler

    UMUT UĞURLU

    Doktora

    İngilizce

    İngilizce

    2019

    İşletmeİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. OKTAY TAŞ