Geri Dön

Ağaç tabanlı sınıflandırma tekniklerinin dengeli olmayan veri setlerinde incelenmesi: Kredi risk örneği

Examination of tree-based techniques in imbalanced data sets: The example of credit risk

  1. Tez No: 700025
  2. Yazar: ALİ ÖZTÜRK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SERKAN ARAS
  4. Tez Türü: Yüksek Lisans
  5. Konular: Ekonometri, Econometrics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Ekonometri Bilim Dalı
  13. Sayfa Sayısı: 238

Özet

Kredi riski, kredi müşterisinin bankadan ödünç aldığı fonu belirlenen vadede ödeyememesi sonucunda, bankanın varlığını tehlikeye sokabilecek bir risk türüdür. Bu nedenle kredi riskine sebep olabilecek müşterilerin doğru tespiti, bankanın faaliyetlerinin devamlılığı açısından büyük önem taşır. Bu noktada müşterilerini kredilendirmek için harekete geçen bankalar, olası kredi riskini bertaraf etmek için kredilendirme süreçlerini büyük bir titizlikle yürütmesi gerekir. Aksi takdirde, süreçte oluşacak bir zafiyet veya ihmal, kredi riskinin doğmasına ve bankanın finansal faaliyetlerinin aksamasına veyahut durmasına sebep olabilir. Özellikle teknolojinin gelişmesiyle beraber kullanımı yaygınlaşan makine öğrenmesi teknikleri, bankacılık sektöründeki kredilendirme faaliyetlerine entegre edilmiş ve kredi talebinde bulunan müşterilerin risk taşıyıp taşımadığına otomatik olarak karar veren mekanizmaların geliştirilmesine yardımcı olmuştur. Bu kapsamda müşterinin krediyi ödeyip ödeyememesinin doğru tespiti, bankanın finansal ve fiziki varlığını açısından önemli olmasına istinaden, oluşturulan karar mekanizmalarını daha güvenilir ve daha etkin hale getirmek için zamanla farklı istatistiksel ve makine öğrenmesi tekniklerinin arayışına girilmiştir. Bu çalışmada, bankaların kredilendirme faaliyetlerini otomatik olarak gerçekleştirebileceği ve aynı zamanda kredi riskini azaltarak karlılığını arttıracağı bir karar mekanizmasının oluşturulması hedeflenmiştir. Çalışma açık kaynaklı Alman, Avustralya ve HMEQ (Home Equity) kredi veri setleri üzerinde gerçekleştirilmiştir. Hedeflenen mekanizmayı oluşturmak için on bir farklı makine öğrenmesi sınıflandırma tekniği, dokuz farklı yeniden örnekleme tekniği ve bir adet değişken seçim tekniği kullanılmıştır. Sonuç olarak çalışmada en iyi performans gösteren modeller, ağaç tabanlı modeller olarak tespit edilmiştir. Bu doğrultuda, kredi riski sorununa karşılık olarak geliştirilecek mekanizmaları yukarı yeniden örnekleme tekniği ve ağaç tabanlı model kombinasyonlarıyla hazırlamak ve aynı zamanda bu mekanizmayı değişken seçim tekniği uygulanmayan veri setleriyle çalıştırmak, bankaların kredilendirme süreçlerinde daha doğru kararlar almasına olanak sağlayacağı bulgusuna ulaşılmıştır.

Özet (Çeviri)

Credit risk is a type of risk that may endanger the existence of the bank as a result of the loan customer's failure to pay the funds borrowed from the bank in the specified time. For this reason, the correct identification of customers that may cause credit risk is of great importance for the continuity of the bank's activities. At this point, banks that take action to lend their customers must carry out their lending processes with great care in order to eliminate the possible credit risk. Otherwise, a weakness or negligence that will occur in the process may cause the credit risk to arise and the financial activities of the bank to be interrupted or stopped. Machine learning techniques, which have become widespread especially with the development of technology, have been integrated into lending activities in the banking sector and have helped to develop mechanisms that automatically decide whether customers who request credit carry a risk or not. In this context, different statistical and machine learning techniques have been sought over time to make the decision mechanisms created more reliable and more effective, based on the fact that the correct determination of the customer's ability to pay the loan is important for the financial and physical existence of the bank. In this study, it is aimed to create a decision mechanism in which banks can perform their lending activities automatically and at the same time increase their profitability by reducing the credit risk. The study was conducted on open source German, Australian and HMEQ (Home Equity) loan datasets. Eleven different machine learning classification techniques, nine different resampling vii techniques and one feature selection technique were used to create the targeted mechanism. As a result, the best performing models in the study were determined as tree-based models. In this direction, it has been found that preparing the mechanisms to be developed in response to the credit risk problem with combinations of over-sampling technique and tree-based model and at the same time operating this mechanism with datasets that do not apply the feature selection technique will enable banks to make more accurate decisions in their lending processes.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Yüksek çözünürlüklü uydu görüntüleri kullanarak benzer spektral özelliklere sahip doğal nesnelerin ayırt edilmesine yönelik bir metodoloji geliştirme

    Developing a methodology for discriminating natural objects having spectrally similar features using very high resolution satellite imagery

    İSMAİL ÇÖLKESEN

    Doktora

    Türkçe

    Türkçe

    2015

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. TAHSİN YOMRALIOĞLU

  3. Makine öğrenmesi yöntemleri ile bıtcoın trend dönüşlerinin tahmin edilmesi

    Predicting bitcoin trends reversals with machine learning methods

    SERGÜL ÜRGENÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. BARIŞ AŞIKGİL

  4. Siber güvenlikte makine öğrenimi tabanlı zararlı yazılımların algılanması ve analizi

    Detection and analysis of malicious software in cybersecurity using machine learning

    AHMET ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SELMAN HIZAL

  5. Kolektif makine öğrenmesi tabanlı ağ saldırı tespiti

    Collective machine learning based network intrusion detection

    ŞURA EMANET

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖNDER DEMİR

    DR. ÖĞR. ÜYESİ GÖZDE KARATAŞ BAYDOĞMUŞ