Geri Dön

Ağaç temelli makine öğrenmesi yöntemleri ile kredi risk analizi

Credit risk analysis using tree based machine learning methods

  1. Tez No: 835591
  2. Yazar: SAFA BOZKURT COŞKUN
  3. Danışmanlar: PROF. DR. MÜNEVVER TURANLI
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: İstanbul Ticaret Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 82

Özet

Günlük yaşam içerisinde çeşitli fırsatlarla kredi kullanımı hayatımızın bir rutini haline gelmiştir. Buna karşılık bankacılık ve finans kuruluşları da kendilerine gelen kredi taleplerinin herhangi bir risk içerip içermediğini tespit etme ihtiyacı duymaktadır. Bu doğrultuda bu kurumlar, kredi başvurusunda bulunan kişinin geçmiş kredi kayıtlarından yararlanarak kredi derecelendirme modellerinin doğru çalışıp çalışmadığını tespit etme konusundaki faaliyetlerini artırmışlardır. Makine öğrenmesi tabanlı teknolojiler bu alanda yeni bir çığır açmıştır. Kredi puanlaması için yapay zeka ve makine öğrenmesi tabanlı yöntemler şu anda bankacılık veya bankacılık dışı finans kurumları tarafından yaygın olarak uygulanmaktadır. Kullanılan modeller, çok çeşitli bilgilerin mevcut olduğu müşteriye ait verilerden anlamlı özellikler çıkarmaktadır. Bu çalışmada rastgele orman, catboost, xgboost ve lightgbm yöntemleri kullanılarak kredi temerrüt riski değerlendirmesi yapılmaktadır. Bu amaçla Kaggle home credit default risk veri seti kullanılmış ve kredilendirme eğiliminin sonuçlar üzerindeki etkisi de göz önünde bulundurulmuştur. Sonuçlar, gradyan artırma yöntemlerinin birbirine yakın sonuçlar verdiğini, temel modellerde catboost ve random forest yöntemlerinin oldukça düşük AUC değerlerine sahip olduğunu, xgboost ve lightgbm'nin birbirine oldukça yakın ve diğer modellerden yaklaşık yüzde elli daha iyi AUC değerlerine sahip olduklarını göstermiştir. Kredilendirme eğilimi random forest ve catboost'ta AUC değerini artırırken, yeni değerler yine de xgboost ve lightgbm'nin AUC değerinden düşük olarak gerçekleşmiştir. Kredilendirme eğilimi xgboost ve lightgbm'nin AUC değerinde görece küçük bir düşüşe neden olmakta ise de xgboost ve lightgbm hala öne çıkmakta ve lightgbm'nin en iyi AUC değerine sahip olduğu görülmektedir.

Özet (Çeviri)

The use of credit with various opportunities in daily life has become a routine of our lives. On the other hand, banking and financial institutions also need to determine whether the loan requests they receive contain any risk. Accordingly, these institutions have increased their activities to determine whether the credit rating models are working correctly by using the past credit records of the loan applicant. Machine learning-based technologies have broken new ground in this field. Artificial intelligence and machine learning-based methods for credit scoring are now widely applied by banking and non-banking financial institutions. The models used extract meaningful features from customer data where a wide variety of information is available. In this study, credit default risk assessment is performed using random forest, catboost, xgboost and lightgbm methods. For this purpose, the Kaggle home credit default risk dataset is used and the effect of the crediting trend on the results is also taken into account. The results show that the gradient boosting methods give similar results, catboost and random forest methods have very low AUC values in the base models, while xgboost and lightgbm are very close to each other and have about fifty percent better AUC values than the other models. While the crediting tendency increases the AUC of random forest and catboost, the new values are still lower than the AUC of xgboost and lightgbm. The crediting tendency causes a relatively small decrease in the AUC of xgboost and lightgbm, but xgboost and lightgbm still stand out, with lightgbm having the best AUC.

Benzer Tezler

  1. Ağaç temelli makine öğrenmesi yöntemleri ile e-ticaret sitesi müşteri harcamalarını tahmin edecek modelin belirlenmesi

    Determining the model to estimate e-commerce site customers' spending with tree-based machine learning

    MEHMET YALÇIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İstatistikİstanbul Ticaret Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. SEDA BAĞDATLI KALKAN

  2. Ağaç temelli makine öğrenmesi yöntemleri ile telekomünikasyon sektöründe müşteri kayıp analizi

    Customer churn analysis in the telecommunications sector using tree-based machine learning methods

    BAŞAK CEREN SEÇİK GÖÇER

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    MatematikYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM EMİROĞLU

  3. Ağaç temelli makine öğrenmesi yöntemlerinin karşılaştırılması ve hastalık tanısı için uygulanması

    Comparison of tree-based machine learning methods and its application to diagnosis

    YUNUS EMRE CEYLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İstatistikMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. ERALP DOĞU

  4. Konvolüsyonel sinir ağlarında ağ eğitiminin iyileştirilmesi

    Improving the network training in convolutional neural networks

    KÜBRA UYAR

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞAKİR TAŞDEMİR

  5. Stratejik yönetim perspektifinden sigortacılık sektöründe makine öğrenmesi algoritmaları ile anomali tespiti

    An application of machine learning to anomaly detection in insurance industry using strategic management approach

    AYŞE NURBANU ŞAHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. TOLGA KAYA