Example-dependent cost-sensitive gradient boosting machines for credit scoring

Kredi skorlama için örnek-bağımlı maliyet-duyarlı gradyan artırma makineleri

PDF İndir

Tez No: 761205
Yazar: İLKER KURTULUŞ
Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA GÖKÇE BAYDOĞAN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, İstatistik, Computer Engineering and Computer Science and Control, Science and Technology, Statistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2022
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 56

Özet

Birçok makine öğrenmesi algoritması maliyet duyarsız kayıpları azaltmaya çalışsa da, birçok gerçek dünya uygulaması yanlış sınıflandırmanın sınıflara bağlı olarak farklı maliyetler oluşturduğu, maliyet-duyarlı yöntemlerin kullanılmasını gerektirir. Yanlış sınıflandırma maliyetlerine ek olarak, veri setleri içindeki örnekler aynı olmayan maliyetlere sahip olabilir, bu da örnek-bağımlı maliyet duyarlı öğrenme problemidir. Örneğin kredi skorlamada, yanlışlıkla reddedilen iyi bir müşteri ile onaylanan finansal durumu kötü olan bir müşterinin yaratacağı maliyetler farklıdır. Buna ek olarak, farklı miktarlarda kredilerin başvuranlara sağlanması, kredi skorlamayı örnek-bağımlı hale getirir. Diğer bir deyişle, 100M$'lık bir kredi ile 1M$'lık bir kredinin yaratacağı maliyetler eşit değildir. Bu problemi çözmek için, tezde örnek-bağımlı maliyet-duyarlı bir kayıp fonksiyonu öneriliyor. Önerilen kayıp fonksiyonu ile maliyet duyarlılık öğrenme sürecinde çözülüyor. Bu çözüme, Gradyan Artırma Makineleri'nin geleneksel kayıp fonksiyonunu, önerilen kayıp fonksiyonu ile değiştirerek ulaşıyoruz. Bu değişim ile Gradyan Artırma Makineleri'ni örnek-bağımlı maliyet-duyarlı hale getiriyoruz. Öerdiğimiz algoritmayı kredi miktarlarını içeren iki gerçek dünya veri setinde ve sentetik veri setlerinde deniyoruz. Algoritmayı, maliyet-duyarsız algoritmalarla, daha önce önerilen maliyet duyarlılığı öğrenme sürecinde halletmeye çalışan örnek-bağımlı maliyet-duyarlı sınıflandırma algoritmalarıyla, maliyet duyarsız algoritmaları maliyet-duyarlı hale getiren Thresholding isimli ön-işleme ve Oversampling isimli son-işleme yöntemleri ile karşılaştıyoruz. Sonuçlar gösteriyor ki, finansal tasarruf açısından yöntemimiz bu dört yöntemden daha iyi çalışıyor.

Özet (Çeviri)

Although most of machine learning algorithms try to minimize cost-insensitive losses, many real world applications require cost-sensitive approaches where misclassification costs among classes differ from each other. In addition to misclassification costs, examples in data sets may have nonidentical costs which is a case of example-dependent cost-sensitive learning. For example in credit scoring, mistakenly rejecting a good borrower and approving a bad client with financial distress result in different costs. Additionally, providing variety of credit amounts to applicants makes the credit scoring example-dependent. In other words, falsely approving 100M$ and 1M$ loans produce unequal costs. To overcome this problem, this thesis proposes an example-dependent cost-sensitive loss function. With the introduced loss function, cost sensitivity is handled during the learning process. This is achieved by changing the traditional loss function of Gradient Boosting Machines with the proposed one to make it Example Dependent Cost-Sensitive Gradient Boosting Machines. The proposed algorithm is tested on two real world data sets that include credit amounts and synthetically generated data sets. The algorithm is compared with cost-insensitive learners, previously proposed example-dependent cost-sensitive classifiers that handles cost-sensitivity during learning, a post-processing method called Thresholding and a pre-processing method Oversampling to make cost-insensitive classifiers cost-sensitive. Results show that our method outperforms those four methods in terms of financial savings.

Benzer Tezler

Tez No
668053
A mixed-integer programming approach to example-dependent cost-sensitive learning
Örneklere-bağlı maliyet-duyarlı öğrenmeye karışık tamsayı doğrusal programlama yaklaşımı
TARKAN TEMİZÖZ
Yüksek Lisans
İngilizce
2021
Endüstri ve Endüstri Mühendisliği Boğaziçi Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA GÖKÇE BAYDOĞAN
Tez No
565580
Development of a dynamic maintenance algorithm with multiple scenarios: A case study for surface mining
Çoklu senaryoya sahip bir dinamik bakım-onarım algoritması geliştirilmesi: Bir açık işletme uygulaması
MERVE ÖLMEZ TURAN
Yüksek Lisans
İngilizce
2019
Maden Mühendisliği ve Madencilik Orta Doğu Teknik Üniversitesi
Maden Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR GÖLBAŞI
Tez No
334379
Takviyeli bir uçak gövde plakasının ve yapısal test adetlerinin güvenilirlik-tabanlı optimizasyonu
Reliability based optimization of a stiffened aircraft fuselage panel and the number of structural tests
RABİA ÇİĞDEM USTA
Yüksek Lisans
Türkçe
2013
Havacılık Mühendisliği TOBB Ekonomi ve Teknoloji Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERDEM ACAR
Tez No
961089
Investigation of ion dynamics of devices with ionic liquid mixture electrolytes using X-ray photoelectron spectroscopy with electrical biasing
Elektrolit olarak iyonik sıvı karışımı içeren cihazlardaki iyon dinamiklerinin elektriksel modülasyon altında X-ışını fotoelektron spektroskopisi ile incelenmesi
EZGİ KUTBAY
Yüksek Lisans
İngilizce
2025
Kimya İhsan Doğramacı Bilkent Üniversitesi
Kimya Ana Bilim Dalı
PROF. DR. ŞEFİK SÜZER
Tez No
421135
Orta ölçekli şantiyelerde asgari proje yönetim ihtiyaçlarını karşılayacak pratik bir kontrol sistemi önerisi
A practical control system proposal in medium sized construction that provide minimum needs of project management
HASAN ÖZTÜRK
Yüksek Lisans
Türkçe
2015
İnşaat Mühendisliği İstanbul Teknik Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
DR. FEYZİ HAZNEDAROĞLU

Geri Dön