Geri Dön

Feature generation for SME behavioral credit scoring model using graph embeddings

Çizge gösterimlerini kullanarak KOBİ müşterilerin kredi modelleri için öznitelik yaratımı

  1. Tez No: 905006
  2. Yazar: KEREM KAŞIKCI
  3. Danışmanlar: PROF. DR. MEHMET GÖNEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimi ve Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 90

Özet

Bankalar, müşterilerinin şirket içi kredi riski modellerinden gelen kredi puanlarına göre kredi verirler. Tüzel müşteriler daha fazla risk taşır ve zaten yüksek performans gösteren modellerle değerlendirilirler. Bu tezde, tüzel müşterilerin birbirleriyle olan finansal etkileşimleri (para transferleri), küçük ve orta ölçekli işletmelerin davranışsal kredi riski puanı modelini iyileştirmek için ek bir öznitelik seti geliştirmek için kullanılmıştır. Çizge temsili öğrenimi, bu tür ilişkilerin özünü çıkarma ve bunları çok boyutlu bir uzaya yansıtma açısından iyi bir iş çıkarır. Bu amaçla, düğümleri işletmeler ve zaman içindeki para transfer tutarlarının toplamı kenarları olan bir çizge oluşturulmuştur. Tümevarımsal bir çizge temsili öğrenme algoritması olan GraphSAGE kullanılmıştır. Bu nedenle, çizge yönlü ve ağırlıklı kenarlarla oluşturulur ve güçlü bir şekilde bağlı bir çizgeye indirgenmiştir. Daha sonra, algoritma en iyi performansı elde etmek için çeşitli ayarlarda çalıştırılmıştır. Mevcut modeli bu yeni gösterim öznitelikleriye iyileştirmek için farklı yapay öğrenme algoritmaları kullanan bir kredi puanlama akışı eklenmiştir. Bu çalışmayı gerçekleştirmek için QNB Finansbank'ın 2022'ye ait gerçek bankacılık verileri kullanılmıştır. Hesaplamalı deneylerin sonuçlarına bakıldığında, en fazla katkı, farklı toplayıcı işlevleriyle üretilen birden fazla gösterimin birleştirilmesinden gelmiştir. Buradan hareketle bir potansiyel ekonomik tasarruf hesaplanmıştır. Ayrıca yeni mimarinin, düşük transfer miktarına veya kenar sayısına sahip düğümlerin kredi puanlamasını en çok iyileştirdiği görülmektedir.

Özet (Çeviri)

Banks lend credit regarding customers' credit scores from in-house credit risk models. Corporate customers hold greater risk and are evaluated with already high-performing models. In this thesis, corporate customers' financial interactions (money transfers) with each other are used to develop an additional feature set to improve the behavioral credit risk scoring model of small and medium-sized enterprises. Graph representation learning does a good job in terms of extracting the essence of such relationships and projecting them into a multidimensional space. For this purpose, a graph of enterprises is constructed where they are nodes and their sum of money transfer amount over time are edges. An inductive graph representation learning algorithm, GraphSAGE, is employed. Therefore, the graph is created with directed and weighted edges and reduced to a strongly connected graph. Then, the algorithm is run in various settings to achieve the best performance. A credit scoring pipeline using different machine learning algorithms is added to improve the current model with these new embedding features. QNB Finansbank's real banking data for 2022 is used to perform this study. After looking at the results of the computational experiments, the most important contribution came from the concatenation of multiple embeddings generated with different aggregator functions. Starting from here, a potential economic savings is calculated. Additionally, it is seen that the new architecture improves the credit scoring of nodes with either low transfer amount or number of edges the most.

Benzer Tezler

  1. Three essays on regional development

    Bölgesel kalkınma üzerine üç makale

    MEHMET ONUR PARTAL

    Doktora

    İngilizce

    İngilizce

    2022

    EkonomiYıldız Teknik Üniversitesi

    İktisat (İngilizce) Ana Bilim Dalı

    PROF. DR. FERİDE GÖNEL

  2. Analysis and design of electronically controlled dual band wifi antenna using nitinol alloys and planar metals

    Nitinol alaşımları ve düzlemsel metaller kullanılarak elektronik olarak kontrollü çift bantlı wifi anteninin analizi ve tasarımı

    CEM BAYTÖRE

    Doktora

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik MühendisliğiDokuz Eylül Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. EMİNE YEŞİM ZORAL

    PROF. DR. ADNAN KAYA

  3. Feature subset generation for ensemble learning using feature clustering and mutual information

    Topluluk öğrenme için öznitelik kümeleme ve karşılıklı bilgi kullanarak öznitelik altkümesi oluşturma

    HANA AMAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    ASST. ASSOC. CEMAL OKAN ŞAKAR

  4. Statistical feature learning and signal generation for time-series sensor signals

    Zaman serisi sensör işaretleri için öznitelik öğrenimi ve işaret üretimi

    ERKAN KARAKUŞ

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE KÖSE

  5. Prediction of pore pressure and deviatoric stress generation for liquefiable soils under cyclic loading using machine learning

    Sıvılaşabilen zeminlerde dinamik yükleme durumunda boşluk suyu basıncı ve deviatorik gerilme değişiminin makine öğrenmesi yöntemleriyle tahmin edilmesi

    ÖMER TUĞŞAD BİRİNCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Deprem Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET BARIŞ CAN ÜLKER