Simplifying balance sheet adjustment process in commercial loan applications using machine learning methods
Ticari kredi başvurularında şirket bilançoları üzerinde gerçekleştirilen aktarma-arındırma işlemlerinin makine öğrenmesi yöntemleri kullanılarak basitleştirilmesi
- Tez No: 557178
- Danışmanlar: PROF. DR. ŞULE GÜNDÜZ ÖĞÜDÜCÜ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 75
Özet
Günümüzde, üzerinde yoğun çalışmalar yapılan yapay zeka ve makine öğrenmesi alanları, hayatımıza birçok anlamda dokunmaktadır. İş dünyası da bu teknolojileri kendi sektörlerinde uygulamak için oldukça isteklidir. Türkiye'de bu teknolojileri kullanarak problemlerini çözme anlamında da bankacılık sektörü öne çıkmaktadır. Bu çalışma, makine öğrenmesi ve özellik mühendisliği kullanılarak, bankacılık sektörünün en önemli araçlarından biri olan ticari kredilerin karar sürecini daha sağlıklı ve hızlı bir şekilde şekillendirmeye yöneliktir. Ticari krediler hem reel sektör hem de bankalar açısından kritik öneme sahiptir. Şirket yatırımları ve banka karlarının büyük bir bölümü ticari krediler yoluyla sağlanmaktadır. Bu karşılıklı yarar temeline dayanan ilişki ekonomik sistemin işlemesini ve işletmelerin sermaye ile buluşmasını sağlar. Ancak bu buluşmanın sağlanabilmesi için bazı süreçlerin işlemesi ve sonlanması gerekir. Bunun için ticari krediyi talep eden işletme, bankalara kredi başvurusunda bulunur. Bu başvuru sırasında bankalar işletmelerden bazı finansal dökümanları teslim alır. Bu finansal dökümanlar bilanço, gelir tablosu ve mizandır. Bankalar kredi kararını vermeden önce bu dökümanları inceler ve ardından nihai kararını işletmelere bildirir. Bu inceleme karmaşık bir süreçtir. Bankalar çok sayıdaki müşterisinin finansal dökümanlarını farklı kaynaklardan gelen bilgilerle birlikte analiz ederler. Bunun sonucunda da banka müşterilerinin kredi skoru belirlenir. Bu sürecin büyük bir kısmını bilançonun, gelir tablosunun ve mizanın analizi oluşturur. Bilanço ve gelir tablosu işletmenin finansal durumunu ortaya koyarken mizan tüm parasal işlemlerin ve hesap hareketlerinin detaylı bir dökümünü verir. Çok sayıda uzman finansal analist, bu finansal belgeleri detaylı bir şekilde inceler. Güvencesiz varlıkları önceden tahmin edip, bilançodan çıkarır ve gerçek borç yükünü ve borçların fiili vadesini ortaya çıkarmaya çalışır. Bilanço üzerinde gerçekleştirilen bu işlemler, şirketin daha gerçekçi ve şeffaf bir finansal portresini elde etmek için beyan edilen finansal bilgilerin her bir bölümünün kullanılmasını gerektirir. Analistler genellikle bu belgeleri gözden geçirir, çeşitli iç ve dış kaynaklardan ek bilgiler toplar ve ilgili kısımları temizlemeye çalışır. Bu temizlik sırasında bilanço kalemleri arasında bakiyelerin toplanması, çıkarılması veya taşınması gibi işlemler gerçekleştirilir. Ayrıca, bu işlemler sırasında bilanço makyajlamanın da önüne geçilmesi amaçlanır. Bu sürece aktarma-arındırma adı verilir. Bu çalışmanın amacı aktarma-arındırma yapılacak bilanço kalemlerinin tespitini hızlı bir şekilde yaparak finansal analistlere yardımcı olmaktır. Bu karmaşık ve maliyetli görev, büyük ölçüde insan faktörüne bağlı olduğundan tutarlılık sorunlarına neden olur. Aynı durumlarda farklı analistler farklı uygulamalar yapabilir. Buna ek olarak, aktarma-arındırma işlemlerini uygulamak için büyük miktarda emek ve zaman gerekir. Aktarma-arındırma işlemleri sırasında finansal analistler yerine yapay zeka ve makine öğrenme yöntemlerinin kullanılması bu sorunların ortaya çıkmasını önleyebilir. Bu çalışmada, makine öğrenmesi yaklaşımlarına dayanan bir yöntem ile bu sorunun çözümü ele alınmaktadır. Bu çözüm modelinin amacı, aktarma-arındırma işlemleri uygulanacak bilanço kalemlerinin tespitini hızlı bir şekilde yaparak finansal analistlere yardımcı olmaktır. Bu çalışma, bu sorunun üstesinden gelebilmek için öncelikle makine öğrenmesi modelleriyle birlikte kullanılabilecek yeni bir özellik kümesi önermiştir. Ardından, sunulan bu özellikleri kullanarak bilançoda dokunulacak bilanço kalemlerinin tespiti için çözüm sunar ve önerilen çözüm modelinin aktarma-arındırma işlemlerinde dokunulacak bilanço kalemlerinin tespiti konusundaki deneysel sonuçlarını sunar. Tezin literatüre temel olarak iki katkısı vardır. Birincisi, aktarma-arındırma işlemi için sorunlu bilanço kalemlerinin belirlenmesidir. Bilançoların her bir kalemi için bilançolara çok etiketli sınıflandırma uygulanarak bu sorunlu bilanço kalemleri tespit edilmiştir. İkinci olarak, aktarma-arındırmada bilanço kalemlerini doğru ve etkin bir şekilde tespit edebilmek için farklı kaynaklardan gelen bilgileri kullanarak yeni bir özellik kümesi oluşturulmuştur. Bu özellik kümesi Merkez Bankası, Kredi Kayıt Bürosu, finansal dökümanlar ve bankanın bilgi kaynaklarından elde edilen bilgilerin derlenmesi sonucunda ortaya çıkan 353 özellikten oluşmaktadır. Bu tezde, anlatılan problemin çözümü için öncelikle Türkiye'nin en büyük bankalarından birinden elde edilen veriler üzerinde veri seti hazırlama çalışmaları yapılmıştır. Orijinal veriler hakkında tanımlayıcı ve açıklayıcı bilgiler histogram ve grafiklerle verilmiştir. Bilançoların orijinal ve düzeltilmiş versiyonundan her bir bilanço kalemi etiket kabul edilerek doğruluk tablosu oluşturulmuştur. Bu tablodan, az sayıda bulunan etiketler tespit edilmiş ve bilançodaki genel kategoriler dikkate alınarak bu etiketler birleştirilmiştir. Bu sayede verideki dengesiz dağılımın etkilerinin azaltılması amaçlanmıştır. Nihai olarak 84 etiket ortaya çıkmıştır. Yeni etiket uzayı dikkate alınarak doğruluk tablosu yeniden düzenlenmiştir. Bilanço, gelir tablosu, mizan, TCMB kaynakları, KKB kaynakları ve bankanın bilgi kaynakları kullanılarak finansal ve finansal olmayan özellikleri birleştiren yeni özellik kümesi ve yeni önerilen özellikler oluşturulmuştur. Bu çalışmada 353 özellikten oluşan üç ayrı özellik grubu tanıtılmıştır. Birinci grup, bilanço ve gelir tablolarından hesaplanan finansal oranlardan oluşmaktadır. Finansal oranlar, şirketlerin finansal durumlarının bir özeti olarak güçlü ve zayıf yönlerini göstermektedir. Bu finansal oranlar hesaplanırken bilanço ve gelir tablosu kalemlerinin az bir kısmı kullanılır. İkinci özellik grubu, bilançonun dikey analizi sonucu ortaya çıkan özelliklerden oluşur. Dikey analiz, bilançoda saklanan bilgilerin kaybolmadan özellik olarak kullanılmasını sağlar. Dikey analiz özellikleri bilançodaki her bir kalemden ayrı ayrı hesaplanırken, birinci gruptaki finansal oranlar sadece belirli kalemleri dikkate alır. Finansal oranlar önemli özellikleri yakalar; ancak, dikey analizle elde edilen özellikler bilanço içeriğindeki bilgilerin kaybolmadan bilgi olarak kullanılabilmesi sağlar. Üçüncü ve son özellik grubu finansal tablolar kullanılmadan elde edilmiştir. Finansal tablolardan sadece finansal olmayan bazı bilgiler tarih vb. gibi bilgiler bu grupta yer almıştır. Bu özellikler TCMB, KKB, mizan ve bankanın iç kaynaklarından elde edilen bilgilerin kullanılması sonucunda ortaya çıkmıştır. Daha önceki benzer çalışmalarda bu tür geniş ve farklı veri kaynakları kullanılmamıştır. Bu grupta sunulan özellikler, bu araştırmanın literatüre kazandırdığı yeni özelliklerdir. Tüm özellik uzayı, 53 birinci grup, 263 ikinci grup ve 37 üçüncü grup özelliklerinden oluşan toplamda 353 özelliğe sahiptir. 86,487 adet bilanço içeren veri setimizle ve ortaya konulan bu özeliklerle birlikte iki farklı deney yapılmıştır. İlk deney, önceki finansal sahtekarlık tespit çalışmalarında kullanılan özelliklerin bilanço düzeltme problemini çözmek için yeterli olmadığını; ancak bu çalışmada önerilen özelliklerin sorunu çözme kapasitesine sahip olduğunu ve makine öğrenmesi modellerinin performansına katkı yaptığını gösterdi. İkinci deneyde ise, esnek yapıdaki önerilen çözüm modeli, farklı makine öğrenme yaklaşımları ile uygulanmış ve bu yaklaşımların karşılaştırmalı performans değerlendirmesi yapılmıştır. Deneylerde LGBM, XGBoost, Catboost, karar ağacı, rastgele orman ve yığılmış genelleme yöntemleri kullanılmıştır. Yığılmış genelleme, üst seviye öğrenici olarak Random Forest ve temel öğreniciler olarak LGBM, XGBoost ve CatBoost algoritmalarının kullanıldığı versiyonuyla bu deneydeki en iyi performans gösteren model olmuştur ve performans olarak tatmin edici bir sonuç elde edilmiştir. Elde edilen sonuçlar değerlendirilerek, sonuçları etkileyen sebepler incelenmiş ve ileride yapılabilecek geliştirmeler ortaya konulmuştur.
Özet (Çeviri)
Financial analysts perform balance sheet adjustment that includes reductions, additions or movements of balances in accounts before applicants' credibility scores are calculated in the assessing commercial loan applications. The analysts usually go through financial documents manually and it causes waste of time and labor for financial institutions. This thesis presented a solution model that detects balance sheet items to be adjusted in order to reduce costs and accelerate the balance sheet adjustment process with helping financial analysts. Machine learning algorithms are the key elements for the solution model. Also, a new feature set that can detect balance sheet items to be adjusted is proposed to be used for machine learning models in this thesis. Three groups of features consisted of 353 features were introduced in this thesis. The first group of features is financial ratios calculated from the balance sheet and income statements. The second group of features is the features obtained from the vertical analysis of the balance sheet. Financial ratios in the first group only take into account certain balance sheet items while vertical analysis features are calculated as using each item in the balance sheet. The third and last group of features were obtained without using the financial statements and contained non-financial features. These features are extracted from information obtained Central Bank of Republic of Turkey, Credit Bureau of Turkey, trial balance book and internal sources of the bank. In previous studies, wide and various data sources have not been used in this way. The features presented in this group are one of the contributions of this study. As another contribution, the proposed solution model and feature set were tested with experiments. The results show that Stacked Generalization model, Random Forest as meta-learner and LightGBM, XGBoost and CatBoost as base learners, is the top performer model with the new feature set. The dataset used in experiments is obtained from one of the largest banks of Turkey. The satisfactory results were obtained for detection of balance items to be adjusted from models in experiments. The obtained results were evaluated and the reasons affecting the results were examined. Future improvements were suggested according to the results of this examination and discussion.
Benzer Tezler
- Ters akımlı soğutma kulelerinde ısı ve kütle geçişinin incelenmesi
Başlık çevirisi yok
İ.HAKAN SADIKOĞLU
- A systematic approach to measure usability and security trade-off of a given user interface
Kullanılabilirlik ve güvenlik dengesi ölçümünde sistematik yaklaşım
İNCİ KARAMAHMUTOĞLU
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET GÖKTÜRK
- Ağır ticari araçların havalı fren sisteminde kullanılan körük bağlantı braketi tasarımı
Design of brake actuator attachment bracket for heavy duty vehicle air brake systems
ÖNDER İNCE
Yüksek Lisans
Türkçe
2016
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DOÇ. DR. EMİN SÜNBÜLOĞLU
- Arap gramerinin kolaylaştırılması bağlamında yenilikçilik hareketleri ve Arapça öğretimine etkileri
Innovative movements tol facilitate learning Arabic Grammar and their effects on teaching Arabic
ŞAHİN ŞİMŞEK
Doktora
Türkçe
2018
Doğu Dilleri ve EdebiyatıCumhuriyet ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
DOÇ. ALİ YILMAZ