Finans sektöründe veri madenciliği kredi skorlama
Data mining in finance sector credit scoring
- Tez No: 536188
- Danışmanlar: DR. ÖĞR. ÜYESİ SABAHATTİN KEREM AYTULUN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Milli Savunma Üniversitesi
- Enstitü: Hezarfen Havacılık ve Uzay Teknolojileri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 123
Özet
Veri madenciliği, üretim, planlama, kontrol, sağlık sektörü hastalık analizleri gibi alanlarda uygulanabilir olduğu için veri inceleme işi ile uğraşan analistlerin büyük ölçüde dikkatini çekmektedir. Olgunlaşmamış veriler tek başlarına herhangi bir anlam ifade etmezler ve bir takım işlemlerden geçmesi gerekmektedir.Şirketler ve kurumlar artan rekabet ortamında ham veriyi işleyerek kullanılır ve yararlı bilgi seviyesine getirerek birbirlerinin önüne geçmeye çalışırlar. Veri ambarları, yığınları arasındaki bu gizli ilişkileri tespit edip; onları işleyip faydalı hale getiren bilgi keşif süreci veri madenciliği olarak adlandırılır. Bu süreç geniş bir yelpazade hizmet vermektedir. Bunlar pazarlama, sağlık sektörü, finans sektörü, üretim departmanları gibi verinin çok boyutlu olduğu hemen hemen her sektörde karşımıza çıkmaktadır. Finans sektöründe veri madenciliği yaygın olarak kullanılmaktadır. Bankaların, gelişen teknoloji ile birlikte müşterilerinin dikkatlerini daha fazla çekme çabaları, onlara daha fazla kredi kullanma yönündeki teşvikleri, verilen kredilerin geri ödenmemesi ya da geç ödenmesi gibi hususlar banka yöneticilerinin dikkatlerini özellikle veri madenciliği ile ilgilinen analistlere yönlendirmiştir. Bankalar için önemli olan karlarını her zaman maksimize etmek olduğu için temerrüde düşen müşteri profillerinin belirlenerek tedbirler alınması önem arz etmektedir. Bu yüzden veri madenciliği ile bankacılık sektörü yakın ilişki halindedir. Bu kapsamda tezin amacı; Almanya'daki bir bankanın 1000 müşterisinin 20 farklı özelliği kullanılarak excel formatında oluşturulmuş UCI Makine Öğrenim Deposunda bulunan veri setinin veri madenciliği sürecinin (bilgi keşfi süreci) aşamalarından geçirilerek, verinin kullanılabilir hale getirilmesi amaçlanmış olup; veri ön işleme ve dönüştürme teknikleri Weka yazılımı ara yüzleri kullanılarak anlamlı hale getirilerek, veri seti için yapılacak olan kredi skorlamada en uygun veri madenciliği sınıflandırma algoritmasını belirlemek; ayrıca bilgi keşfi sürecindeki veri ön işleme işlemleri aracılığı ile veri setinde kullanacağımız sınıflandırma algoritmaları için çok fazla öneme haiz olmayan özellikler (ikincil özellikler) tespit edilerek veri setinden çıkarılması ve sonrasında oluşturulacak hibrid (melez) sınıflandırma algoritmalarının, veri değerlendirme kriterleri (Doğruluk,F-Score,Gini Katsayısı, Duyarlılık, Kesinlik ve ROC alanı) ile analizleri amaçlanmıştır. Özellikle veri setinin bilgi keşif sürecinden geçmeden ve geçtikten sonraki durumları ortaya konularak hibrid sınıflandırma algoritmalarının diğer sınıflandırma algoritmalarına göre daha tutarlı sonuçlar ulaştığı gözlemlenmiştir.
Özet (Çeviri)
Data mining is applicable to areas such as production, planning, control, health sector disease analysis, analysts who are engaged in data inspection. The unregulated data alone do not have any meaning and must undergo a number of transactions. It is used by processing raw data in the environment and trying to prevent each other by bringing them to the level of useful information. The process of information discovery, which makes them useful and useful, is called data mining. This process serves a wide range. These appear in almost every sector where data such as marketing, healthcare, finance and production departments are multidimensional. Data mining is widely used in the finance sector. The efforts of the banks to attract the attention of their customers together with the developing technology, the incentives for using them more credit, the non-repayment of the loans given or the late payment of them have directed the attention of the bank managers to the analysts who are interested in data mining. Since it is important to always maximize their profits, it is important to determine the customer profiles that are in default and take measures. Therefore, the banking sector is in close relation with data. In this context, the aim of the thesis; The data mining process of the data set in the UCI Machine Learning Store, which was created in excel format using 20 different features of the 1000 customers of a bank in Germany, was passed through the stages of the data mining process (information discovery process) and it was aimed to make the data available. data pre-processing and conversion techniques will be made meaningful by using Weka software interfaces to determine the most appropriate data mining classification algorithm for credit scoring for the data set; In addition, data pre-processing process in the process of data discovery through the data set will be used for the classification algorithms are not of much importance (secondary features) to be determined by removing the data set and then hybrid (hybrid) classification algorithms, data evaluation criteria (Accuracy, F-Score , Gini Coefficient, Recall, Precision, and ROC area). In particular, it was observed that hybrid classification algorithms achieved more consistent results than other classification algorithms by revealing the data set after the discovery process and after passing.
Benzer Tezler
- Bankacılık sektöründe mali tahlil ve istihbaratın gelişim süreci ve teknolojik yenilikler: Bir uygulama önerisi olarak duygu analizi
Development process of financial analysis and intelligence and technological innovations in the banking sector: Sentiment analysis as an application recommendation
YASİN ATAMAN
Yüksek Lisans
Türkçe
2023
BankacılıkBilecik Şeyh Edebali Üniversitesiİşletme Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA ARI
- Bireysel araç kredilerinin yasal takibe girme durumları hakkında tahmin modellerinin oluşturulması
Establishing a predictive model for individual car loans exposing to legal procedure
AYBUKE DOĞAN
Yüksek Lisans
Türkçe
2015
BankacılıkBahçeşehir ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ALPER TUNGA
- Sermaye piyasalarında veri madenciliği uygulamaları: Borsa İstanbul örneği
Data mining applications in capital markets: The example of Borsa Istanbul
SABAHATTİN NUR
Yüksek Lisans
Türkçe
2024
Ekonomiİskenderun Teknik ÜniversitesiEkonomi Finans Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SAMİYE EKİM DERTLİ
- 2008 Küresel Kriz ve Türkiye ekonomisine yansımaları, 1994 ve 2001 karşılaştırılması
2008 Global Crisis and reflections on Turkey's economy, comparison of 1994 and 2001
CANAN TİFTİK
- Finans sektöründe veri madenciliği ile dolandırıcılık tespiti
Fraud detection in a finance association by data mining
ERCAN ÖZBAY
Yüksek Lisans
Türkçe
2007
BankacılıkSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ARSLAN