Topluluk öğrenimi ile kredi kartı dolandırıcılık tespiti: Karşılaştırmalı bir analiz
Credit card fraud detection using ensemble learning: A comparative analysis
- Tez No: 744831
- Danışmanlar: PROF. DR. SELİN SONER KARA
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Sistem Mühendisliği Bilim Dalı
- Sayfa Sayısı: 87
Özet
Kredi kartı hırsızlık vakalarını önleme çalışmaları giderek artan kart kullanım sayılarına bağlı olarak önemini sürdürmeye devam etmektedir. Bu çalışmanın amacı, kredi kartı müşterilerine ait mevcut işlemleri analiz ederek çok sayıda normal işlemin arasından az sayıdaki hırsızlık işlemlerini doğru tespit etmeyi sağlayan etkin tahmin modelini oluşturmaktır. Bu amaçla literatürde sıklıkla tercih edilen Makine Öğrenmesi algoritmaları kullanılarak veri hazırlığından tahmin modeli oluşturmaya, performans parametresi seçiminden model gruplamaya kadar farklı uygulama adımları ele alınmıştır. Öncelikle işlem verisini hazırlamak ve başlangıç noktasını görmek amacıyla bir tahmin modeli üretilmiştir. Böylece öğrenme verisinde farklı gözlem boyutu sayısı ve hırsızlık oranı değerlerinin test verisindeki tahmin sonuçlarına etkisi baz model aracılığıyla test edilerek ortaya çıkarılmıştır. Tahmin sonuçlarını yorumlamak amacıyla, problemin gözlem dengesizliğine uygun olduğundan dolayı F1 skoru değeri birincil performans göstergesi olarak belirlenmiştir. Sonrasında uygulama verisine ait müşteri numarası, harcama tutarı, işlem tarihi gibi temel özellikler kullanılarak haftalık, aylık gibi çeşitli periyotları kapsayan müşteri ve iş yeri bazlı yardımcı özellikler üretilmiştir. Üretilen yardımcı özelliklerin ardından literatürde öne çıkan makine öğrenmesi algoritmaları sınıflandırma tahmini amacıyla önce teker teker kullanılmış, ardından tahmin sonuçları incelendikten sonra önerilen risk algısı bazlı seçim kriterine göre üç farklı şekilde gruplama için seçim yapılmıştır. Seçilen tekil tahmin modellerinin gruplanması ise çeşitli yollarla yapılmıştır. İyimser, kötümser, ortalama gibi temel yaklaşımlara ek olarak ağırlıklı ortalama, uzlaşma (Hurwicz kriteri), yumuşak oylama (soft voting), üst katman öğrenme gibi ek yaklaşımlar değerlendirilmiştir. Gruplanmış modellerin tekil modeller ile elde edilen başarı seviyesini arttırdığı görülmüştür.
Özet (Çeviri)
Prevention of credit card fraud cases continues to be important due to the increasing number of card usage. The aim of this study is to create an effective classification model that enables to accurately detect a small number of fraud transactions among a large number of normal transactions by analyzing the transactions of credit card customers. For this purpose, different application steps like data preparation, model training, selection of performance parameters and ensemble models are discussed by using frequently preferred Machine Learning algorithms in the literature. First of all, a classification model is created to prepare the transaction dataset properly and to specify the starting point of the study. Furthermore, the effect of the number of different observation sizes and fraud rates of the training data was investigated by testing through the base model. Thus, test results of using different sizes and fraud rates in training data was revealed with the help of the base model. Since it is compatible with the class imbalance problem, F1 score is selected as the primary performance indicator in order to evaluate the classification results. Then, additional periodic customer and merchant-based features are created by using the basic features from the application data such as customer number, merchant number or transaction amount. Thus, the most popular machine learning algorithms are used individually and then three different ensembles are selected according to the new proposed risk appetite-based selection criteria. Also, the ensemble models are prepared with various ways. In addition to the basic approaches such as optimistic, pessimistic and average methods, additional approaches such as weighted average, realism (Hurwicz criterion), soft voting and top layer models are also used. It has been observed that ensemble models are increased the success of individual models.
Benzer Tezler
- Yığın topluluk öğrenme temelli oltalama saldırıları tespit sistemi
Stack ensemble learning based phishing attacks detection system
RAMAZAN SAMİ ÇINAR
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAfyon Kocatepe ÜniversitesiBilgisayar Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET HAŞİM YURTTAKAL
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Bankacılık sektöründe kredi ödemelerinin makine öğrenimi sınıflandırma algoritmalarına göre analizi
Analysis of loan payments in the banking sector according to machine learning classification algorithms
ASLI MUKADDES ESİ
Yüksek Lisans
Türkçe
2022
EkonometriMarmara ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. SAİT ERDAL DİNÇER
- Üniversite öğrencilerinde topluluk hissi, kurumla bütünleşme düzeyi ve akademik başarı arasındaki ilişki
The relationship among university students' sense of school community, institutional integration and academic success
HASAN ŞAHİN YILDIRIM
Yüksek Lisans
Türkçe
2018
Eğitim ve ÖğretimFırat ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. MUHAMMED TURHAN
- Phishing websites detection using bagging ensemble machine learning
Torbalama topluluk makine öğrenmesi kullanarak oltalama web sitelerini tespit etme
NUHA ABUBAKER IBRAHEEM
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ADIB HABBAL