Geri Dön

Topluluk öğrenimi ile kredi kartı dolandırıcılık tespiti: Karşılaştırmalı bir analiz

Credit card fraud detection using ensemble learning: A comparative analysis

  1. Tez No: 744831
  2. Yazar: BARIŞ AKYÜZ
  3. Danışmanlar: PROF. DR. SELİN SONER KARA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Sistem Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 87

Özet

Kredi kartı hırsızlık vakalarını önleme çalışmaları giderek artan kart kullanım sayılarına bağlı olarak önemini sürdürmeye devam etmektedir. Bu çalışmanın amacı, kredi kartı müşterilerine ait mevcut işlemleri analiz ederek çok sayıda normal işlemin arasından az sayıdaki hırsızlık işlemlerini doğru tespit etmeyi sağlayan etkin tahmin modelini oluşturmaktır. Bu amaçla literatürde sıklıkla tercih edilen Makine Öğrenmesi algoritmaları kullanılarak veri hazırlığından tahmin modeli oluşturmaya, performans parametresi seçiminden model gruplamaya kadar farklı uygulama adımları ele alınmıştır. Öncelikle işlem verisini hazırlamak ve başlangıç noktasını görmek amacıyla bir tahmin modeli üretilmiştir. Böylece öğrenme verisinde farklı gözlem boyutu sayısı ve hırsızlık oranı değerlerinin test verisindeki tahmin sonuçlarına etkisi baz model aracılığıyla test edilerek ortaya çıkarılmıştır. Tahmin sonuçlarını yorumlamak amacıyla, problemin gözlem dengesizliğine uygun olduğundan dolayı F1 skoru değeri birincil performans göstergesi olarak belirlenmiştir. Sonrasında uygulama verisine ait müşteri numarası, harcama tutarı, işlem tarihi gibi temel özellikler kullanılarak haftalık, aylık gibi çeşitli periyotları kapsayan müşteri ve iş yeri bazlı yardımcı özellikler üretilmiştir. Üretilen yardımcı özelliklerin ardından literatürde öne çıkan makine öğrenmesi algoritmaları sınıflandırma tahmini amacıyla önce teker teker kullanılmış, ardından tahmin sonuçları incelendikten sonra önerilen risk algısı bazlı seçim kriterine göre üç farklı şekilde gruplama için seçim yapılmıştır. Seçilen tekil tahmin modellerinin gruplanması ise çeşitli yollarla yapılmıştır. İyimser, kötümser, ortalama gibi temel yaklaşımlara ek olarak ağırlıklı ortalama, uzlaşma (Hurwicz kriteri), yumuşak oylama (soft voting), üst katman öğrenme gibi ek yaklaşımlar değerlendirilmiştir. Gruplanmış modellerin tekil modeller ile elde edilen başarı seviyesini arttırdığı görülmüştür.

Özet (Çeviri)

Prevention of credit card fraud cases continues to be important due to the increasing number of card usage. The aim of this study is to create an effective classification model that enables to accurately detect a small number of fraud transactions among a large number of normal transactions by analyzing the transactions of credit card customers. For this purpose, different application steps like data preparation, model training, selection of performance parameters and ensemble models are discussed by using frequently preferred Machine Learning algorithms in the literature. First of all, a classification model is created to prepare the transaction dataset properly and to specify the starting point of the study. Furthermore, the effect of the number of different observation sizes and fraud rates of the training data was investigated by testing through the base model. Thus, test results of using different sizes and fraud rates in training data was revealed with the help of the base model. Since it is compatible with the class imbalance problem, F1 score is selected as the primary performance indicator in order to evaluate the classification results. Then, additional periodic customer and merchant-based features are created by using the basic features from the application data such as customer number, merchant number or transaction amount. Thus, the most popular machine learning algorithms are used individually and then three different ensembles are selected according to the new proposed risk appetite-based selection criteria. Also, the ensemble models are prepared with various ways. In addition to the basic approaches such as optimistic, pessimistic and average methods, additional approaches such as weighted average, realism (Hurwicz criterion), soft voting and top layer models are also used. It has been observed that ensemble models are increased the success of individual models.

Benzer Tezler

  1. Yığın topluluk öğrenme temelli oltalama saldırıları tespit sistemi

    Stack ensemble learning based phishing attacks detection system

    RAMAZAN SAMİ ÇINAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAfyon Kocatepe Üniversitesi

    Bilgisayar Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET HAŞİM YURTTAKAL

  2. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  3. Bankacılık sektöründe kredi ödemelerinin makine öğrenimi sınıflandırma algoritmalarına göre analizi

    Analysis of loan payments in the banking sector according to machine learning classification algorithms

    ASLI MUKADDES ESİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    EkonometriMarmara Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. SAİT ERDAL DİNÇER

  4. Üniversite öğrencilerinde topluluk hissi, kurumla bütünleşme düzeyi ve akademik başarı arasındaki ilişki

    The relationship among university students' sense of school community, institutional integration and academic success

    HASAN ŞAHİN YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Eğitim ve ÖğretimFırat Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DOÇ. DR. MUHAMMED TURHAN

  5. Phishing websites detection using bagging ensemble machine learning

    Torbalama topluluk makine öğrenmesi kullanarak oltalama web sitelerini tespit etme

    NUHA ABUBAKER IBRAHEEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ADIB HABBAL