Geri Dön

Credit card fraud detection with autoencoders, one-class SVMs and isolation forests

Otokodlayıcılar, tek sınıflı destek vektör makineleri ve izolasyon ormanları ile kredi kartı dolandırıcılığı tespiti

  1. Tez No: 844885
  2. Yazar: ÖZDEMİR ÖZKUM
  3. Danışmanlar: PROF. DR. ÖZLEM İLK DAĞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Dolandırıcılık tespiti, ekonomi ve genel popülasyon üzerinde yarattığı maliyetler sebebiyle, son yıllarda önem kazanmıştır. Ancak, dolandırıcılık tespiti yapılırken, modelleme süreçlerinde çözülmesi gereken birkaç problem söz konusudur. Bunlardan birincisi veriye erişebilirliktir. Şöyle ki, müşteriler tarafından üretilen veriler gizlilik kurallarına tabi olduklarından, yapay veri ile bir gerekliliktir. Ancak, finansal işlemlerin veri üretimi ve analiz süreçlerini yansıtan az sayıda veri bulunmaktadır. Dolandırıcılık tespitinde bir diğer nokta ise, verilerin etiketlenmemiş oluşudur. Hatta etiketlenmiş olsalar bile bu işlem kurallar aracılığıyla yürütüldüğünden bu sürecin otomatize edilmesi gerekmektedir. Bu nedenle denetimsiz öğrenme yöntemleri ile verinin kendi adına konuşmasına izin verilmesi önemlidir. Bu çalışma, bahsedilen bu nedenlerle, yapay kredi kartı verisi kullanarak, dolandırıcılık tespitinde kullanılan denetimsiz öğrenme yöntemlerine odaklanmaktadır. Kullanılan öğrenme yöntemleri Otokodlayıcılar, Seyrek Otokodlayıcılar, Tek Sınıflı Destek Vektör Makineleri ve İzolasyon Ormanları olup, karşılaştırma yapmak üzere Rassal Orman modeli de kurulmuştur. Sonuçlar göstermektedir ki denetimsiz öğrenme yöntemleri arasında en iyi performansı Geri Çağırma= 0.98, Kesinlik=0.68 ve F1 Skoru=0.81 olmak üzere Tek Sınıflı Destek Vektör Makineleri göstermiştir. Buna karşın, Rassal Orman Modeli ise Tek Sınıflı Destek Vektör Makineleri modelinden daha başarılı bir performans göstererek Geri Çağırma=0.95, Kesinlik=1.00 ve F1=0.97 skorlarını elde etmiştir.

Özet (Çeviri)

Fraud Detection has gained importance in the last few years due to its cost to the economy and the population in general. However, there are a number of important problems in the modeling process to tackle when detecting fraud. One is the availability of data. Since the financial data produced by the customers is subject to privacy rules, working with synthetic data is a necessity. While this is the case, there are very few data sets that reflect the true nature of the data generation and analysis processes of financial transactions. Another problem is that the fraud or any data that require anomaly detection do not have labeled data. Even labeled, the data points are labeled by rules and there is a need to automate this process. This is why it is deemed important to incorporate an unsupervised collection of methods and let the data speak for itself. For these reasons, this study focuses on the unsupervised learning methods in fraud detection using a synthetic data set which consists of credit card transactions. The learning methods used were the Autoencoders, Sparse Autoencoders, One-Class Support Vector Machines and Isolation Forests. For comparison, a Random Forest Model was also built. It was found that among the unsupervised methods One-Class SVM was the best performing model with Precision=0.68, Recall=0.98, and F1 Score=0.81. However, One-Class SVM did not outperform the supervised Random Forest model which achieved Precision=1.00, Recall=0.95, and F1-Score=0.97.

Benzer Tezler

  1. Denetimsiz öğrenme ile kredi kartı kopyalama noktalarının tespit edilmesi

    Point of compromise detection with unsupervised learning

    FUAT ÖGME

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MİNE ELİF KARSLIGİL YAVUZ

  2. Akan verilerde anomali tespiti için hibrit tekniklere dayalı bir yöntem tasarımı ve gerçekleştirimi

    Design and implementation of a method based on hybrid techniques for anomaly detection in streaming data

    ERCAN GÜNBİLEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HASAN BULUT

    DR. ÖĞR. ÜYESİ ZÜLEYHA AKUSTA DAĞDEVİREN

  3. Kara para aklamanın önlenmesi için derin öğrenme

    Deep learning for anti money laundering

    MERT YILMAZ ÇAKIR

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. YAHYA ŞİRİN

  4. Çekişmeli üretici ağlar ile sentetik veri üretiminin kredi kartı sahtekarlığı tespitine etkisi

    The effect of synthetic data generation with generative adversarial networks on credit card fraud detection

    ENSAR BAYHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MİNE ELİF KARSLIGİL YAVUZ

  5. İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti

    Anomaly detection with machine learning on air conditioning systems

    REFİK KİBAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK

    DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR