Credit card fraud detection with autoencoders, one-class SVMs and isolation forests
Otokodlayıcılar, tek sınıflı destek vektör makineleri ve izolasyon ormanları ile kredi kartı dolandırıcılığı tespiti
- Tez No: 844885
- Danışmanlar: PROF. DR. ÖZLEM İLK DAĞ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Dolandırıcılık tespiti, ekonomi ve genel popülasyon üzerinde yarattığı maliyetler sebebiyle, son yıllarda önem kazanmıştır. Ancak, dolandırıcılık tespiti yapılırken, modelleme süreçlerinde çözülmesi gereken birkaç problem söz konusudur. Bunlardan birincisi veriye erişebilirliktir. Şöyle ki, müşteriler tarafından üretilen veriler gizlilik kurallarına tabi olduklarından, yapay veri ile bir gerekliliktir. Ancak, finansal işlemlerin veri üretimi ve analiz süreçlerini yansıtan az sayıda veri bulunmaktadır. Dolandırıcılık tespitinde bir diğer nokta ise, verilerin etiketlenmemiş oluşudur. Hatta etiketlenmiş olsalar bile bu işlem kurallar aracılığıyla yürütüldüğünden bu sürecin otomatize edilmesi gerekmektedir. Bu nedenle denetimsiz öğrenme yöntemleri ile verinin kendi adına konuşmasına izin verilmesi önemlidir. Bu çalışma, bahsedilen bu nedenlerle, yapay kredi kartı verisi kullanarak, dolandırıcılık tespitinde kullanılan denetimsiz öğrenme yöntemlerine odaklanmaktadır. Kullanılan öğrenme yöntemleri Otokodlayıcılar, Seyrek Otokodlayıcılar, Tek Sınıflı Destek Vektör Makineleri ve İzolasyon Ormanları olup, karşılaştırma yapmak üzere Rassal Orman modeli de kurulmuştur. Sonuçlar göstermektedir ki denetimsiz öğrenme yöntemleri arasında en iyi performansı Geri Çağırma= 0.98, Kesinlik=0.68 ve F1 Skoru=0.81 olmak üzere Tek Sınıflı Destek Vektör Makineleri göstermiştir. Buna karşın, Rassal Orman Modeli ise Tek Sınıflı Destek Vektör Makineleri modelinden daha başarılı bir performans göstererek Geri Çağırma=0.95, Kesinlik=1.00 ve F1=0.97 skorlarını elde etmiştir.
Özet (Çeviri)
Fraud Detection has gained importance in the last few years due to its cost to the economy and the population in general. However, there are a number of important problems in the modeling process to tackle when detecting fraud. One is the availability of data. Since the financial data produced by the customers is subject to privacy rules, working with synthetic data is a necessity. While this is the case, there are very few data sets that reflect the true nature of the data generation and analysis processes of financial transactions. Another problem is that the fraud or any data that require anomaly detection do not have labeled data. Even labeled, the data points are labeled by rules and there is a need to automate this process. This is why it is deemed important to incorporate an unsupervised collection of methods and let the data speak for itself. For these reasons, this study focuses on the unsupervised learning methods in fraud detection using a synthetic data set which consists of credit card transactions. The learning methods used were the Autoencoders, Sparse Autoencoders, One-Class Support Vector Machines and Isolation Forests. For comparison, a Random Forest Model was also built. It was found that among the unsupervised methods One-Class SVM was the best performing model with Precision=0.68, Recall=0.98, and F1 Score=0.81. However, One-Class SVM did not outperform the supervised Random Forest model which achieved Precision=1.00, Recall=0.95, and F1-Score=0.97.
Benzer Tezler
- Denetimsiz öğrenme ile kredi kartı kopyalama noktalarının tespit edilmesi
Point of compromise detection with unsupervised learning
FUAT ÖGME
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MİNE ELİF KARSLIGİL YAVUZ
- Akan verilerde anomali tespiti için hibrit tekniklere dayalı bir yöntem tasarımı ve gerçekleştirimi
Design and implementation of a method based on hybrid techniques for anomaly detection in streaming data
ERCAN GÜNBİLEK
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HASAN BULUT
DR. ÖĞR. ÜYESİ ZÜLEYHA AKUSTA DAĞDEVİREN
- Kara para aklamanın önlenmesi için derin öğrenme
Deep learning for anti money laundering
MERT YILMAZ ÇAKIR
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. YAHYA ŞİRİN
- Çekişmeli üretici ağlar ile sentetik veri üretiminin kredi kartı sahtekarlığı tespitine etkisi
The effect of synthetic data generation with generative adversarial networks on credit card fraud detection
ENSAR BAYHAN
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MİNE ELİF KARSLIGİL YAVUZ
- İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti
Anomaly detection with machine learning on air conditioning systems
REFİK KİBAR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK
DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR