Federated learning for credit card fraud detection: A privacy-preserving approach with controlled noise integration
Kredi kartı dolandırıcılığı tespiti için federated learning: Kontrollü gürültü entegrasyonu ile gizlilik koruyucu yaklaşım
- Tez No: 934224
- Danışmanlar: DR. ÖĞR. ÜYESİ MURAT SARAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Çankaya Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilişim Teknolojileri Bilim Dalı
- Sayfa Sayısı: 87
Özet
E-ödeme teknolojisinin hızla artmasıyla birlikte, kartlar önemli araçlardan biri olarak öne çıkmaktadır. Ancak, bu büyüme dolandırıcılık saldırılarının riskini de beraberinde getirerek ilgili tarafların zarar görmesine ve kayıplar yaşamasına neden olabilir. Bankalar, varlıklarını korumak ve düzenleyici kurallara uymak için güçlü dolandırıcılık tespit sistemleri kurmayı hedeflemektedir. Bu nedenle, güvenlik ve bütünlük gereksinimlerini karşılayan bir model geliştirmek kritik öneme sahiptir. Bu araştırma projesinde, Derin Sinir Ağı (DNN) ve AdaBoost ile topluluk öğrenimi gibi gelişmiş Makine Öğrenimi (ML) modelleri tanıtılarak, veri setlerindeki dengesiz yapıyı dengeleme yöntemleriyle dolandırıcılık tespit edilmiştir. Ayrıca, veri gizliliğini koruyarak bankalar arasında Federated Learning (FL) aracılığıyla iş birliği içinde öğrenme kolaylaştırılmıştır. Bu çalışmada, FL modeli, öğrenme sürecini sabote etmeye çalışan bankaların kötü niyetli eylemlerine karşı dayanıklılığı değerlendirmek için farklı oranlarda etiket tersine çevirme saldırılarına karşı test edilmiştir. Modeller, bir Irak bankasından alınan gerçek bir veri seti ve tanınmış Kaggle kredi kartı veri seti üzerinde test edilmiştir. Yöntemlerin tüm yönlerini kapsayacak bir dizi performans metriği ile değerlendirilmiştir. Sonuçlar, Random Forest (RF) ve AdaBoost ile topluluk öğreniminin her iki veri setinde de dikkate değer bir performans sergilediğini göstermiştir. Ayrıca, FL cosine tabanlı yöntem, mevcut Federated Average yönteminden daha iyi sonuçlar vermiştir. Son olarak, RF+AdaBoost ile FL cosine birleşimini içeren önerilen yaklaşım, özel bir banka veri setinde doğrulama yapıldığında %96.47 doğruluk ve %94.58 geri çağırma oranı ile mevcut yöntemi geride bırakmıştır. Bu çalışma, dolandırıcılık tespiti alanında gerçek veri setlerinin eksikliğini ele alarak akademik literatüre katkıda bulunmuştur.
Özet (Çeviri)
With the rapid increase in e-payment technology, cards are present as one of the essential tools. However, with this growth comes a risk of fraudulent attacks that may cause involved parties' losses and damage. Banks aim to establish strong fraud detection systems to protect assets and obey regulator rules. Therefore, developing a model that copes with security and integrity requirements is crucial. This research project introduced advanced Machine Learning (ML) models, such as Deep Neural Network (DNN) and ensemble learning with AdaBoost, to detect fraud while addressing the skewed nature of datasets using balancing methods. Additionally, it facilitates collaborative learning among banks using Federated Learning (FL) while preserving data privacy. In this study, the FL model was tested against various percentages of label-flip attacks to evaluate resilience against malicious acts by banks trying to sabotage the learning process. The models were tested on two datasets: a real dataset from an Iraqi bank and the known Kaggle creditcard dataset. Models were assessed on a set of performance metrics to cover all aspects of the methods. Results showed that ensemble learning with Random Forest (RF) and AdaBoost achieved remarkable performance across both datasets. Moreover, the FL cosine-based worked better than the existing Federated Average method. Lastly, the proposed approach combining RF+AdaBoost with FL cosine aggregation surpassed the existing method when validated on a private bank dataset achieving 96.47% accuracy and 94.58% recall. The present study contributed to the academic literature by addressing the lack of real datasets in the fraud detection domain.
Benzer Tezler
- Finans alanında veri mahremiyeti yöntemleri: Federe öğrenme ve sentetik veri üretimi
Data privacy methods in finance: Federated learning and synthetic data generation
ELİF ÖZCAN
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
- Comparative study of federated learning for credit risk assessment and fairness evaluation
Federe öğrenmenin karşılaştırmalı çalışması: Kredi risk değerlendirmesi ve adalet ölçümü
MUSTAFA AKTAŞ
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
DR. RUŞEN HALEPMOLLASI
- Privacy and security enhancements of federated learning
Federe öğrenme uygulamalarında mahremiyet ve güvenlik geliştirmeleri
ŞÜKRÜ ERDAL
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
PROF. DR. ENVER ÖZDEMİR
DR. FERHAT KARAKOÇ
- Görüntü dönüştürücüler kullanılarak retina hastalıklarının tespiti için federe öğrenme
Federated learning for retinal disease detection using vision transformers
SAİD AKÇA
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEYNEP GARİP
DOÇ. DR. EKİN EKİNCİ
- Federated learning for customer digital on-boarding
Federe öğrenme ile yeni müşteri kabulü
SÜMEYRA TERZİOĞLU
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ FUAT ALKAYA