Geri Dön

A novel sampling technique and gradient boosting tree-based approach for cross-channel fraud detection

Kanallar arası dolandırıcılık tespiti için yeni bir örnekleme tekniği ve gradyan artırıcı ağaç tabanlı yaklaşım

  1. Tez No: 758798
  2. Yazar: UĞUR DOLU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ EMRE SEFER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Özyeğin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
  12. Bilim Dalı: Uygulamalı Veri Bilimi Bilim Dalı
  13. Sayfa Sayısı: 55

Özet

Yüzlerce finans kurumu üzerinde yapılan en son araştırmalara göre, bu kurumların sadece %26'sının kanallar arası dolandırıcılığı tespit etmek için atanmış bir ekibe sahip olduğu ortaya çıktı. Gelişen teknolojiler neticesinde dijital ortamlarda çeşitli dolandırıcılık yöntemleri ortaya çıkmıştır ve var olan yöntemler gelişmiştir. Sahte işlemler, direkt olarak müşteri memnuniyetine etki eder. Örneğin, 2020 yılında sadece Birleşik Krallıkta dolandırıcılık işlemlerinden ortaya çıkan toplam kayıp 1.26 milyar £'du. Bu çalışmada, kanallar arası sahtekarlıkları verimli bir şekilde tespit etmek için Gradient Boosting Tree (GBT) tabanlı bir yaklaşım uygulandı. Çalışmada önerilen yaklaşımın bir parçası olarak, modeli eğitmek ve dengesiz veri sorunlarının üstesinden gelmek için optimize edilmiş bir eğitim seti oluşturabilen bir algoritma geliştirdik. Bu çözüm, modelin değişen müşteri davranışından kaynaklanan bir diğer önemli sorun olan kavram kaymasını anlamasını kolaylaştırdı. Öznitelik mühendisliğinin bir parçası olarak var olan özniteliklere ek demografik, ekonomik ve davranışsal öznitelikleri entegre ederek GBT modelinin performansı arttırıldı. Hiper parametre optimizasyon yöntemleri, model i ̧cin en iyi parametrelerin bulunmasında kullanıldı. Dolandırıcılık tespit problemindeki bir diğer zorluk olan, dolandırıcılık açısından oldukça dengesiz olan gerçek bir bankacılık veri seti u ̈zerinde bu çalışmada geliştirilen kanallar arası dolandırıcılık tespit yönteminin performansı ölçüldü. Türkiye'nin önde gelen özel bankalarından birinin gerçek zamanlı ve tarihsel çapraz kanal işlemlerini puanlamak için eğitimli modelimizi kullanıyoruz. Bu çalışmanın sonucunda uygulanan yaklaşım, düşük bir yanlış pozitif oranıyla dolandırıcılık işlemleri nedeniyle bir ayda gerçekle ̧sen toplam kaybın neredeyse %75'ini yakalayabilir.

Özet (Çeviri)

The most recent research on hundreds of financial institutions uncovered that only 26% of them have a team assigned to detect cross-channel fraud. Due to the developing technologies, various fraud techniques have emerged and increased in digital environments. Fraud directly affects customer satisfaction. For instance, only in the UK, the total loss of fraud transactions was £1.26 billion in 2020. In this study, we come up with a Gradient Boosting Tree (GBT)-based approach to efficiently detect cross-channel frauds. As a part of our proposed approach, we developed an algorithm able to generate an optimized training set to train the model and overcome imbalanced data problems. This solution made it easier for the model to understand the concept drift, another major problem arising from changing customer behavior. We boost the performance of our GBT model by integrating additional demographic, economic, and behavioral features as a part of feature engineering. Hyperparameter tuning methods find the best parameters for the model. The cross-channel fraud detection performance of the model is evaluated on a real banking dataset which is highly imbalanced in terms of fraud which is another challenge in the fraud detection problem. We use our trained model to score real-time cross-channel transactions by a leading private bank in Turkey. As a result, our approach can catch almost 75% of total fraud loss in a month with a low false-positive rate and acceptable call count.

Benzer Tezler

  1. A robust gradient boosting model based on smote and near miss methods for intrusion detection in imbalanced data sets

    Saldırı tespit sistemleri için dengesiz veri setlerinde smote ve near mıss metotlarına dayalı güçlü gradyan artırma modeli

    AHMET OKAN ARIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÜLSÜM ÇİĞDEM ÇAVDAROĞLU

  2. Novel deep reinforcement learning algorithms for continuous control

    Sürekli kontrol için yeni derin pekiştirmeli öğrenme algoritmaları

    BATURAY SAĞLAM

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. SÜLEYMAN SERDAR KOZAT

  3. An approach for automatic building extraction from high resolution satellite images using shadow analysis and active contours model

    Gölge analizi ve aktif yükselti eğrileri modeli kullanarak yüksek çözünürlüklü uydu görüntülerinden otomatik bina çıkarımı için bir yaklaşım

    SALAR GHAFFARIAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA TÜRKER

  4. Uncertain linear equations

    Belirsiz denklem sistemleri

    MERT PİLANCI

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    PROF. DR. ORHAN ARIKAN

  5. Novel methods for SAR imaging problems

    SAR görüntüleme problemleri için yeni metodlar

    SALİH UĞUR

    Doktora

    İngilizce

    İngilizce

    2013

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ORHAN ARIKAN