Geri Dön

Makine öğreniminde sınıflandırma yöntemleri kullanılarak ulaşım kartı suistimalinin tespit edilmesi

Detection of transportation card fraud by classification method in machine learning

  1. Tez No: 783228
  2. Yazar: SERHAT DEMİRTÜRK
  3. Danışmanlar: DOÇ. DR. EMRE DÜNDER
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Ondokuz Mayıs Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 84

Özet

Makine öğrenimi günümüzde hem bilim dünyasında hem de iş dünyasında birçok problemin çözülmesine somut ve hızlı çözümler üretmekte olup, yeni neden sonuç ilişkilerinin ortaya çıkmasına katkı sağlamaktadır. Bu nedenle son yıllarda makine öğreniminin kullanımı giderek yaygınlaşmış ve popüler bir bilim haline gelmiştir. Günümüzde ise ödeme sistemlerinde yaşanan birtakım gelişmeler yeni problemlerin ortaya çıkmasına neden olmuştur ve olmaya devam etmektedir. Bahsi geçen problemlerin başında akıllı kartlarda meydana gelen suistimaller yer almaktadır. Bu çalışmada da akıllı kart olarak nitelendirilen ulaşım kartlarında yapılan suistimaller incelenerek literatürde en sık kullanılan sınıflandırma algoritmaları kullanılmış ve bu algoritmaların sınıflandırma performansları karşılaştırılarak en iyi algoritmaya göre değişkenlerin önem seviyeleri değerlendirilmiştir. Kullanılan algoritmalar ise, Karar Ağaçları, Rastgele Ormanlar, Destek Vektör Makineleri, Lojistik Regresyon, Naif Bayes, Adaboost, XGBoost, K-En Yakın Komşu ve Yapay Sinir Ağlarından Derin Öğrenme algoritmalarıdır. Bu algoritmaların sınıflandırma performanslarının ölçümünde doğruluk, MCC, F1 ölçütü ve AUC ölçütleri kullanılmıştır. Yine, bu çalışmada öncelikli olarak tüm değişkenlerin veri seti üzerindeki dağılımları ve nümerik değişkenlerin normal dağılım durumları incelenmiş, normal dağılım göstermeyen nümerik değişkenlere logaritmik dönüşüm uygulanmıştır. Çalışmada değişken seçme yöntemlerinden Boruta yöntemi tercih edilmiş ve bu yönteme göre bütün değişkenler anlamlı bulunmuştur. Bütün değişkenler modele dahil edilmeden önce bu değişkenler üzerinde 10 katlı çapraz geçerlilik uygulanmış ve veri setinde yer alan tüm değişkenler çalışmaya konu olan tüm makine öğrenimi algoritmalarına dahil edilmiştir. Tüm bu hususlar neticesinde XGBoost algoritmasının diğer algoritmalara göre daha yüksek doğruluk derecesine sahip olduğu gözlenmiştir. XGBoost algoritmasının doğruluk derecesi 0,881, MCC değeri 0,750, AUC değeri 0,953 ve F1 ölçütü de 0,875 olarak ölçülmüştür. Bu sonuca göre XGBoost algoritmasının doğruluk derecesinin en yüksek olması ve orta düzeyde model başarısına sahip olması nedeniyle ulaşım kartı suistimalinin tespit edilmesinde en başarılı sınıflandırıcı olduğu gözlenmiştir.

Özet (Çeviri)

Today, machine learning produces concrete and fast solutions to solving many problems both in the scientific world and in the business world, and contributes to the emergence of new cause-effect relationships. Therefore, in recent years, the use of machine learning has become increasingly widespread and has become a popular science. Today, some developments in payment systems have led to the emergence of new problems and continue to do so. At the beginning of the aforementioned problems is the abuse of smart cards. In this study, the most frequently used classification algorithms in the literature were used by examining the abuses made in the transportation cards, which are described as smart cards, and the classification performances of these algorithms were compared and the importance levels of the variables were evaluated according to the best algorithm. The algorithms used are Decision Trees, Random Forests, Support Vector Machines, Logistic Regression, Naive Bayes, Adaboost, XGBoost, K-Nearest Neighbor and Deep Learning algorithms from Artificial Neural Networks. Accuracy, MCC, F1 criteria and AUC criteria were used to measure the classification performance of these algorithms. Again, in this study, first of all, the distribution of all variables on the data set and the normal distribution of the numerical variables were examined, and the logarithmic transformation was applied to the numerical variables that did not show normal distribution. In the study, Boruta method was preferred among the variable selection methods and all variables were found significant according to this method. Before all variables were included in the model, 10-fold cross-validation was applied on these variables and all variables in the data set were included in all machine learning algorithms that were the subject of the study. As a result of all these issues, it has been observed that the XGBoost algorithm has a higher degree of accuracy than other algorithms. The accuracy of the XGBoost algorithm was 0,881, the MCC value was 0,750, the AUC value was 0,953, and the F1 criterion was 0,875. According to this result, it has been observed that XGBoost algorithm is the most successful classifier in detecting transportation card abuse, since it has the highest accuracy and moderate model success.

Benzer Tezler

  1. Ensemble based feature selection with hybrid model

    Hibrit modeli ile topluluk temelli öznitelik seçimi

    CEYLAN DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İZZET GÖKSEL

    DOÇ. DR. SÜREYYA AKYÜZ

  2. Makine öğreniminde sıralayıcı ölçekteki verilerin sınıflandırma yöntemleri ile modellenmesi

    Modelling of ordinal scale by classification methods in machine learning

    İLKE GENÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikDokuz Eylül Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. ÖZGÜL VUPA ÇİLENGİROĞLU

  3. Perküsyon ve makine öğrenim yöntemleri kullanılarak beton nem seviyesini takibi

    Moisture tracking of concrete using percussion and machine learning methods

    ZEKİYE ŞEYMA TAMAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiSivas Cumhuriyet Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. YAVUZ TÜRKAY

  4. Comparison of feature selection and extraction methods and active learning in voice based emotion recognition systems

    Ses duygu tanıma sistemlerinde aktif öğrenme ve öznitelik seçme ve çıkarma yöntemlerinin karşılaştırılması

    TOLGA ATALAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF YASLAN

  5. A decision support system on packaging planning using machine learning algorithms: Industrial case study

    Paketleme planlaması için makine öğrenmesi algoritmaları kullanarak bir karar destek sistemi: Bir yan sanayi uygulaması

    BEGÜM ŞENER

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. FERHAN ÇEBİ