Geri Dön

Machine learning based for insurance claims fraud detection technique for safeguarding the health industry

Sağlık sektörünü koruma amaçlı makine eğitimi tabanlı sigorta talep dolandırıcılığı tespit tekniği

  1. Tez No: 888782
  2. Yazar: GHİNA ÖZDEMİR
  3. Danışmanlar: PROF. RAFET AKDENİZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Makine Öğrenimi, Sigorta Talepleri, Dolandırıcılık Tespiti, Açıklanabilir Yapay Zeka, SHAP, Machine Learning, Insurance Claims, Fraud Detection, Explainable AI, SHAP
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: İstanbul Aydın Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 85

Özet

Sigorta talepleri sahtekarlığı, bireyler veya gruplar, sigorta şirketlerini yasal olarak hak sahibi olmadıkları menfaatleri veya ödemeleri almaları için bilerek yanılttığında ortaya çıkar. Hayat, sağlık, araç ve mülk sigortası gibi çeşitli sigorta ürünleriyle ilgili olarak, bu tür dolandırıcılık birçok farklı biçimde olabilir. Dünyadaki sağlık sistemlerinin bütünlüğü, sağlık sigortası talep sahtekarlığı nedeniyle ciddi şekilde tehdit altındadır ve bu da finans sektöründe çok fazla zarara neden olabilir ve hasta tedavisini aşabilir. Bu araştırmada amaç, sağlık sigortası taleplerinde sahtekarlığı tespit etmek ve önlemek için Makine Öğrenimini ve Açıklanabilir Yapay Zekayı (XAI) kullanmaktır. Ayrıca, şeffaflığı ve güveni sağlamak için, tespit sürecinin anlaşılmasına ve doğrulanmasına yardımcı olacak kararların nasıl alındığına dair ayrıntılı açıklamalar sağlayın. Kaggle'ın Medicare veri kümesini yatan hasta, ayakta tedavi, yararlanıcı ve hedef veriler olmak üzere dört ana dosyayla kullanarak entegre bir veri kümesi oluşturulur. Bu veri kümesi, amacın sağlık hizmeti sağlayıcılarını hileli olarak sınıflandırmak olduğu denetimli sınıflandırma sorunlarının temelidir. Eğitim için lojistik regresyon (LR), rastgele orman (RF), karar ağacı (DT), destek vektör makinesi (SVM) ve XGBoost dahil olmak üzere çeşitli makine öğrenimi algoritmaları kullanılmıştır. Ek olarak, tüm modelleri daha güçlü bir modelde birleştirmek için sert ve yumuşak oylama topluluğu öğrenme teknikleri kullanılır. Ayrıca, özellik seçimi yaklaşımı, modelin performansını iyileştirmek ve sonuçları karşılaştırmak için kullanılır. Ek olarak, çalışma, yapay sinir ağlarının, özellikle derin öğrenmenin, sağlık sigortası taleplerinde sahtekarlığı tespit etmedeki etkinliğini araştırmaktadır. Özellikle, lojistik regresyon, yüksek doğruluk, F1 puanları ve AUC puanları sergileyen yüksek performanslı bir algoritma olarak görünür. Bu araştırmada, lojistik regresyon tahmininin anlaşılmasını geliştiren bir model yorumlama tekniği olan SHapley Katkı açıklaması (SHAP) kullanılarak daha da gösterilmiştir.

Özet (Çeviri)

Insurance claims fraud occurs when individuals or groups knowingly mislead insurance companies to get benefits or payments to which they are not legally entitled. Regarding various insurance products, like life, health, vehicle, and property insurance, this type of fraud can take many different forms. The integrity of healthcare systems around the world is seriously threatened by healthcare insurance claims fraud, which can make a lot of losses in the financial sector and subpar patient treatment. In this research the aim is to use Machine Learning and Explainable AI (XAI) to detect and prevent fraud in healthcare insurance claims. Also, to ensure transparency and confidence, provide detailed explanations of how decisions are made, which will aid in understanding and validating the detection process. By using Medicare dataset from Kaggle with four main files namely, inpatient, outpatient, beneficiary, and target data, an integrated dataset is created This dataset is basis for supervised classification problems, where the objective is to classify health care providers as fraudulent or not. Several machine learning algorithms have been used for training, including logistic regression (LR), random forest (RF), decision tree (DT), support vector machine (SVM), and XGBoost. In addition, hard and soft voting ensemble learning techniques are used to combine all the models into more powerful model. Also, the feature selection approach is used to enhance model performance and to compare the results. Additionally, the study investigates the effectiveness of artificial-neural networks, particularly deep learning, in detecting fraud in health insurance claims. Notably, logistic regression appears as a high-performance algorithm, exhibiting high accuracy, F1 scores, and AUC scores. In this research is further illustrated using the SHapley Additive explanation (SHAP), which is a model interpretation technique that enhances the understanding of logistic regression prediction.

Benzer Tezler

  1. Stratejik yönetim perspektifinden sigortacılık sektöründe makine öğrenmesi algoritmaları ile anomali tespiti

    An application of machine learning to anomaly detection in insurance industry using strategic management approach

    AYŞE NURBANU ŞAHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. TOLGA KAYA

  2. Türk sigorta sektöründe kullanılan yeni dijital teknolojiler (Insurtech)

    New digital technologies used in Turkish insurance sector (Insurtech)

    PINAR AYDEMİR

    Doktora

    Türkçe

    Türkçe

    2023

    Sigortacılıkİstanbul Ticaret Üniversitesi

    Sigortacılık ve Risk Yönetimi Ana Bilim Dalı

    PROF. DR. ÜNAL HALİT ÖZDEN

  3. İnteraktif makine öğrenmesi kullanılarak, aktör-metâ ilişkisinin analizi ile sağlık geri ödeme sistemlerinde proaktif suistimal tespiti modeli

    An interactive machine-learning-based electronic fraud and abuse detection system in healthcare insurance

    İLKER KÖSE

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET GÖKTÜRK

  4. Türkiye'de otomobil sigortası sahtekarlıklarının makine öğrenmesi yöntemleri ile tespit edilmesi

    Detecting automobile insurance frauds in turkey using machine learning approaches

    EZGİ GÜNBATAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri MühendisliğiHacettepe Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BARBAROS YET

  5. Car damage analysis for insurance market using convolutional neural networks

    Sigorta sektörü için evrişimsel sinir ağları kullanarak araç hasarı analizi

    CİHAT TOLGA ARTAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TOLGA KAYA