Machine learning based for insurance claims fraud detection technique for safeguarding the health industry
Sağlık sektörünü koruma amaçlı makine eğitimi tabanlı sigorta talep dolandırıcılığı tespit tekniği
- Tez No: 888782
- Danışmanlar: PROF. RAFET AKDENİZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Makine Öğrenimi, Sigorta Talepleri, Dolandırıcılık Tespiti, Açıklanabilir Yapay Zeka, SHAP, Machine Learning, Insurance Claims, Fraud Detection, Explainable AI, SHAP
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İstanbul Aydın Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 85
Özet
Sigorta talepleri sahtekarlığı, bireyler veya gruplar, sigorta şirketlerini yasal olarak hak sahibi olmadıkları menfaatleri veya ödemeleri almaları için bilerek yanılttığında ortaya çıkar. Hayat, sağlık, araç ve mülk sigortası gibi çeşitli sigorta ürünleriyle ilgili olarak, bu tür dolandırıcılık birçok farklı biçimde olabilir. Dünyadaki sağlık sistemlerinin bütünlüğü, sağlık sigortası talep sahtekarlığı nedeniyle ciddi şekilde tehdit altındadır ve bu da finans sektöründe çok fazla zarara neden olabilir ve hasta tedavisini aşabilir. Bu araştırmada amaç, sağlık sigortası taleplerinde sahtekarlığı tespit etmek ve önlemek için Makine Öğrenimini ve Açıklanabilir Yapay Zekayı (XAI) kullanmaktır. Ayrıca, şeffaflığı ve güveni sağlamak için, tespit sürecinin anlaşılmasına ve doğrulanmasına yardımcı olacak kararların nasıl alındığına dair ayrıntılı açıklamalar sağlayın. Kaggle'ın Medicare veri kümesini yatan hasta, ayakta tedavi, yararlanıcı ve hedef veriler olmak üzere dört ana dosyayla kullanarak entegre bir veri kümesi oluşturulur. Bu veri kümesi, amacın sağlık hizmeti sağlayıcılarını hileli olarak sınıflandırmak olduğu denetimli sınıflandırma sorunlarının temelidir. Eğitim için lojistik regresyon (LR), rastgele orman (RF), karar ağacı (DT), destek vektör makinesi (SVM) ve XGBoost dahil olmak üzere çeşitli makine öğrenimi algoritmaları kullanılmıştır. Ek olarak, tüm modelleri daha güçlü bir modelde birleştirmek için sert ve yumuşak oylama topluluğu öğrenme teknikleri kullanılır. Ayrıca, özellik seçimi yaklaşımı, modelin performansını iyileştirmek ve sonuçları karşılaştırmak için kullanılır. Ek olarak, çalışma, yapay sinir ağlarının, özellikle derin öğrenmenin, sağlık sigortası taleplerinde sahtekarlığı tespit etmedeki etkinliğini araştırmaktadır. Özellikle, lojistik regresyon, yüksek doğruluk, F1 puanları ve AUC puanları sergileyen yüksek performanslı bir algoritma olarak görünür. Bu araştırmada, lojistik regresyon tahmininin anlaşılmasını geliştiren bir model yorumlama tekniği olan SHapley Katkı açıklaması (SHAP) kullanılarak daha da gösterilmiştir.
Özet (Çeviri)
Insurance claims fraud occurs when individuals or groups knowingly mislead insurance companies to get benefits or payments to which they are not legally entitled. Regarding various insurance products, like life, health, vehicle, and property insurance, this type of fraud can take many different forms. The integrity of healthcare systems around the world is seriously threatened by healthcare insurance claims fraud, which can make a lot of losses in the financial sector and subpar patient treatment. In this research the aim is to use Machine Learning and Explainable AI (XAI) to detect and prevent fraud in healthcare insurance claims. Also, to ensure transparency and confidence, provide detailed explanations of how decisions are made, which will aid in understanding and validating the detection process. By using Medicare dataset from Kaggle with four main files namely, inpatient, outpatient, beneficiary, and target data, an integrated dataset is created This dataset is basis for supervised classification problems, where the objective is to classify health care providers as fraudulent or not. Several machine learning algorithms have been used for training, including logistic regression (LR), random forest (RF), decision tree (DT), support vector machine (SVM), and XGBoost. In addition, hard and soft voting ensemble learning techniques are used to combine all the models into more powerful model. Also, the feature selection approach is used to enhance model performance and to compare the results. Additionally, the study investigates the effectiveness of artificial-neural networks, particularly deep learning, in detecting fraud in health insurance claims. Notably, logistic regression appears as a high-performance algorithm, exhibiting high accuracy, F1 scores, and AUC scores. In this research is further illustrated using the SHapley Additive explanation (SHAP), which is a model interpretation technique that enhances the understanding of logistic regression prediction.
Benzer Tezler
- Stratejik yönetim perspektifinden sigortacılık sektöründe makine öğrenmesi algoritmaları ile anomali tespiti
An application of machine learning to anomaly detection in insurance industry using strategic management approach
AYŞE NURBANU ŞAHAN
Yüksek Lisans
Türkçe
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. TOLGA KAYA
- Türk sigorta sektöründe kullanılan yeni dijital teknolojiler (Insurtech)
New digital technologies used in Turkish insurance sector (Insurtech)
PINAR AYDEMİR
Doktora
Türkçe
2023
Sigortacılıkİstanbul Ticaret ÜniversitesiSigortacılık ve Risk Yönetimi Ana Bilim Dalı
PROF. DR. ÜNAL HALİT ÖZDEN
- İnteraktif makine öğrenmesi kullanılarak, aktör-metâ ilişkisinin analizi ile sağlık geri ödeme sistemlerinde proaktif suistimal tespiti modeli
An interactive machine-learning-based electronic fraud and abuse detection system in healthcare insurance
İLKER KÖSE
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET GÖKTÜRK
- Türkiye'de otomobil sigortası sahtekarlıklarının makine öğrenmesi yöntemleri ile tespit edilmesi
Detecting automobile insurance frauds in turkey using machine learning approaches
EZGİ GÜNBATAR
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri MühendisliğiHacettepe ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BARBAROS YET
- Car damage analysis for insurance market using convolutional neural networks
Sigorta sektörü için evrişimsel sinir ağları kullanarak araç hasarı analizi
CİHAT TOLGA ARTAN
Yüksek Lisans
İngilizce
2019
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. TOLGA KAYA