A data-mining based fraud detection system for health insurance companies
Sağlık sigortası şirketleri için veri madenciliği tabanlı suistimal tespit sistemi
- Tez No: 258531
- Danışmanlar: DOÇ. DR. MELİH KIRLIDOĞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: İngilizce
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 134
Özet
Sigortacılık tamamen risk ve olasılık üzerine çalışan bir sistemdir. Sigorta şirketleri kaza, hastalık ve buna benzer durumlar yüzünden insanların uğrayacağı maddi kayıpların riskini üstlendiklerini kabul ederler. Bu maddi kayıpların riskini üstlenmelerine karşılık müşterilerinden aylık belirli bir ücret alırlar. Bu ücrete sigorta primi denir. Sağlık sigortalıcılığı da aynı şekilde çalışır. Sigorta şirketi her ay sigorta primi ödeme karşılığında böbrek nakli, kanser tedavisi gibi sağlık sorunları sebebiyle oluşacak finansal riskleri üstlendiğini kabul eder.Sağlık sektörünün en büyük problemi suistimallerdir. Sağlık suistimalleri, kişilerin veya kurumların haksız kazanç sağlamak adına kasıtlı olarak yaptıkları hile , yanlış beyan ve benzeri sahtekarlıklardır. Sigorta sistemine müşteri olarak giren insanların sayısının çok artması ile tıbbi suistimallerin sağlık sigorta sektörüne verdiği zarar gittikçe büyümektedir. 2007 yılında Amerika'da 4 milyar hasar sağlık sigorta şirketlerine gelmiş ve 2.26 trilyon dolar sağlık sektöründe harcanmıştır. Bu hasarların bir kısmının hileli olduğu tartışılmaz bir gerçektir. Bu hileli hasarlar tüm hasarlar göz önünde tutulduğunda az bir orana sahip olsalar da büyük bir maliyete sahiptirler. Sonuç olarak sağlık sigortacılığı sektörü suistimal tespit sistemine ihtiyaç duymaktadır.Bu araştırmada sağlık sigorta şirketleri için veri madenciliği tabanlı suistimal tespit sistemi incelenmektedir. Bu sistem için öncelikle bir veri tabanı geliştirilmiştir. Sağlık sigorta sisteminden tüm kayıtlar bu veri tabanına aktarılmıştır. İncelemek üzere sağlık sigortacılığında üç suistimal tipi belirlenmiştir. Bunlar sigorta şirketinin ödemesi gereken miktardan daha fazla ödeme yapılan hasarlar, dört gün öncesine kadar doktor muayenesi ya da ameliyatı olmayan ilaç alımları ve ortalama vaka fiyatı, tüm sağlık merkezlerinin ortalamasından fazla olan ya da sigortalılara elden ödenen hasarların ortalamasının tüm sağlık merkezlerince sigortalılara elden ödenen hasarların ortalamasından fazla olan sağlık merkezleridir. Son suistimal tipinde sağlık merkezleri hastane ve eczane diye ayrılıp, her biri için ayrı model geliştirilmiştir. Daha sonra tek sınıflı destek vektör makineleri tabanlı suistimal tespit modelleri farklı kernel fonksiyonları ile şüpheli kayıt içermeyen veriler üzerinde oluşturulmuştur. Kullanılan kernel fonksiyonları da linear ve Gaussian kernel fonksiyonlarıdır. Bu modeler üretildikten sonra tamamı veri tabanında bulunan tüm kayıtlar üzerinde çalıştırılmıştır. Bu modellerin oluşturulmasında ve veri tabanının tamamı üzerinde çalıştırılmasında Oracle şirketinin veri madenciliği için geliştirdiği araç kullanılmıştır. Linear kernel fonksiyon tabanlı modellerin birinci ve ikinci suistimal tipleri için , Gaussian kernel fonksiyon tabanlı modelin de üçüncü suistimal tipi için uygun olduğu görülmüştür. Deneysel sonuçlar önerilen sistemin şüpheli kayıtlar üzerinde uygulandığında etkili sonuçlar verdiğini göstermektedir.
Özet (Çeviri)
Insurance is all about risk and probabilities. With insurance, insurance company agrees to assume risk of incurring serious financial loss due to an accident, illness, bad luck, or other specified means. In exchange for this service, the insurance company charges their insured monthly premiums to help offset the cost of protecting him against this potential financial loss. Health insurance works the same way. Every month, insured pays a premium. In exchange for this premium, insurance company agrees to assume the financial risk if, for example, insured requires a kidney transplant or takes medical treatment.The biggest problem of the health insurance sector is medical fraud and abuse. Health care fraud is an intentional deception or misrepresentation that the individual or entity makes knowing that the misrepresentation could result in some unauthorized benefit to the individual, or the entity or to some other party. With the increasing number of insured people, medical fraud began to compose great damage to the sector. In 2007, $2.26 trillion was spent on health care and more than 4 billion health insurance claims were processed in the United States. It is an undisputed reality that some of these health insurance claims are fraudulent. Although they constitute only a small fraction, those fraudulent claims carry a very high price tag. Because of this health insurance sector needs a fraud detection system.In this research a fraud detection system based on data mining for health insurance companies is presented. First of all a new database was created. Huge data from health insurance system were then imported to the database. Three health insurance fraud types were determined to investigation. These are claims whose paid amount is greater than its invoice amount that insurance company will pay, transactions which is medicine taking without doctor inspection or surgical operation in four days, and health centers whose average incident cost bigger than the average incident cost of all health centers and rate of the payment to directly insured is bigger than the average payment to directly insured rate of all health centers. In last fraud type, health centers were separated into two types as hospital and pharmacy, and models were created for both of them. Fraud detection models based on one class support vector machine algorithm with different kernel function were created on non suspicious data. Kernel functions that were used to create these models are Linear and Gaussian kernel functions. After creating the models, they are applied to the whole data. Oracle data mining tool is used to create and apply model. It was seen that linear kernel function based models are suitable for first and second fraud types and Gaussian kernel function based model is suitable for third fraud type. Experimental results show that the proposed system gave effective results when applied to suspicious data sets.
Benzer Tezler
- İnteraktif makine öğrenmesi kullanılarak, aktör-metâ ilişkisinin analizi ile sağlık geri ödeme sistemlerinde proaktif suistimal tespiti modeli
An interactive machine-learning-based electronic fraud and abuse detection system in healthcare insurance
İLKER KÖSE
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET GÖKTÜRK
- Detection of debit card fraud through random forest
ATM kartı hilelerinin rastgele orman yöntemi ile tespiti
KASIM AKSOY
Yüksek Lisans
İngilizce
2017
BankacılıkDoğuş ÜniversitesiMühendislik ve Teknoloji Yönetimi Ana Bilim Dalı
PROF. DR. MESUT KUMRU
- Developing an artificial intelligence based system to detect fraud in credit card transactions
Başlık çevirisi yok
ALI ABDULSALAM HUSSEIN HUSSEIN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. OĞUZ KARAN
- Yapay bağışıklık sistem tabanlı algoritma ile aykırı değer tespiti
Outlier detection by using an artificial immune system-based algorithm
MEHMET GÜÇLÜ
Yüksek Lisans
Türkçe
2012
Bilim ve TeknolojiYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BANU DİRİ
- Kural tabanlı şüpheli işlem önleme sistemlerinde kullanılmak üzere çizge veritabanı modeli önerisi
A graph database model proposal for use in rule based fraud transaction prevention systems
BAHADIR ESAD DEMİR
Yüksek Lisans
Türkçe
2024
BankacılıkSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ VEYSEL HARUN ŞAHİN