Medikal veri sınıflandırmada sentetik veri üretiminin etkisi
Effect of synthetic generation on medi̇cal data classification
- Tez No: 666299
- Danışmanlar: DR. ÖĞR. ÜYESİ ABDÜLKADİR GÜMÜŞÇÜ
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Harran Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 58
Özet
Veri madenciliği, son yıllarda birçok alanda yaygın olarak kullanılmaktadır. Veri sınıflandırmalarında, örnek sayıların sınıflara göre eşit dağılımı çok önemlidir. Ancak, bazı durumlarda veri setinde yer alan sınıflar eşit dağılıma sahip olmayabilir. Özellikle veri oluşturma aşamasında zorluk yaşanan medikal veri setleri bu probleme verilecek örnekler arasında yer almaktadır. Bu gibi durumlarda, sınıflandırma başarı parametreleri olumsuz yönde etkilenir. Bu soruna bir çözüm olarak, yeni sentetik veri örnekleri üretilerek veri seti dengeli bir hale getirilebilir. Bu çalışmada tıbbi rahatsızlıklara ait nümerik, kategorik ve hem nümerik hem de kategorik olan veri setlerinin sınıflandırılmasında dengesiz veriyi oluşturma yöntemlerinin etkisi tartışılmıştır. Bu veri setlerine ait dengesizlik problemleri iki farklı sentetik örnekleme yaklaşımı yöntemi uygulanarak çözümlenmiştir. Veri setine, sentetik örnekleme yaklaşımı yöntemleri uygulandıktan sonra, Karar Ağacı (KA) ve K- En Yakın Komşuluk (KEYK) sınıflandırma yöntemleri uygulanmıştır. Böylelikle, sentetik veri üretiminin farklı veri türleri üzerindeki etkisi gözlemlenmiştir. Sonuçlar incelendiğinde; sadece kategorik ve hem kategorik hem sayısal veri tipine sahip veri setlerinde en başarılı sonuçların Sentetik Azınlık Aşırı Örnekleme Tekniği (SAAÖT) algoritmasında KA sınıflandırılmasında, sadece numerik veri setinde en başarılı sonucun ise Uyarlamalı Sentetik Örnekleme (USÖ) algoritmasında, k en yakın komşuluk sınıflandırılmasında elde edildiği gözlemlenmiştir.
Özet (Çeviri)
Data mining has been widely used in many areas in recent years. In data classification, equal distribution of sample numbers according to classes is very important. However, in some cases, the classes in the data set may not be equally distributed. Medical datasets, which have difficulties especially in data generation, are among the examples to be given to this problem. In such cases, the classification success parameters are adversely affected. As a solution to this problem, the data set can be balanced by producing new synthetic data samples. In this study, the effect of synthetıc generation on medical data classifıcation of numerical, categorical and both numerical and categorical data sets of medical diseases are discussed. The imbalance problems of these data sets have been solved by applying two different adaptive synthetic sampling approach methods. After the adaptive synthetic sampling approach methods were applied to the data set, Decision Tree (DT) and K-Nearest Neighbors (KNN) classification methods were applied. Thus, the effect of synthetic data generation on different data types has been observed. When the results are examined; It was observed that the most successful results were obtained in the decision tree classification in the Synthetic Minority Oversampling Technique (SMOTE) algorithm in the data sets with only categorical and both categorical and numerical types, and the most successful result in only the numerical data set was obtained in the Adaptive Synthetic Sampling Method (ADASYN) algorithm and k nearest neighbors classification.
Benzer Tezler
- Experimental investigation of singular sources method for microwave imaging
Tekil kaynaklar yöntemiyle mikrodalga görüntülemenin deneysel olarak incelenmesi
TUĞHAN ÇAĞLAYAN
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ÇAYÖREN
- Yenidoğan yoğun bakım üniteleri için termal görüntü analizi
Thermal image analysis for neonatal intensive care units
DUYGU SAVAŞCI
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik MühendisliğiKonya Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT CEYLAN
- Machine learning based augmentation of medical microwave imaging
Medikal mikrodalga görüntülemenin makine öğrenmesiyle iyileştirilmesi
MERVE KAPLAN ŞAFAK
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÇAYÖREN
- Derin öğrenme tabanlı şiddetli farenjit tespiti
Deep learning based severe pharyngitis detection
TUĞBA TAK
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN KUTUCU
- Vascular segmentation of brain MR angiography images using convolutional neural networks
Evrişimsel sinir ağları kullanarak beyin MR anjiyografi görüntülerinin vasküler segmentasyonu
YUSUF HÜSEYİN ŞAHİN
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. GÖZDE ÜNAL