Medikal veri sınıflandırmada sentetik veri üretiminin etkisi
Effect of synthetic generation on medi̇cal data classification
- Tez No: 666299
- Danışmanlar: DR. ÖĞR. ÜYESİ ABDÜLKADİR GÜMÜŞÇÜ
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Harran Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 58
Özet
Veri madenciliği, son yıllarda birçok alanda yaygın olarak kullanılmaktadır. Veri sınıflandırmalarında, örnek sayıların sınıflara göre eşit dağılımı çok önemlidir. Ancak, bazı durumlarda veri setinde yer alan sınıflar eşit dağılıma sahip olmayabilir. Özellikle veri oluşturma aşamasında zorluk yaşanan medikal veri setleri bu probleme verilecek örnekler arasında yer almaktadır. Bu gibi durumlarda, sınıflandırma başarı parametreleri olumsuz yönde etkilenir. Bu soruna bir çözüm olarak, yeni sentetik veri örnekleri üretilerek veri seti dengeli bir hale getirilebilir. Bu çalışmada tıbbi rahatsızlıklara ait nümerik, kategorik ve hem nümerik hem de kategorik olan veri setlerinin sınıflandırılmasında dengesiz veriyi oluşturma yöntemlerinin etkisi tartışılmıştır. Bu veri setlerine ait dengesizlik problemleri iki farklı sentetik örnekleme yaklaşımı yöntemi uygulanarak çözümlenmiştir. Veri setine, sentetik örnekleme yaklaşımı yöntemleri uygulandıktan sonra, Karar Ağacı (KA) ve K- En Yakın Komşuluk (KEYK) sınıflandırma yöntemleri uygulanmıştır. Böylelikle, sentetik veri üretiminin farklı veri türleri üzerindeki etkisi gözlemlenmiştir. Sonuçlar incelendiğinde; sadece kategorik ve hem kategorik hem sayısal veri tipine sahip veri setlerinde en başarılı sonuçların Sentetik Azınlık Aşırı Örnekleme Tekniği (SAAÖT) algoritmasında KA sınıflandırılmasında, sadece numerik veri setinde en başarılı sonucun ise Uyarlamalı Sentetik Örnekleme (USÖ) algoritmasında, k en yakın komşuluk sınıflandırılmasında elde edildiği gözlemlenmiştir.
Özet (Çeviri)
Data mining has been widely used in many areas in recent years. In data classification, equal distribution of sample numbers according to classes is very important. However, in some cases, the classes in the data set may not be equally distributed. Medical datasets, which have difficulties especially in data generation, are among the examples to be given to this problem. In such cases, the classification success parameters are adversely affected. As a solution to this problem, the data set can be balanced by producing new synthetic data samples. In this study, the effect of synthetıc generation on medical data classifıcation of numerical, categorical and both numerical and categorical data sets of medical diseases are discussed. The imbalance problems of these data sets have been solved by applying two different adaptive synthetic sampling approach methods. After the adaptive synthetic sampling approach methods were applied to the data set, Decision Tree (DT) and K-Nearest Neighbors (KNN) classification methods were applied. Thus, the effect of synthetic data generation on different data types has been observed. When the results are examined; It was observed that the most successful results were obtained in the decision tree classification in the Synthetic Minority Oversampling Technique (SMOTE) algorithm in the data sets with only categorical and both categorical and numerical types, and the most successful result in only the numerical data set was obtained in the Adaptive Synthetic Sampling Method (ADASYN) algorithm and k nearest neighbors classification.
Benzer Tezler
- Çekişmeli üretken ağlarla sentetik veri üretiminin model başarımını arttırmadaki etkisinin incelenmesi
Investigation of the effect of synthetic data generation with generative adversarial networks on model performance improvement
MUHAMMED MİRAC KOÇAR
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜRCAN ÇETİN
- Experimental investigation of singular sources method for microwave imaging
Tekil kaynaklar yöntemiyle mikrodalga görüntülemenin deneysel olarak incelenmesi
TUĞHAN ÇAĞLAYAN
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ÇAYÖREN
- Yenidoğan yoğun bakım üniteleri için termal görüntü analizi
Thermal image analysis for neonatal intensive care units
DUYGU SAVAŞCI
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik MühendisliğiKonya Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT CEYLAN
- Unet based segmentation in qualitative microwave imaging for breast cancer diagnosis
Meme kanseri tanisi için nitel mikrodalga görüntülemenin unet tabanli segmentasyonu
GİZEM ÜNER
Yüksek Lisans
İngilizce
2025
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÇAYÖREN
- Machine learning based augmentation of medical microwave imaging
Medikal mikrodalga görüntülemenin makine öğrenmesiyle iyileştirilmesi
MERVE KAPLAN ŞAFAK
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÇAYÖREN