Geri Dön

Medikal veri sınıflandırmada sentetik veri üretiminin etkisi

Effect of synthetic generation on medi̇cal data classification

  1. Tez No: 666299
  2. Yazar: MEHMET ŞEYHANLI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ABDÜLKADİR GÜMÜŞÇÜ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Harran Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 58

Özet

Veri madenciliği, son yıllarda birçok alanda yaygın olarak kullanılmaktadır. Veri sınıflandırmalarında, örnek sayıların sınıflara göre eşit dağılımı çok önemlidir. Ancak, bazı durumlarda veri setinde yer alan sınıflar eşit dağılıma sahip olmayabilir. Özellikle veri oluşturma aşamasında zorluk yaşanan medikal veri setleri bu probleme verilecek örnekler arasında yer almaktadır. Bu gibi durumlarda, sınıflandırma başarı parametreleri olumsuz yönde etkilenir. Bu soruna bir çözüm olarak, yeni sentetik veri örnekleri üretilerek veri seti dengeli bir hale getirilebilir. Bu çalışmada tıbbi rahatsızlıklara ait nümerik, kategorik ve hem nümerik hem de kategorik olan veri setlerinin sınıflandırılmasında dengesiz veriyi oluşturma yöntemlerinin etkisi tartışılmıştır. Bu veri setlerine ait dengesizlik problemleri iki farklı sentetik örnekleme yaklaşımı yöntemi uygulanarak çözümlenmiştir. Veri setine, sentetik örnekleme yaklaşımı yöntemleri uygulandıktan sonra, Karar Ağacı (KA) ve K- En Yakın Komşuluk (KEYK) sınıflandırma yöntemleri uygulanmıştır. Böylelikle, sentetik veri üretiminin farklı veri türleri üzerindeki etkisi gözlemlenmiştir. Sonuçlar incelendiğinde; sadece kategorik ve hem kategorik hem sayısal veri tipine sahip veri setlerinde en başarılı sonuçların Sentetik Azınlık Aşırı Örnekleme Tekniği (SAAÖT) algoritmasında KA sınıflandırılmasında, sadece numerik veri setinde en başarılı sonucun ise Uyarlamalı Sentetik Örnekleme (USÖ) algoritmasında, k en yakın komşuluk sınıflandırılmasında elde edildiği gözlemlenmiştir.

Özet (Çeviri)

Data mining has been widely used in many areas in recent years. In data classification, equal distribution of sample numbers according to classes is very important. However, in some cases, the classes in the data set may not be equally distributed. Medical datasets, which have difficulties especially in data generation, are among the examples to be given to this problem. In such cases, the classification success parameters are adversely affected. As a solution to this problem, the data set can be balanced by producing new synthetic data samples. In this study, the effect of synthetıc generation on medical data classifıcation of numerical, categorical and both numerical and categorical data sets of medical diseases are discussed. The imbalance problems of these data sets have been solved by applying two different adaptive synthetic sampling approach methods. After the adaptive synthetic sampling approach methods were applied to the data set, Decision Tree (DT) and K-Nearest Neighbors (KNN) classification methods were applied. Thus, the effect of synthetic data generation on different data types has been observed. When the results are examined; It was observed that the most successful results were obtained in the decision tree classification in the Synthetic Minority Oversampling Technique (SMOTE) algorithm in the data sets with only categorical and both categorical and numerical types, and the most successful result in only the numerical data set was obtained in the Adaptive Synthetic Sampling Method (ADASYN) algorithm and k nearest neighbors classification.

Benzer Tezler

  1. Experimental investigation of singular sources method for microwave imaging

    Tekil kaynaklar yöntemiyle mikrodalga görüntülemenin deneysel olarak incelenmesi

    TUĞHAN ÇAĞLAYAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ÇAYÖREN

  2. Yenidoğan yoğun bakım üniteleri için termal görüntü analizi

    Thermal image analysis for neonatal intensive care units

    DUYGU SAVAŞCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiKonya Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT CEYLAN

  3. Machine learning based augmentation of medical microwave imaging

    Medikal mikrodalga görüntülemenin makine öğrenmesiyle iyileştirilmesi

    MERVE KAPLAN ŞAFAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ÇAYÖREN

  4. Derin öğrenme tabanlı şiddetli farenjit tespiti

    Deep learning based severe pharyngitis detection

    TUĞBA TAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN KUTUCU

  5. Vascular segmentation of brain MR angiography images using convolutional neural networks

    Evrişimsel sinir ağları kullanarak beyin MR anjiyografi görüntülerinin vasküler segmentasyonu

    YUSUF HÜSEYİN ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. GÖZDE ÜNAL