Geri Dön

MiWGAN-GP: missing data imputation using Wasserstein generative adversarial nets with gradient penalty

MiWGAN-GP: Eksik verilerin gradyan cezalandırmalı Wassersteın çekışmeli sinir ağları ile tamamlanması

  1. Tez No: 759219
  2. Yazar: EBRU UÇGUN ERGÜN
  3. Danışmanlar: PROF. DR. SUAT ÖZDEMİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 63

Özet

IoT uygulamalarının başarısı ve güvenilirliği büyük ölçüde veri kalitesine bağlıdır. Donanım sorunları, senkronizasyon zorlukları, tutarsız ağ bağlantısı ve manuel sistem kapatma nedeniyle üretilen veriler eksik, hatalı ve gürültülü olabilir. Bu eksik veya hatalı değerler sağlık, askeri ve gözetleme verisetlerinde de oluşabilmekte ve bu verilerin kullanıldığı görev sistemlerinde de önemli hatalara neden olabilmektedir. Kritik görev sistemi; tıbbi alanda kullanılıyorsa, bu tür eksik veri sorunları insan hayatını etkileyebilir. Bu nedenle, IoT sağlık sistemlerinde ve diğer kritik sistemlerde hatalı yargılardan kaçınmak için Eksik veriler uygun şekilde doldurulmalıdır. Bu çalışmada verilerin eksik olmasının makine öğrenmesi algoritmaları üzerindeki etkilerini göstermek için IoT sağlık verileri üzerinde Naive Bayes, K-Nearest Neighbors, Decision Tree ve XGboost algoritmaları uygulanmıştır. Bunu takiben, eksik verileri doldurmak için farklı stratejiler uygulanmıştır. Kullanılan sınıflandırma yöntemleri hem farklı eksiklik yüzdeleri hem de farklı atama yöntemleri ile karşılaştırılmıştır. Bu tezde, eksik verileri tamamlamak için GAN tabanlı yeni bir yaklaşım önerilmiştir. Önerilen yöntemin başarısı klasik atama yöntemleri ile karşılaştırılmıştır. Hata değerleri dört farklı hata metriği ile ölçülmüştür. Ayrıca önerilen GAN tabanlı modelin başarısı, bu yöntemle doldurulan veri seti üzerinde farklı sınıflandırma yöntemleri uygulanarak gösterilmektedir.

Özet (Çeviri)

The success and dependability of IoT applications are heavily dependent on data quality. Due to hardware problems, synchronization challenges, inconsistent network connectivity, and manual system shutdown, produced data might be missing, erroneous, and noisy. These missing or erroneous values can also occur on health, military and surveillance data and result in errors can also cause important errors in mission systems. If the mission critical system is used in medical domain such missing data problems may affect human life. Hence, Missing values should be imputed appropriately to avoid erroneous judgments in IoT healthcare systems and other critical systems. In addition, Naive Bayes, K-Nearest Neighbors, Decision Tree and XGboost algorithms are applied in the IoT health sector in this study to show in detail the effect of missing data on the outputs of machine learning algorithms. Following that, we compare different strategies for imputing missing data. The classification methods used were compared both for each defect percentage and with different imputation methods. In this thesis, a new GAN-based approach is proposed to complete the missing data. The success of the proposed method is compared with classical imputation methods. Error measurements are realized with four different error metrics. In addition, the success of the proposed GAN-based model is demonstrated by applying different classification methods on the data set filled with this method.

Benzer Tezler

  1. Sivas ilinde yaşayan sağlıklı bireylerde tatarcık humması (Sandfly fever) prevalansının araştırılması

    Investigation of sandfly fever prevalance of healthy people living in sivas

    MUHAMMED MİRGAN POLAT

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2013

    Klinik Bakteriyoloji ve Enfeksiyon HastalıklarıCumhuriyet Üniversitesi

    Dahili Tıp Bilimleri Bölümü

    DOÇ. DR. AYNUR ENGİN

  2. Cihazdan cihaza haberleşme tekniğinde kaynak paylaşım yöntemlerinin ağ hizmet kalitesi bakımından incelenmesi

    Investigation of resource sharing methods in regards of network quality of service in device to device technique

    YASEMİN MİNGAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiEge Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BİLGE KARTAL ÇETİN

  3. Başkurt şairi Reşit Nigmeti'nin şiirleri üzerine dil incelemesi (giriş-metin-dizin)

    A grammatical study on Bashkir poetry Rashid Nigmeti's poems (introduction-text-index)

    BAHADIR MİNGAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Türk Dili ve EdebiyatıEge Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET YASİN KAYA

  4. Murat Dağı (Uşak) yöresinde yayılış gösteren ağaç türlerinin (sarıçam, karaçam, kızılçam) gelişimini etkileyen kimi ekolojik etmenlerin araştırılması

    Devolopment of stands in Uşak-Banaz Murat Mountains forest ecosystems areas and their relations ships with edaphic physsoigraphic factors

    EMİN YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Ormancılık ve Orman MühendisliğiKaradeniz Teknik Üniversitesi

    Orman Mühendisliği Ana Bilim Dalı

    DOÇ. DR. LOKMAN ALTUN