Geri Dön

Kayıp veri analizi istatistiksel ve makine öğrenimi algoritmalarının karşılaştırılması

Missing data analysis comparison between statistical and machine learning algorithms

  1. Tez No: 521109
  2. Yazar: HASAN YASİN SUCU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ELİF ÖZGE ÖZDAMAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 83

Özet

Yapılan hemen hemen her araştırma çalışmasında hangi alanda olursa olsun kayıp veri olma ihtimali vardır. Kayıp veri birçok nedenden kaynaklanabilir: bir anket çalışmasında katılımcılar cevap vermeyi reddedebilir veya cevaplamaları gerekmeyen sorular olabilir, veriyi kaydetmek için kullanılan ekipmanlar arızalanabilir, devam eden bir araştırmaya daha fazla devam etmek istemeyen vakalar araştırmayı yarıda bırakabilirler ve bu gibi durumlarda kayıp veri durumuyla karşılaşılır. Verinin kayıp olmasındaki en büyük sorun hemen hemen tüm istatistiksel analizler için eksiksiz bir veri setine ihtiyaç duyulmasıdır. Fakat günümüzde yapılan analiz çalışmalarının veya kullanılan paket programların büyük bir çoğunluğu bu problemi kayıp veri bulunduran gözlemi silme veya yapılan analize dahil etmeme yoluyla çözmeye çalışmaktadır. Bu çalışmadaki amaç kayıp veri durumunda daha gelişmiş veri çözümleme yöntemleri kullanılarak bu yöntemlerden elde edilen sonuçların verimliliğinin farklı istatistikler yardımıyla karşılaştırılması ve kullanılacak doğru çözümleme yönteminin belirlenmesidir.

Özet (Çeviri)

In almost any research, there is the potential for missing or incomplete data. Missing data can occur for many reasons: participants can fail to respond to questions, equipment and data collecting or recording mechanisms can malfunction, subjects can withdraw from studies before they are completed, and data entry errors can occur. The issue with missingness is that nearly all classic and modern statistical techniques assume complete data, and most common statistical packages default to the least desirable options for dealing with missing data: deletion of the case from the analysis. This study aims to compare statistical and machine learning imputation methods in order to determine the most appropriate algorithm for the data set.

Benzer Tezler

  1. Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini

    Forecasting the spread of covid-19 using deep learning and big data analytics methods

    CYLAS KIGANDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL

  2. Prediction of COVID 19 disease using chest X-ray images based on deep learning

    Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini

    ISMAEL ABDULLAH MOHAMMED AL-RAWE

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADEM TEKEREK

  3. Poincaré plot-based fault detection on Tennessee Eastman process using various machine learning algorithms

    Çeşitli makine öğrenimi algoritmalarını kullanarak Tennessee Eastman sürecinde Poincaré grafik tabanlı hata tespiti

    EMRE ÇANCIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİzmir Katip Çelebi Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SAVAŞ ŞAHİN

    DOÇ. DR. YALÇIN İŞLER

  4. Effect of lignin, extractive matter, holocellulose, and alpha cellulose of biomass on calorific value

    Biyokütlenin içeriğindeki lignin, ekstraktif madde, holoselüloz ve alfa selülozun kalorifik değer üzerindeki etkisi

    ÖZLEM ECEM KAYNAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Kimya Mühendisliğiİstanbul Teknik Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. DR. SERDAR YAMAN

  5. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ