Geri Dön

A hybrid method for missing value imputation

Kayıp verilerin tamamlanması için bir hibrit model

  1. Tez No: 543640
  2. Yazar: BASMA AL-BRGE
  3. Danışmanlar: Assoc. Prof. Dr. MURAT KOYUNCU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Hibrit yaklaşım, Kayıp değerler, K-en yakın komşu, Tekil Değer Ayrışımı
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Atılım Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgi Teknolojileri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 76

Özet

Eksik veriler neredeyse tüm ciddi istatistiksel analizlerde ortaya çıkmaktadır. İstatistiksel analizler, eksik verileri işlemek için, rastgele değerlendirme yaklaşımı gibi genellikle makul sonuçlar verebilecek bazı basit yaklaşımlar da dahil olmak üzere çeşitli yöntemlere sahiptir. Eksik veri değerlendirme süreci, doğru tamamlamalar yapabilmek için modellenmelidir. Veri setlerini ampirik uygulamalarda kullanmak bazı görevleri gerçekleştirmek için çok yaygındır, ancak veri setlerindeki eksik değerler veri setlerinden çıkarılmalı ya da veri madenciliğinin ön işleme aşamasında tahmin edilmelidir. Bu tezde, veri algılamasını iyileştirmek ve orijinal eksik değerlerle yüksek korelasyonlu veri üretmek için K-En Yakın Komşu (KNN) ile Tekil Değer Ayrıştırma (SVD) algoritmasını birleştiren bir karma yaklaşım kullanılmaktadır. Önerilen hibrit yöntemin test sonuçları, farklı kayıp değerlerin oranı için çeşitli alternatif yöntemlerin sonuçlarıyla karşılaştırılmış ve önerilen yöntemin performansı diğerlerinden daha iyi çıkmıştır. Ayrıca sonuçlar, önerilen modelin performansı hakkında bir fikir vermesi amacıyla literatürdeki raporlanan diğer sonuçlarla da karşılaştırılmıştır.

Özet (Çeviri)

Missing data arises in almost all serious statistical analyses. Statistical analyses have a variety of methods to handle missing data, including some relatively simple approaches that can often yield reasonable results such as the random imputation approach. The missing data imputation process must be modeled in order to perform imputations correctly. Using datasets in empirical applications is very common to perform some tasks; however, missing values in datasets should be extracted from the datasets or should be estimated before they are used for processing to produce correct association rules or clustering in the preprocessing stage of data mining and processing. In this thesis, a hybrid approach is used that combines K-Nearest Neighbor (KNN) with Singular Value Decomposition (SVD) algorithm to improve the data imputation and produce data with high correlation with original missing values. The test results of the proposed hybrid method are compared with the results of several alternative methods for different rate of missing values and the results of the proposed method yields better performance than the others. The results are also compared with the reported results in the literature to give an idea about its performance. Hybrid approach, Missing values, K-nearest Neighbour, Singular Value Decomposition.

Benzer Tezler

  1. Sezgisel hibrit öğrenme yöntemleri ile sağlık verilerinin analizi

    Analysis of health data with heuristic hybrid learning methods

    HATİCE NİZAM ÖZOĞUR

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEYNEP ORMAN

  2. Use of data mining techniques to determine presence of coronary artery disease and deriving a risk score by employing risk factors

    Veri madenciliği tekniklerinin kullanılarak koroner arter hastalığının varlığının belirlenmesi ve risk faktörlerinin kullanılmasıyla bir risk skor sisteminin oluşturulması

    JALE BEKTAŞ

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TURGAY İBRİKÇİ

    PROF. DR. İSMAİL TÜRKAY ÖZCAN

  3. Short-term solar power forecasting with artificial neural network models

    Yapay sinir ağları modelleri ile kısa süreli güneş enerjisi tahmini

    SEÇKİN GÖKÇE

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞAHİN SERHAT ŞEKER

  4. Otomatik makine öğrenmesi ile endüstriyel nesnelerin interneti tabanlı uç sistemlerde gerçek zamanlı saldırı tespit sistemi geliştirilmesi

    Development of a real-time intrusion detection system in industrial internet of things based edge systems with automated machine learning

    ANIL SEZGİN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYTUĞ BOYACI

  5. Wind energy forecasting methods: A case study of the long short term memory model (LSTM)

    Rüzgar enerjı̇sı̇ tahminı̇ yöntemleri: Uzun kısa sürelı̇ bellek modeli (LSTM) örneği

    ALI ABDULRAHMAN HUSSEIN SALIHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    EnerjiKırşehir Ahi Evran Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MERDİN DANIŞMAZ