Geri Dön

Comparison of missing value imputation methods for meteorological time series data

Meteorolojik zaman serisi verilerinde kayıp veri atama yöntemlerinin karşılaştırılması

  1. Tez No: 269701
  2. Yazar: SİPAN ASLAN
  3. Danışmanlar: YRD. DOÇ. DR. CEYLAN YOZGATLIGİL
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 101

Özet

Alansal ve zamansal özellikler taşıyan zaman serilerinde karşılaşılan kayıp verileri incelemek kayıp veri probleminin önemli bir branşını oluşturmaktadır. Zamana bağlı verilerin istatistiksel özellikleri gözlemlerin ardışıklığıyla karakterize edilebildiğinden zaman dizisi gözlemlerinde ki ardışıklığın herhangi bir nedenden ötürü kesintiye uğraması çözümü zor problemlere neden olmaktadır. Bu tür durumlarda güvenilir analizler yapabilmek için kayıp verileri, serilerin içermiş olduğu alansal ve zamansal özellikleri dikkate alarak değerlendirmek gerekmektedir.Biz bu çalışmada, alansal ve zamansal özellikte ki meteorolojik zaman serilerinde karşılaşılan kayıpların uygun şekilde tamamlanması için bazı yöntemleri karşılaştırmayı amaçladık. Bu amaçla, Devlet Meteoroloji Genel Müdürlüğüne ait klimatoloji istasyonlarından elde edilen aylık toplam yağış ve aylık ortalama sıcaklık serilerinde yapay olarak oluşturulan kayıp verileri kullanarak yöntemlerin kayıp tahmin başarımlarını değerlendirdik. Yapay olarak oluşturulan kayıp veriler altı yöntemle tahmin edildi. Çalışmada basit yöntemler olarak adlandırabileceğimiz Basit Artimetik Ortalama (BAO), Normal Oran (NO), ve Korelasyon Ağırlıklı Normal Oran (KANO) yöntemleri kullanılmıştır. Ayrıca hesap yoğun yöntemlerden Çok Katmanlı Yapay Sinir Ağları (ÇKYSA) Modeli ve Beklenti Maksimizasyonu tabanlı Monte Karlo Markov Zinciri (BM-MCM) algortiması kullanılmıştır. Yukarıdaki yöntemlere ek olarak basit yöntemlerden elde edilen sonuçların yardımcı değişken olarak kullanıldığı modifiye edilmiş BM-MCMC algoritmasını önerdik. Yöntemlerin uygun biçimde karşılaştırılması için hata kareler hesabına dayalı doğruluk ölçümü yanında Doğrusal Olmayan Zaman Serileri Analizinin önemli bir konusu olan Korelasyon Boyutu tekniğini kullandık

Özet (Çeviri)

Dealing with missing data in spatio-temporal time series constitutes important branch of general missing data problem. Since the statistical properties of time-dependent data characterized by sequentiality of observations then any interruption of consecutiveness in time series will cause severe problems. In order to make reliable analyses in this case missing data must be handled cautiously without disturbing the series statistical properties, mainly as temporal and spatial dependencies.In this study we aimed to compare several imputation methods for the appropriate completion of missing values of the spatio-temporal meteorological time series. For this purpose, several missing imputation methods are assessed on their imputation performances for artificially created missing data in monthly total precipitation and monthly mean temperature series which are obtained from the climate stations of Turkish State Meteorological Service. Artificially created missing data are estimated by using six methods. Single Arithmetic Average (SAA), Normal Ratio (NR) and NR Weighted with Correlations (NRWC) are the three simple methods used in the study. On the other hand, we used two computational intensive methods for missing data imputation which are called Multi Layer Perceptron type Neural Network (MLPNN) and Monte Carlo Markov Chain based on Expectation-Maximization Algorithm (EM-MCMC). In addition to these, we propose a modification in the EM-MCMC method in which results of simple imputation methods are used as auxiliary variables. Beside the using accuracy measure based on squared errors we proposed Correlation Dimension (CD) technique for appropriate evaluation of imputation performances which is also important subject of Nonlinear Dynamic Time Series Analysis.

Benzer Tezler

  1. Yüksek boyutlu verilerde eksik veri değer atama yöntemlerinin sınıflandırma performansına etkisinin simülasyonla karşılaştırılması

    Comparison the effects of missing data imputation methods on classification performance in high dimensional data through simulation

    BUĞRA VAROL

    Doktora

    Türkçe

    Türkçe

    2023

    BiyoistatistikAydın Adnan Menderes Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. İMRAN KURT ÖMÜRLÜ

  2. Kayıp veri analiz yöntemlerinin karşılaştırılması

    The comparison of missing value analysis methods

    YÜCEL MENENGİÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. NACİ MURAT

  3. Veri madenciliği yöntemleriyle hayvan hastalıklarında teşhis, prognoz ve risk faktörlerinin belirlenmesi

    Determination of diagnosis, prognosis and risk factors in animal diseases using by data mining methods

    PINAR CİHAN

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OYA KALIPSIZ

    DOÇ. DR. ERHAN GÖKÇE

  4. Trust in family context: The case of Turkey

    Aile bağlamında güven: Türkiye örneği

    MUHAMMED ALPEREN YAŞAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    EkonomiGalatasaray Üniversitesi

    İktisat Ana Bilim Dalı

    DOÇ. DR. SEZGİN POLAT

  5. ABİDE 2016 fen başarısının yordanmasında MARS ve BRT veri madenciliği yöntemlerinin karşılaştırılması

    Predicting the ABIDE 2016 science achievement: The comparison of MARS and BRT data mining methods

    HİKMET ŞEVGİN

    Doktora

    Türkçe

    Türkçe

    2020

    Eğitim ve ÖğretimGazi Üniversitesi

    Eğitimde Ölçme ve Değerlendirme Ana Bilim Dalı

    DOÇ. DR. EMİNE ÖNEN