Comparison of missing value imputation methods for meteorological time series data
Meteorolojik zaman serisi verilerinde kayıp veri atama yöntemlerinin karşılaştırılması
- Tez No: 269701
- Danışmanlar: YRD. DOÇ. DR. CEYLAN YOZGATLIGİL
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 101
Özet
Alansal ve zamansal özellikler taşıyan zaman serilerinde karşılaşılan kayıp verileri incelemek kayıp veri probleminin önemli bir branşını oluşturmaktadır. Zamana bağlı verilerin istatistiksel özellikleri gözlemlerin ardışıklığıyla karakterize edilebildiğinden zaman dizisi gözlemlerinde ki ardışıklığın herhangi bir nedenden ötürü kesintiye uğraması çözümü zor problemlere neden olmaktadır. Bu tür durumlarda güvenilir analizler yapabilmek için kayıp verileri, serilerin içermiş olduğu alansal ve zamansal özellikleri dikkate alarak değerlendirmek gerekmektedir.Biz bu çalışmada, alansal ve zamansal özellikte ki meteorolojik zaman serilerinde karşılaşılan kayıpların uygun şekilde tamamlanması için bazı yöntemleri karşılaştırmayı amaçladık. Bu amaçla, Devlet Meteoroloji Genel Müdürlüğüne ait klimatoloji istasyonlarından elde edilen aylık toplam yağış ve aylık ortalama sıcaklık serilerinde yapay olarak oluşturulan kayıp verileri kullanarak yöntemlerin kayıp tahmin başarımlarını değerlendirdik. Yapay olarak oluşturulan kayıp veriler altı yöntemle tahmin edildi. Çalışmada basit yöntemler olarak adlandırabileceğimiz Basit Artimetik Ortalama (BAO), Normal Oran (NO), ve Korelasyon Ağırlıklı Normal Oran (KANO) yöntemleri kullanılmıştır. Ayrıca hesap yoğun yöntemlerden Çok Katmanlı Yapay Sinir Ağları (ÇKYSA) Modeli ve Beklenti Maksimizasyonu tabanlı Monte Karlo Markov Zinciri (BM-MCM) algortiması kullanılmıştır. Yukarıdaki yöntemlere ek olarak basit yöntemlerden elde edilen sonuçların yardımcı değişken olarak kullanıldığı modifiye edilmiş BM-MCMC algoritmasını önerdik. Yöntemlerin uygun biçimde karşılaştırılması için hata kareler hesabına dayalı doğruluk ölçümü yanında Doğrusal Olmayan Zaman Serileri Analizinin önemli bir konusu olan Korelasyon Boyutu tekniğini kullandık
Özet (Çeviri)
Dealing with missing data in spatio-temporal time series constitutes important branch of general missing data problem. Since the statistical properties of time-dependent data characterized by sequentiality of observations then any interruption of consecutiveness in time series will cause severe problems. In order to make reliable analyses in this case missing data must be handled cautiously without disturbing the series statistical properties, mainly as temporal and spatial dependencies.In this study we aimed to compare several imputation methods for the appropriate completion of missing values of the spatio-temporal meteorological time series. For this purpose, several missing imputation methods are assessed on their imputation performances for artificially created missing data in monthly total precipitation and monthly mean temperature series which are obtained from the climate stations of Turkish State Meteorological Service. Artificially created missing data are estimated by using six methods. Single Arithmetic Average (SAA), Normal Ratio (NR) and NR Weighted with Correlations (NRWC) are the three simple methods used in the study. On the other hand, we used two computational intensive methods for missing data imputation which are called Multi Layer Perceptron type Neural Network (MLPNN) and Monte Carlo Markov Chain based on Expectation-Maximization Algorithm (EM-MCMC). In addition to these, we propose a modification in the EM-MCMC method in which results of simple imputation methods are used as auxiliary variables. Beside the using accuracy measure based on squared errors we proposed Correlation Dimension (CD) technique for appropriate evaluation of imputation performances which is also important subject of Nonlinear Dynamic Time Series Analysis.
Benzer Tezler
- Yüksek boyutlu verilerde eksik veri değer atama yöntemlerinin sınıflandırma performansına etkisinin simülasyonla karşılaştırılması
Comparison the effects of missing data imputation methods on classification performance in high dimensional data through simulation
BUĞRA VAROL
Doktora
Türkçe
2023
BiyoistatistikAydın Adnan Menderes ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. İMRAN KURT ÖMÜRLÜ
- Kayıp veri analiz yöntemlerinin karşılaştırılması
The comparison of missing value analysis methods
YÜCEL MENENGİÇ
Yüksek Lisans
Türkçe
2015
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
YRD. DOÇ. DR. NACİ MURAT
- Veri madenciliği yöntemleriyle hayvan hastalıklarında teşhis, prognoz ve risk faktörlerinin belirlenmesi
Determination of diagnosis, prognosis and risk factors in animal diseases using by data mining methods
PINAR CİHAN
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OYA KALIPSIZ
DOÇ. DR. ERHAN GÖKÇE
- Trust in family context: The case of Turkey
Aile bağlamında güven: Türkiye örneği
MUHAMMED ALPEREN YAŞAR
Yüksek Lisans
İngilizce
2021
EkonomiGalatasaray Üniversitesiİktisat Ana Bilim Dalı
DOÇ. DR. SEZGİN POLAT
- ABİDE 2016 fen başarısının yordanmasında MARS ve BRT veri madenciliği yöntemlerinin karşılaştırılması
Predicting the ABIDE 2016 science achievement: The comparison of MARS and BRT data mining methods
HİKMET ŞEVGİN
Doktora
Türkçe
2020
Eğitim ve ÖğretimGazi ÜniversitesiEğitimde Ölçme ve Değerlendirme Ana Bilim Dalı
DOÇ. DR. EMİNE ÖNEN