İmputasyon yöntemlerinin derin öğrenme modellerinin performansı üzerindeki etkisinin incelenmesi
An examination of the impact of imputation methods on the performance of deep learning models
- Tez No: 877598
- Danışmanlar: DR. ÖĞR. ÜYESİ İSMAİL YENİLMEZ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Eskişehir Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Teorisi Bilim Dalı
- Sayfa Sayısı: 92
Özet
Bu tez çalışmasında, Türk Hava Yolları, Lufthansa Hava Yolları, Delta Hava Yolları hisse fiyatları ve simülasyon yardımıyla sentetik veri setleri kullanılarak zaman serisi analizinde imputasyon yöntemlerinin kayıp verileri doldurma performansı ve derin öğrenme yöntemlerinin tahmin performansı incelenmiştir. Çalışmada LSTM, GRU, RNN ve Transformer modelleri kullanılarak analizler yapılmıştır. Veri setlerinde %5, %15 ve %25 oranında eksik veri oluşturulmuş ve bu eksik veriler lineer, spline, Stineman, ortalama ve rasgele imputasyon teknikleriyle doldurulmuştur. Elde edilen sonuçlar, her bir modelin performansının, kullanılan imputasyon tekniğine ve eksik veri oranına bağlı olarak değiştiğini göstermektedir. Özellikle derin öğrenme yöntemlerinin, eksik veri oranı arttıkça ve kullanılan imputasyon tekniğine bağlı olarak performanslarının farklılaştığı gözlemlenmiştir. Analiz yöntemlerinden Transformer modeli, genellikle diğer modellere göre daha iyi performans sergilemiş; imputasyon yöntemlerinden Stineman imptuasyon tekniği ani değişimler ve keskin dönüşlerin bulunduğu veri setlerinde daha başarılı sonuçlar vermiş ve Spline imputasyon tekniği ise doğrusal olmayan ilişkilerde üstün sonuçlar elde edilmesini sağlamıştır. Zaman serisi analizlerinde imputasyon yöntemlerinin ve derin öğrenme yöntemlerinin performansları böylece karşılaştırmalı ve kombinasyonlu incelenmiştir. Model performanslarını iyileştirmek için hangi yöntem ve yöntem çiftlerinin uygun olabileceği konusunda önemli bulgular sunulmuştur.
Özet (Çeviri)
In this thesis study, the performance of imputation methods in filling missing data and the estimation performance of deep learning methods in time series analysis were examined using Turkish Airlines, Lufthansa Airlines, Delta Airlines stock prices and synthetic dataset based on simulation. In the study, analyzes were conducted using LSTM, GRU, RNN and Transformer models. Missing data was generated at the rate of 5%, 15% and 25% in the dataset, and these missing data were filled with linear, spline, Stineman, average and random imputation techniques. The results obtained show that the performance of each model varies depending on the imputation technique used and the rate of missing data. It has been observed that the performance of deep learning methods, in particular, varies as the rate of missing data increases and depending on the imputation technique used. Among the analysis methods, the Transformer model generally performed better than other models; Among the imputation methods, the Stineman imputation technique performed well for dataset with sudden changes and sharp turns, and the Spline imputation technique provided superior results in non-linear relationships. The performances of imputation methods and deep learning methods in time series analyzes were examined comparetively and in combination. Important findings are presented regarding which methods and pairs of methods may be suitable to improve model performances.
Benzer Tezler
- A deep learning architecture for missing metabolite concentration prediction
Eksik metabolit miktarı tahmini için bir derin öğrenme mimarisi
SADİ ÇELİK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ ÇAKMAK
- Gen dizilerinin tanımlanması ve sınıflandırılması amacıyla Yapay Zekâ sistemlerinin geliştirilmesi
Development of Artificial Intelligence systems for the identification and classification of gene sequences
BAHAR ÇİFTÇİ
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBatman ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. RAMAZAN TEKİN
- Süt dişlerinde formokrezol, MTA, kalsiyum hidroksit ve kalsiyum hidroksit+biyostimülasyon amputasyon tedavi yöntemlerinin karşilaştirmali olarak değerlendirilmesi: klinik ve radyografik takip
Comparison of formocresol, MTA, calcium hydroxide and calcium hydroxide+biostimulation pulpotomies in primary teeth: clinical and radiographic follow up
CAN KAYA
Diş Hekimliği Uzmanlık
Türkçe
2017
Diş HekimliğiKocaeli ÜniversitesiPedodonti Ana Bilim Dalı
YRD. DOÇ. DR. ÜLKÜ ŞERMET ELBAY
- Hücresel aykırı gözlem olması durumunda sağlam tahmin yöntemleri ile istatistiksel veri analizi
Statistical data analysis with robust estimation methods in cellwise outlier observation
ELİF ŞEN
- A data mining approach to predicting patient-based laser machine settings for kidney stone treatment operation
Böbrek taşı tedavi operasyonunda hasta bazlı lazer-makine ayarlarının tahmini için bir veri madenciliği yaklaşımı
FİDAN ESER
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri MühendisliğiBoğaziçi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA NECATİ ARAS
PROF. DR. HAKAN TOZAN