Geri Dön

İmputasyon yöntemlerinin derin öğrenme modellerinin performansı üzerindeki etkisinin incelenmesi

An examination of the impact of imputation methods on the performance of deep learning models

  1. Tez No: 877598
  2. Yazar: KÜRŞAT ATMACA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ İSMAİL YENİLMEZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Teorisi Bilim Dalı
  13. Sayfa Sayısı: 92

Özet

Bu tez çalışmasında, Türk Hava Yolları, Lufthansa Hava Yolları, Delta Hava Yolları hisse fiyatları ve simülasyon yardımıyla sentetik veri setleri kullanılarak zaman serisi analizinde imputasyon yöntemlerinin kayıp verileri doldurma performansı ve derin öğrenme yöntemlerinin tahmin performansı incelenmiştir. Çalışmada LSTM, GRU, RNN ve Transformer modelleri kullanılarak analizler yapılmıştır. Veri setlerinde %5, %15 ve %25 oranında eksik veri oluşturulmuş ve bu eksik veriler lineer, spline, Stineman, ortalama ve rasgele imputasyon teknikleriyle doldurulmuştur. Elde edilen sonuçlar, her bir modelin performansının, kullanılan imputasyon tekniğine ve eksik veri oranına bağlı olarak değiştiğini göstermektedir. Özellikle derin öğrenme yöntemlerinin, eksik veri oranı arttıkça ve kullanılan imputasyon tekniğine bağlı olarak performanslarının farklılaştığı gözlemlenmiştir. Analiz yöntemlerinden Transformer modeli, genellikle diğer modellere göre daha iyi performans sergilemiş; imputasyon yöntemlerinden Stineman imptuasyon tekniği ani değişimler ve keskin dönüşlerin bulunduğu veri setlerinde daha başarılı sonuçlar vermiş ve Spline imputasyon tekniği ise doğrusal olmayan ilişkilerde üstün sonuçlar elde edilmesini sağlamıştır. Zaman serisi analizlerinde imputasyon yöntemlerinin ve derin öğrenme yöntemlerinin performansları böylece karşılaştırmalı ve kombinasyonlu incelenmiştir. Model performanslarını iyileştirmek için hangi yöntem ve yöntem çiftlerinin uygun olabileceği konusunda önemli bulgular sunulmuştur.

Özet (Çeviri)

In this thesis study, the performance of imputation methods in filling missing data and the estimation performance of deep learning methods in time series analysis were examined using Turkish Airlines, Lufthansa Airlines, Delta Airlines stock prices and synthetic dataset based on simulation. In the study, analyzes were conducted using LSTM, GRU, RNN and Transformer models. Missing data was generated at the rate of 5%, 15% and 25% in the dataset, and these missing data were filled with linear, spline, Stineman, average and random imputation techniques. The results obtained show that the performance of each model varies depending on the imputation technique used and the rate of missing data. It has been observed that the performance of deep learning methods, in particular, varies as the rate of missing data increases and depending on the imputation technique used. Among the analysis methods, the Transformer model generally performed better than other models; Among the imputation methods, the Stineman imputation technique performed well for dataset with sudden changes and sharp turns, and the Spline imputation technique provided superior results in non-linear relationships. The performances of imputation methods and deep learning methods in time series analyzes were examined comparetively and in combination. Important findings are presented regarding which methods and pairs of methods may be suitable to improve model performances.

Benzer Tezler

  1. A deep learning architecture for missing metabolite concentration prediction

    Eksik metabolit miktarı tahmini için bir derin öğrenme mimarisi

    SADİ ÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ ÇAKMAK

  2. Gen dizilerinin tanımlanması ve sınıflandırılması amacıyla Yapay Zekâ sistemlerinin geliştirilmesi

    Development of Artificial Intelligence systems for the identification and classification of gene sequences

    BAHAR ÇİFTÇİ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBatman Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. RAMAZAN TEKİN

  3. Süt dişlerinde formokrezol, MTA, kalsiyum hidroksit ve kalsiyum hidroksit+biyostimülasyon amputasyon tedavi yöntemlerinin karşilaştirmali olarak değerlendirilmesi: klinik ve radyografik takip

    Comparison of formocresol, MTA, calcium hydroxide and calcium hydroxide+biostimulation pulpotomies in primary teeth: clinical and radiographic follow up

    CAN KAYA

    Diş Hekimliği Uzmanlık

    Türkçe

    Türkçe

    2017

    Diş HekimliğiKocaeli Üniversitesi

    Pedodonti Ana Bilim Dalı

    YRD. DOÇ. DR. ÜLKÜ ŞERMET ELBAY

  4. Hücresel aykırı gözlem olması durumunda sağlam tahmin yöntemleri ile istatistiksel veri analizi

    Statistical data analysis with robust estimation methods in cellwise outlier observation

    ELİF ŞEN

    Doktora

    Türkçe

    Türkçe

    2023

    İstatistikAnkara Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. OLÇAY ARSLAN

  5. A data mining approach to predicting patient-based laser machine settings for kidney stone treatment operation

    Böbrek taşı tedavi operasyonunda hasta bazlı lazer-makine ayarlarının tahmini için bir veri madenciliği yaklaşımı

    FİDAN ESER

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri MühendisliğiBoğaziçi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA NECATİ ARAS

    PROF. DR. HAKAN TOZAN