Comparison of big data time series analysis methods
Büyük verilerin zaman seri analiz metotlarının karşılaştırılması
- Tez No: 751696
- Danışmanlar: DOÇ. DR. MEHMET HİLAL ÖZCANHAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Zaman serisi analizi, düzenli veya düzensiz zaman aralıklarında kaydedilen verilerin yorumlanmasıdır. Analizler depremler, satışlar, finansal yatırım tahminleri, erken uyarı, karar verme ve diğer birçok alanda uygulanmaktadır. Büyük verilerin zaman serisi analizinin nicel ve nitel yöntemleri vardır. Bu çalışmanın amacı, iki önemli nicel yöntemi karşılaştırmaktır: Otoregresif Bütünleşik Hareketli Ortalama (ARIMA) ve Uzun Kısa Süreli Bellek (LSTM). Karşılaştırma için deprem büyüklüğü ve yer tahmininin doğruluğu kullanılmıştır. 1970-2019 yılları arasındaki deprem verilerinden (deprem büyüklüğü, boylam, enlem; güneş ve ayın yükseklik-azimut-deprem anındaki dünyaya olan uzaklığı) yararlanılmıştır. Amerika Birleşik Devletleri Jeolojik Araştırma verilerinin yüzde sekseni eğitim için, geri kalanı ise test için kullanılmıştır. 4.0 ve üzeri büyüklükteki depremler dikkate alınmıştır. Her yöntemin sonuçları, standart sapma, ortalama karesel hata, ortalama mutlak hata ve medyan mutlak hata performansları kullanılarak önceki çalışmaların sonuçlarıyla karşılaştırılmıştır. ARIMA, uzun vadeli tahminlerde yetersiz kalırken, LSTM'in literatürde de desteklendiği gibi uzun dönemli, düzensiz verilerin analizi için uygun bir yöntem olduğu görülmüştür. LSTM'nin Vanilla ve Stacked modelleri karşılaştırılmış ve Stacked LSTM yoğunluk, parti boyutu ve dönem parametreleri değiştirilerek optimize edildikten sonra en iyi sonuçları vermiştir. En iyi sonuçlar 8 yoğunluk, 64 parti boyutu ve 64 dönem parametreleri kullanılarak elde edilmiştir. Boylam tahmini çok uzak olsa da en iyi tahmin edilen sonuçlar depremlerin büyüklüğü ve enlemleri olmuştur.
Özet (Çeviri)
Time series analysis is interpretation of data recorded at regular or irregular time intervals. The analysis is applied to earthquakes, sales, financial investment forecasting, early warning, decision making and many other areas. There are quantitative and qualitative methods of time series analysis of big data. The aim of this study is to compare two important quantitative methods: Autoregressive Integrated Moving Average and Long Short-Term Memory. For comparison, the accuracy of earthquake magnitude and location prediction has been used. Earthquake data (earthquake magnitude, longitude, latitude; sun and moon altitude-azimuth-distance to earth at the instant of the earthquake) between years 1970 and 2019 were utilized. Eighty percent of the United States Geological Survey data was used for training and the remaining for testing. Earthquakes of magnitude 4.0 and above were considered. The results of each method were compared with the results of previous works, using standard deviation, mean squared error, mean absolute error and median absolute error performances. ARIMA was inefficient in long term predictions. Therefore, LSTM was deemed as the appropriate method for the analysis of long term, irregular data, as supported in the literature too. Vanilla and Stacked models of LSTM were compared and Stacked LSTM provided the best results after being optimized by changing the dense, batch size and epoch parameters. The best results were obtained by using parameters 8 dense, 64 batch size and 64 epochs. While the longitude prediction was way off, the best predicted outcomes were the magnitude and latitude of the earthquakes.
Benzer Tezler
- Proposal for a forecasting methodology to predict commercial real estate values in Istanbul using social big data
Sosyal büyük veri kullanımı ile İstanbul'daki ticari gayrimenkul değerlerini tahmin etmek için bir kestirim yöntemi önerisi
MARAL TAŞCILAR
Yüksek Lisans
İngilizce
2023
Ekonometriİstanbul Teknik ÜniversitesiGayrimenkul Geliştirme Ana Bilim Dalı
DOÇ. KEREM YAVUZ ARSLANLI
- Büyük veri ve finansal piyasalarda istatistiki makine öğrenmesi metodlarının yatırım kararlarında kullanılması
Using big data and statistical machine learning methods in investment decisions in financial markets
FEHİM KURUCAN
- Feasibility analysis based on advanced deep learning techniques in integrating renewable energy resources into microgrids
Yenilenebilir enerji kaynaklarının mikroşebekelere entegre edilmesinde gelişmiş derin öğrenme tekniklerine dayalı uygulanılabilirlik analizi
FATHI FARAH FADOUL FATHI FARAH FADOUL
Doktora
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
DOÇ. DR. RAMAZAN ÇAĞLAR
- Fotovoltaik enerji sistemleri için öngörü modellerinin geliştirilmesi: Veri madenciliği ve derin öğrenme yaklaşımları
Development of forecasting models for photovoltaic energy systems: Data mining and deep learning approaches
FATMA DİDEM ALAY
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHarran ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET TAHİR GÜLLÜOĞLU
DR. ÖĞR. ÜYESİ NAGEHAN İLHAN
- Gerçek zamanlı kinematik GPS yöntemiyle yapıların dinamik davranışlarının incelenmesi
Analysis of buildings dynamic behaviours with real-time kinematic GPS method
HÜSEYİN PEHLİVAN
Doktora
Türkçe
2009
Jeodezi ve FotogrametriYıldız Teknik ÜniversitesiJeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı
PROF. DR. ÖMER AYDIN