Irregular longitudinal data analysis with statistical and machine learning methods in asteroid dataset
Asteroid veri kümesinde istatistiksel ve makine öğrenme yöntemleriyle düzensiz boylamsal veri analizi
- Tez No: 830528
- Danışmanlar: PROF. DR. ÖZLEM İLK DAĞ
- Tez Türü: Yüksek Lisans
- Konular: Astronomi ve Uzay Bilimleri, İstatistik, Astronomy and Space Sciences, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 164
Özet
Asteroidlerin bilimsel olarak tanınması ve araştırılması, 18. yüzyılın sonlarına doğru önemli bir ivme kazanmıştır. Zaman içerisinde Dünya yörüngesine giren asteroidlerin özellikleri kaydedilmiş ve zararlı olup olmadıkları sınıflandırılmıştır. Bu kayıtlar sayesinde bir asteroidin Dünyaya yönlenmesi tahmin edilebilir. Ancak, bu tür uzun süreli gözlemler sonucunda ortaya çıkan verilerin boylamsal yapısına uygun analiz yöntemlerinin kullanılması büyük önem taşımaktadır. Buna rağmen, önceki çalışmalarda, Dünyaya Yakın Asteroitler (DYA) verilerindeki özgül tekrarlamaların ve veri bağımlılığının göz ardı edildiği yöntemlerin kullanıldığını görmekteyiz. Bu tez, yukarıda belirtilen eksiklikleri gidermek amacıyla DYA verisi üzerinde çeşitli istatistiksel ve makine öğrenmesi yöntemlerinin uygulanmasını önermektedir. NASA aracılığıyla düzensiz zaman aralıklarıyla gözlemlenen 751 asteroidin verisini analiz ediyoruz. Tez içeriği, genelleştirilmiş lineer karma model, marjinal model, karar ağacı, tarihsel rastgele orman, GPBoost ve Spline gibi boylamsal veri yapısına uygun çeşitli algoritmaların kapsamlı uygulamasını ve karşılaştırmasını sunmaktadır. Elde ettiğimiz sonuçlara göre, modellerin doğruluğu 0.89 ile 0.99 arasında değişmektedir. GPBoost modeli en yüksek performansa sahipken, marjinal model en düşük performansa sahiptir. Ardından, DYA verileri farklı grup boyutları ve düzenli zaman noktaları ile simülasyonu gerçekleştirildi. Sonuç olarak grup ve zaman boyutları arttıkça model performansları da artmaktadır. En yüksek performansa sahip model GPBoost, küçük örneklem boyutları için ise en düşük performansa sahip model ise karar ağacıdır.
Özet (Çeviri)
During the 18-th century, scientific research on asteroids began to gain recognition and importance. Records are kept of the characteristics of asteroids that entered Earth's orbit, and their hazardous status is classified. It is crucial to use appropriate analysis methods and account for the longitudinal structure of the data. Unfortunately, previous studies used methods that ignore data dependency in Near-Earth Asteroids (NEA) data. Therefore, this thesis proposes various statistical and machine learning methods on NEA data to overcome these shortcomings. We analyze data from 751 asteroids observed at irregular time intervals through the National Aeronautics and Space Administration (NASA). We compare algorithms suitable for longitudinal data structure, such as the Generalized Linear Mixed Models (GLMM), marginal model, GLMM-Tree, Historical Random Forest, GPBoost, and Spline. According to the findings, the accuracies of the models range from 0.89 and 0.99. The GPBoost model has the highest performance, while the marginal model has the poorest performance. Then, NEA data is simulated with different subject sizes and regular time points. As a result, the model performances increase as the subject and time sizes increase. The model with the highest performance is GPBoost, while the model with the poorest performance is GLMM-Tree for small sample sizes.
Benzer Tezler
- Statistical investigation of ionospheric electron density over İstanbul during geomagnetic storms and implications for GPS communications
Geomanyetik fırtına zamanlarında İstanbul üzerindeki iyonosferik elektron yoğunluğunun istatistiksel olarak incelenmesi ve GPS haberleşmesi üzerine etkisi
BUTE NAZ ERBAŞ
Yüksek Lisans
İngilizce
2018
Havacılık Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. ZEREFŞAN KAYMAZ
- Menstruel siklusun dişeti üzerine etkileri
The effects of menstrual cycle on gingival health
ÜLKÜ BAŞER
Doktora
Türkçe
2008
Diş Hekimliğiİstanbul ÜniversitesiPeriodontoloji Ana Bilim Dalı
PROF. DR. FUNDA YALÇIN
- Magnus etkisi ile çalışan dairesel kesitli silindirik bir yalpa sönümleyici sistemin performansının tam ölçekli bir motoryat üzerinde hesaplamalı olarak incelenmesi
Investigation of the performance of a circular cross-section roll stabilizer system working with a Magnus effect on a full-scale motoryacht
DENİZ ÖZTÜRK
Yüksek Lisans
Türkçe
2019
Gemi Mühendisliğiİstanbul Teknik ÜniversitesiGemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN AKYILDIZ
- Çok katlı bir çelik yapının Türkiye Bina Deprem Yönetmeliği-2018'e göre tasarımı
Design of a multi-storey steel Structure According to Turkey building earthquake code-2018
BURAK TÜTÜNCÜ
Yüksek Lisans
Türkçe
2019
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. GÜLİZ BAYRAMOĞLU
- Boylamsal veri analizi ile dengeli olmayan tekrarlı ölçümlerin modellenmesi
Longitudinal data analysis in the modeling of unbalanced repeated measurements
DUYGU SIDDIKOĞLU
Yüksek Lisans
Türkçe
2015
BiyoistatistikÇukurova ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ZELİHA NAZAN ALPARSLAN