Irregular longitudinal data analysis with statistical and machine learning methods in asteroid dataset
Asteroid veri kümesinde istatistiksel ve makine öğrenme yöntemleriyle düzensiz boylamsal veri analizi
- Tez No: 830528
- Danışmanlar: PROF. DR. ÖZLEM İLK DAĞ
- Tez Türü: Yüksek Lisans
- Konular: Astronomi ve Uzay Bilimleri, İstatistik, Astronomy and Space Sciences, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 164
Özet
Asteroidlerin bilimsel olarak tanınması ve araştırılması, 18. yüzyılın sonlarına doğru önemli bir ivme kazanmıştır. Zaman içerisinde Dünya yörüngesine giren asteroidlerin özellikleri kaydedilmiş ve zararlı olup olmadıkları sınıflandırılmıştır. Bu kayıtlar sayesinde bir asteroidin Dünyaya yönlenmesi tahmin edilebilir. Ancak, bu tür uzun süreli gözlemler sonucunda ortaya çıkan verilerin boylamsal yapısına uygun analiz yöntemlerinin kullanılması büyük önem taşımaktadır. Buna rağmen, önceki çalışmalarda, Dünyaya Yakın Asteroitler (DYA) verilerindeki özgül tekrarlamaların ve veri bağımlılığının göz ardı edildiği yöntemlerin kullanıldığını görmekteyiz. Bu tez, yukarıda belirtilen eksiklikleri gidermek amacıyla DYA verisi üzerinde çeşitli istatistiksel ve makine öğrenmesi yöntemlerinin uygulanmasını önermektedir. NASA aracılığıyla düzensiz zaman aralıklarıyla gözlemlenen 751 asteroidin verisini analiz ediyoruz. Tez içeriği, genelleştirilmiş lineer karma model, marjinal model, karar ağacı, tarihsel rastgele orman, GPBoost ve Spline gibi boylamsal veri yapısına uygun çeşitli algoritmaların kapsamlı uygulamasını ve karşılaştırmasını sunmaktadır. Elde ettiğimiz sonuçlara göre, modellerin doğruluğu 0.89 ile 0.99 arasında değişmektedir. GPBoost modeli en yüksek performansa sahipken, marjinal model en düşük performansa sahiptir. Ardından, DYA verileri farklı grup boyutları ve düzenli zaman noktaları ile simülasyonu gerçekleştirildi. Sonuç olarak grup ve zaman boyutları arttıkça model performansları da artmaktadır. En yüksek performansa sahip model GPBoost, küçük örneklem boyutları için ise en düşük performansa sahip model ise karar ağacıdır.
Özet (Çeviri)
During the 18-th century, scientific research on asteroids began to gain recognition and importance. Records are kept of the characteristics of asteroids that entered Earth's orbit, and their hazardous status is classified. It is crucial to use appropriate analysis methods and account for the longitudinal structure of the data. Unfortunately, previous studies used methods that ignore data dependency in Near-Earth Asteroids (NEA) data. Therefore, this thesis proposes various statistical and machine learning methods on NEA data to overcome these shortcomings. We analyze data from 751 asteroids observed at irregular time intervals through the National Aeronautics and Space Administration (NASA). We compare algorithms suitable for longitudinal data structure, such as the Generalized Linear Mixed Models (GLMM), marginal model, GLMM-Tree, Historical Random Forest, GPBoost, and Spline. According to the findings, the accuracies of the models range from 0.89 and 0.99. The GPBoost model has the highest performance, while the marginal model has the poorest performance. Then, NEA data is simulated with different subject sizes and regular time points. As a result, the model performances increase as the subject and time sizes increase. The model with the highest performance is GPBoost, while the model with the poorest performance is GLMM-Tree for small sample sizes.
Benzer Tezler
- Statistical investigation of ionospheric electron density over İstanbul during geomagnetic storms and implications for GPS communications
Geomanyetik fırtına zamanlarında İstanbul üzerindeki iyonosferik elektron yoğunluğunun istatistiksel olarak incelenmesi ve GPS haberleşmesi üzerine etkisi
BUTE NAZ ERBAŞ
Yüksek Lisans
İngilizce
2018
Havacılık Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. ZEREFŞAN KAYMAZ
- Dikkat eksikliği ve hiperaktivite bozukluğu olan çocukların el yazılarının görüntü işleme teknikleri ile analizi
Analysis of handwriting of children with attention deficit hyperactivity disorder using image processing techniques
ÖZLEM YILDIZ BUDAK
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUHAMMED FATİH ADAK
- Menstruel siklusun dişeti üzerine etkileri
The effects of menstrual cycle on gingival health
ÜLKÜ BAŞER
Doktora
Türkçe
2008
Diş Hekimliğiİstanbul ÜniversitesiPeriodontoloji Ana Bilim Dalı
PROF. DR. FUNDA YALÇIN
- Magnus etkisi ile çalışan dairesel kesitli silindirik bir yalpa sönümleyici sistemin performansının tam ölçekli bir motoryat üzerinde hesaplamalı olarak incelenmesi
Investigation of the performance of a circular cross-section roll stabilizer system working with a Magnus effect on a full-scale motoryacht
DENİZ ÖZTÜRK
Yüksek Lisans
Türkçe
2019
Gemi Mühendisliğiİstanbul Teknik ÜniversitesiGemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN AKYILDIZ
- Çevresel etkiler altındaki refakat römorkörü performansının deneysel ve hesaplamalı analizi
Experimental and computational investigation of escort tug performance under environmental effects
ÇAĞRI AYDIN
Doktora
Türkçe
2025
Gemi Mühendisliğiİstanbul Teknik ÜniversitesiGemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı
PROF. DR. UĞUR ORAL ÜNAL