Geri Dön

Irregular longitudinal data analysis with statistical and machine learning methods in asteroid dataset

Asteroid veri kümesinde istatistiksel ve makine öğrenme yöntemleriyle düzensiz boylamsal veri analizi

  1. Tez No: 830528
  2. Yazar: İREM TANRIVERDİ
  3. Danışmanlar: PROF. DR. ÖZLEM İLK DAĞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Astronomi ve Uzay Bilimleri, İstatistik, Astronomy and Space Sciences, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 164

Özet

Asteroidlerin bilimsel olarak tanınması ve araştırılması, 18. yüzyılın sonlarına doğru önemli bir ivme kazanmıştır. Zaman içerisinde Dünya yörüngesine giren asteroidlerin özellikleri kaydedilmiş ve zararlı olup olmadıkları sınıflandırılmıştır. Bu kayıtlar sayesinde bir asteroidin Dünyaya yönlenmesi tahmin edilebilir. Ancak, bu tür uzun süreli gözlemler sonucunda ortaya çıkan verilerin boylamsal yapısına uygun analiz yöntemlerinin kullanılması büyük önem taşımaktadır. Buna rağmen, önceki çalışmalarda, Dünyaya Yakın Asteroitler (DYA) verilerindeki özgül tekrarlamaların ve veri bağımlılığının göz ardı edildiği yöntemlerin kullanıldığını görmekteyiz. Bu tez, yukarıda belirtilen eksiklikleri gidermek amacıyla DYA verisi üzerinde çeşitli istatistiksel ve makine öğrenmesi yöntemlerinin uygulanmasını önermektedir. NASA aracılığıyla düzensiz zaman aralıklarıyla gözlemlenen 751 asteroidin verisini analiz ediyoruz. Tez içeriği, genelleştirilmiş lineer karma model, marjinal model, karar ağacı, tarihsel rastgele orman, GPBoost ve Spline gibi boylamsal veri yapısına uygun çeşitli algoritmaların kapsamlı uygulamasını ve karşılaştırmasını sunmaktadır. Elde ettiğimiz sonuçlara göre, modellerin doğruluğu 0.89 ile 0.99 arasında değişmektedir. GPBoost modeli en yüksek performansa sahipken, marjinal model en düşük performansa sahiptir. Ardından, DYA verileri farklı grup boyutları ve düzenli zaman noktaları ile simülasyonu gerçekleştirildi. Sonuç olarak grup ve zaman boyutları arttıkça model performansları da artmaktadır. En yüksek performansa sahip model GPBoost, küçük örneklem boyutları için ise en düşük performansa sahip model ise karar ağacıdır.

Özet (Çeviri)

During the 18-th century, scientific research on asteroids began to gain recognition and importance. Records are kept of the characteristics of asteroids that entered Earth's orbit, and their hazardous status is classified. It is crucial to use appropriate analysis methods and account for the longitudinal structure of the data. Unfortunately, previous studies used methods that ignore data dependency in Near-Earth Asteroids (NEA) data. Therefore, this thesis proposes various statistical and machine learning methods on NEA data to overcome these shortcomings. We analyze data from 751 asteroids observed at irregular time intervals through the National Aeronautics and Space Administration (NASA). We compare algorithms suitable for longitudinal data structure, such as the Generalized Linear Mixed Models (GLMM), marginal model, GLMM-Tree, Historical Random Forest, GPBoost, and Spline. According to the findings, the accuracies of the models range from 0.89 and 0.99. The GPBoost model has the highest performance, while the marginal model has the poorest performance. Then, NEA data is simulated with different subject sizes and regular time points. As a result, the model performances increase as the subject and time sizes increase. The model with the highest performance is GPBoost, while the model with the poorest performance is GLMM-Tree for small sample sizes.

Benzer Tezler

  1. Statistical investigation of ionospheric electron density over İstanbul during geomagnetic storms and implications for GPS communications

    Geomanyetik fırtına zamanlarında İstanbul üzerindeki iyonosferik elektron yoğunluğunun istatistiksel olarak incelenmesi ve GPS haberleşmesi üzerine etkisi

    BUTE NAZ ERBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Havacılık Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEREFŞAN KAYMAZ

  2. Menstruel siklusun dişeti üzerine etkileri

    The effects of menstrual cycle on gingival health

    ÜLKÜ BAŞER

    Doktora

    Türkçe

    Türkçe

    2008

    Diş Hekimliğiİstanbul Üniversitesi

    Periodontoloji Ana Bilim Dalı

    PROF. DR. FUNDA YALÇIN

  3. Magnus etkisi ile çalışan dairesel kesitli silindirik bir yalpa sönümleyici sistemin performansının tam ölçekli bir motoryat üzerinde hesaplamalı olarak incelenmesi

    Investigation of the performance of a circular cross-section roll stabilizer system working with a Magnus effect on a full-scale motoryacht

    DENİZ ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Gemi Mühendisliğiİstanbul Teknik Üniversitesi

    Gemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN AKYILDIZ

  4. Çok katlı bir çelik yapının Türkiye Bina Deprem Yönetmeliği-2018'e göre tasarımı

    Design of a multi-storey steel Structure According to Turkey building earthquake code-2018

    BURAK TÜTÜNCÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. GÜLİZ BAYRAMOĞLU

  5. Boylamsal veri analizi ile dengeli olmayan tekrarlı ölçümlerin modellenmesi

    Longitudinal data analysis in the modeling of unbalanced repeated measurements

    DUYGU SIDDIKOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    BiyoistatistikÇukurova Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. ZELİHA NAZAN ALPARSLAN