Geri Dön

Irregular longitudinal data analysis with statistical and machine learning methods in asteroid dataset

Asteroid veri kümesinde istatistiksel ve makine öğrenme yöntemleriyle düzensiz boylamsal veri analizi

  1. Tez No: 830528
  2. Yazar: İREM TANRIVERDİ
  3. Danışmanlar: PROF. DR. ÖZLEM İLK DAĞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Astronomi ve Uzay Bilimleri, İstatistik, Astronomy and Space Sciences, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 164

Özet

Asteroidlerin bilimsel olarak tanınması ve araştırılması, 18. yüzyılın sonlarına doğru önemli bir ivme kazanmıştır. Zaman içerisinde Dünya yörüngesine giren asteroidlerin özellikleri kaydedilmiş ve zararlı olup olmadıkları sınıflandırılmıştır. Bu kayıtlar sayesinde bir asteroidin Dünyaya yönlenmesi tahmin edilebilir. Ancak, bu tür uzun süreli gözlemler sonucunda ortaya çıkan verilerin boylamsal yapısına uygun analiz yöntemlerinin kullanılması büyük önem taşımaktadır. Buna rağmen, önceki çalışmalarda, Dünyaya Yakın Asteroitler (DYA) verilerindeki özgül tekrarlamaların ve veri bağımlılığının göz ardı edildiği yöntemlerin kullanıldığını görmekteyiz. Bu tez, yukarıda belirtilen eksiklikleri gidermek amacıyla DYA verisi üzerinde çeşitli istatistiksel ve makine öğrenmesi yöntemlerinin uygulanmasını önermektedir. NASA aracılığıyla düzensiz zaman aralıklarıyla gözlemlenen 751 asteroidin verisini analiz ediyoruz. Tez içeriği, genelleştirilmiş lineer karma model, marjinal model, karar ağacı, tarihsel rastgele orman, GPBoost ve Spline gibi boylamsal veri yapısına uygun çeşitli algoritmaların kapsamlı uygulamasını ve karşılaştırmasını sunmaktadır. Elde ettiğimiz sonuçlara göre, modellerin doğruluğu 0.89 ile 0.99 arasında değişmektedir. GPBoost modeli en yüksek performansa sahipken, marjinal model en düşük performansa sahiptir. Ardından, DYA verileri farklı grup boyutları ve düzenli zaman noktaları ile simülasyonu gerçekleştirildi. Sonuç olarak grup ve zaman boyutları arttıkça model performansları da artmaktadır. En yüksek performansa sahip model GPBoost, küçük örneklem boyutları için ise en düşük performansa sahip model ise karar ağacıdır.

Özet (Çeviri)

During the 18-th century, scientific research on asteroids began to gain recognition and importance. Records are kept of the characteristics of asteroids that entered Earth's orbit, and their hazardous status is classified. It is crucial to use appropriate analysis methods and account for the longitudinal structure of the data. Unfortunately, previous studies used methods that ignore data dependency in Near-Earth Asteroids (NEA) data. Therefore, this thesis proposes various statistical and machine learning methods on NEA data to overcome these shortcomings. We analyze data from 751 asteroids observed at irregular time intervals through the National Aeronautics and Space Administration (NASA). We compare algorithms suitable for longitudinal data structure, such as the Generalized Linear Mixed Models (GLMM), marginal model, GLMM-Tree, Historical Random Forest, GPBoost, and Spline. According to the findings, the accuracies of the models range from 0.89 and 0.99. The GPBoost model has the highest performance, while the marginal model has the poorest performance. Then, NEA data is simulated with different subject sizes and regular time points. As a result, the model performances increase as the subject and time sizes increase. The model with the highest performance is GPBoost, while the model with the poorest performance is GLMM-Tree for small sample sizes.

Benzer Tezler

  1. Statistical investigation of ionospheric electron density over İstanbul during geomagnetic storms and implications for GPS communications

    Geomanyetik fırtına zamanlarında İstanbul üzerindeki iyonosferik elektron yoğunluğunun istatistiksel olarak incelenmesi ve GPS haberleşmesi üzerine etkisi

    BUTE NAZ ERBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Havacılık Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEREFŞAN KAYMAZ

  2. Dikkat eksikliği ve hiperaktivite bozukluğu olan çocukların el yazılarının görüntü işleme teknikleri ile analizi

    Analysis of handwriting of children with attention deficit hyperactivity disorder using image processing techniques

    ÖZLEM YILDIZ BUDAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUHAMMED FATİH ADAK

  3. Menstruel siklusun dişeti üzerine etkileri

    The effects of menstrual cycle on gingival health

    ÜLKÜ BAŞER

    Doktora

    Türkçe

    Türkçe

    2008

    Diş Hekimliğiİstanbul Üniversitesi

    Periodontoloji Ana Bilim Dalı

    PROF. DR. FUNDA YALÇIN

  4. Magnus etkisi ile çalışan dairesel kesitli silindirik bir yalpa sönümleyici sistemin performansının tam ölçekli bir motoryat üzerinde hesaplamalı olarak incelenmesi

    Investigation of the performance of a circular cross-section roll stabilizer system working with a Magnus effect on a full-scale motoryacht

    DENİZ ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Gemi Mühendisliğiİstanbul Teknik Üniversitesi

    Gemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN AKYILDIZ

  5. Çevresel etkiler altındaki refakat römorkörü performansının deneysel ve hesaplamalı analizi

    Experimental and computational investigation of escort tug performance under environmental effects

    ÇAĞRI AYDIN

    Doktora

    Türkçe

    Türkçe

    2025

    Gemi Mühendisliğiİstanbul Teknik Üniversitesi

    Gemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı

    PROF. DR. UĞUR ORAL ÜNAL