Ensemble and deep learning on astronomical data with different modalities
Astronomik veride farklı kiplerle topluluk öğrenmesi ve derin öğrenme
- Tez No: 835448
- Danışmanlar: PROF. DR. EMRE ONUR KAHYA, PROF. DR. ZEHRA ÇATALTEPE
- Tez Türü: Doktora
- Konular: Astronomi ve Uzay Bilimleri, Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Fizik ve Fizik Mühendisliği, Astronomy and Space Sciences, Computer Engineering and Computer Science and Control, Physics and Physics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Fizik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Fizik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 103
Özet
Bu tezde iki ayrı fotometrik verinin makine öğrenmesi ile sınıflandırılması üzerinde durulmuştur. İlk veri seti olarak, 2024 yılında gözlemlerine başlaması beklenen Vera C. Rubin gözlemevinin Legacy Survey of Space and Time (LSST) verisini modellemek amacı ile 6 bant için hazırlanmış simülasyon verisi kullanılmıştır. Diğer veri seti ise Sloan Digital Sky Survey (SDSS) gözlemlerinin çıktısı olan Galaxy Zoo fotoğraflarıdır. Tip Ia gibi patlayan değişen yıldızların gözlemlerinde spektroskopi güvenilir sonuçlar vermektedir. Spektroskopik yöntemin fotometrik yönteme göre daha pahalı bir yöntem olması ve elimizde sınırlı kaynak olması sebebi ile Vera Rubin LSST gibi büyük veri hacmine sahip gözlemler fotometrik yöntemlerden yararlanacaktır. Astronomik verinin görsel inceleme ile sınıflandırılması öncesinde sıklıkla başvurulan bir yöntemdi. Galaxy Zoo projesinde gönüllülerden galaksi fotoğrafları kullanılarak sınıflandırma yapması istenildi. PanSTARRS ya da LSST gibi büyük hacimli gözlemler insan eli ile sınıflandırma yapmayı olanaksız kılmaktadır. LSST kamerası yaklaşık 9.6 derecekarelik oldukça büyük bir görüş alanına sahiptir. Temel mottosu Geniş-Hızlı-Derin (WFD) olan bu teleskop, parlaklığı düşük objeleri, gökyüzünün geniş bir kısmını hızlı bir şekilde tarayarak gözlemlemeyi planlamaktadır. Vera Rubin gözlemlerinin, karanlık madde dağılımını incelemek ve karanlık enerji etkisini ölçmek, değişen ve geçiş yapan objeleri araştırmak, Samanyolu ve etrafını incelemek ve Güneş Sisteminin envanterini oluşturmak üzere 4 ana amacı bulunmaktadir. Verinin düzgün sınıflandırılması bu amaçlara başarılı bir şekilde ulaşmada çok önemli bir basamaktır. Işık eğrileri astronomik objenin parlaklığının zamanla nasıl değiştiği hakkında bizi bilgilendirir. Bir fotometrik banttaki ışık eğrisi, art arda alınan astronomik obje fotoğraflarının birbirinden çıkarılması ile elde edilir. Bu tezde ilk olarak Vera Rubin Gözlemevi'nin gelecekteki gözlemlerini modellemek üzere hazırlanmış olan Fotometrik LSST Astronomik Zaman Serisi Sınıflandırma Yarışması (PLAsTiCC) verisindeki 14 astronomik objenin sınınflandırılması üzerinde duruldu. Haar dalgacık dönüşümü ile her bir objeye ait ışık eğrisi iki ayrı parçaya ayrıldı. Bu iki dalgacık bileşeni kullanılarak her bir bant için ayrı ayrı ortalama, standart sapma, minimum gibi istatistiksel özellikler elde edildi. Işık eğrisi verisinden hesaplanan özellikler ve veri setinin ek olarak sağladığı fotometrik kırmızıya kayma ve onun belirsizliği gibi özellikler kullanılarak güçlendirilmiş yapay sinir ağları ve güçlendirilmiş karar ağaçları ile sınıflandırma yapıldı. Güçlendirilmiş karar ağaçları daha başarılı bulundu. En iyi sonuç güçlendirilmiş karar ağaçları, rassal ormanlar ve aşırı rassal ağaçların birleşiminden oluşan oylamalı sınıflandırıcı ile elde edildi. Fotometrik kırmızıya kaymanın süpernova sınıflandırmasına katkısı araştırıldı. Fotometrik kırmızıya kayma faktörü devre dışı bırakıldığında tip Ia, II, Iax, Ibc, Ia-91bg ve süper parlak süpernovaların (SLSN-I) işlem karakteristik eğrisi altında kalan alan (AUC) skorunda sırasıyla %8.5, %8.8, %7.3, %9.0, %6.1 ve %10.0 oranında düşüş gözlemlendi. Oylamalı sınıflandırıcı üzerinde ekstragalaktik ve galaktik objeleri ayırarak sınıflandırma yapıldığında, galaktik objelerin belirgin bir şekilde daha başarılı sınıflandırıldığı gözlemlendi. Böylesine açık bir farkın gerçek veriye ulaşıldığında gözlemlenilmesi beklenilmemektedir. Bu durum belki simülasyonlarda kullanılan galaktik obje modellerindeki çeşitliliğin ekstragalaktik obje modellerindeki çeşitlilikten daha az olmasıyla açıklanabilir (bu gözlem anonim bir hakem tarafından tezin yazarı ile paylaşılmıştır). Astronomik verinin sınıflandırılması üzerine çıkarılan yayınlarda rassal ormanlar kullanarak özellik önemi araştırılması yönünde ciddi bir eğilim olduğu gözlemlenilmiştir. Rassal ormanlar her durumda en önemli özelliği yansıtmayabilirler. Bu yöntemin en fazla kategori içeren özelliği seçme eğiliminde olduğu gözlemlenmiştir. Bu tezde yapay sinir ağları ile özellik önemi araştırması yapılması önerilmektedir. Herbir astronomik obje için önemli özelliklerin yapay sinir ağları kullanarak elde edildi. 14 obje için en önemli özelliklerin değiştiği gözlemlendi. Özellikle tip Ia ve Iax süpernovaların ışık eğrileri birbirlerine benzemektedir ve bu durum kozmolojik hesaplamaları etkileyebilecek bir durumdur. SN Ia için i bandına ilişkin skew bileşeni öne çıktığı gözlemlendi. Tip Iax süpernovalar için ise salınım bileşenleri en önemli özelliler olarak gözlemlenmiştir. Haar dalgacıklarına bir alternatif olarak, sürekli dalgacık dönüşümü kullanılarak zaman-frekans görüntüleri elde edildi. Özellik çıkarımından faydalanmak yerine bütün ışık eğrileri verisi kullanıldığından, noksan veriyi tahmin etmek için güçlü bir modele ihtiyaç duyuldu. Işık eğrilerindeki boşlukları doldurmada en başarılı modellerden olan Gausyen süreç regresyonu kullanıldı. Literatürde de vurgu yapıldığı gibi 14 astronomik objenin sadece bir kernel kullanılarak doğru sınıflandırılmasının zor olması sebebiyle, yalnızca tip Ia ve II süpernovalar dikkate alınarak sınıflandırma yapıldı. Gelecek gözlemlerde karşılaşacağımız zorluklardan birisi bazı fotometrik bantlarda gözlem durumuna bağlı olarak hiçbir veri elde edemeyecek olmamızdır. Bu durum için Villar ve diğerleri 2 boyutlu bir Gausyen süreç regresyonu önermiştir. Söz konusu iki boyutlu kernel kullanılarak noksan veriler tahmin edildi. Bu yöntem aynı zamanda tahmin edilen verinin varyansını düşürmektedir. Dalgacık transformasyonu sonrasında elde edilen görüntüler, 2 boyutlu konvolüsyonel sinir ağları (CNN) kullanılarak sınıflandırıldı. CANDECOMP/PARAFAC (CP) ayrıştırması bir tensörün, vektör dış çarpımları toplamı şeklinde tahmininden oluşur. Değişen kerte sayısı kaç adet bileşenin toplanacağını belirler. Büyük kerte değerleri için daha fazla parametre tahmin ederler. Kullanılan CNN yapıları bir tensör ayrıştırma yönteminden yararlanılarak (CP ayrıştırması) ayrıştırıldı. Ağdaki parametre sayısını değiştiren kerte seçiminin sınıflandırıcı performansını da etkilediği gözlemlendi. Sınıflandırıcı çok küçük kerte seçimlerinde kötü performans sergilemiştir. Kerte yükseldikçe performans bir süre artıp sonrasında düşmeye başlamıştır. Bu durum tensör ayrıştırma yöntemlerinin gürültülü ışık eğrilerinin analizinde önemli olabileceğine işaret etmektedir. Uygulanan tensör ayrıştırma yöntemi, Lochner ve diğerlerinin makalesinde dalgacık bileşenlerine temel bileşen analizi (PCA) uygulayarak elde edilen özellik seti ve güçlendirilmiş karar ağaçları ile yapılan sınınflandırmaya bir alternatif oluşturmaktadır. Bu tezde değinilen bir başka konu, Galaxy Zoo görüntülerinin morfolojik sınıflandırması olmuştur. Galaxy Zoo yarışmasındaki görüntüler SDSS'in yayınlamış olduğu yedinci veri kümesinden (DR7) alınmıştır. SDSS gözlemlerini, u, g, r, i ve z olmak üzere, 5 farklı fotometrik bant üzerinden toplamıştır. Galaksi Zoo fotoğrafları, r, g ve i bantlarında gözlemlenmiş galaksi fotoğraflarının birleştirilmesinden elde edilmektedir. Concelice, çalışmasında galaksi fotoğraflarında en parlak noktayı merkez olarak tanımlamış ve her objeyi 180 derece döndürüp piksel değerlerini birbirinden çıkararak asimetri parametresi tanımlamıştır. İlgili çalışmada galaksi popülasyonu ile asimetri parametresi arasında bir korelasyon olduğunu ve asimetri parametresi yüksek olan galaksilerin daha genç yıldızlar içerme eğiliminde olduğunu gözlemlemiştir. Yakın zamanda galaksi sınıflandırması üzerine yapılan bir başka çalışmada galaksi asimetrisi özellik kümesi içinde kullanılarak sınıflandırma yapılmıştır. Bu tezde, bahsedilen çalışmadan farklı olarak, simetrinin özellik çıkarımı yaparak kullanılması yerine derin konvolüsyonel ağlar içinde dikkate alınması tercih edilmiştir. Galaksi görüntülerinin sabit veya tercih edilen yönelimi olmadığından, galaksileri doğru sınıflandırmayı hedefleyen herhangi bir sınıflandırıcının birbirinin döndürülmüş versiyonu olan galaksileri düzgün bir şekilde tespit etmesi beklenir. Konvolüsyonel katmanlar görüntü işleme konusunda oldukça başarılı olmalarına ve bir objenin ötelenmiş versiyonu ile karşılaştıklarında özellik haritasını korumalarına rağmen, döndürülmüş nesneleri aynı nesne olarak tanımlama konusunda başarısızlar. Konvolüsyon işlemi ile dönme işlemi değişmeli olmadığından, aynı galaksilerin farklı yönelimleri için oluşturulan özellik haritası korunmamaktadır. Aynı nesnelerin döndürülmüş versiyonlarını tanımlayamama sorununun üstesinden gelebilmek için görüntü sınıflandırıcıları eşdeğişken bir yapıya ihtiyaç duymaktadır. Konvolüsyonel katmanlar, genelleştirilmiş eşdeğişken mimarilerini tanımlamak için oldukça elverişlidir. Geleneksel konvolüsyonel katmanları kullanmak yerine farklı simetrileri koruyan grup işlemleri ile genelleştirilmiş bir konvolüsyon işlemi tanımlamak mümkündür. Bu tezde, ilk olarak p4m grup konvolüsyonel katmanları kullanılarak eğitilen mimariye sonrasında farklı açıların da öğretildiği dinamik bir yapı önerilmektedir (p4m, öteleme, yansıma ve 90 derecelik dönmelerin oluşturduğu bir düzlem simetri grubudur).
Özet (Çeviri)
Light curves inform us how the brightness of an astronomical object changes over time. They are obtained by subtracting successive images of astronomical objects of a photometric band. In this thesis, the first task was to focus on the classification of 14 astronomical objects in the Photometric LSST Astronomical Time-series Classification Challenge (PLAsTiCC) data set which was prepared to model future observations of the Vera Rubin Observatory. The light curve of each object was divided into two separate parts using a Haar wavelet transform. By using these two wavelet components, statistical properties such as the mean, standard deviation, and minimum were obtained for each band. The classification was performed with boosted artificial neural networks and boosted decision trees by using extracted features and also including additional features such as the photometric redshift and its uncertainty. The training set was highly biased toward low-redshifted objects. Importance weights were estimated for each training object, and more representative data were given larger weights. The combination of boosted decision trees, random forests and extremely randomized trees was found to give the best performance for type Ia supernovae which are important indicators for cosmological measurements. The role of photometric redshift was examined by excluding the redshift parameter. The performance of superluminous supernovae (SLSN-I) was significantly affected by the omission of the redshift parameter with a 10% decrease in the area under the receiver operating characteristic curve (AUC) score. The relevant features of each object class were ranked using a neural network classifier. The time-frequency images were also obtained using a continuous wavelet transform as an alternative to discrete Haar wavelets. Since all data points of the light curves were used instead of utilizing feature extraction, a powerful model was needed to estimate the missing data. Gaussian process regression was employed for that task as one of the most successful models in filling the gaps of the light curves. As discussed previously in the literature, it is very difficult to accurately estimate 14 astronomical objects with only one kernel. Therefore we limited our attention to only include type Ia and II supernovae for the classification task. One of the difficulties that will be faced in future observations is that researchers will not be able to obtain any data on some photometric bands, depending on the status of the observation. Villar et al. proposed a 2D Gaussian process regression for this situation. The missing data in this part of the thesis was estimated using this two-dimensional kernel. The convolutional neural network (CNN) structures were decomposed using a tensor decomposition method (CP decomposition). It was observed that rank selection, which changes the number of parameters, also affects the classifier performance. While the classifier performed poorly on very small ranks, an optimal rank was determined for better performance. This indicates that tensor decomposition methods may be significant enough to include in the analysis of noisy light curves. This method provides an alternative to feature engineering that applies principal component analysis (PCA) to wavelet components. Another main task that was performed in this thesis was the morphological classification of Galaxy Zoo images. The images used in the Galaxy Zoo challenge were taken from the seventh data release (DR7) of the Sloan Digital Sky Survey (SDSS). SDSS made observations in 5 photometric bands which are labeled as u, g, r, i and z. The Galaxy Zoo photos are composite photos of galaxies observed in the r, g, and i bands. As galaxy images do not have a fixed or preferred orientation, any classifier that aims to correctly classify galaxies should be expected to properly detect when two galaxies are rotated versions of each other. Although convolutional layers are successful in processing images and preserve feature maps when encountering a translated version of an object, they fail in identifying rotated objects as the same. The convolution operation does not commute with rotation and this causes the feature map to change when it is generated for different orientations of the same galaxies. To overcome the problem of not identifying rotated versions of the same object, an equivariant structure is needed for an image classifier. Convolutional layers can be excellent ingredients in defining generalized equivariant architectures. Instead of using traditional convolution layers, it is possible to define a generalized convolution operation with group operations that preserve different symmetries. A dynamic structure using the p4m group convolutional layers (p4m is the plane symmetry group of translations, reflections, and rotations by 90 degrees) is proposed in this thesis, which introduces additional angles to the architecture after the initial training of the p4m group convolutional layers.
Benzer Tezler
- Göğüs kafesi röntgen görüntülerinde derin öğrenme metoduyla zatürre hastalığının tanısı
Pneumonia detection using deep learning on chest X-ray images
MUAZZEZ BUKET DARICI
Yüksek Lisans
Türkçe
2020
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ZÜMRAY ÖLMEZ
- Türkçe metinlerde duruş tespiti
Stance detection in Turkish texts
KAAN KEMAL POLAT
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NİLGÜN GÜLER BAYAZIT
- Topluluk ve derin öğrenme yöntemleri ile renk ön işlemesine dayalı meyve sınıflandırma
Fruit classification based on color preprocessing with deep learnining and ensemble learning methods
ESMA İBİŞ
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYBARS UĞUR
- Derin öğrenme ve topluluk öğrenme yöntemlerine dayalı bilgisayar destekli tanı sisteminin geliştirilmesi: Omik teknolojileri üzerine uygulaması
Development of computer aided diagnosis system based on deep learning and ensemble learning methods: Application on omics technologies
AHMET KADİR ARSLAN
Doktora
Türkçe
2021
Biyoistatistikİnönü ÜniversitesiBiyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
PROF. DR. CEMİL ÇOLAK
- Domates hastalıklarının sınıflandırılması için makine öğrenmesi ve derin öğrenme temelli yeni yaklaşımlar
New approaches to classification of tomato diseases based on machine learning and deep learning
HASAN ULUTAŞ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. VEYSEL ASLANTAŞ