Çok değişkenli fonksiyonel verilerin kümeleme yöntemleri ile incelenmesi: Türkiye iklim örneği
Investigation of multivariate functional data with clustering methods: The case of Turkey climate
- Tez No: 562246
- Danışmanlar: DOÇ. DR. YÜKSEL ÖNER
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Ondokuz Mayıs Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 103
Özet
İstatistiksel analizlerde, analiz edilmek istenen gözlemlerin sayısı arttıkça, bu gözlemler reel değerli bir fonksiyondan örneklenmekte olduğu kabul edilmektedir. Bu durumda türetilen veriler bir fonksiyonel yapının örnekleri olmaktadır. Araştırmada yer alan birimlere ait özelliklerin belirli bir zaman içerisinde incelenmesi durumunda, her birime ait veri yapısı bir fonksiyonel yapı gösterecektir. Bu tür verilerin analiz edilmesinde klasik tek değişkenli ve çok değişkenli yöntemler yetersiz kalmaktadır. Bu yüzden bu türde verilerin analiz edilmesinde fonksiyonel veri analizinin kullanılması daha uygun olacaktır. Fonksiyonel veri analizinde ilk önce ayrık noktalarda gözlenen verileri reel fonksiyonlardan oluşan bir veri örneğine dönüştürmek gerekir. Fonksiyonların oluşturulması sürecinde baz fonksiyon ve pürüzlü ceza yaklaşımı kullanılmaktadır. Oluşturulan bireysel fonksiyonların analizi için fonksiyonel temel bileşenler analizi, kümeleme analizi ve fonksiyonel ANOVA kullanmak mümkündür. Bu çalışmada Türkiye'de bulunan 81 ilin bazı iklimsel değişkenlerine ait (günlük ortalama sıcaklık, günlük toplam yağış, günlük sıcaklık değişimi, günlük güneşlenme süresi ve günlük buharlaşma süresi) veriler 365 ayrık noktada incelendi. Veriler periyodik bir yapı izlediklerinden baz fonksiyon yaklaşımı olarak Fourier baz fonksiyonu kullanıldı. Veriler Fourier baz ve pürüzlü ceza yaklaşımları kullanılarak sürekli bir fonksiyon haline dönüştürüldü. Değişkenlere ait düzgünleştirme parametresinin bulunmasında genelleştirilmiş çapraz geçerlilik yöntemi kullanıldı. Değişkenlere ait değişimlerin temel nedenini belirleyebilmek için fonksiyonel temel bileşenler analizinden yararlanıldı. Oluşturulan bireysel fonksiyonların sınıflandırılmasında model tabanlı kümeleme yöntemi kullanıldı. Kümelerin, ortalama fonksiyonları bakımından aralarında istatistiksel açıdan fark olup olmadığının belirlenmesi işleminde FANOVA uygulandı.
Özet (Çeviri)
Observations to be analyzed are sampled from a real-valued function as they increase in number. The derived data are, therefore, samples of a functional structure. When the properties of units are analyzed within a certain time period, the data structure of each unit corresponds to a functional structure. Classical single variable and multivariate methods fall short of analyzing such data. It would, therefore, be more appropriate to use functional data analysis, in which data observed at discrete time points should first be converted into a data sample consisting of real functions. Base function and roughness penalty approaches are used to create functions. Functional principal component analysis, cluster analysis and functional ANOVA can then be used for the analysis of individual functions. This study examined the mean daily temperature, daily total precipitation, daily temperature changing, daily sunshine duration and daily evaporation data of 81 cities in Turkey at 365 discrete time points. Data had a periodic structure, and therefore, the Fourier base function was used. Data were transformed into a continuous function using Fourier base and roughness penalty approaches. Generalized cross validity method was used to find the smoothing parameter of variables. Functional principal component analysis was used to determine the main cause of the change in variables. Model-based clustering method was used to classify individual functions. Functional ANOVA was used to determine whether there was a statistical difference in mean functions between clusters.
Benzer Tezler
- Gelir ve yaşam koşulları verisinin veri madenciliği yaklaşımı ile incelenmesi ve model performanslarının değerlendirilmesi
The examination and the model performance evaluation of the income and living conditions data within data mining approach
OLGUN ÖZDEMİR
Doktora
Türkçe
2020
İstatistikYıldız Teknik Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. İBRAHİM DEMİR
- Short term electricity load forecasting with deep learning
Derin öğrenme ile kısa dönemli elektrik yük talep tahmini
İBRAHİM YAZICI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- Chemometric analysis of SEM-EDAX, porosity and souble salts data for archaeo-ceramics
Arkeo seramiklerin SEM-EDAX, porozite ve çözünen tuzlara ait verilerinin kemometrik analizi
NEJLA ÇİNİ
Yüksek Lisans
İngilizce
2003
Kimyaİstanbul Teknik ÜniversitesiKimya Ana Bilim Dalı
PROF. DR. TÜLAY TULUN
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL