Meteorolojik ölçüm verilerinin regresyon yaklaşımı ile modellenmesinde veri madenciliği aşamaları ve kullanımı
Data mining stages and usage in modeling meteorological measurement data with regression approach
- Tez No: 883838
- Danışmanlar: DOÇ. DR. OĞUZ AKPOLAT
- Tez Türü: Yüksek Lisans
- Konular: Meteoroloji, Meteorology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Çevre Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
En yaygın ifadelerle modelleri; doğal benzeşim sistemleri/modelleri, donanımsal (fiziksel) sistemler/modeller ve matematiksel sistemler/modeller olmak üzere üç sınıfa ayırmak mümkündür. Bu çalışmada, meteorolojik ölçüm süreçlerinde sıklıkla ölçülen veriler olarak bağıl nem, hava sıcaklığı, atmosferik basınç, birikmiş günlük toplam yağış miktarı ve ölçümün yapıldığı zaman bilgileri gibi veriler ile güneş ışınım şiddeti arasındaki ilişkinin modellenmesinde ve güneş ışınım şiddetinin bazı modeller ile tahmin edilmesi amaçlanmıştır. Çalışmada ele alınan problem tam anlamıyla bir regresyon problemi olup, çalışmada kullanılan veriler ise literatürde de belirtildiği gibi doğrusal olmayan bir sistemden gelmektedir. Orange veri madenciliği platformunda regresyon problemleri için kullanılabilen modellerden Yapay Sinir Ağları (YSA), Karar Ağacı (KA), Rastgele Orman (RO), Doğrusal Regresyon (DR) ve K-En Yakın Komşu (KEY) modelleri kullanılmıştır. Tüm modellerden elde edilen sonuçlar karşılaştırıldığında regresyon problemine uygun olan ve olmayan modeller belirlenmiştir. Ayrıca bu tez çalışmasıyla, Orange veri madenciliği platformunun herhangi bir programlama dili bilmeyi gerektirmeden, veri madenciliği, veri modelleme, makine öğrenmesi ile ilgili çalışmalarda kullanılabileceği ve çok hızlı bir şekilde sonuçların elde edilebileceği gösterilmiştir. Çalışmanın bundan sonrası için mimarisinde tıpkı rastgele orman modeli gibi çoklu karar ağacı kullanan gradyan arttırma (Gradient Boosting), kategorik arttırma (CatBoost), uyarlamalı arttırma (AdaBoost) gibi arttırma algoritması temelli modeller ile daha fazla gizli katmanlı YSA modelleri kullanılarak bu tez çalışmasında tercih edilen modellerle karşılaştırılabilir.
Özet (Çeviri)
Models in the most common expressions; it is possible to divide them into three classes: natural simulation systems/models, hardware/physical systems/models and mathematical systems/models. In this study, it is aimed to model the relationship between data such as relative humidity, air temperature, atmospheric pressure, accumulated daily total precipitation and the time information when the measurement is made, and solar radiation intensity, which are frequently measured data in meteorological measurement processes, and to estimate solar radiation intensity with some models. The problem addressed in the study is literally a regression problem, and the data used in the study comes from a nonlinear system, as stated in the literature. Among the models that can be used for regression problems on the Orange data mining platform, Artificial Neural Networks (ANN), Decision Tree (KA), Random Forest (RO), Linear Regression (DR) and K-Nearest Neighbor (KEY) models were used. When the results obtained from all models were compared, models that were and were not suitable for the regression problem were determined. In addition, with this thesis, it has been shown that the Orange data-mining platform can be used in studies related to data mining data modeling and machine learning and those results can be obtained very quickly, without requiring knowledge of any programming language. For the future of the study, using algorithm-based models such as gradient boosting (Gradient Boosting), categorical boosting (CatBoost), adaptive boosting (AdaBoost) and ANN models with more hidden layers, similar to the random forest model, aimed models for future could be compared with the models preferred in this thesis study.
Benzer Tezler
- Extended water budget equation based on the fuzzy regression and implementation for lake Van
Bulanık regresyon ile su bütçesi denklemi geliştirilmesi ve Van Gölü üzerinde uygulanması
ECEM UYSAL
Yüksek Lisans
İngilizce
2021
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ABDÜSSELAM ALTUNKAYNAK
- Comparison of experimental and semi-experimental models for predicting solar thermal power plants with artificial neural network
Solar termal santralların yapay sinir ağlarıyla öngörüsünde deneysel ve yarı-deneysel modellerin karşılaştırılması
SHABNAM CHOOPANI
Yüksek Lisans
İngilizce
2023
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilimleri ve Teknoloji Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURAK BARUTÇU
- Particulate matter 2.5 – PM2.5 mapping using MODIS satellite data and multivariate non-linear regression analysis over Marmara Region – Turkey
MODIS uydu verileri ve çok değişkenli doğrusal olmayan regresyon analizi ile partiküler madde 2.5-PM2.5 haritasının Marmara Bölgesi-Türkiye için üretilmesi
MIDYAN ALDABASH
Doktora
İngilizce
2021
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. FİLİZ BEKTAŞ BALÇIK
- Taşkın debilerinin tahmini için olasılık modeli yaklaşımı
A probabilistic model for flood frequency analysis
ESRA SÖKMEL
Yüksek Lisans
Türkçe
2016
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. BİHRAT ÖNÖZ
- Regressive stochastic models for Lake Urmia water level
Urmiye Gölü su seviyesi için regresif stokastik modeller
BABAK VAHEDDOOST
Doktora
İngilizce
2017
Çevre Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. HAFZÜLLAH AKSOY
DOÇ. DR. HIRAD ABGHARI