Veri madenciliği süreçleri ile Akdeniz bölgesi güneş ışınım potansiyelinin tahmini
Using data mining processes to the estimate of solar radiation potential in the Mediterranean region
- Tez No: 671660
- Danışmanlar: PROF. DR. ŞAKİR TAŞDEMİR
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Enerji, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Energy, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Selçuk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 166
Özet
Bu tez çalışmasında, veri-tahmin ve algoritma-tahmin ilişkisi çerçevesinde seçilerek kullanılan ML algoritmaları ile Akdeniz Bölgesi hedef alınarak Küresel Güneş Işınımı (KGI)'nın tahmin edilmesi amaçlanmıştır. Hedef yerler için yapılan tahmin çalışmalarında Çok Katmanlı İleri Beslemeli Sinir Ağı (ÇKİBSA), Destek Vektör Regresyonu (DVR), K-En Yakın Komşu (K-NN) ve M5 Kuralları ML algoritmaları kullanılmıştır. ML algoritmalarının tahmin performansı büyük oranda kullanılan veri setinin yapısına duyarlı olduğundan, KGI tahmin çalışmalarında nadir kullanılan Veri Madenciliği (VM) süreçleri ile ML algoritmalarının bir arada kullanıldığı tahmin modelleri önerilmiştir. Çalışmada ilk olarak, VM süreçlerinde kullanılan ön işlem adımları ile her bir ilin ham verileri üzerindeki eksiklikler giderilerek düzenlenmiş ve veri setindeki her değişken için 23,442 adet veri tahmin modellerinde kullanılabilir hale getirilmiştir. Ayrıca VM süreçlerinden KGI üzerinde en etkili olan veri özelliklerinin belirlenmesi sağlanarak, özellik seçim fonksiyonları temelinde girdi veri grupları oluşturulmuştur. İkinci olarak, tezin ana konusu olan veri-tahmin ilişkisinin değerlendirilmesinde oluşturulan veri grupları kullanılarak, ÇKİBSA ML algoritması ile Akdeniz bölgesinin her bir ili için ayrıntılı tahmin modelleri geliştirilmiş ve tahmin sonuçları birbirleri arasında karşılaştırılmıştır. İller arasında en iyi KGI tahmin sonucu GR3 özellik seçim veri grubu ile Mersin ilinde, R2 = 0.9668 ve SMAPE = %6.11 bulunmuştur. Akdeniz bölgesi illerinin ÇKİBSA ML algoritması kullanılarak ayrı ayrı KGI potansiyelinin tahmin edilmesinin yanında, 8 ilin verilerinin bir araya getirilerek bölge geneli bir çalışma yapılmış ve iller bazında yapılan modelleme çalışmalarının genel performansının değerlendirilmesi sağlanmıştır. Bölgenin geneli için geliştirilen modelin en iyi tahmin performansı GR3 veri grubunda R2 = 0.9587 olarak hesaplanırken, 8 ilin R2 tahmin ortalaması yaklaşık olarak 0.9598 bulunmuştur. Üçüncü olarak, farklı ML algoritmalarının KGI tahmin performanslarının değerlendirilmesi için aynı enlem üzerinde bulunan iki ilin veri grupları kullanılarak karşılaştırmalı bir çalışma yapılmıştır. Sonuçlar, hedef yerler için, özellik seçim grupları ile geliştirilen tahminlerin kullanılan her bir ML algoritmasında daha başarılı olduğunu ve her iki ilin ışınım potansiyellerinin benzeştiğini ortaya koymuştur. Tahmin modellerinin performansları farklı istatistiksel göstergeler ile karşılaştırıldığında M5 Kuralları ve K-NN için Kahramanmaraş ilinde MAE ölçeğine göre sırasıyla 0.0418 ve 0.0419 değerleri elde edilirken, Isparta ilinde R2 ölçeğine göre 0.9254 ve 0.9261 sonuçlarına ulaşılmış ve birbirlerine oldukça yakın değerler elde edilmiştir. En düşük tahmin performansı her iki ilde DVR tabanlı LibSVM ile geliştirilen modellerde hesaplanırken, en iyi tahminler ÇKİBSA ML algoritmaları ile elde edilmiştir. Isparta ve Kahramanmaraş illeri için ÇKİBSA ile geliştirilen modellerden en başarılı sonuçlara MAE ve SMAPE istatistiksel ölçeklerine göre sırasıyla 0.0352-0.0341 ve %7.77-%7.79 değerleri ile ulaşılmıştır. Çalışma sonucunda, VM süreçlerinin kullanılan ML algoritmalarını KGI tahmininde oldukça iyi bir tahmin performansı seviyesine ulaştırdığı ve ayrıca modelleme süresini kısaltarak modelin yorumlanmasına önemli bir katkı sağladığı görülmüştür. Veri-tahmin ve algoritma-tahmin ilişkisinin değerlendirildiği çalışmaların tamamında en iyi tahmin performansının elde edilmesini sağlayan özellik seçim veri gruplarındaki değişkenlerin dışında kalan meteorolojik özelliklerin tahmin performansına hiçbir etkisinin olmadığı veya performansı düşürdüğü gözlemlenmiştir. Bunula birlikte yapılan modelleme çalışmalarında KGI üzerinde en etkili meteorolojik verinin Güneşlenme Süresi olduğu anlaşılmıştır. Ayrıca Hatay ili hariç yapılan çalışmaların tamamında tüm girdi özelliklerini kullanmanın en iyi tahmin performansına ulaşmayı sağlayamadığı gösterilmiştir.
Özet (Çeviri)
In this thesis study, the purpose was to the estimate Global Solar Radiation (KGI) by targeting the Mediterranean Region with ML algorithms that were selected based on data-estimation and algorithm-estimation relations. Multilayer Feedforward Neural Network (ÇKİBSA), Support Vector Regression (DVR), K-Nearest Neighbor (K-NN), and M5 Rules ML Algorithms were used for the estimation studies of target places. Since the predictive performance of ML algorithms is largely sensitive to the structure of the dataset employed in this respect, the estimation models that employ a combination of rarely used Data Mining (VM) processes and ML algorithms were proposed in KGI estimation studies. In the study, the first step was to eliminate the deficiencies in the raw data of each city with pre-processing steps used in VM processes and to organize these data and 23,442 data were made useable for each variable in the dataset for the estimation models. Also, the input data groups were created based on the basis of feature selection functions after determining the data attributes, which were most effective on KGI from VM processes. Secondly, detailed prediction models were developed for each city in the Mediterranean Region with the ÇKİBSA ML Algorithm by using the data groups created in the evaluation of the data-estimation relations, which is the main subject of this thesis, and the estimation results were compared with each other. Among the cities, the best KGI estimation result was detected in Mersin with GR3 feature selection data group as R2 = 0.9668 and SMAPE = 6.11%. In addition to estimation the KGI potential of Mediterranean Region cities separately by using the ÇKİBSA ML Algorithm, a region-wide study was conducted by merging the data of 8 provinces to evaluate the overall performance of the modelling studies on a provincial basis. The best prediction performance of the model that was developed for the Mediterranean Region was calculated as R2 = 0.9587 in GR3 data group, and the R2 prediction average of 8 provinces was found to be approximately 0.9598. Thirdly, a comparative study was conducted by using the data groups of two provinces, which are located on the same latitude, to evaluate the KGI prediction performance of different ML algorithms. The results showed that the predictions that were developed with feature selection groups were more successful for target locations in each ML algorithm employed, and the solar radiation potentials of both provinces were similar. When the performance of the prediction models was compared with different statistical indicators, for M5 Rules and K-NN, 0.0418 and 0.0419 values were obtained respectively according to the MAE scale in Kahramanmaraş; and 0.9254 and 0.9261 results were obtained according to the R2 scale in Isparta, and these values were very close to each other. The lowest prediction performance was calculated in models that were developed with the SVR-based LibSVM in both provinces, and the best predictions were obtained with the ÇKİBSA ML algorithms. The most successful results among the models that were developed with ÇKİBSA for Isparta and Kahramanmaraş were obtained with 0.0352-0.0341 and 7.77%-7.79%, respectively according to the MAE and SMAPE statistical scales. As a result, it was concluded that the VM processes bring the ML Algorithms to a fairly good level in terms of estimation performance in KGI, and also contribute to the interpretation of the model at significant levels by shortening the modelling time. In all previous studies in which the data-estimation and algorithm-estimation relations were evaluated, it was found that the meteorological attributes outside the variables in the feature selection data groups, which ensured the best estimate performance, had no effects on -or decreased the performance of- the estimation performance. However, it was also understood in the modelling studies that the most effective meteorological data on KGI was Sunshine Duration. Also, it was concluded that using all the input features in all studies -except for Hatay- does not achieve the best estimate performance.
Benzer Tezler
- İstanbul Boğazı deniz trafiği için kuyruk teorisi uygulaması ve süreç optimizasyonu
Queueing theory application and process optimization for Istanbul Strait sea traffic
İSMAİL KARACA
Yüksek Lisans
Türkçe
2021
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma İşletme Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZCAN ARSLAN
DR. ÖĞR. ÜYESİ ÖMER SÖNER
- Veri madenciliği teknikleri ile sağlık turizminde rezervasyon iptallerinin tahmini
Prediction of reservation cancellations in health tourism with data mining techniques
EROKAN CANBAZOĞLU
- Bilgi-iletişim teknolojileri yatırımlarının değerlendirilmesi
Assessment of ICT investments
TUĞRUL ÜLGER
- Akkuyu Nükleer Enerji Santrali'nin yakın çevresinde yayılış gösteren Pelophylax bedriagae (Rana bedriagae) (Amfibia: Anura) türünde arka plan radyonüklit aktivite seviyelerinin belirlenmesi
Determination of background radionuclide activity levels in Pelophylax bedriagae (Rana bedriagae) (Amfibia: Anura)populations living in the habitats close to the Akkuyu Nuclear Power Plant
SEZGİN AKSAKAL CESUR
Doktora
Türkçe
2021
ZoolojiAkdeniz ÜniversitesiBiyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA YAVUZ
DOÇ. DR. SÜLEYMAN FATİH ÖZMEN
- Veri madenciliği süreçleri ile tavuk yumurtalarında cinsiyet ayrımı yapılması
Chick sexing in chicken eggs with data mining process
CANAN TOKSÖZ
Yüksek Lisans
Türkçe
2016
Bilim ve TeknolojiSüleyman Demirel ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. MEHMET ALBAYRAK