Makine öğrenme algoritmaları ile su tüketim miktarlarının tahmini: Kocaeli örneği
Estimation of water consumption amounts using machine learning algorithms: The case study of Kocaeli
- Tez No: 947304
- Danışmanlar: DOÇ. DR. ALİ GÜLBAĞ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Sakarya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 151
Özet
Su kaynaklarının etkin yönetimi ve sürdürülebilir kullanımı, günümüzün en kritik çevresel ve ekonomik sorunlarından biridir. Su kaynaklarının yönetimi, sadece mevcut ihtiyaçları karşılamakla sınırlı olmayıp, gelecekteki nesillerin de suya erişimini garanti altına almayı hedeflemektedir. Bununla birlikte, iklim değişikliği, aşırı hava olayları ve su talebindeki artış, bu yönetimi daha karmaşık hale getirmektedir. Su yönetimi, tarım, endüstri ve evsel kullanım gibi farklı sektörlerin ihtiyaçlarına yanıt vermek zorundadır ve bu da karmaşık bir planlama sürecini gerektirir. Artan nüfus, kentleşme ve iklim değişikliği gibi faktörler, su kaynaklarının yönetimini giderek daha karmaşık hale getirmektedir. Bu bağlamda, su tüketim miktarlarının doğru tahmini, su dağıtım sistemlerinin planlanması ve yönetimi açısından büyük önem taşımaktadır. Doğru tahminler, su kaynaklarının optimal kullanımı ve gereksiz israfın önlenmesi açısından hayati önem taşır. Su dağıtım ağlarında yaşanabilecek kayıpların önceden belirlenmesi ve su talebindeki ani değişimlere hızlı cevap verebilmek, su yönetiminin sürdürülebilirliğini artıran unsurlar arasındadır. Ayrıca, su tüketim tahminleri, altyapı yatırımlarının planlanması ve uzun vadeli stratejik kararların alınmasında önemli bir rol oynar. Bu çalışma, yapay zeka tekniklerini kullanarak su tüketim miktarlarının tahmin edilmesini amaçlamaktadır. Çalışmanın temel amacı, Kocaeli ilindeki farklı abone türlerinin (konut, ticari, resmi) su tüketim davranışlarını modelleyerek, daha doğru ve güvenilir tahminler üretmektir. Araştırmada, Kocaeli Su ve Kanalizasyon İdaresi Genel Müdürlüğü'nden (İSU) elde edilen veriler kullanılmıştır. Bu veriler, bölgedeki su tüketim alışkanlıklarını yansıtan kapsamlı bir veri seti sunmaktadır. 2016 Ocak ile 2022 Ağustos arasındaki dönemde, 5000 abonenin (3447 konut, 1422 ticari ve 131 resmi) aylık su tüketim verileri analiz edilmiştir. Bu abonelerin su tüketim alışkanlıkları, farklı özelliklerine (abone türü, tarife tipi, faaliyet alanı vb.) göre incelenmiştir. Özellikle konut abonelerinin aylık su tüketim tahminlerinin diğer gruplara göre daha düşük performans göstermesi nedeniyle, bu abone grubuna odaklanılmıştır. Konut abonelerinin tahmin performansını iyileştirmek amacıyla, günlük su tüketimi verilerine sahip 33 konut abonesine ait 3 Eylül 2019 ile 5 Kasım 2021 tarihleri arasındaki veriler de çalışmaya dahil edilmiştir. Günlük veriler, su tüketimindeki kısa vadeli değişimleri daha doğru bir şekilde yakalayabilmek ve tahmin performansını artırmak için kullanılmıştır. Bu veri seti, her aboneye ait günlük toplam su tüketim değerlerini, meteorolojik (sıcaklık, yağış, nem vb.) ve sosyo-ekonomik verileri (hafta sonları, tatil günleri, COVID-19 pandemisi vb.) içermektedir. Veri kalitesini sağlamak amacıyla, eksik veya tutarsız verilere sahip aboneler analiz dışı bırakılmıştır. Veriler, tahmin modellerine uygun şekilde hazırlanarak günlük tüketim tahminlerinde kullanılabilir hale getirilmiştir. Veri seti, farklı abone türlerini (konut, ticari, resmi) içermekte ve çeşitli faktörleri kapsamaktadır. Bu faktörler arasında tarife türleri, faaliyet türleri, hava durumu verileri, mevsimsellik ve COVID-19 pandemi verileri yer almaktadır. Çalışmada, bu faktörlerin su tüketimi üzerindeki önem dereceleri analiz edilmiş ve su tüketimini etkileyen en kritik unsurlar belirlenmiştir. Ayrıca, su talebinin mevsimsel olarak nasıl değiştiğini anlamak için sıcaklık, yağış miktarı ve nem oranı gibi meteorolojik değişkenler değerlendirilmiştir. Pandemi süresince değişen su tüketim alışkanlıkları ise özellikle konut aboneleri üzerinde belirgin bir etki yaratmış, ticari ve resmi aboneler arasında su kullanımında düşüşlere yol açmıştır. Çalışmada, Yapay Sinir Ağları (ANN) başta olmak üzere, Uzun Kısa Vadeli Bellek (LSTM) ve Kapılı Tekrarlayan Birimler (GRU) gibi çeşitli yapay zeka teknikleri uygulanmıştır. ANN modeli, girdi değişkenleri arasındaki karmaşık ilişkileri modelleme yeteneği ve farklı aktivasyon fonksiyonları ile ağ yapılarıyla uyarlanabilir olması nedeniyle tercih edilmiştir. Derin Öğrenme (DL) yaklaşımları da değerlendirilmiş, ancak ana odak noktası ANN modeli olmuştur. Veri artırma (data augmentation) teknikleri kullanılarak modelin farklı senaryolara uyum sağlaması ve daha tutarlı tahminler yapabilmesi hedeflenmiştir. Geliştirilen modeller, su tüketimini etkileyen faktörleri girdi olarak kullanarak, gelecekteki su tüketim miktarlarını tahmin etmek üzere eğitilmiştir. Veri ön işleme aşamasında, eksik verilerin tamamlanması, aykırı değerlerin tespiti ve giderilmesi, ve veri normalizasyonu gibi teknikler uygulanmıştır. Modellerin eğitimi için veri seti, eğitim, doğrulama ve test setlerine ayrılmıştır. Modellerin performansı, çeşitli istatistiksel metrikler (R², MSE, RMSE, MAE) kullanılarak değerlendirilmiştir. Sonuçlar, özellikle ANN modelinin, ticari ve resmi aboneler için yüksek doğrulukta tahminler yapabildiğini göstermiştir. Konut aboneleri için tahmin performansı nispeten daha düşük olmakla birlikte, yine de anlamlı sonuçlar elde edilmiştir. Pandemi döneminde, konut abonelerinin su tüketiminde belirgin bir artış gözlemlenirken, ticari ve resmi abonelerde düşüş yaşanmıştır. Çalışma kapsamında, farklı yapay zeka tekniklerinin performansları karşılaştırılmış ve her bir tekniğin güçlü ve zayıf yönleri analiz edilmiştir.
Özet (Çeviri)
The efficient management and sustainable use of water resources is one of the most critical environmental and economic issues of our time. Water resource management is not just about meeting current needs, but also about ensuring access to water for future generations. However, climate change, extreme weather events, and increasing water demand are making this management more complex. Water management must respond to the needs of different sectors, such as agriculture, industry, and domestic use, which requires a complex planning process. Factors such as increasing population, urbanization, and climate change are making the management of water resources increasingly complex. In this context, accurate prediction of water consumption amounts is of great importance for the planning and management of water distribution systems. Accurate predictions are vital for the optimal use of water resources and the prevention of unnecessary waste. Determining potential losses in water distribution networks in advance and being able to respond quickly to sudden changes in water demand are among the elements that increase the sustainability of water management. In addition, water consumption predictions play an important role in planning infrastructure investments and making long-term strategic decisions. This study aims to estimate water consumption amounts using various artificial intelligence techniques, with a primary focus on Artificial Neural Networks (ANN). While other models like Long Short-Term Memory (LSTM) and Gated Recurrent Units (GRU) were considered, the emphasis is on ANN due to its robustness and adaptability to complex data structures. The research utilizes data obtained from the Kocaeli Water and Sewerage Administration General Directorate. This dataset provides a comprehensive view of regional water consumption patterns. The study analyzes the monthly water consumption data of 5000 subscribers, consisting of 3447 residential, 1422 commercial, and 131 public subscribers, between January 2019 and August 2022. Additionally, to improve the prediction performance for residential subscribers, daily water consumption data from 33 residential subscribers between September 3, 2019, and November 5, 2021, were used. Daily data were chosen to more accurately capture short-term variations in water consumption and enhance predictive accuracy. This dataset includes daily total water consumption values for each subscriber, as well as meteorological and socio-economic data. Subscribers with missing or inconsistent data were excluded from the analysis to ensure data quality. The data were pre-processed and prepared for use in daily consumption predictions, optimizing the models for higher accuracy. The dataset includes different subscriber types (residential, commercial, public) and various factors, including tariff types, activity types, weather data, seasonality, and COVID-19 pandemic data. The study analyzed the importance of these factors on water consumption and identified the most critical variables influencing water demand. Additionally, meteorological variables such as temperature, precipitation, and humidity were evaluated to understand seasonal changes in water consumption. The impact of the COVID-19 pandemic was particularly significant for residential subscribers, leading to an increase in water usage, while commercial and public subscribers experienced a decline. This shift in consumption patterns underscores the need for adaptive and responsive water management strategies. Various artificial intelligence techniques were applied in the study, with Artificial Neural Networks (ANN) being the primary method. Other machine-learning models, such as Support Vector Machines (SVM) and Random Forest (RF), were also explored for comparative analysis. While Deep Learning algorithms were considered, ANN was chosen for its balance between complexity and computational efficiency. Data augmentation techniques were employed to enable the model to adapt to different scenarios and provide more consistent predictions, particularly in the face of unforeseen events like the pandemic. These algorithms are capable of analyzing numerous variables simultaneously, and they excel in handling large datasets. The developed models were designed and trained to predict future water consumption amounts using factors affecting water consumption as inputs. Data preprocessing techniques such as filling in missing values, detecting and removing outliers, and data normalization were applied to ensure data quality and model accuracy. For model training, the dataset was divided into training, validation, and test sets, following standard machine learning practices. This approach allowed for rigorous evaluation and optimization of the models' performance. The models' performance was evaluated using various statistical metrics (R², MSE, RMSE, MAE). The results showed that the ANN model, in particular, was able to make high-accuracy predictions for commercial and official subscribers. Although the prediction performance for residential subscribers was relatively lower, meaningful results were still obtained, demonstrating the model's overall effectiveness. These metrics provide a quantitative basis for assessing the reliability and accuracy of the predictions. The study compared the performance of different artificial intelligence techniques and analyzed the strengths and weaknesses of each. Additionally, the importance levels of factors affecting water consumption were determined, and the effects of these factors on prediction performance were examined. Tariff types, activity types, seasonality, and the COVID-19 pandemic were found to have a significant impact on water consumption. It was found that tariff types, activity types, seasonality, and the COVID-19 pandemic had significant effects on water consumption. To increase the generalization ability of the models, cross-validation techniques were used, and hyperparameter optimization was performed. Feature importance analysis was conducted to enhance the interpretability of the models, allowing for the identification of which factors have the most significant impact on water consumption. This rigorous approach ensures that the models are robust and reliable for real-world applications. This research demonstrates the potential of artificial intelligence techniques, particularly ANN, in predicting water consumption and provides a valuable tool for water resource management. The findings can be used for planning water distribution systems, developing demand management strategies, and promoting sustainable water use. The results of the study also offer new perspectives for future research and providea foundation for further development of artificial intelligence applications in water consumption estimation. Additionally, the results offer new perspectives for future research and lay the foundation for further development of artificial intelligence applications in the field of water consumption prediction. For future studies, it is recommended to improve model performance using larger datasets, develop real-time prediction systems, and test the model in other geographical regions. Additionally, examining the potential effects of climate change scenarios on water consumption could be among future research topics. The integration of advanced artificial intelligence techniques in water resource management highlights the importance of this study and offers a more dynamic and adaptive approach to water consumption estimation. Moreover, this study highlights the importance of integrating advanced artificial intelligence techniques into water resource management, offering a more dynamic and adaptive approach to water consumption forecasting. The integration of such technologies could significantly improve the efficiency of water distribution networks, ensuring sustainable water use even during periods of high demand. Future advancements in AI models, especially in real-time data processing and climate change adaptation, will be essential to tackle the growing challenges of water scarcity worldwide.
Benzer Tezler
- Makine öğrenimi algoritmaları kullanılarak Erzurum ili için kirletici madde tahmini
Pollutant prediction for Erzurum province using machine learning algorithms
CEVAHİR DURAK
Yüksek Lisans
Türkçe
2024
Meteorolojiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. HÜSEYİN TOROS
- Estimating instant fuel consumption by machine learning and improving fuel consumption
Anlık yakıt tüketiminin makine öğrenmesi ile tahmin edilerek iyileştirilmesi
BUĞRA ŞEN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET TEOMAN NASKALİ
- Açıklanabilir yapay zeka yöntemleri ile toprak tuzluluğu haritalarının üretilmesi
Soil salinity mapping using explainable artificial intelligence methods
SAMET AKSOY
Yüksek Lisans
Türkçe
2023
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. ELİF SERTEL
- Predicton of maximal oxygen uptake using machine learning methods combined with feature selection
Nitelik seçme ile birleştirilmiş makina öğrenme yöntemleri kullanılarak maksimum oksijen tüketiminin tahmini
ERMAN AKTÜRK
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET FATİH AKAY
- Modeling of the marine diesel engines with comparative machine learning methodologies
Gemi dizel motorların karşılaştırmalı makine öğrenmesi yöntemleri ile modellenmesi
MEHMET İLTER ÖZMEN
Doktora
İngilizce
2024
Gemi Mühendisliğiİstanbul Teknik ÜniversitesiGemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN AZMİ ÖZSOYSAL