Makine öğrenimi algoritmaları kullanılarak Erzurum ili için kirletici madde tahmini
Pollutant prediction for Erzurum province using machine learning algorithms
- Tez No: 863444
- Danışmanlar: PROF. DR. HÜSEYİN TOROS
- Tez Türü: Yüksek Lisans
- Konular: Meteoroloji, Meteorology
- Anahtar Kelimeler: Hava Kirliliği Tahmini, Makine Öğrenmesi Algoritmaları, Meteorolojik Parametreler, Erzurum, Python Programlama Dili, Air Pollution Forecasting, Erzurum, Machine Learning Algorithms, Meteorological Parameters, Python Programming Language
- Yıl: 2024
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Meteoroloji Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Atmosfer Bilimleri Bilim Dalı
- Sayfa Sayısı: 87
Özet
Sanayi devriminden günümüze kadar gelişen teknolojiyle birlikte endüstriyelleşmenin artması, plansız yapılaşma ve aşırı kentleşme, eksponansiyel olarak artan nüfus oranı, iklim değişimine ve kirliliğe bağlı olarak doğal kaynakların azalması ekosistem için tehdit olan çevre kirliliğine sebebiyet vermektedir. Çevre kirliliği dünya çapında çok önemli sorunların başında gelmektedir. Çevre kirliliği; hava, su, toprak, gürültü ve görüntü kirliliği olarak sınıflandırılmaktadır. Atmosferde meydana gelen kirlilik, çevre kirliliğinin başında gelmektedir. Hava kirliliği; havada katı, sıvı ve gaz formda bulunabilen yabancı maddelerin canlı ve cansız varlıklar üzerinde, ekolojik denge üzerinde belli sürede olumsuz etki oluşturacak miktar ve yoğunluğa ulaşması sonucunda meydana gelmektedir. Hava kirliliği başka bir deyişle, havada katı, sıvı ve gaz şeklinde bulunabilen yabancı maddelerin insan sağlığına, diğer canlıların yaşam döngülerine ve ekolojik stabilizasyona zarar verecek miktar, yoğunluk ve zamanda atmosferde bulunmasıdır. İnsanların her zaman gelişen nüfuslarının ihtiyaçlarını karşılamak için yaptıkları çeşitli faaliyetleri sonucu meydana gelen üretim ve tüketim aktiviteleri sırasında ortaya çıkan atıklarla hava tabakası kirlenerek, dünya üzerindeki canlı hayatı olumsuz etkilenmektedir hatta bazı bölgelerde bu durum artık kontrol altına alınamaması çok zorlaşmış durumdadır. Hava kirleticileri; partiküler madde (PM2.5, PM10), kükürt dioksit (SO2), nitrojen oksitleri (NOX), karbonmonoksit (CO) ve Ozon (O3) gibi kirleticilerdir. Dünya çapında hava kirliliği problemi ekosistemi olumsuz etkileyen (özellikle şehirlerde) en önemli sorunlardan biri olarak ön plana çıkmaktadır. Dünya Sağlık Örgütü'nün yaptığı çalışmaya göre dünya nüfusunun %99'u belirlenen hava kalitesi sınır değerlerinin aşıldığı kirli havaya maruz kalmaktadır. Endüstriyelleşmenin yoğun olduğu yerlerde, taşıt yoğunluğunun ve yerleşimin fazla olduğu bölgelerde hava kirliliği seviyesi meteorolojik parametreler ve topoğrafyanın da etkisiyle artmaktadır. Bu duruma bağlı olarak konsantrasyonu normalin üstünde olan hava kirleticileri insan sağlığını tehdit etmeye devam etmektedir. Hava kirliliğinin birçok olumsuz etkisi olması sebebiyle bilim insanlarının ve araştırmacıların bir kısmı hava kirliliği üzerine araştırma yapmaktadırlar. Hava kirliliğinin neden olduğu sosyo-ekonomik kaybın indirgenmesi için hava kirleticilerinin ölçülmesi önem arz etmektedir. Hava kalitesi, atmosferdeki kirletici maddelerin seviyesini tanımlar (Kükürt dioksit (SO2), Partiküler madde (PM2.5, PM10), Nitrojen oksitleri (NOX) ve Ozon (O3). Hava kalitesi istasyonlarının kurulumu, bir bölgedeki hava kirliliği seviyesinin tespitinde son derece kritik bir öneme sahiptir. Bir bölgedeki hava kalitesini tespit etmek ve analiz edebilmek için hava kalitesi istasyonlarına ihtiyaç duyulmaktadır. T.C. Çevre ve Şehircilik Bakanlığı, Ulusal Hava Kalitesi İzleme Ağı kapsamında ölçüm ağını önemli ölçüde arttırmıştır. Hava kirleticilerinin seviyesinin tespiti için Türkiye'nin tüm illerine hava kalitesi istasyonları kurulmuştur. Kurulan istasyonlarda kirletici maddeler ile ilgili her saatte veri toplanmaktadır. Hava kirliliğini ölçmek için kurulan hava kalitesi ölçüm istasyonları sayısının az olması sebebiyle hava kirleticilerinin miktarı net olarak belirlenememektedir. Aynı zamanda hava kalitesi istasyonlarında meydana gelen arızalar sebebiyle de eksik veri sorunu ortaya çıkmaktadır. Dolayısıyla hava kalitesi istasyonları kirletici miktarını belirlemede yetersiz kalmaktadır. Günümüzde bilgisayarların veri işleme kapasitesi arttığı için farklı konulara ilişkin veriler işlenip, modellenerek verilerin görselleştirilmesi sağlanmaktadır. Hava kirliliği konusunda çeşitli programlar aracılığıyla makine öğrenimi yöntemleri, yapay sinir ağları modelleri kullanılarak hava kirleticileri için detaylı analiz yapılabilmektedir. Türkiye'de meteorolojik ve topografik faktörlerin etkisi altında hava kirliliğinin görüldüğü yerlerden birisi de Erzurum'dur. Bu çalışmada makine öğrenme algoritmaları kullanılarak eksik verisi olan istasyon için kirletici tahmini üzerinde durulmuştur. Çalışma kapsamında Erzurum ilinde 01.01.2022 ile 01.10.2023 yılları arasında ölçülen kirletici maddeler (PM2.5, PM10, SO2, CO, NO2, NO, NOX, O3) ile meteorolojik parametrelerden (sıcaklık, rüzgâr hızı, rüzgâr yönü, yağış miktarı, basınç, nem) yararlanılmıştır. Tahmin aşamasında öncelikle eksik veriler, kNN makine öğrenimi algoritması kullanılarak tamamlanmıştır. Ancak ölçüm alınan bazı istasyonlarda kirleticilerden bazılarının ölçümü hiç bulunmamaktadır. Ölçümü bulunmayan kirletici parametresi tahmini için eğitim veri seti (verinin %80'i) ve test veri seti (verinin %20'si) oluşturulmuştur. Eksik veriler tamamlandıktan sonra Python programlama dili kullanılarak Lineer Regresyon (Linear Regression), Karar Ağacı ile Regresyon (Desicion Tree Regressor), Destek Vektör Regresyon (Support Vector Regression), KNeighbors Regressor, Random Forest Regressor, Extra Trees Regressor, MLP Regressor, Gradient Boosting Regressor makine öğrenimi yöntemleri kullanılarak ölçümü bulunmayan istasyona ait kirletici tahmini yapılması amaçlanmıştır. Her 8 yöntemde hata oranlarını tespit etmek için ortalama mutlak hata (MAD), ortalama mutlak yüzde hata (MAPE), ortalama karesel hata (MSE), kök ortalama karesel hata (RMSE) ve R2 (doğruluk katsayısı) değerleri hesaplanmıştır. Çalışmanın sonucunda eksik veri tahmininde en başarılı makine öğrenmesi modellerin Extra Trees Regressor ve Random Forest Regressor modelleri olduğu görülmüştür. Aynı zamanda tahmin başarısı için tahmin edilen her bir kirletici maddenin yüzdelik hata oranına bakıldı.. NO grubunun yüzdelik sapma değerinin diğer kirletici parametrelere oranla düşük olduğu görüldü. Çalışmanın bölgede hava kalitesi çalışmalarına ve diğer şehirlerde hava kirliliği verilerindeki eksikliğin tamamlanmasına katkı sağlaması düşünülmektedir. Bu sayede çevresel problemlerin azaltılmasına yönelik stratejik planlamalar yapılabilecek ve geleceğe yönelik hava kalitesini iyileştirmek için önceden önlem alınmasına katkı sağlayacağı düşünülmektedir.
Özet (Çeviri)
Since the industrial revolution, the increase in industrialization with the developing technology, unplanned urban development and excessive urbanization, exponentially increasing population rate, decrease in natural resources, due to climate change and pollution cause environmental derangement that is a threat to the ecosystem. Environmental pollution is one of the vital problems around the world. Environmental pollution; It is classified as air, water, soil, visual pollution and noise nuisance. Pollution in the atmosphere is one of the leading environmental pollutions. Air pollution; It occurs as a result of extraneous substances, which can be found in solid, liquid and gaseous forms in the air, reaching the amount and density that will have an adverse impact on living and non-living creatures and on the ecological balance in a certain period of time. Air Pollution, in other words, is the presence of extraneous substances in the air in the form of solids, liquids and gases in the atmosphere in an amount, density and time that harms human health, the life cycles of other living things and ecological stabilization. The air layer is polluted with the wastes generated during the production and consumption activities that occur as a result of the various activities that people carry out to meet the needs of their ever-developing population, negatively impacting the living life on the earth and even in some regions, this situation has become very difficult to control. Air pollutants can be named as; pollutants such as particulate matter (PM2.5, PM10), sulphur dioxide (SO2), nitrogen oxides (NOX), carbon monoxide (CO) and Ozone (O3). Worldwide, the problem of air pollution stands out as one of the most important issues that negatively affect the ecosystem (especially in densely urbanised areas). According to the study conducted by the World Health Organization, 99% of the world's population is exposed to polluted air where the determined air quality limit values are exceeded. In places where industrialization is intense and where vehicle density and settlements are high, the air pollution level increases with the influence of meteorological parameters and topography. In this case, air pollutants with concentrations above normal continue to threaten human health. Since air pollution has many negative effects, some scientists and researchers are conducting research on air pollution to reduce impacts of air pollution and to find environmentally friendly solutions to this crucial issue. It is essential to measure air pollutants to reduce the socio-economic loss caused by air pollution. Air quality describes the level of pollutants in the atmosphere (Sulphur dioxide (SO2), Particulate matter (PM2.5, PM10), Oxides of nitrogen (NOX) and Ozone (O3). The installation of air quality stations is extremely critical in detecting the level of air pollution in a region. Set-up and development of air quality stations has great importance to debate with various pollutions. Air quality stations are needed to detect and analyse the air quality in a region. The Ministry of Environment and Urbanization of the Republic of Turkey has significantly increased the measurement network within the scope of the National Air Quality Monitoring Network. Air quality monitoring is carried out in all provinces of Turkey to detect the level of air pollutants. Stations have been established, and data on pollutants is collected at the established stations every hour. Due to the small number of air quality measurement stations established to measure air pollution, the amount of air pollutants cannot be determined clearly. At the same time, the problem of missing data arises due to malfunctions in air quality stations. Therefore, air quality stations are insufficient to determine the amount of pollutants. Nowadays, as the data processing capacity of computers has increased, data related to different subjects can be processed, modelled and visualized. Detailed analysis of air pollutants can be made using machine learning methods and artificial neural network models through various programs on air pollution. Erzurum is one of the places where air pollution is observed under the influence of meteorological and topographic factors in Turkey. This study focused on pollutant estimation for stations with missing data using machine learning algorithms. Within the scope of the study in Erzurum province from 01-01-2022 to 01-10-2023 to measure pollutant substances, such pollutants; (PM2.5, PM10, SO2, CO, NO2, NO, NOX, O3) and meteorological parameters (temperature, wind speed, wind direction, rainfall amount, pressure, humidity) were used. In the prediction phase, first the missing data was completed using the kNN machine learning algorithm. However, some of the pollutants are not measured at all at some stations where measurements are taken. A training data set (80% of the data) and a test data set (20% of the data) were created for the estimation of the unmeasured pollutant parameter. After completing the missing data, Linear Regression, Decision Tree Regressor, Support Vector Regression, (SGD Regressor) were performed using the Python programming language. It is aimed to estimate the pollutants of the unmeasured station by using KNeighbors Regressor, Random Forest Regressor, Extra Trees Regressor, MLP Regressor, Gradient Boosting Regressor machine learning methods. To determine the error rates in each of the 8 methods, mean absolute error (MAD), mean absolute percentage error (MAPE), mean square error (MSE), root mean square error (RMSE) and R2 (coefficient of determination) values were calculated. During the model installation phase, the entire pollutant data set and the entire meteorological data set of Erzurum station were used for SO2, O3, NOX and NO2 parameters. 80% of this data was randomly selected as training data and 20% as test data. Taşhan station data was used in the models established for PM10, PM2.5 and NO pollutant parameters. The entire data set of Aziziye station and the meteorological data set were used in model setup for the CO parameter. As a result of the study, when we looked at the measurement criteria of the models established for all pollutant parameters, it was seen that the most successful models were the Extra Trees Regressor and Random Forest Regressor models. After this process, with the Extra Trees Regressor model established, in order to estimate the pollutant that was not measured at the station, the station data with the missing pollutant was entered into the model and the pollutant that was not measured was estimated. At the same time, prediction success was examined by looking at the percentage error rate of each predicted pollutant. It was observed that the percentage deviation value of the NO group was lower than other pollutant parameters. It is thought that the study will contribute to air quality studies in the region and to fill in the lack of air pollution data in other cities. In this way, it is thought that strategic planning can be made to reduce environmental problems and will contribute to taking precautions to improve air quality in the future.
Benzer Tezler
- XRD'de X-ışını kırınım verilerinin yapay zeka yöntemleri ile analizi
Analysis of X-ray diffraction (XRD) data using artificial intelligence techniques
ÖZCAN ALİ KALKAN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBatman ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
PROF. DR. ÖMER FARUK ERTUĞRUL
- Inversion for elasticity tensor of focal region using machine learning algorithms
Makine öğrenimi algoritmaları kullanılarak deprem odak bölgesinin esneklik tensörünün çözülmesi
YILMAZ ÜNAL
Yüksek Lisans
İngilizce
2023
Jeofizik MühendisliğiBoğaziçi ÜniversitesiJeofizik Ana Bilim Dalı
DOÇ. DR. ÇAĞRI DİNER
- Makine öğrenimi algoritmaları kullanılarak kaçak elektrik takibi ve kontrol sisteminin gerçekleştirilmesi
Realisation of illegal electricity tracking and control system using machine learning algorithms
ÖNDER CİVELEK
Doktora
Türkçe
2024
Elektrik ve Elektronik MühendisliğiKaradeniz Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. HALİL İBRAHİM OKUMUŞ
- Makine öğrenimi algoritmaları kullanılarak EEG sinyallerinden matematik oyun performans tahmini
Math game performance prediction from EEG signals using machine learning algorithms
PINAR KILIÇ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiEğitim Teknolojileri Ana Bilim Dalı
PROF. DR. MUHAMMET DEMİRBİLEK
DR. ÖĞR. ÜYESİ DURMUŞ KOÇ
- Forecasting of Turkey's total electricity consumption in sectoral bases using machine learning algorithms
Makine öğrenimi algoritmaları kullanılarak sektörel bazda Türkiye'nin toplam elektrik tüketiminin tahmini
MHD KHAIR HAJJAR
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Kültür ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İLAYDA ÜLKÜ