Kimyasal verilerin tahmini için python yazılımı ile karar ağaçları uygulaması
Decision tree application with python software for estimating chemical data
- Tez No: 938985
- Danışmanlar: DOÇ. DR. OĞUZ AKPOLAT
- Tez Türü: Yüksek Lisans
- Konular: Kimya, Chemistry
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Kimya Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 74
Özet
Atık suların özelliklerinin belirlenmesinde Biyokimyasal oksijen ihtiyacı (BOD5), kimyasal oksijen ihtiyacı (COD), toplam organik karbon (TOC) ve çözünmüş oksijen (DO) miktarlarının tayini atık suyun karakterizasyonu açısından en temel ölçüm kriterleridir. Biyolojik oksijen ihtiyacı (BOD5), atık su arıtma tesislerine gelen ham atık su veya arıtılmış atık sudan alınan örneklerle yapılacak olan asitlik (pH), sıcaklık (T), iletkenlik (C), çözünmüş oksijen (DO), oksijen doygunluğu (SO), tuzluluk (SA), elektriksel iletkenlik (EC), kimyasal oksijen ihtiyacı (COD), askıda katı madde (LSS), toplam azot (TN), toplam fosfor (TP) ile birlikte BOD5 en az 5 gün sürerken diğerlerin hepsi bir günden az olmaktadır. Daha önce yapılan yukarıdaki parametrelerin ölçüldüğü bir çalışmada 334 adet örneğe ilişkin veri setinde veri setinde bulunan bu parametrelerinin karar ağacı yöntemiyle KNIME veri madenciliği paketinden yararlanarak BOD5 parametresine etkileri irdelenmiştir. Böylece BOD5 parametresine etkileri bilinen parametrelerin ağırlıklı etkileri dikkate alınarak sonucu bilinmeyen bir örneğin muhtemel BOD5 değerinin tahminine çalışılmıştır. Bu çerçevede yapılmış olan bu çalışmada ise bu veri seti esas alınarak, veri madenciliği yöntemlerinden Python algoritması ile kodlanan karar ağacı yöntemi ile hem yapısal hem de sonuçlar açısından ayrıntılı olarak incelenmiştir. Python yazılımı ile kodlanarak modellenmiş ve algoritmanın diğer parametrelere bağlı olarak BOD5 parametresini tahmin etmedeki performansı karar kuralları çıkarılarak incelenmiştir. Python ile programlamanın temeli olarak Pandas, NumPy, Pyplot ve scikit-learn paketleri kullanılmıştır. Karışıklık matrisine bakıldığında toplam verileri oluşturan test verileri için dağılım yani sonuçlara ilişkin uyum mükemmeldir. Seçilen 4 parametrenin analiz sonuçlarını gösteren veri setinden elde edilen sonuçlar incelendiğinde BOD5 334 örneğin değer dağılımı %72 oranında 250'nin altındaydı. BOD5 değeri 251-500 arasında olanların oranı yüzde 18, 500-750 arasında olanların oranı ise yüzde 6 ve BOD5 değerini en çok etkileyen değişkenin COD (Kimyasal Oksijen İhtiyacı) olduğu anlaşılmaktadır. Bu çalışmanın sonuçlarının beklendiği gibi daha önce KNIME yazılımı ile gerçekleştirilen çalışma ile karşılaştırıldığında, çok yakın olduğu anlaşılmaktadır
Özet (Çeviri)
Determination of biochemical oxygen demand (BOD5), chemical oxygen demand (COD), total organic carbon (TOC) and dissolved oxygen (DO) amounts in determining the properties of wastewater are the most basic measurement criteria for the characterization of wastewater. Biological oxygen demand (BOD5), acidity (pH), temperature (T), conductivity (C), dissolved oxygen (DO), oxygen saturation (SO), which will be determined by samples taken from raw wastewater or treated wastewater coming to wastewater treatment plants. BOD5 along with salinity (SA), electrical conductivity (EC), chemical oxygen demand (COD), suspended solids (LSS), total nitrogen (TN), total phosphorus (TP) last at least 5 days, while all others take less than one day. In a previous study where the above parameters were measured, the effects of these parameters in the data set of 334 samples on the BOD5 parameter were examined using the decision tree method and the KNIME data mining package. Thus, an attempt was made to estimate the possible BOD5 value of a sample whose results were unknown, taking into account the weighted effects of the parameters whose effects are known on the BOD5 parameter. In this study conducted within this framework, based on this data set, it was examined in detail, both structurally and in terms of results, using the decision tree method coded with the Python algorithm, one of the data mining methods. It was modeled by coding with Python software, and the performance of the algorithm in estimating the BOD5 parameter depending on other parameters was examined by deriving decision rules. Pandas, NumPy, Pyplot and scikit-learn packages were used as the basis of programming with Python. Looking at the confusion matrix, the distribution for the test data that constitutes the total data, that is, the agreement regarding the results, is excellent. When the results obtained from the data set showing the analysis results of the 4 selected parameters were examined, the BOD5 value distribution of 334 samples was below 250 at a rate of 72%. The rate of those with BOD5 values between 251-500 is 18 percent, those with values between 500-750 are 6 percent, and it is understood that the variable that affects the BOD5 value the most is COD (Chemical Oxygen Demand). It is understood that the results of this study are very close as expected when compared to the previous study performed with KNIME software.
Benzer Tezler
- Estimation of PM10 variations in the Southeastern and Eastern Anatolia regions of Türkiye using remote sensing and statistical models
Türkiye'nin Güneydoğu ve Doğu Anadolu bölgelerindeki PM10 değişimlerinin uzaktan algılama ve ı̇statistiksel modeller kullanılarak tahmini
SULTANAY MURZAEVA
Yüksek Lisans
İngilizce
2024
Bilim ve Teknolojiİstanbul Teknik Üniversitesiİklim ve Deniz Bilimleri Ana Bilim Dalı
PROF. DR. ALPER ÜNAL
- Bazı Türk linyitlerinin kısa-elementel değerleri kullanılarak maseral dağılımlarının belirlenmesi
Determination of maceral distributions using proximate and ultimate analysis of some Turkish lignites
GÖKHAN ALABAŞ
Yüksek Lisans
Türkçe
2025
Jeoloji MühendisliğiAkdeniz ÜniversitesiJeoloji Mühendisliği Ana Bilim Dalı
DOÇ. DR. SELİN KARADİREK
- Estimation of microstructure movement underflow using motion vectors in video
Akış altındakı mikroyapı hareketinin videodaki hareket vektörleri kullanılarak tahmini
REZA SADEGHI
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET CAN ERTEN
- Development of data-drıven models for estımatıng mud and fıltrate alkalınıty usıng machıne learnıng applıcatıons
Makine öğrenimi uygulamaları kullanarak çamur ve filtrat alkalinitesini tahmin etmek için veri odaklı modellerin geliştirilmesi
AHMET ÖNDER
Yüksek Lisans
İngilizce
2025
Petrol ve Doğal Gaz Mühendisliğiİstanbul Teknik ÜniversitesiPetrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İHSAN BURAK KULGA
DR. SERCAN GÜL
- Evaluation of three semi-empirical soil moisture estimation models in agriculture areas with Radarsat-2 imagery processing in the Southeast of Turkey
Güneydoğu Türkiye tarımsal alanlarında, Radarsat-2 uydu görüntülerinin işlenmesi ile yarı-deneysel, üç toprak nemi tahmin modelinin geliştirilmesi
ELNAZ BEHNAM MAKOEI
Yüksek Lisans
İngilizce
2015
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. SEDEF KENT PINAR