Machine learning analysis of data collected from published literature on photocatalytic reforming of glycerol
Gliserolün fotokatalitik reformlaması hakkında literatürden toplanan veriler ile makine öğrenmesi analizi
- Tez No: 860421
- Danışmanlar: PROF. DR. RAMAZAN YILDIRIM
- Tez Türü: Yüksek Lisans
- Konular: Kimya Mühendisliği, Chemical Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Kimya Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 81
Özet
Bu tezin amacı, gliserolün fotokatalitik reformlanması hakkında yayınlanmış literatürden toplanan verideki bilgiyi açığa çıkarmaktır. 93 makaleden 791 veri noktası toplanmıştır. Bu veriler makine öğrenmesi metotları için temizlenmiş, düzenlenmiş ve hazırlanmıştır. Rastgele orman ve YSA (Yapay Sinir Ağı) makine öğrenmesi teknikleri olarak kullanılmıştır. Bu teknikleri kullanarak, bant aralığı ve hidrojen üretim hızları için modeller oluşturulmuştur. Aşırı öğrenmeyi önlemek için tüm modellere çapraz doğrulama uygulanmıştır. Hidrojen üretim hızı modeli için, bant aralığında eksik olan değerler, bant aralığının YSA modelinde tahmin edilen değerler ile doldurulmuştur. Rastgele ormanda, özelliklerin önemi belirlenmiş ve sonuca en yüksek etkisi olan değişkenler bulunmuştur. Bant aralığı için en önemli olan değişkenler kokatalizörün ağırlık yüzdesi, yarıiletkenin yüzdesi ve kalsinasyon sıcaklığıdır. Hidrojen üretim hızı için en önemli değişkenler fotokatalizör yüklemesi, bant aralığı, gliserol konsantrasyonu, kokatalizörün ağırlık yüzdesi ve pH'dır. Rastgele ormanda, ağaç sayısı ve düğümün içerdiği örnek sayısı için k-katmanlı çapraz doğrulamada test/eğitim seti ayırma oranı ve k değerleri değiştirilerek en iyi model belirlenmiştir. Bant aralığı için 0.25 test/eğitim seti ayırma oranı, 4-katmanlı çapraz doğrulama, 41 ağaç ve 1 örnek, 0.234 RMSE ve 0.73 R-kare ile en iyi sonucu vermiştir. Hidrojen üretim hızı modeli için ise 0.25 test/eğitim seti ayırma oranı, 5-katmanlı çapraz doğrulama, 81 ağaç ve 2 örnek, 1.09 x 104 RMSE ve 0.71 R-kare değeri ile en iyi model olmuştur. YSA için, nöron sayısı, aktivasyon fonksiyonu, test/eğitim seti ayırma yüzdesi ve k değerleri değiştirilerek en iyi model belirlendi. Bant aralığı için 0.3 test/eğitim seti ayırma oranı, 4-katmanlı çapraz doğrulama, 52 nöron ve ReLU aktivasyon fonksiyonu, 0.282 RMSE ve 0.70 R kare değeri ile en iyi modeli vermiştir. Hidrojen üretim hızı için ise 0.25 test/eğitim seti ayırma oranı, 7-katmanlı çapraz doğrulama, 3 nöron ve ReLU aktivasyon fonksiyonu RMSE 1.47 x 104 ve R-kare değeri 0.60 ile en iyi modeli vermiştir.
Özet (Çeviri)
In this thesis, the aim is to extract knowledge from the data that was collected from published literature about photocatalytic reforming of glycerol. 791 data points were collected from 93 articles. This data was cleaned, organized, and prepared for the machine learning methods. Random forest and ANN (Artificial Neural Network) were used as machine learning techniques. By using them, the models for band gap and hydrogen production rates were constructed. Cross validation was applied to all models to prevent overfitting. For hydrogen production rate model, the missing values for band gap were filled with the predicted values of ANN of band gap. In random forest, feature importance was determined and the variables with the highest effect on the result were found. For band gap, the most important variables were weight percent of cocatalyst, percent of semiconductor and calcination temperature and duration. For hydrogen production rate, the most significant variables were photocatalyst load, band gap, glycerol concentration, weight percent of cocatalyst and pH. In random forest, the best model was determined by changing test/train split and k values in k-fold cross validation for various tree number and number of samples in a leaf node. For band gap model, 0.25 test/train split and 4-fold with 41 trees and 1 sample was the best model with RMSE (Root Mean Square Error) of 0.234 and R-squared of 0.73. For hydrogen production rate model, 0.25 test/train split and 5-fold with 81 trees and 2 samples was the best model with RMSE of 1.09 x 104 and R-squared value of 0.71. For ANN, test/train split ratio, k value for k-fold cross validation, the number of neurons and activation function were changed to find the best model. For band gap, 52 neurons and ReLU function gave the best model with RMSE of 0.282 and R-squared value of 0.70 with 0.3 test/train split and 4-fold cross validation. For hydrogen production rate model, 0.25 test/train split ratio, 7-fold cross validation, 63 neurons and ReLU function gave the best model with RMSE of 1.47 x 104 and R-squared value of 0.60.
Benzer Tezler
- A machine learning model to guide the synthesis of supported palladium catalysts
Başlık çevirisi yok
KÜBRA TIRAŞ
Yüksek Lisans
İngilizce
2023
Kimya MühendisliğiKoç ÜniversitesiKimya ve Biyoloji Mühendisliği Ana Bilim Dalı
PROF. DR. ALPER UZUN
- Sentiment analysis in Iraqi Arabic dialects based on distributed representations of sentences and machine learning approach
Cümlelerin dağıtılmış temsilleri ve makine öğrenmesi yaklaşımına dayalı Irak lehçelerinde duygu analizi
ANWAR ADNAN MZHER ALNAWAS
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NURSAL ARICI
PROF. DR. MEHMET HAKKI SUÇİN
- Gemilerde enerji verimliliğinin izlenmesi ve raporlanması
Monitoring and reporting of energy efficiency in ships
EMRE HÜSMEN
Yüksek Lisans
Türkçe
2017
Enerjiİstanbul Teknik ÜniversitesiGemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı
PROF. DR. OĞUZ SALİM SÖĞÜT
- Analysis of signal processing algorithms for detection of human vital signs using uwb radar
Hayati bulguların geniş bantlı radar sistemleri ile tespitinde kullanılan sinyal işleme algoritmalarının analizi
CANSU EREN
Doktora
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. MESUT KARTAL
PROF. DR. SAEİD KARAMZADEH
- Machine learning-enabled stress detection in children using physiological signals during robot assisted therapy
Çocuklarda makine öğrenmesi ile desteklenmiş robot ile yapılan terapi sırasında fizyolojik sinyallerle stres tespiti
SEVGİ NUR BİLGİN AKTAŞ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Eğitimi Ana Bilim Dalı
PROF. DR. HATİCE KÖSE