Geri Dön

Machine learning analysis of data collected from published literature on photocatalytic reforming of glycerol

Gliserolün fotokatalitik reformlaması hakkında literatürden toplanan veriler ile makine öğrenmesi analizi

  1. Tez No: 860421
  2. Yazar: RÜVEYDA KARAKOYUN
  3. Danışmanlar: PROF. DR. RAMAZAN YILDIRIM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Kimya Mühendisliği, Chemical Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Kimya Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 81

Özet

Bu tezin amacı, gliserolün fotokatalitik reformlanması hakkında yayınlanmış literatürden toplanan verideki bilgiyi açığa çıkarmaktır. 93 makaleden 791 veri noktası toplanmıştır. Bu veriler makine öğrenmesi metotları için temizlenmiş, düzenlenmiş ve hazırlanmıştır. Rastgele orman ve YSA (Yapay Sinir Ağı) makine öğrenmesi teknikleri olarak kullanılmıştır. Bu teknikleri kullanarak, bant aralığı ve hidrojen üretim hızları için modeller oluşturulmuştur. Aşırı öğrenmeyi önlemek için tüm modellere çapraz doğrulama uygulanmıştır. Hidrojen üretim hızı modeli için, bant aralığında eksik olan değerler, bant aralığının YSA modelinde tahmin edilen değerler ile doldurulmuştur. Rastgele ormanda, özelliklerin önemi belirlenmiş ve sonuca en yüksek etkisi olan değişkenler bulunmuştur. Bant aralığı için en önemli olan değişkenler kokatalizörün ağırlık yüzdesi, yarıiletkenin yüzdesi ve kalsinasyon sıcaklığıdır. Hidrojen üretim hızı için en önemli değişkenler fotokatalizör yüklemesi, bant aralığı, gliserol konsantrasyonu, kokatalizörün ağırlık yüzdesi ve pH'dır. Rastgele ormanda, ağaç sayısı ve düğümün içerdiği örnek sayısı için k-katmanlı çapraz doğrulamada test/eğitim seti ayırma oranı ve k değerleri değiştirilerek en iyi model belirlenmiştir. Bant aralığı için 0.25 test/eğitim seti ayırma oranı, 4-katmanlı çapraz doğrulama, 41 ağaç ve 1 örnek, 0.234 RMSE ve 0.73 R-kare ile en iyi sonucu vermiştir. Hidrojen üretim hızı modeli için ise 0.25 test/eğitim seti ayırma oranı, 5-katmanlı çapraz doğrulama, 81 ağaç ve 2 örnek, 1.09 x 104 RMSE ve 0.71 R-kare değeri ile en iyi model olmuştur. YSA için, nöron sayısı, aktivasyon fonksiyonu, test/eğitim seti ayırma yüzdesi ve k değerleri değiştirilerek en iyi model belirlendi. Bant aralığı için 0.3 test/eğitim seti ayırma oranı, 4-katmanlı çapraz doğrulama, 52 nöron ve ReLU aktivasyon fonksiyonu, 0.282 RMSE ve 0.70 R kare değeri ile en iyi modeli vermiştir. Hidrojen üretim hızı için ise 0.25 test/eğitim seti ayırma oranı, 7-katmanlı çapraz doğrulama, 3 nöron ve ReLU aktivasyon fonksiyonu RMSE 1.47 x 104 ve R-kare değeri 0.60 ile en iyi modeli vermiştir.

Özet (Çeviri)

In this thesis, the aim is to extract knowledge from the data that was collected from published literature about photocatalytic reforming of glycerol. 791 data points were collected from 93 articles. This data was cleaned, organized, and prepared for the machine learning methods. Random forest and ANN (Artificial Neural Network) were used as machine learning techniques. By using them, the models for band gap and hydrogen production rates were constructed. Cross validation was applied to all models to prevent overfitting. For hydrogen production rate model, the missing values for band gap were filled with the predicted values of ANN of band gap. In random forest, feature importance was determined and the variables with the highest effect on the result were found. For band gap, the most important variables were weight percent of cocatalyst, percent of semiconductor and calcination temperature and duration. For hydrogen production rate, the most significant variables were photocatalyst load, band gap, glycerol concentration, weight percent of cocatalyst and pH. In random forest, the best model was determined by changing test/train split and k values in k-fold cross validation for various tree number and number of samples in a leaf node. For band gap model, 0.25 test/train split and 4-fold with 41 trees and 1 sample was the best model with RMSE (Root Mean Square Error) of 0.234 and R-squared of 0.73. For hydrogen production rate model, 0.25 test/train split and 5-fold with 81 trees and 2 samples was the best model with RMSE of 1.09 x 104 and R-squared value of 0.71. For ANN, test/train split ratio, k value for k-fold cross validation, the number of neurons and activation function were changed to find the best model. For band gap, 52 neurons and ReLU function gave the best model with RMSE of 0.282 and R-squared value of 0.70 with 0.3 test/train split and 4-fold cross validation. For hydrogen production rate model, 0.25 test/train split ratio, 7-fold cross validation, 63 neurons and ReLU function gave the best model with RMSE of 1.47 x 104 and R-squared value of 0.60.

Benzer Tezler

  1. A machine learning model to guide the synthesis of supported palladium catalysts

    Başlık çevirisi yok

    KÜBRA TIRAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Kimya MühendisliğiKoç Üniversitesi

    Kimya ve Biyoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. ALPER UZUN

  2. Sentiment analysis in Iraqi Arabic dialects based on distributed representations of sentences and machine learning approach

    Cümlelerin dağıtılmış temsilleri ve makine öğrenmesi yaklaşımına dayalı Irak lehçelerinde duygu analizi

    ANWAR ADNAN MZHER ALNAWAS

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NURSAL ARICI

    PROF. DR. MEHMET HAKKI SUÇİN

  3. Gemilerde enerji verimliliğinin izlenmesi ve raporlanması

    Monitoring and reporting of energy efficiency in ships

    EMRE HÜSMEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Enerjiİstanbul Teknik Üniversitesi

    Gemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı

    PROF. DR. OĞUZ SALİM SÖĞÜT

  4. Analysis of signal processing algorithms for detection of human vital signs using uwb radar

    Hayati bulguların geniş bantlı radar sistemleri ile tespitinde kullanılan sinyal işleme algoritmalarının analizi

    CANSU EREN

    Doktora

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. MESUT KARTAL

    PROF. DR. SAEİD KARAMZADEH

  5. Machine learning-enabled stress detection in children using physiological signals during robot assisted therapy

    Çocuklarda makine öğrenmesi ile desteklenmiş robot ile yapılan terapi sırasında fizyolojik sinyallerle stres tespiti

    SEVGİ NUR BİLGİN AKTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Eğitimi Ana Bilim Dalı

    PROF. DR. HATİCE KÖSE