Estimation of the critical properties of compounds using machine learning algorithms
Makine öğrenmesi algoritmaları kullanılarak bileşiklerin kritik özelliklerinin tayini
- Tez No: 818818
- Danışmanlar: PROF. DR. HASAN SADIKOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Kimya Mühendisliği, Chemical Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Kimya Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Kimya Mühendisliği Bilim Dalı
- Sayfa Sayısı: 80
Özet
Kritik özellikler, endüstriyel birimlerin işletilmesinde ve tasarlanmasında bir mihenk taşı olarak kabul edilir. Bu özellikleri deneysel olarak elde etmek aşırı enerji ve zaman tüketimi gerektirir. Bu nedenle, kimyasal bileşiklerin yapısına bağlı olarak kritik özelliklerin tahmin edilmesinde Grup Katkı Yöntemleri kullanılmaktadır. Lydersen yöntemi bu kapsamda geliştirilen en başarılı yöntemlerden biridir. Birçok araştırmacı, kritik özelliklerin tahmini için geliştirilmiş modeller geliştirmek için bu yöntemi temel olarak kullandı. Son zamanlarda, kimyasal bileşiklerin farklı özelliklerinin tahminini geliştirmek için makine öğrenimi algoritmaları kullanıldı. Bu çalışmada, alkol bileşiklerinin kritik özelliklerini tahmin etmek için çeşitli makine öğrenme algoritmaları (Lineer Regresyon, SVM, DT, Ensembles, GPR ve NN) kullanılmıştır. Bu kapsamda, makine öğrenme modellerini oluşturmak için kullanılan Lydersen sabitlerini elde etmek için 150 alkol bileşiğine Lydersen yöntemi uygulanmıştır. Makine öğrenimi modellerinin doğruluğunu değerlendirmek için R2, MSE, RMSE ve MAE hesaplandı. Modellerin geçerliliğini test etmek için 10 kat çapraz doğrulama yöntemi kullanılmıştır. Girdi değişkenleri arasındaki ilişkiyi anlamak için Pearson korelasyonu yapıldı. Ayrıca, makine öğrenmesi modellerinin oluşturulmasında girdi değişkenlerinin önemini anlamak için özellik seçimi yapılmıştır. Lydersen yönteminin tahmin doğruluğu, makine öğrenimi modellerininkiyle karşılaştırıldı. Tc, Pc ve Vc sırasıyla SVM modeli, GPR modeli ve GPR modeli tarafından en iyi şekilde tahmin edilmiştir. Bu modellerin sırasıyla 0,9842, 0,9685 ve 0,9964 R2 değerleri ile en iyi performansı verdiği bulunmuştur. Lydersen yöntemi kullanılarak Tc, Pc ve Vc tahmininde R2 değerleri sırasıyla 0.9759, 0.9318 ve 0.9943 olarak bulunmuştur. Elde edilen sonuçlar literatür ile karşılaştırıldı. Elde edilen sonuçlar, makine öğrenimi algoritmalarının, özellik tahmini için sağlam modeller oluşturmak için güçlü araçlar olduğunu göstermektedir.
Özet (Çeviri)
Critical properties are considered a cornerstone in operating and designing industrial units. Obtaining these properties experimentally requires excessive consumption of energy and time. Thus, Group Contribution Methods are used for estimating the critical properties depending on the structure of chemical compounds. Lydersen method is one of the most successful methods developed in this scope. Many researchers used this method as a basis to develop improved models for the estimation of critical properties. Recently, machine learning algorithms were employed to enhance the estimation of different properties of chemical compounds. In this study, various machine learning algorithms (Linear Regression, SVM, DT, Ensembles, GPR, and NN) were used to estimate the critical properties of alcohol compounds. In this scope, Lydersen method was applied to 150 alcohol compounds to obtain Lydersen constants which were used to construct the machine-learning models. R2, MSE, RMSE, and MAE were calculated to evaluate the accuracy of the machine learning models. 10-fold cross-validation method was used to test the validity of the models. Pearson correlation was performed to understand the relationship between input variables. Also, feature selection was performed to understand the importance of the input variables in building the machine learning models. The estimation accuracy of the Lydersen method was compared to that of the machine learning models. Tc, Pc, and Vc were best estimated by the SVM model, GPR model, and GPR model, respectively. These models were found to yield the best performance with R2 values of 0.9842, 0.9685, and 0.9964, respectively. In the estimation of Tc, Pc, and Vc using Lydersen method the R2 values were found as 0.9759, 0.9318, and 0.9943, respectively. The obtained results were compared to the literature. The results obtained indicate that machine learning algorithms are powerful tools to generate robust models for property estimation.
Benzer Tezler
- Encapsulation and release of amino acids in double emulsions
Amino asitlerin çoklu emülsiyonlarda enkapsülasyonu ve salımı
ESRA KOCAMAN
Doktora
İngilizce
2021
Gıda Mühendisliğiİstanbul Teknik ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
DOÇ. DR. ASLI CAN KARAÇA
PROF. DR. PAUL VAN DER MEEREN
- Fantom malzemelerinin doku denkliğinin deneysel ve teorik olarak incelenmesi
Experimental and theoretical investigation of tissue equivalency for phantom materials
İREM ERK
Yüksek Lisans
Türkçe
2016
Radyoloji ve Nükleer Tıpİstanbul Teknik ÜniversitesiNükleer Araştırmalar Ana Bilim Dalı
PROF. DR. NESRİN ALTINSOY
- Amin grubu içeren bazı moleküllerin glutatyon redüktaz enzim aktivitesi üzerine etkilerinin in vitro yöntemler ile belirlenmesi
Determining the in vitro effects of chemicals including amine group atom on glutation reductase enzyme activity from human blood
MELİSA SEVAL
Yüksek Lisans
Türkçe
2021
BiyokimyaKilis 7 Aralık ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMET KARAMAN
- Mixtures of fluorinated ether and sulfur derivatives as chlorodifluoromethane (R-22) alternatives
Başlık çevirisi yok
İSMAİL KUL