Predicting the bandgap of hole-transport materials by deep learning
Derin öğrenme ile delik geçiş malzemelerinin bant aralığı tahmini
- Tez No: 784015
- Danışmanlar: PROF. DR. ADEM TEKİN
- Tez Türü: Yüksek Lisans
- Konular: Kimya, Chemistry
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
- Bilim Dalı: Hesaplamalı Bilim ve Mühendislik Bilim Dalı
- Sayfa Sayısı: 71
Özet
Günümüzde kömür, petrol ve doğal gaz gibi geleneksel enerji üretim yöntemleri dünyanın artan nüfusunun ve sanayisinin enerji ihtiyacını karşılamakta zorlanmaktadır. Bu geleneksel enerji üretim yöntemleri yüksek karbon salınımı nedeniyle çevreye verdiği zarar vermekte ve küresel ısınmaya neden olmaktadır. Bu yöntemlerin gelecekte sürdürülebilir olmadığı aşikardır. Tüm bu dezavantajlar göz önünde bulundurulduğunda, enerji üretiminin yenilenebilir yöntemlerle üretilmesi büyük önem taşımaktadır. Yenilenebilir enerji yöntemleri arasında da en öne çıkan seçenek güneş enerjisidir. Perovskite güneş hücreleri, %25'lere ulaşan yüksek enerji dönüşüm oranları ve düşük üretim maliyetleri sayesinde güneş enerjisi teknolojilerinde fazlaca tercih edilmekte ve gelecek vaat etmektedir. Bu hücreler, fotovoltaik güneş panelleri endüstrisine de önemli bir soluk getirmiştir. Perovskite güneş hücreleri, ismini perovskite mineralinden almaktadır. Bu mineral ilk olarak Alman mineralojist Gustrav Rose tarafından 1839 yılında Ural dağlarında keşfedilmiş ve onun çalışma arkadaşı olan Lev Perovsky'nin ismi bu minerale verilmiştir. Bu mineral temelde kalsiyum titanat (CaTiO3) olarak da bilinir ve kalsiyum titanat kristal yapısına sahip diğer malzeme sınıfları da aynı isimle bilinir. Perovskite güneş hücrelerinin performansında delik geçiş malzemeleri (hole transport materials, HTM) önemli rol oynar. Bu malzeme ve katman, diğer katmanların kimyasal reaksiyona girmesini önler, katmanlar arasında enerji bariyeri yükseliğinin ayarlamasına yardımcı olur ve hücrenin stabilitesinin artırılmasına yardımcı olur. Perovskite hücrelerinde kullanılan delik geçiş malzemeleri inorganik, polimer, küçük veya büyük organik moleküller gibi birçok tipte seçilip kullanılabilir. Delik geçiş malzemelerinde en çok kullanılan ve çalışılan molekül ise 2,2',7,7'-tetra[N,N-bis(4-methoxyphenyl)amino]-9,9'-spirobifluorene kimyasal yapısına sahip olan Spiro-OMeTAD organik molekülüdür. Delik geçiş malzemelerinin performansı ise en yüksek dolu molekül orbitali (the highest occupied molecular orbital, HOMO) ve en düşük boş molekül orbitali (the lowest unoccupied molecular orbital, LUMO) enerji seviyeleriyle yakından ilişkilidir. Bu iki enerji seviyesi arasındaki aralık ise bant aralığı (bandgap) olarak adlandırılır. Bant aralığı değeri Perovskite güneş hücrelerinin enerji dönüşüm performansını etkilemektedir. Literatürde yürütülen çalışmalarda bant aralığı için ideal değerin 1-4 eV (elektron Volt) arasında olduğu gösterilmiştir. HOMO, LUMO ve bant aralığı gibi quantum kimyasal özelliklerin hesaplamasında en çok tercih edilen yöntemlerden biri yoğunluk fonksiyoneli teorisi yöntemidir (Density functional theory, DFT). Bu yöntem hesaplamalı fizik, kimya, biyoloji ve malzeme biliminde oldukça yaygın, deneylerle uyumlu sonuçlar üretebilen bir yöntemdir. Organik moleküllerden proteinlere kadar birçok yapının quantum kimyasal özelliklerinin hesaplanmasında kullanılmaktadır. Yöntemin başarısına rağmen, hesaplama maliyeti yüksektir. Seçilen yapının quantum kimyasal bir özelliğinin hesaplanması, kullanılan bilgisayar donanımına bağlı olarak günler hatta haftalar sürebilir. Günümüzde bu hesaplama maliyetlerinin minimuma indirebilmesi için yapay sinir ağları çokça kullanılmaktadır. Özellikle grafik işlem birimi donanımlarının (graphical processing unit, GPU) performansındaki dramatik gelişmeler ve yapay sinir ağlarındaki önemli iyileştirmeler sayesinde makine öğrenmesi ve derin öğrenme alanları her geçen gün geleneksel ve deterministik hesaplama yöntemleriyle aradaki farkı kapatmaktadır. Yapay sinir ağları insan beyninin bilgiyi nasıl işlediği üzerine yapılan çalışmalar neticesinde geliştirilmiş olan bir teknolojidir ve ana kullanım alanı derin öğrenme yöntemleridir. Karşılaşılan problemlere ilişkin farklı yapay sinir ağı modelleri geliştirilmiştir. Örneğin görüntü tanıma çalışmaları için evrişimli sinir ağları (convolutional neural network, CNN); doğal dil işleme, yazı ve konuşma çevirileri için yinelemeli sinir ağları (recurrent neural network, RNN); grafiklerle tanımlanabilen molekül gibi yapılar için de grafik sinir ağları (graph neural networks) oluşturulmuştur. Yapay sinir ağları sağlık sektöründe kanser hücrelerinin önceden belirlenmesi, otomotiv sektöründe kendi kendine gidebilen otonom araçların tasarlanması, havacılık ve savunma sektöründe uydu görüntülerinden tehdit algılanması, fabrikalarda üretim sistemlerinin optimizasyonu, yüz tanıma sistemleri, moleküllerin quantum kimyasal özelliklerin tahmin edilebilmesi gibi birçok sektör ve konuda kullanılmakta, başarılı sonuçlar vermektedir. Bu çalışmada delik geçiş malzemelerinin bant aralığı değerlerinin tahmin edilmesi için yapay sinir ağları kullanıldı. Tahmin edilmesi istenen yapı molekül olduğundan evrişimli sinir ağları (CNN) ve grafik sinir ağları (GNN) içeren modeller tercih edildi. Yapılan araştırmalar sonucunda çalışmaya uygun olan SchNetPack ve ALIGNN modelleri seçildi. Kuantum özelliklerin çalışıldığı araştırmalarda en popüler veri seti QM9 olmasına rağmen, bu çalışmada OMDB (Open Material Database) veri seti ile ilerlendi. Çünkü bu çalışmanın konusu olan delik geçiş malzemeleri büyük moleküller olduğundan QM9 veri seti ile modellerin eğitilmesi uygun değildir. QM9 veri seti yaklaşık 134000 molekül içermesine rağmen, veri seti içindeki moleküllerin atom sayısı büyük çoğunlukla 10-25 arasındadır. Bu da QM9 ile eğitilen modellerin büyük yapılarda başarısız olmasına neden olmaktadır. OMDB veri setinde 12500 molekül bulunmaktadır ve moleküllerin ortalama atom sayısı 82'dir. Yapay sinir ağları, eğitim sırasında çokça veriye ihtiyaç duymaktadır. Veri miktarı modellerin performansını doğrudan etkilemektedir. Küçük veri setleriyle çalışıldığı zaman, model eğitim setindeki tüm koşulları ezberlemekte ve aşırı uyum gösterme (overfitting) problemi ortaya çıkmaktadır. Aşırı uyum gösteren model, test veri setinde de bu koşulları aradığı için kötü performans vermektedir. OMDB veri setindeki yapıların sayısını artırmak için yapay çoğaltma (augmentation) yöntemi seçilmiş ve bu işlem AugLiChem kütüphanesi seçilmiştir. Yapay çoğaltma yöntemi, var olan veri seti üzerinden, var olan verilerde ufak değişiklikler yapılarak yeni görüntüler veya yapılar elde etme işlemidir. Bu sayede mevcut veri setindeki veri miktarı artırılmış olur. Örneğin, bir veri setinde araba görüntüleri azsa, bu görüntüler yakınlaştırılarak, kırpılarak veya ters çevrilerek yeni görüntüler elde edilir. Böylece model farklı görüntüler göreceğinden eğitim süresince aşırı uyum sağlama problemi belli oranda engellenmiş olur. Çalışmada öncelikle OMDB veri seti yapay çoklamaya maruz bırakılmadan kullanıldı. SchNetPack ve ALIGNN modellerinin makalelerinde yer verilen varsayılan parametrelerle eğitim süreci gerçekleştirildi. Eğitim süreci NVIDIA Tesla A100 (40GB), 2 adet NVIDIA RTX A4500 (20GB) ve NVIDIA RTX A4000 (16GB) grafik kartları üzerinde gerçekleştirildi. Yapılan eğitim sonucunda SchNetPack ve ALIGNN modelleri için MAE değeri sırasıyla 0.43 eV ve 0.25 eV bulundu. Bu değerlere sahip modellerle Spiro-OMeTAD molekülünün bant aralığı tahmini yapıldı. Literatür değeri 3.05 eV olan bant aralığı, SchNetPack ve ALIGNN modelleri tarafından sırasıyla 2.73 eV ve 2.52 olarak tahmin edildi. Daha sonra OMDB veri setine Kristalografi Açık Veritabanı'nda (Crystallography Open Database, COD) bulunan 10 adet delik geçiş malzemesi yapısı ve her bir yapı için 10 adet konformer olacak şekilde toplamda 100 adet yapı eklendi. Eklenen bu yapılarla beraber veri setine AugLiChem kütüphanesi ile yapay çoklama yöntemi uygulandı. Model performansını artırabilmek için yeni yapıların araştırılmasına devam edildi ve makale taramalarından 79 yeni yapı daha bulundu. Bu yapıların bant genişliği değerleri DFT metodu ile hesaplandıktan sonra veri setine eklendi. Yapılan bu işlemler neticesinde veri setinde toplamda 52835 yapı elde edildi. SchNetPack ve ALIGNN modelleri, yapay çoklanmış OMDB veri seti ve farklı parametrelerle birçok kez eğitildi. Bu eğitimler sonucunda en düşük MAE değerleri SchNetPack ve ALIGNN modelleri için MAE sırasıyla 0.23 eV ve 0.25 eV olarak bulundu. Bu değerlere sahip modellerle Spiro-OMeTAD molekülünün bant aralığı tahmini yapıldı. Literatür değeri 3.05 eV olan bant aralığı, SchNetPack ve ALIGNN modelleri tarafından sırasıyla 2.97 eV ve 2.82 olarak tahmin edildi. Yapılan yapay çoklama ve parametre değişiklikleri sonrasında modellerin MAE değerleri ortalama %40, bant aralığı değeri tahmin performansı ise ortalama %13 oranında artırılmıştır. Bant değeri tahmini yapılan diğer moleküller çalışma içerisinde gösterilmiştir.
Özet (Çeviri)
Conventional energy production methods such as coal, petroleum and natural gas do not supply the need of increasing population and industry. Both supplying the increasing energy demand and protecting the nature against pollution, renewable energy methods are seriously considered. Therefore, the need for renewable energy is increasing everyday. In this context, the most promising renewable energy option is solar energy. Perovskite solar cells (PSCs) are the hot topic in renewable and solar energy technologies and are considered as an encouraging technology because of the high power conversion efficiency along with very low material costs. Hole transport materials (HTMs) are one of the key compounds to improve performance and for highly efficient and stable perovskite solar cells. Density functional theory (DFT) and wavefunction based post-Hartree Fock methods can be utilized to study quantum-chemical properties (such as bandgap) in atomistic systems. Despite its success, DFT calculations become computationally expensive especially for larger molecular systems such as hole transport materials (HTMs). With the help of dramatic developments in GPU hardwares and artificial neural networks, deep learning and machine learning algorithms are used in many areas such as image recognition and classification, object detection, pattern recognition, natual language processing, and even quantum chemistry today. Therefore, the results of calculation that may take weeks are predicted in couple of minutes with a proper dataset and a proper neural network algorithms. Here, we present a case study of how deep learning algorithms can enable bandgap prediction in HTMs. Since the main focus of this study is big organic molecules, QM9, the most common benchmark dataset was not used to train neural network models. The bangdap values of molecules that were calculated by DFT, and their correspoding structures in Organic Material Database (OMDB) were used as datasets to train SchNetPack and ALIGNN neural network algorithms. The fist attempt of training procedures was conducted by default configuration parameters that have been stated in SchNetPack and ALIGNN articles. MAE (Mean Absolute Error) value for SchNetPack and ALIGNN was obtained 0.43 eV and 0.25 eV respectively. In order to improve the efficiency of these models, 10 HTM molecules found on Crystallography Open Database and their 10 conformers were added to the OMDB dataset. The molecules in OMDB dataset were augmented with AugLiChem library to provide more structures. In order to increase the number of structures in the dataset, new structures were searched and 79 new HTMs were found. Their bandgap values were calculated with DFT and their structures were added to the dataset after augmentation process. In the final dataset, 52835 HTM structures were obtained. Training of the models was performed on NVIDIA A100, 2xNVIDIA RTX A4500 and NVIDIA RTX A4000 GPU cards. After tuning the hyperparameters for the models, MAE value for SchNetPack and ALIGNN was obtained to be 0.23 eV and 0.15 eV respectively.
Benzer Tezler
- Photocatalytic hydrogen production over ionic liquid coated semiconductors
İyonik sıvı kaplı yarı iletkenler kullanılarak foto katalitik hidrojen üretimi
ELİF CAN
Doktora
İngilizce
2021
Kimya MühendisliğiBoğaziçi ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. RAMAZAN YILDIRIM
- Thermally stimulated current study of traps distribution in TlGaSeS layered single crystals
TlGaSeS tek kristallerde tuzak dağılımlarının ısıl uyarılmış akım çalışması
HİSHAM NASSER
Yüksek Lisans
İngilizce
2010
Fizik ve Fizik MühendisliğiOrta Doğu Teknik ÜniversitesiFizik Bölümü
PROF. NİZAMİ HASANLİ
- Shape, size and functionalization dependent raman characterization of graphene quantum dots by DFT method
Grafen kuantum noktalarının YFT yöntemi ile şekil, boyut ve fonksiyonel gruba bağlı raman karakterizasyonu
ENES BERKAY GÖNEN
Yüksek Lisans
İngilizce
2024
Kimyaİstanbul Teknik ÜniversitesiKimya Ana Bilim Dalı
PROF. DR. MİNE YURTSEVER
- Estimating the band gap of materials with machine learning methods
Malzemelerin Bant Aralığının Makine Öğrenmesi Yöntemleriyle Tahmin Edilmesi
AYDIN EROL
Yüksek Lisans
İngilizce
2022
Fizik ve Fizik MühendisliğiYıldız Teknik ÜniversitesiFizik Ana Bilim Dalı
DOÇ. DR. SEÇKİN DÜNDAR GÜNAY
- Geçiş metalleri katkılı zno'nun elektronik özellikleri
Electronic properties of zno doped with transition metals
HÜSEYİN CENGİZ ÇEKİL
Yüksek Lisans
Türkçe
2013
Fizik ve Fizik MühendisliğiÇukurova ÜniversitesiFizik Ana Bilim Dalı
PROF. DR. METİN ÖZDEMİR