Geri Dön

Machine learning assisted massively parallel crystal structure prediction

Makine öğrenimi destekli paralel kristal yapı tahmini

  1. Tez No: 799709
  2. Yazar: SAMET DEMİR
  3. Danışmanlar: PROF. DR. ADEM TEKİN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Fizik ve Fizik Mühendisliği, Kimya, Computer Engineering and Computer Science and Control, Physics and Physics Engineering, Chemistry
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
  12. Bilim Dalı: Hesaplamalı Bilim ve Mühendislik Bilim Dalı
  13. Sayfa Sayısı: 164

Özet

Kristal yapı tahmini (KYT) materyallerin hesaplamalı taranmasında oldukça önemli bir yer tutar. Günümüze kadar bu konuda birçok yöntem geliştirilmiş olsa da, gelişen teknoloji ile birlikte daha yeni yöntemlerin geliştirilmesi veya var olan yöntemlerin daha ileri bir seviyeye getirilmesi gerekmektedir.KYT problemlerinde birçok yerel minimum noktasının bulunması, küresel optimizasyon yöntemlerinin KYT için kullanılmasını gerekli kılar.KYT için kullanılan küresel optimizasyon yöntemlerinde objektif fonksiyon olarak Yoğunluk Fonksiyonel Teorisi (Density Functional Theory (DFT)) kullanılabilir. Fakat bu yaklaşım hesap süresini büyük bir miktarda arttırdığı için hesap süresi bakımından pahalı bir yaklaşımdır. Bu amaçla objektif fonksiyon olarak kuvvet alanları (force fields) kullanılarak özellikle moleküler kristaller için oldukça başarılı sonuçlar alınabilmektedir.Çalışma grubumuz tarafından yıllar evvel geliştirilmiş olan CASPESA (CrystAl Structure PrEdiction via Simulated Annealing) isimli program kovalent kristallerin modellenmesinde başarıyla kullanılmış ve rapor edilmiştir.Bu tez kapsamında esnek yapıda, kullanması kolay, olabildiğince hızlı, hem kolvalent hem de moleküler kristaller için çalışabilen bir yazılım geliştirilmiştir.KYT problemi günümüzde hala tam anlamıyla çözülememiş bir problemdir.Bir molekülün özelliklerinin birçoğu sadece molekülün şekline bakarak bile belirlenebilir. Burada problem olan kısım ise deneyler sonucunda bu moleküler örüntünün her zaman belirlenemeyebilmesidir.Ayrıca deneysel çalışmalar yürüten bilim insanları için çalışılacak molekülün şeklini ve etkileşimlerini deneyi yapmadan önce ya da yapmaya karar vermeden önce bilmek oldukça kullanışlı ve belirleyici olabilir. KYT için üretilmiş birçok algoritma literatürde hali hazırda bulunsa da, bu algoritmalar genel olarak birbirinden çok farklı prensiplerle çalışmaktadırlar. Bu algoritmalardan birçoğu en iyileme kısmında DFT kullanmakta ve bu yaklaşım onları sadece küçük moleküllerle çalışmak ile kısıtlamakladır.Bu tez kapsamında geliştirilen algoritmada ise, bilgi temelli veya kuvvet alanlarına dayalı objektif fonksiyonlar kullanılmaktadır.Tez kapsamındaki uygulamalardan birinde, birim hücresinde 200'ü geçkin atom bulunan bir yapı başarıyla tahmin edilebilmiştir.Bir diğer önemli ve özgün yaklaşım ise geliştirilen molekül hareket sistemidir. Kristal yapılar için 230 olası simetri bulunur ve veri tabanında bulunan moleküllerin \%99'dan fazlasının simetrik olduğu düşünüldüğünde, oluşturulacak hareket sisteminin simetrili yapı üretme konusunda oldukça başarılı olması gerektiği anlaşılmaktadır.Birçok KYT algoritması sabit bir simetri değerini seçerek sadece o simetride tahminler yapmakta ve böylece eniyilenecek parametre sayısını düşürürken, sadece literatürde sıklıkla karşılaşılan simetri değerlerini kapsamaktadırlar.Tez kapsamında oluşturulan algoritmada ise 230 simetriyi 14 prototipe ayırarak, 14 farklı tahmin seti ile tüm simetri değerlerinin kapsanması hedeflenmiştir. KYT algoritmasınin geliştirilmesi için öncelikle algoritmada kullanılmak üzere optimizasyon algoritmaları geliştirilmiştir.KYT konusundaki başarısı önceki çalışmalarımızdan bilinen Benzetilmiş Tavlama (Simulated Annealing) tekrar ele alınmış ve modernize edilerek daha iyi bir seviyeye getirilmiştir. Modernize edilirken var olan Fortran 77 kodu Modern Fortran özellikleri kullanılarak tekrar yazılmış, çok çekirdekli bilgisayarlarda daha başarılı olması için paralelizasyon yapılmış, simüle eden sıcaklığın daha akıllıca düşürülüp yükseltilmesi için yeni bir karar mekanizması geliştirilmiş, periyodik parametreler tanımlanmış ve daha iyi bir raporlama sistemi geliştirilmiştir. Oluşturulan sistemde görülen en büyük eksiklik, büyük yapılarda çalışırken (8 veya daha büyük formül hücresi) başlangıç bariyerlerinin zor aşılmasıdır. Bu tarz büyük bariyerleri iyi aştığı bilinen Parçacık Sürü Optimizasyonu (Particle Swarm Optimization) konusunda çalışma yapılarak Benzetilmiş Tavlama algoritmasından önce çalışacak şekilde yeni bir algoritma geliştirilmiş ve böylece büyük potansiyel bariyerlerin daha kolay aşılabilmesi sağlanmıştır. Oluşturulan bu yeni hibrit optimizasyon algoritması oldukça genel bir şekilde yazılmış olup sadece KYT değil, birçok optimizasyon problemine rahatlıkla uygulanabilir. Geliştirilen optimizasyon algoritması KYT için hazırlanan hareket ve birim hücre kurallarıyla birleştirilerek bir kristal yapı tahmin algoritması prototipi oluşturulmuştur. Algoritmada bu noktaya kadar henüz bahsedilmemiş olan en önemli kısım ise objektif fonksiyondur.Bu noktada iki farklı yöntem geliştirilmiştir.Yöntemlerden biri tahmin edilecek olan yapıya dair literatürden veya DFT hesaplarından elde edilebilecek bilgilere dayalıyken diğeri ise kuvvet alanlarının kullanımına dayalıdır.Ayrıca, FFCASP Tools adında oldukça yetenekli bir son ve ön işleme aracı geliştirilmiştir.Bu araç FFCASP'ın kullanımını çok kolay hale getirmektedir.Tezde bahsi geçen uygulamaların hepsinde FFCASP Tools çok önemli bir yer tutmaktadır. FFCASP algoritması ile ilk olarak, Cu(I)-TCNQ mollekülünün potansiyel enerji yüzeyini araştırdık. Bu çalışmada bilgiye dayalı objektif fonksiyonu kullanarak, binlerce kristal yapı tahmin edilmiş, FFCASP Tools kullanılarak yapılar benzerliklerine göre sınıflandırılmıştır.Ek olarak bu çalışma kapsamında, literatürde deneysel olarak rapor edilmiş faz-1 ve faz-2 olarak adlandırılan iki yapı bulunarak, bu yapılar arasındaki ilişkinin anlamlandırılması hedeflenmiştir.Ayrıca, deneysel çalışmada faz-1 hakkındaki yapısal detayların çalışma ekinde verildiği söylenmesine rağmen, çalışma ekinde faz-1'e ait detaylar bulunmamaktadır. Çalışmamızda faz-1 konusundaki literatüdeki eksiklik giderilmiş ve yapısal detaylar paylaşılmıştır.Dahası, faz-1 ve faz-2 arasındaki geçişin nasıl gerçekleştiği detaylı bir şekilde gösterilmiştir.Oluşturulan algoritmanın kullanıldığı bir diğer çalışmada, çift katyonlu amin metal borohidrit sınıfında oldukça bilinen bir hidrojen depolama malzemesi olan LiMg(BH4)3(NH3)2 molekülünün kristal yapısı ve hidrojen salma mekanizması incelenmiştir. Bu çalışmada, literatürde raporlanan deneysel yapı başarıyla bulunmakla birlikte, deneysel yapıya nerdeyse eş enerjili birçok polimorf da bulunarak raporlanmıştır.Ek olarak bu çalışma kapsamında, moleküler dinamik ile bu materyal detaylıca incelenmiş, bozunma sırasında diboran oluşumu ya da amonyak salınımı gözlemlenmemiştir. Tezde bahsi geçen üçüncü çalışmada ise, genel formülü Sr(NH3)nCl2} (n=1,2,4,6,8) olan SrCl2 metal halid aminlerin polimorfizm'i üzerine hesaplamalı tarama çalışması yapılmıştır.Bu çalışmada, literatürde rapor edilmiş olan deneysel yapıların başarılı bir şekilde saptanmasının yanı sıra, üzerine çalışılan beş fazın her biri için deneysel yapı ile izoenerjetik olan birçok yapı tahmin edilmiştir.Bu yapılardan umut vadedenler için termodinamik kararlılıklarını incelemek üzere fonon hesapları yapılmış olup, kararlı olduğu tespit edilen yapılar paylaşılmıştır.Buradaki bir önemli bulgu, fonon hesaplarının sonuçlarına göre diamin deneysel yapısının termodinamik olarak kararsız olduğu keşfedilmiş ve bu faz için 4 farklı kararlı yapı saptanmış olmasıdır. Bilgiye dayalı objektif fonksiyonun kullanıldığı tezde bulunan son çalışmada, üç metalli borohidritler için polimorf ve moleküler dinamik çalışması yapılmıştır.Bu çalışmada incelenen yapılar hakkında literatürde hiç bir bilgi bulunmadığından dolayı FFCASP için gerekli olan kuralları elde etmek için farklı bir yol izlenmiştir.Öncelikle veritabanlarında bulunan benzer moleküller kullanılarak ilk kurallar belirlenmiş, daha sonra DFT ile en iyilenen yapılar incelenerek nihai kurallar oluşturulmuştur.Bulunan düşük enerjili yapılar için yapılan moleküler dinamik çalışması LiAlZn(BH4)6 molekülünün umut vaadeden özelliklere sahip olduğunu gösterirken, bozunma sırasında diboran oluşumu da gözlenmemiştir. Tezde yer alan bir sonraki çalışmada ise, önceki çalışmalardan farklı olarak kuvvet alanları objektif fonksiyonda kullanılmıştır. Bu çalışmada Cytosine, Coumarin ve Pyrazinamide gibi önemli moleküller için üretilmiş KYT sonuçları sunulmaktadır.Cytosine için çalışma grubumuz tarafından üretilmiş özel bir kuvvet alanı kullanılırken, coumarin ve pyrazinamide için ise AMBER kuvvet alanı kullanılmıştır.Burada FFCASP'ın hız yeteneklerini açıkça ortaya koyan bir örnek olarak, 16 birim hücreden oluşan, 208 atomlu deneysel cytosine polimorfu başarıyla tahmin edilmiştir.Ayrıca, FFCASP Tools kullanılarak polimorflar sınıflandırılmış ve bir dijital parmak izi oluşturularak yapıların kolayca anlamlandırılması sağlanmıştır.Çalışmada cytosine molekülü için bilinen iki polimorfun ikisi, coumarin için birim hücrede dört ve daha az olan bilinen deneysel üç yapıdan ikisi ve pyrazinamide için bilinen dört deneysel yapıdan üç tanesi başarıyla bulunmuştur.Dahası tahmin çalışması yapılan her molekül için deneysel yapılarla neredeyse eş enerjili ve fonon stabil olan bir çok yapı bulunmuş ve rapor edilmiştir.Coumarin ve pyrazinamide için bulunamayan yapılarda pi - pi etkileşimlerinin önemli olması ve AMBER kuvvet alanının bu tür etkileşimlerde çok iyi çalışmaması, bu yapıların bulunamamasının başlıca sebebidir.Çalışma grubumuz tarafından geliştirilen fakat henüz yayınlanmamış olan yeni bir kuvvet alanıyla bu yapılar kolaylıkla bulunabilmiştir.Tezde bahsi geçen son çalışmada diğer tüm uygulamalardan farklı olarak FFCASP yazılımımız kullanılmamıştır.Bu çalışmada, oldukça önemli ve üzerinde çok çalışılan iki batarya malzemesi, kübik Li7La3Zr2O12 (c-LLZO) ve Li7P3S11 (LPS), için elekton iletkenliğini etkileyen faktörleri açıklamak üzerine hesaplamalar yapılmıştır.İlk olarak c-LLZO (herhangi bir veritabanında veya yayında hazır olarak bulunmamakta) ve Li7P3S11 moleküllerinin kristal yapıları FFCASP Tools yardımıyla oluşturulmuştur.Çalışma sonucunda, incelenen iki yapıda da“küçük”polaronların n-tipi iletkenlikte önemli rol oynadıkları bulunmuştur.

Özet (Çeviri)

Crystal structure prediction (CSP) is of utmost significance in the process of computationally screening materials. Despite the fact that many methods have been developed to date, new methods must be developed or existing methods must be enhanced to keep pace with advancing technology. The presence of numerous local minima in CSP problems necessitates the use of global optimization techniques. Density Functional Theory (DFT) can be used as the objective function for CSP global optimization methods. However, this method is costly as it significantly increases the computation time. For this purpose, force fields are used as an objective function, which can be quite successful, especially for molecular crystals. CASPESA (CrystAl Structure PrEdiction via Simulated Annealing), a program developed by our working group many years ago, has been successfully used and reported for modeling covalent crystals. Within the scope of this thesis, a flexible, easy-to-use and speedy software that can work for both colvalent and molecular crystals, FFCASP (Fast and Flexible CrystAl Structure Predictor), has been developed. Many properties of molecules can be determined simply by observing its structure. Moreover, the CSP problem is still not entirely resolved. Even though there are already a great number of algorithms for CSP accessible in the literature, the majority of them operate according to completely distinct principles. Many of these algorithms rely on DFT in the objective function, which limits their applicability to small molecules. The algorithm devised in this thesis employs knowledge-based or force-field-based objective functions. In one of the implementations presented in this thesis, a structure with more than 200 atoms per unit cell was accurately predicted. This accomplishment is a distinct indication of objective realization; building a very fast and effective algorithm. Another important and unique approach is the molecule movement system. There are 230 possible symmetries for crystal structures and considering that more than 99% of the molecules in the databases has symmetry, it is clear that the motion system to be created must be very successful in producing symmetrical structures. Many CSP algorithms choose a fixed symmetry value and make predictions only in that symmetry, thus reducing the number of parameters to be optimized, while only covering the symmetry values frequently encountered in the literature. In the algorithm created within this thesis, it is aimed to cover all symmetry values with 14 different prediction sets by dividing 230 symmetries into 14 prototypes. In order to improve the CSP algorithm, global optimizer was first developed to be used in the algorithm. Simulated Annealing (SA), whose success in CSP is known from our previous work, was revisited and modernized to a better level. During the modernization, the existing Fortran 77 code was rewritten using Modern Fortran features, parallelization was done to make it more successful on multi-core computers, a new decision mechanism was developed for more intelligent lowering and raising of the simulated temperature, periodic parameters were defined and a better reporting system was developed. The biggest shortcoming of the system is that when working with large structures (8 or more formula units) the initial barriers are difficult to overcome. Particle Swarm Optimization (PSO), which is known to overcome such large barriers well, was studied and a new algorithm was developed to work before the SA algorithm so that large potential barriers could be overcome more easily. This novel hybrid optimization algorithm is written in a manner that makes it applicable to a wide variety of optimization problems, not just CSP. The optimization algorithm is combined with the motion and unit cell rules for CSP to create a prototype crystal structure prediction algorithm. The most important part of the algorithm that has not yet been mentioned up to this point is the objective function. Two different methods were developed for this purpose. One method is based on the knowledge which can be gathered from literature or DFT calculations and the other one one is based on the use of force fields. In addition, a highly capable post-processing and pre-processing tool called FFCASP Tools has been developed. This utility simplifies the use of FFCASP. FFCASP Tools plays a crucial role in each of the applications discussed in this thesis. Numerous CSP applications were executed utilizing FFCASP and FFCASP Tools, and the outcomes of these studies demonstrated that all of our goals have been realized with great success. In the scope of this thesis, a comprehensive analysis of six different applications were provided alongside with the technical details of the algorithm.

Benzer Tezler

  1. Machine-learning-assisted de novo design of molybdenum disulfide binding peptides

    Molibden disülfid bağlayıcı peptitlerin makine öğrenimi destekli de novo tasarımı

    ALP DENİZ ÖĞÜT

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Biyomühendislikİzmir Yüksek Teknoloji Enstitüsü

    Biyoteknoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DENİZ TANIL YÜCESOY

    DR. ÖĞR. ÜYESİ MEHMET SERKAN APAYDIN

  2. Secure and coordinated beamforming in 5G and beyond systems using deep neural networks

    5G ve ötesi sistemlerde derin sinir ağları kullanarak güvenli ve koordineli hüzmeleme

    UTKU ÖZMAT

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET AKİF YAZICI

    DR. ÖĞR. ÜYESİ MEHMET FATİH DEMİRKOL

  3. Design, implementation and BCI-based control of a series elastic mobile robot for home-based physical rehabilitation

    Evde kullanılabilen seri elastik mobil rehabilitasyon robotunun tasarımı, uygulaması ve beyin-bilgisayar arayüzü tabanlı kontrolü

    MİNE SARAÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Mekatronik MühendisliğiSabancı Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VOLKAN PATOĞLU

    DOÇ. DR. MÜJDAT ÇETİN

  4. Machine learning assisted intraoperative assessment of brain tumor margins using HRMAS NMR spectroscopy

    Beyin tümörü sınırlarının ameliyat sırasında HRMAS NMR spektroskopisi kullanılarak makine öğrenimi destekli değerlendirilmesi

    DORUK ÇAKMAKÇI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULLAH ERCÜMENT ÇİÇEK

  5. Makine öğrenmesi destekli akciğer görüntüleme

    Machine learning assisted lung imaging

    GÜLCE LEYLEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NAKİFE YASEMİN TOPALOĞLU

    DR. ÖĞR. ÜYESİ AHMET EGESOY