Machine learning analysis on nanomaterials literature data and knowledge exploration
Makine öğrenimi ile nanomalzeme literatür verisinin analizi ve bilgi keşfi
- Tez No: 877814
- Danışmanlar: PROF. DR. NİLGÜN BAYDOĞAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Nanobilim ve Nanomühendislik Ana Bilim Dalı
- Bilim Dalı: Nanobilim ve Nanomühendislik Bilim Dalı
- Sayfa Sayısı: 185
Özet
Bu tez çalışmasının bilimsel literatüre katkısı, alüminyum katkılı çinko oksit filmler için süreç-özellik ve yapı-özellik arasındaki ilişkileri genelleştirmek, bu ilişkilerin ortaya çıkmasını sağlayan önemli proses ve yapı parametreleri bulmaktır. Malzeme paradigması, temel olarak süreç, yapı, özellik ve performans arasındaki bağlantıları tanımlamayı amaçlamıştır. Literatürde çok sayıda deneysel ve hesaplamalı araştırma yapılmış olmasına rağmen, nanomalzemelerin proses – yapı – özellik - performans etkileşimleri hakkında henüz sınırlı bilgiye sahip olduğumuz düşünülmektedir. Bunun önemli sebeplerinden birisi, PSPP çalışmalarının neden – sonuç temelli tümdengelim yöntemine dayanmasıdır ve tümevarım yöntemine yeterli çaba gösterilmemesidir. Ayrıca bilim insanları çoğunlukla kendi izlenimlerine göre önemli olduğunu düşündükleri veya yayınlanmış literatürlerde başarılı deneysel çalışmaların sağlamış olduğu etkiyi ölçümlemeye odaklanırlar. Ancak başarısız deneyler de, temelde, gözden kaçan önemli tasarım bilgisine sahip olabilir. Buna benzer senaryolarda, bilim camiası istemeden de olsa önyargıya yaratmaya ve eksik bilgi kazanımına yol açmıştır. Sonuç olarak bilgi sınırlı bir alanda derinleşmekle beraber, büyük resim içerisinde çok düşük verimlilik elde edilmektedir. Bu durum aynı zamanda bilimsel sürecin yavaşlamasına ve tıkanmasına da neden olmaktadır. Dolayısıyla, literatürde deneysel ve hesaplamalı yollarla elde edilen veri üzerinden genelleştirilmiş sezgisel tasarım kuralların çıkarımı, kritik proses parametereleri ve malzeme yapı özelliklerinin belirlenmesi ve veriye dayalı tasarım tahminleme araçlarının oluşturulması hem literatürde tekrar edilebilirliği için bilginin genelleştirilmesini, hem de bilimsel keşif sürecin hızlanmasını sağlayacaktır. Bu çalışma özelinde, ağaç tabanlı makine öğrenim algoritmaları kullanılarak, alüminyum katkılı çinko oksit filmlerin (AZO ince filmler) ve P3HT tabanlı organik transistörlerin performansını artırabilecek üretim süreci değişkenleri, üretim koşulları ve malzeme yapısı öğeleri belirlenmiştir. Üretim sürecinin girdileri, yapısal özellikler ve malzeme özellikleri arasındaki ilişki, birbirleriyle ilgili olarak nicel bir şekilde tanımlanmıştır. Aynı zamanda en iyi performansı sağlayan proses değişkenleri ve malzeme iç yapı özellikleri veri temelli sezgisel çıkarım ile formülize edilmiştir. Tüm bu sonuçlar itibariyle, her iki film yapısı için de, literatürde elde edilmiş deneysel bilginin yeniden üretilebilirlik sorunu büyük ölçüde azaltılmıştır. Dolayısıyla bundan sonra yapılacak deneysel ve hesaplamalı çalışmalarda deneysel tasarım aracı olara kullanılarak, umut verici malzeme tasarım alanlarının tanımlanması hakkında bilim insanlarına katkı sağlayacaktır.Çalışma doğası gereği kısıtlı bir veri seti ile çalışılması da, gerçek hayat senaryosuna uygulanabilirliği göstermek açısından ek bir değer taşımaktadır. Sol-jel kaplamalı alüminyum katkılı çinko oksit filmler, geniş enerji bandı aralıkları ve düşük elektrik dirençleri nedeniyle, güneş pilleri, transistörlerde ve diyotlarda yüksek performans elde etmek için umut verici, düşük maliyetli bir alternatif olarak literatürdeki farklı çalışmalarda ele alınmıştır. Alüminyum katkılı çinko oksit filmlerinin enerji bandı aralığındaki ve elektriksel özdirencindeki değişikliklerin nedenleri, doping konsantrasyonu, kristal boyutu kristalliği, film kalınlığı ve kafes sabitleri olarak tartışılmıştır. Bununla birlikte, bu çalışmalar genellikle, tek veya birkaç yapısal özellik üzerindeki varyasyonları ve bunların özellikler üzerindeki yerel etkilerini taramak için tasarlanmış kontrollü deneylerdir. Bu yapısal özelliklerin genel tasarım alanındaki genel önemi nadiren ortaya çıkmıştır. Ayrıca, bu çalışmaların tekrarlanabilirliği, deneysel verilerdeki kaçınılmaz gürültü ve deneysel koşullar hakkında eksik raporlama nedeniyle tartışmaya sürekli açık kalmaktadır ve bilim insanları tarafından sıkça sorgulanmaktadır. Bu çalışmada, makine öğreniminin alümiyum katkılı çinko oksit tasarım hedeflerine uygunluğu, çeşitli makine öğrenim deneyleri ve karşılaştırma yöntemi ile gösterilmiş ve sonuçları raporlanmıştır. Fizik tabanlı modellere düşük maliyetli bir alternatif olarak, makine öğrenim algortimalarının daha geniş enerji bant aralıklarına ve daha düşük elektrik direncine sahip alüminyum katkılı çinko oksit filmleri başarıyla tahmin edebildiği makine öğrenim deneyleri ile ortaya konmuştur. Ayrıca karar ağacı modeli, yapısal özelliklerin enerji bant aralığı ve elektriksel direnç özellikleri için önem düzeyini için doğrudan yorumlanmıştır. Buna göre alümiyum konsantrasyon oranı ve film kalınlığı, sırasıyla, enerji bant aralığı ve elektriksel direnç için en önemli yapısal özellikler olarak bulunmuştur. Optimal film performansını ortaya çıkaran yapısal özellik formülasyonu da yine bu çalışmalar sırasında elde edilmiştir. Tek örnek dışlanarak yapılan çapraz doğrulama deneyleri, karar ağacı modelinin enerji bant aralığı ve elektriksel direnç tahmininde ortalama doğruluğunu yaklaşık %60 ve %84, ortalama geri çağırma peformansını %60 ve %82, ve hassasiyet düzeyini yaklaşık %55 ve %90 olarak hesaplamıştır. poly(3-hexylthiophene-2,5-diyl) temelli organik alan etkili transistörler son yirmi yılda, amorf silikon alan etkili transistörlerle karşılaştırılabilir elektrik performansıyla, solüsyon tabanlı yöntemler kullanılarak düşük maliyetle, esnek alt tabakalar üzerinde, oda sıcaklığında veya yakınında imal edilebilme gibi bazı ek avantajlarla, umut vaat eden bir anahtar teknoloji olarak ortaya çıkmıştır. poly(3-hexylthiophene-2,5-diyl) organik alan etkili transistörlerinin pratikte yüksek performans ile çalışabilmesi, elektriksel özellikleriyle doğrudan bağlantılıdır. Genel anlamda organik alan etkili transistörlerde alan etkili yük taşıma özelliği, malzeme özellikleri, solüsyon tabanlı üretim süreci değişkenleri ve cihazın geometrik özellikleri arasındaki karmaşık ilişkiye büyük ölçüde bağımlıdır. Bilimsel literatürdeki önemli deneysel çalışmalar, poly(3- hexylthiophene-2,5-diyl) organik alan etkili transistörler için bu ilişkinin anlaşılmasına ayrılmıştır. Bununla birlikte, çok boyutlu, doğrusal olmayan ve oldukça belirsiz değişkenlerin varlığı göz önüne alındığında, sınırlı sayıda deneysel çalışmaya dayalı insan güdümlü çıkarım kullanarak bu ilişkiyi açıklayan sağlam ve sistematik bilgiyi belirlemek zordur. Basit istatistiksel yöntemlerle en umut verici deney bölgelerine odaklanmak da yetersizdir çünkü yayınlar çeşitli kaynaklara dağılmıştır ve birçok uyumsuzluk ve çatışma içermektedir. Öte yandan, organik alan etkili transistör araştırma topluluğuna daha öngörülebilir bir hedef sağlamak için literatür verisinde saklı kalmış sistematik bilginin ortaya çıkarılması gerekmektedir. Bu çalışma, literatürdeki nadir çalışmalardan biri olarak, poly(3-hexylthiophene-2,5- diyl) organik alan etkili transistörler için solüsyon temelli tabanlı fabrikasyon çalışmalarını içeren bir veri tabanı oluşturulmuş ve makine öğrenimi algoritmaları kullanılarak analiz edilmiştir. Analizin ilk aşamasında, kaplama yönteminin cihaz performansı üzerinde büyük etkiye sahip olduğu görüldükten sonra, ana veri seti daldırarak kaplama ve döndürerek kaplama veri setlerine ayrılmıştır. Daldırarak kaplama yöntemiyle üretilen cihazlarda dielektrik yüzeyinin kaplama öncesi iyileştirme yapılması cihaz performansının iyileşmesinde en önemli etmen olduğu ortaya konulmuştur. Döndürerek kaplama işleminde ise solvent tipi ve tavlama süresinin cihaz performansını artttırmada en önemli etmenler olduğu ortaya çıkartılmıştır. Ayrıca, karar ağacı algoritmasının yorumlanabilirlik avantajından faydalanılarak, hem daldırarak kaplama yöntemi hem de döndürerek kaplama yönteminde cihaz performansında optimizasyonunu sağlayan proses reçeteleri ortaya çıkartılmıştır. Bilgi çıkarımında kullanılan modeller %90 civarında bir başarı oranına sahip olmanın yanı sıra F1 skoru, geri çağırma ve hassasiyet ölçütlerinde de %90 civarı başarı oranı göstermiştir.
Özet (Çeviri)
In this thesis study, regression- and classification-based machine learning analyzes were used to understand process-property and structure-property relationships of thin film materials. As an aspect of materials paradigm, two distinct efforts were comprehensively performed on poly(3-hexylthiophene-2,5-diyl) (P3HT) thin films, and aluminum doped zinc oxide (AZO) thin films. The extended automated machine learning workflows were used to find proper regression algorithm, and hyperparameters, that can demonstrate high prediction capability by coefficient of determination, 𝑅2. These models can be used as thin film design tools for screening promising design areas before real laboratory experiments to be performed.These models can improve the efficiency of laboratory studies, in terms of both reducing time and financials. In this way, the formed models has been named for two most critical challenges in scientific development. The study is also reducing the reproducibility issue for both film structures.In this endeavor, a tree-based method and a hierarchical agglomerative clustering algorithm were both applied on the dataset compiled from published literature. According to the performance of nanomaterials, the clustering method generated performance classes (for example, field effect charge carrier mobility for transistors, electrical resistivity, energy bang gap characteristics etc.). After creating performance classes, tree-based algorithms looked for the most important process variables, conditions, or structural elements that could improve the performance of nanomaterials. The relationship between the inputs to the fabrication process, structural characteristics, and material properties can be defined in quantitative manner by the relevance each other. Sol-gel deposited aluminum doped zinc oxide films have been shown to be a promising and cost-effective transparent conductive oxide for achieving high performance in solar cells, transistors, and diodes due to their wide energy band gap and low electrical resistivity. The reasons for variations in energy band gap and electrical resistivity of aluminum doped zinc oxide films have been discussed as doping concentration, crystalline size crystallinity, film thickness, and lattice constants. In this study, as a low-cost alternative to physics-based models, decision tree can successfully predict aluminum zinc oxide films films with wider energy band gaps and lower electrical resistance. Furthermore, decision tree model was interpreted to obtain the level of importance of structural features for the energy bandgap and electrical resistance properties, as well as generalizable combinations of structural features of aluminum zinc oxide films from narrow experimental studies. The film thickness and aluminum doping concentration were found as the most critical structural features for electrical resistivity and energy band gap characteristics, respectively. It was also expressed that the microstructural features should be considered holistic design considerations because of having similar level of importance among each other. The ability of poly(3-hexylthiophene-2,5-diyl) organic field effect transistor devices to work with high performance in practice is directly related to their electrical properties. In general, the field effect charge carrying capability of organic field effect transistor devices is highly dependent on the complex relationship between material properties, solution-based manufacturing process variables, and the geometric properties of the device. The significant experimental studies in scientific literature are devoted to understanding this relationship for organic field effect transistors. However, given the presence of multidimensional, nonlinear, and highly uncertain variables, it is difficult to determine robust and systematic knowledge describing this relationship using human-driven inference based on a limited number of experimental studies. In this study, a database containing peer-reviewed solution-based fabrication studies for organic field effect transistors was generated and analyzed using a data-driven framework, a combination of hierarchical clustering algorithm and decision tree classification algorithm, to deduce and generalize the design heuristics that neither naked-eye inference nor simple statistical tools can provide
Benzer Tezler
- Ailevi Akdeniz Ateşi'nde kolşisin tedavisinin makine öğrenmesi analizi
Machine learning analysis of colchicine treatment in Familial Mediterranean Fever
MUHAMMET İKBAL YILDIZ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBilecik Şeyh Edebali ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SALİM CEYHAN
- Revealing the dynamic changes induced by various peptides on TCR-pMHC via molecular dynamics simulation techniques
TCR-pMHC'de çeşitli peptidlerin neden olduğu dinamik değişimlerin moleküler dinamik simülasyon teknikleri ile ortaya çıkarılması
ELİF NAZ BİNGÖL AKSOY
Doktora
İngilizce
2024
BiyofizikMarmara ÜniversitesiBiyomühendislik Ana Bilim Dalı
DOÇ. DR. PEMRA ÖZBEK SARICA
- Büyük veri analizi için yeni algoritmalar
New algorithms for big data analysis
BURAK GÜLMEZ
Doktora
Türkçe
2021
Endüstri ve Endüstri MühendisliğiErciyes ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SİNEM KULLUK
- Twitter verileri kullanılarak koronavirus aşıları hakkındaki kamu algısının zaman içindeki değişiminin yapay zeka destekli duygu analizi ile incelenmesi
Investigation of trend change in public perception of coronavirus vaccines over time using Twitter data with artificial intelligence-assisted sentiment analysis
UĞUR ERTOY
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKütahya Dumlupınar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUAMMER AKÇAY
- Optimization of Nb-Ti-B master alloy in aluminum a356 parts with general factorial and neuro-regression
Alüminyum a356 parçalarda Nb-Ti-B master alaşımının genel faktöriyel ve sinirsel regresyon ile optimizasyonu
BATUHAN DOĞDU
Yüksek Lisans
İngilizce
2023
Metalurji Mühendisliğiİzmir Katip Çelebi ÜniversitesiMalzeme Bilimi ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. ONUR ERTUĞRUL
DOÇ. DR. LEVENT AYDIN