Geri Dön

Estimating the band gap of materials with machine learning methods

Malzemelerin Bant Aralığının Makine Öğrenmesi Yöntemleriyle Tahmin Edilmesi

  1. Tez No: 748740
  2. Yazar: AYDIN EROL
  3. Danışmanlar: DOÇ. DR. SEÇKİN DÜNDAR GÜNAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Fizik ve Fizik Mühendisliği, Physics and Physics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Fizik Ana Bilim Dalı
  12. Bilim Dalı: Fizik Bilim Dalı
  13. Sayfa Sayısı: 57

Özet

Makine öğrenmesi yöntemleri son on yılda kayda değer ilerleme göstermiştir. Bu yöntemlerin fiziğin çeşitli alanlarındaki uygulamalarının sayısı ve niteliği de ayrıca artmaktadır. Makine öğrenmesi algoritmaları bir veri setindeki örüntüyü öğrenebilen ve sonrasında hedef alınan etiketin değerlerini tahmin edebilen matematiksel modellerdir. Öğrenebilen bir algoritmanın seçilmesi ve en iyi hale getirilmesi, probleme ve kullanılan veri setinin yapısına bağlıdır. Bir modeli eğitmeden önce bu veri setinin işlenmesi ve özelliklerin seçilmesi ayrıca önemlidir. Makine öğrenmesi yöntemleri kullanılarak materyallerin bant aralığını tahmin ederken modeli en iyileştirmede kullanılan yöntemlerin incelenmesi bu tezin ana amacıdır. Bant yapılarının bilinmesi, güneş panelleri veya ışık yayan diyotlar gibi çevresel teknolojiler için ayrıca önemlidir. Bu gibi teknolojiler yarı-iletken materyallerden oluşur ve tüm yarı-iletkenler için geçerli olduğu üzere materyallerin bant aralıkları bu materyallerin iletkenliğini belirler. Materyal özelliklerinin tahmin edilmesi, ilgili simülasyonlara veya deneylere uzun mesai saatlerinin ve bilgisayar kaynaklarının ayrılmasını gerektirmesi nedeniyle zorlayıcıdır. Makine öğrenmesi bu problemler için gereken iş yükünü azaltarak genel verimin artması için bir çözüm sunabilmektedir. Bu tez çalışmasında önerilen rastgele orman modeli Python programlama dili kullanılarak geliştirilmiş ve en iyi hale getirilmiştir. Birden çok hata ölçüsünü bir geri bildirim aracı olarak kullanan özel yapım özellik seçici algoritma son modelin performansını iyileştirmiştir. Sonuçların gösterdiği üzere Citrine ve Matminer veri setlerindeki materyallerin bant aralıkları, en iyileştirilmiş rastgele orman modeli tarafından 0.500 eV'tan az bir ortalama mutlak hata ve 0.800'den yüksek R2 puanı ile tahmin edebilmektedir.

Özet (Çeviri)

Methods of machine learning have shown significant progress in the last decade. The number and quality of applications of these methods in various fields of physics are also increasing. Machine learning algorithms are mathematical models that can learn patterns in a data set and estimate the values of the target label afterward. The selection and optimization of a learning algorithm depend on the problem and the structure of the used data set. Processing this data set and selecting features before training a model is also important. Predicting the band gap of different types of materials with machine learning methods while investigating methods that are used for model optimization is the main objective of this thesis. Knowing the band structures is especially important in environmental technologies, such as solar panels or light-emitting diodes. They consist of semiconductor devices, and like all semiconductor materials, their band gap determines their conductivity. Forecasting material properties in physics is challenging because of the long work hours and computational resources required to dedicate to related experiments or simulations. Machine learning can offer a solution to these problems and increase overall efficiency by decreasing workloads. The proposed random forest model was developed and optimized in Python programming language. A custom feature selector algorithm that utilizes multiple metrics as a feedback tool to select optimal features also improves the performance of the final model. Results show that the optimized random forest model can predict band gaps of the materials in the Citrine and Matminer data sets with less than the mean absolute error value of 0.500 eV and an R2 score higher than 0.800.

Benzer Tezler

  1. Design, production and industrial applications of ferroelectric photovoltaic cells

    Ferroelektrik fotovoltaik hücrelerin dizaynı, üretilmesi ve endüstriyel uygulamaları

    DENİZ ÇOBAN ÖZKAN

    Doktora

    İngilizce

    İngilizce

    2021

    Makine MühendisliğiManisa Celal Bayar Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET TÜRK

  2. Determination of optimal material as TLD device for radiation dosimetry application

    Radyasyon dozimetrisi uygulaması için TLD cihazı olarak optimum malzemenin belirlenmesi

    AHMED ABDULHASAN HUSSEIN ZARKOOSH

    Doktora

    İngilizce

    İngilizce

    2024

    Fizik ve Fizik MühendisliğiSüleyman Demirel Üniversitesi

    Fizik Ana Bilim Dalı

    PROF. DR. İSKENDER AKKURT

  3. Quantitative analysis of carbon nanotube suspensions, synthesis of inorganic nanostructured materials and their characterization

    Karbon nanotüp süspansıyonlarının kantitatif analizi, inorganik nanoyapılı malzemelerin üretimi ve karakterizasyonu

    ALİ CAN ZAMAN

    Doktora

    İngilizce

    İngilizce

    2015

    KimyaYıldız Teknik Üniversitesi

    Malzeme Bilimi ve Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZ KAYA

    PROF. DR. FİGEN KAYA

  4. Design, analysis, simulation and optimization of a MEMS Lorentz force magnetic field sensor for biosensing of biowarfare agents

    Biyolojik savaş ajanlarının tespit uygulamaları için Lorentz kuvveti temelli manyetik alan sensörünün tasarımı, analizi, simülasyon ve optimizasyonu

    EMİNE RUMEYSA YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Nanobilim ve Nanomühendislik Ana Bilim Dalı

    PROF. DR. LEVENT TRABZON