Geri Dön

Design and implementation of models on deep learning and machine learning algorithms using NASA MDP dataset for software fault prediction

Yazılım hata tahmini için NASA MDP veri kümesini kullanarak derin öğrenme ve makine öğrenimi algoritmalarına ilişkin modellerin tasarımı ve gerçekleştirilmesi

  1. Tez No: 850998
  2. Yazar: BARAAH MAHMOOD KHUDHAIR ALSANGARI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ GÖKSEL BİRİCİK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 116

Özet

Yazılım Hata Tahmini (YHT), yazılım mühendisliği ve kalite güvencesinin bir alt alanıdır ve yazılım sistem hatalarını, zayıflıklarını ve anormallikleri tanımlanmasını ve öngörülmesini sağlar. Bu sorunları yazılım kalitesini ve güvenilirliğini etkilemeden düzeltme amacını taşır. Bu tez, NASA'nın JM1 veri kümesini kullanarak Makine Öğrenimi (MÖ) ve Yapay Sinir Ağları'nın (YSA) Derin Öğrenme (DÖ) ile iki YHT modeli önermektedir. MÖ modelinde, normalizasyon için Min-Max ölçekleyici kullanılmış olup, Doğrusal Regresyon (DR), Destek Vektör Makinesi (DVM), Rastgele Orman (RO), Karar Ağacı (KA), K-En Yakın Komşu (KEYK) ve Naive Bayes (NB) sınıflandırıcıları uygulanmıştır. Seçilen özellik sayısına (8, 13, 21) bağlı olarak, örnekleme olmadan, Rastgele Örnekleme (ROE) ve Sentezli Azınlık Örnekleme Tekniği (SMOTE) ile sınıf dengesizliği için üç senaryo da sunulmuştur. Sonuçlara göre, 21 özellik kullanan RO diğer sınıflandırıcılara göre sırasıyla 0.81, 0.92 ve 0.88 doğrulukla daha iyi performans göstermiştir. Bu sonuç, yöntemin varyans azaltma ve güvenilir tahminleme açısından güçlü olduğunu göstermiştir. Sınıflandırma doğruluğunu arttırmak amacıyla veri ön işleme adımlarına İnterquartile Range (IQR) tekniği eklenmiş ve aykırı değerler temizlenmiştir. YSN modellerinde ağırlıkları ilklendirme için normal ve tekdüze metotları kullanılmıştır. Model uygulamasında ADAM ve RMSprop optimizatörleri kullanılmış ve farklı epoklar ve katmanlarla test edilmiştir. Sonuçlar, tekdüze ilklendirme ve ReLU aktıvasyon fonksiyonunun geniş katman sayılı modeller için daha optimal olduğunu göstermiştir. Ayrıca, ADAM'ın parametreye özel öğrenme oranlarını hesapladığı için RMSprop'tan daha iyi çalıştığı görülmüştür. Bunun yanında, ADAM optimizatörünün geçmiş gradyanlara bağlı olarak eğitim öğrenme oranlarını ayarladığı, momentum kullanarak gradyan bilgisini biriktirdiği ve yakınsamayı hızlandırdığı sonuçlarına varılmıştır.

Özet (Çeviri)

Software Fault Prediction (SFP) is a subfield of software engineering and quality assurance that identifies and predicts software system faults, vulnerabilities, and abnormalities. The goal is to fix these problems before they affect software quality and reliability. Thus, this thesis proposes two SFP models of Machine Learning (ML) and Deep Learning (DL) of Artificial Neural Networks (ANN) with employing NASA's JM1 dataset. In ML model, Min Max scalar is used for normalization, Linear Regression (LR), Support Vector Machine (SVM), Randon Forest (RF,) Decision Tree (DT), K-Nearest Neighbor (KNN), and Naive Bayes (NB) classifiers have been executed. Based on the number of features selected (8, 13, 21), three scenarios of no sampling, Random over Sampling (ROS), and Synthetic Minority Over-sampling Technique (SMOTE) for class imbalancing are also provided. Results showed that RF outperform other classifiers for three scenarios with accuracy of 0.81, 0.92, and 0.88 using 21 features respectively. Concluded it's powerful in variance reduction and reliable prediction. To improve the accuracies, the Interquartile Range (IQR) technique is added to the preprocessing steps for removing the outliers. For the ANN models, normal and uniform initialization methods are used for the weights. ADAM and RMSprop optimizers are included in model implementation with different epochs and layers. Results indicate that using uniform method and ReLU activation function is optimal on models having more layers due to the wider range of initialization. Also, it has been concluded that ADAM outperforms RMSprop because it calculates parameter-specific learning rates. Additionally, it adjusts training learning rates depending on past gradients and uses momentum to accumulate gradient information and speed convergence.

Benzer Tezler

  1. Cevap seçimi için derin öğrenme tabanlı bir melez zeki sistem tasarımı ve gerçekleştirimi

    Design and implementation of deep learning-based hybrid intelligent system for answer selection

    CANER ULUTÜRK

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AYBARS UĞUR

  2. Makine öğrenmesi tabanlı iç ortam sıcaklık kontrolü için bir simülatör yazılımı tasarımı

    Design of a simulator software for machine learning-based indoor temperature control

    AYDIN BOSTANCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. DEVRİM AKGÜN

  3. Proposing a hybrid talent acquisition methodology towards tanker industry

    Tanker endüstrisine yönelik bir hibrit yetenek kazanım yöntemi önerisi

    MUHİTTİN ORHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Denizcilikİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    PROF. DR. METİN ÇELİK

  4. Deep learning based dynamic turkish sign language recognition with leap motion

    Derin öğrenme tabanlı leap motıon ile dinamik türk işaret dili tanıma

    BURÇAK DEMİRCİOĞLU KAM

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HATİCE KÖSE

  5. İmalat sistemlerinin tasarlanması ve öncelik kurallarının belirlenmesinde yapay sinir ağlarının kullanılması

    Başlık çevirisi yok

    TARIK ÇAKAR

    Doktora

    Türkçe

    Türkçe

    1997

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. AYHAN TORAMAN