Design and implementation of models on deep learning and machine learning algorithms using NASA MDP dataset for software fault prediction

Yazılım hata tahmini için NASA MDP veri kümesini kullanarak derin öğrenme ve makine öğrenimi algoritmalarına ilişkin modellerin tasarımı ve gerçekleştirilmesi

PDF İndir

Tez No: 850998
Yazar: BARAAH MAHMOOD KHUDHAIR ALSANGARI
Danışmanlar: DR. ÖĞR. ÜYESİ GÖKSEL BİRİCİK
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2024
Dil: İngilizce
Üniversite: Yıldız Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
Sayfa Sayısı: 116

Özet

Yazılım Hata Tahmini (YHT), yazılım mühendisliği ve kalite güvencesinin bir alt alanıdır ve yazılım sistem hatalarını, zayıflıklarını ve anormallikleri tanımlanmasını ve öngörülmesini sağlar. Bu sorunları yazılım kalitesini ve güvenilirliğini etkilemeden düzeltme amacını taşır. Bu tez, NASA'nın JM1 veri kümesini kullanarak Makine Öğrenimi (MÖ) ve Yapay Sinir Ağları'nın (YSA) Derin Öğrenme (DÖ) ile iki YHT modeli önermektedir. MÖ modelinde, normalizasyon için Min-Max ölçekleyici kullanılmış olup, Doğrusal Regresyon (DR), Destek Vektör Makinesi (DVM), Rastgele Orman (RO), Karar Ağacı (KA), K-En Yakın Komşu (KEYK) ve Naive Bayes (NB) sınıflandırıcıları uygulanmıştır. Seçilen özellik sayısına (8, 13, 21) bağlı olarak, örnekleme olmadan, Rastgele Örnekleme (ROE) ve Sentezli Azınlık Örnekleme Tekniği (SMOTE) ile sınıf dengesizliği için üç senaryo da sunulmuştur. Sonuçlara göre, 21 özellik kullanan RO diğer sınıflandırıcılara göre sırasıyla 0.81, 0.92 ve 0.88 doğrulukla daha iyi performans göstermiştir. Bu sonuç, yöntemin varyans azaltma ve güvenilir tahminleme açısından güçlü olduğunu göstermiştir. Sınıflandırma doğruluğunu arttırmak amacıyla veri ön işleme adımlarına İnterquartile Range (IQR) tekniği eklenmiş ve aykırı değerler temizlenmiştir. YSN modellerinde ağırlıkları ilklendirme için normal ve tekdüze metotları kullanılmıştır. Model uygulamasında ADAM ve RMSprop optimizatörleri kullanılmış ve farklı epoklar ve katmanlarla test edilmiştir. Sonuçlar, tekdüze ilklendirme ve ReLU aktıvasyon fonksiyonunun geniş katman sayılı modeller için daha optimal olduğunu göstermiştir. Ayrıca, ADAM'ın parametreye özel öğrenme oranlarını hesapladığı için RMSprop'tan daha iyi çalıştığı görülmüştür. Bunun yanında, ADAM optimizatörünün geçmiş gradyanlara bağlı olarak eğitim öğrenme oranlarını ayarladığı, momentum kullanarak gradyan bilgisini biriktirdiği ve yakınsamayı hızlandırdığı sonuçlarına varılmıştır.

Özet (Çeviri)

Software Fault Prediction (SFP) is a subfield of software engineering and quality assurance that identifies and predicts software system faults, vulnerabilities, and abnormalities. The goal is to fix these problems before they affect software quality and reliability. Thus, this thesis proposes two SFP models of Machine Learning (ML) and Deep Learning (DL) of Artificial Neural Networks (ANN) with employing NASA's JM1 dataset. In ML model, Min Max scalar is used for normalization, Linear Regression (LR), Support Vector Machine (SVM), Randon Forest (RF,) Decision Tree (DT), K-Nearest Neighbor (KNN), and Naive Bayes (NB) classifiers have been executed. Based on the number of features selected (8, 13, 21), three scenarios of no sampling, Random over Sampling (ROS), and Synthetic Minority Over-sampling Technique (SMOTE) for class imbalancing are also provided. Results showed that RF outperform other classifiers for three scenarios with accuracy of 0.81, 0.92, and 0.88 using 21 features respectively. Concluded it's powerful in variance reduction and reliable prediction. To improve the accuracies, the Interquartile Range (IQR) technique is added to the preprocessing steps for removing the outliers. For the ANN models, normal and uniform initialization methods are used for the weights. ADAM and RMSprop optimizers are included in model implementation with different epochs and layers. Results indicate that using uniform method and ReLU activation function is optimal on models having more layers due to the wider range of initialization. Also, it has been concluded that ADAM outperforms RMSprop because it calculates parameter-specific learning rates. Additionally, it adjusts training learning rates depending on past gradients and uses momentum to accumulate gradient information and speed convergence.

Benzer Tezler

Tez No
833083
Cevap seçimi için derin öğrenme tabanlı bir melez zeki sistem tasarımı ve gerçekleştirimi
Design and implementation of deep learning-based hybrid intelligent system for answer selection
CANER ULUTÜRK
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ege Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYBARS UĞUR
Tez No
898581
Makine öğrenmesi tabanlı iç ortam sıcaklık kontrolü için bir simülatör yazılımı tasarımı
Design of a simulator software for machine learning-based indoor temperature control
AYDIN BOSTANCI
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Sakarya Üniversitesi
Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. DEVRİM AKGÜN
Tez No
918729
Açık uçlu soruların yapay zeka destekli otomatik değerlendirilmesi ve kullanıcı deneyimleri
Open-ended questions' automatic evaluation with artificial intelligence, and user experiences
ABDULKADİR KARA
Doktora
Türkçe
2025
Eğitim ve Öğretim Atatürk Üniversitesi
Bilgisayar ve Öğretim Teknolojileri Ana Bilim Dalı
DOÇ. DR. SERKAN YILDIRIM
Tez No
847538
Proposing a hybrid talent acquisition methodology towards tanker industry
Tanker endüstrisine yönelik bir hibrit yetenek kazanım yöntemi önerisi
MUHİTTİN ORHAN
Yüksek Lisans
İngilizce
2024
Denizcilik İstanbul Teknik Üniversitesi
Deniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. METİN ÇELİK
Tez No
637211
Deep learning based dynamic turkish sign language recognition with leap motion
Derin öğrenme tabanlı leap motıon ile dinamik türk işaret dili tanıma
BURÇAK DEMİRCİOĞLU KAM
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HATİCE KÖSE

Geri Dön