Design and implementation of models on deep learning and machine learning algorithms using NASA MDP dataset for software fault prediction
Yazılım hata tahmini için NASA MDP veri kümesini kullanarak derin öğrenme ve makine öğrenimi algoritmalarına ilişkin modellerin tasarımı ve gerçekleştirilmesi
- Tez No: 850998
- Danışmanlar: DR. ÖĞR. ÜYESİ GÖKSEL BİRİCİK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 116
Özet
Yazılım Hata Tahmini (YHT), yazılım mühendisliği ve kalite güvencesinin bir alt alanıdır ve yazılım sistem hatalarını, zayıflıklarını ve anormallikleri tanımlanmasını ve öngörülmesini sağlar. Bu sorunları yazılım kalitesini ve güvenilirliğini etkilemeden düzeltme amacını taşır. Bu tez, NASA'nın JM1 veri kümesini kullanarak Makine Öğrenimi (MÖ) ve Yapay Sinir Ağları'nın (YSA) Derin Öğrenme (DÖ) ile iki YHT modeli önermektedir. MÖ modelinde, normalizasyon için Min-Max ölçekleyici kullanılmış olup, Doğrusal Regresyon (DR), Destek Vektör Makinesi (DVM), Rastgele Orman (RO), Karar Ağacı (KA), K-En Yakın Komşu (KEYK) ve Naive Bayes (NB) sınıflandırıcıları uygulanmıştır. Seçilen özellik sayısına (8, 13, 21) bağlı olarak, örnekleme olmadan, Rastgele Örnekleme (ROE) ve Sentezli Azınlık Örnekleme Tekniği (SMOTE) ile sınıf dengesizliği için üç senaryo da sunulmuştur. Sonuçlara göre, 21 özellik kullanan RO diğer sınıflandırıcılara göre sırasıyla 0.81, 0.92 ve 0.88 doğrulukla daha iyi performans göstermiştir. Bu sonuç, yöntemin varyans azaltma ve güvenilir tahminleme açısından güçlü olduğunu göstermiştir. Sınıflandırma doğruluğunu arttırmak amacıyla veri ön işleme adımlarına İnterquartile Range (IQR) tekniği eklenmiş ve aykırı değerler temizlenmiştir. YSN modellerinde ağırlıkları ilklendirme için normal ve tekdüze metotları kullanılmıştır. Model uygulamasında ADAM ve RMSprop optimizatörleri kullanılmış ve farklı epoklar ve katmanlarla test edilmiştir. Sonuçlar, tekdüze ilklendirme ve ReLU aktıvasyon fonksiyonunun geniş katman sayılı modeller için daha optimal olduğunu göstermiştir. Ayrıca, ADAM'ın parametreye özel öğrenme oranlarını hesapladığı için RMSprop'tan daha iyi çalıştığı görülmüştür. Bunun yanında, ADAM optimizatörünün geçmiş gradyanlara bağlı olarak eğitim öğrenme oranlarını ayarladığı, momentum kullanarak gradyan bilgisini biriktirdiği ve yakınsamayı hızlandırdığı sonuçlarına varılmıştır.
Özet (Çeviri)
Software Fault Prediction (SFP) is a subfield of software engineering and quality assurance that identifies and predicts software system faults, vulnerabilities, and abnormalities. The goal is to fix these problems before they affect software quality and reliability. Thus, this thesis proposes two SFP models of Machine Learning (ML) and Deep Learning (DL) of Artificial Neural Networks (ANN) with employing NASA's JM1 dataset. In ML model, Min Max scalar is used for normalization, Linear Regression (LR), Support Vector Machine (SVM), Randon Forest (RF,) Decision Tree (DT), K-Nearest Neighbor (KNN), and Naive Bayes (NB) classifiers have been executed. Based on the number of features selected (8, 13, 21), three scenarios of no sampling, Random over Sampling (ROS), and Synthetic Minority Over-sampling Technique (SMOTE) for class imbalancing are also provided. Results showed that RF outperform other classifiers for three scenarios with accuracy of 0.81, 0.92, and 0.88 using 21 features respectively. Concluded it's powerful in variance reduction and reliable prediction. To improve the accuracies, the Interquartile Range (IQR) technique is added to the preprocessing steps for removing the outliers. For the ANN models, normal and uniform initialization methods are used for the weights. ADAM and RMSprop optimizers are included in model implementation with different epochs and layers. Results indicate that using uniform method and ReLU activation function is optimal on models having more layers due to the wider range of initialization. Also, it has been concluded that ADAM outperforms RMSprop because it calculates parameter-specific learning rates. Additionally, it adjusts training learning rates depending on past gradients and uses momentum to accumulate gradient information and speed convergence.
Benzer Tezler
- Cevap seçimi için derin öğrenme tabanlı bir melez zeki sistem tasarımı ve gerçekleştirimi
Design and implementation of deep learning-based hybrid intelligent system for answer selection
CANER ULUTÜRK
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYBARS UĞUR
- Makine öğrenmesi tabanlı iç ortam sıcaklık kontrolü için bir simülatör yazılımı tasarımı
Design of a simulator software for machine learning-based indoor temperature control
AYDIN BOSTANCI
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. DEVRİM AKGÜN
- Proposing a hybrid talent acquisition methodology towards tanker industry
Tanker endüstrisine yönelik bir hibrit yetenek kazanım yöntemi önerisi
MUHİTTİN ORHAN
Yüksek Lisans
İngilizce
2024
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. METİN ÇELİK
- Deep learning based dynamic turkish sign language recognition with leap motion
Derin öğrenme tabanlı leap motıon ile dinamik türk işaret dili tanıma
BURÇAK DEMİRCİOĞLU KAM
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HATİCE KÖSE
- İmalat sistemlerinin tasarlanması ve öncelik kurallarının belirlenmesinde yapay sinir ağlarının kullanılması
Başlık çevirisi yok
TARIK ÇAKAR
Doktora
Türkçe
1997
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. AYHAN TORAMAN