Makine öğrenmesi algoritmalarına dayalı yazılım hata tahmini: Çevresel metriklerin etkisi

Software fault prediction based on machine learning algorithms: The effect of environmental metrics

PDF İndir

Tez No: 575792
Yazar: MERVE ODABAŞI
Danışmanlar: PROF. DR. ENSAR GÜL
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2019
Dil: Türkçe
Üniversite: İstanbul Şehir Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgi Güvenliği Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 93

Özet

Bu çalışmada 2012-2019 yılları arasında makine öğrenmesi algoritmaları ile yazılım hata tahminleme konusunda, akademik ve sektörel alanda yapılan çalışmalar incelenmiştir. Yapılan inceleme sonucunda akademik alanda, yazılım test alanında makine öğrenmesi çalışmalarının trend olduğu görülmüştür. Word Quality Report'ta kaliteli verinin olmamasından dolayı sektörde makine öğrenmesi çalışmalarının kullanımının az olduğu belirtilmiştir. İlgili çalışmalarda, tahminlemeler esnasında sadece yazılımsal metriklerin kullanıldığı görülmüştür. Bu çalışmada ise, Yazılımsal metriklerin yanında, çevresel metriklerin de sonuç üzerinde etkili olup olmadığı, çevresel metriklerin kullanılarak makine öğrenmesi algoritmaları ile başarılı sonuç tahminleme yapılıp yapılamayacağı, hangi çevresel etkenlerin sonuç üzerinde ne kadar etkili olduğu araştırılmıştır. Çalışma için veri seti, 4 analist, 8 yazılım mühendisi ve 5 test uzmanından oluşan bir ekibinin yapmış olduğu 10 adet projenin çıktıları ile oluşturulmuştur. 36 adet metrik ile 6676 adet test durumu değerlendirilmiştir. Hatayı sadece hata olarak kabul etmenin yanında, hatanın önem derecesi ve test edilemeyecek olan senaryolarda hesaba katılmıştır. Toplamda dokuz adet sonuç tahminlemesi modelde kullanılmıştır. Ön işleme aşamasında PCA analizi yapılmış, 36 adet metrik içerisinden 12 adedinin sonuca etkili olduğu görülmüştür. Dört farklı algoritma ile modeller oluşturulup; karar ağacı algoritmasında 89\%, en yakın komşular algoritmasında 87\%, rastgele ormanlar algoritmasında 88\% ve naive bayes algoritmasında 91\% başarı elde edilmiştir. Sonuç olarak çevresel metriklerin de yazılım test sonucu tahminlemesinde etikili olduğu ve makine öğrenmesi algoritmaları ile kullanıldığında, yüksek oranda başarılı sonuç tahminlemesi yapılabileceği görülmüştür.

Özet (Çeviri)

According to the Word Quality report, the use of machine learning studies in the industrial field is rare due to the severe lack of quality data. Software metrics are generally utilized during software fault prediction in this field. In this study, besides the software metrics, the environmental metrics are also explored to see whether they also affect the results of machine learning and if they could, what would be the success rates and which environmental metrics are more effective on the results. The data set for this study was generated from combining various data from 10 projects that were produced a team of 4 analysts, 8 software engineers, and 5 test experts. 36 metrics and 6676 test cases in total were evaluated. The errors occurred in the test cases are not just considered as an error, their priority and cases that can not be tested are also taken into consideration. 9 fault level are employed in models. During the pre-processing phase, the PCA analysis is conducted, out of 36 metrics 12 are effective to the results. Models are created with four different algorithms which have achieved a success rate of; 89\% by the decision tree algorithm, 87\% by the nearest neighbors algorithm, 88\% by the random forests algorithm and 91\% by the Naive Bayes algorithm. In conclusion, it was observed that environmental metrics are indeed effective in software fault prediction and when applied with machine learning algorithms a high rate of success can be achieved.

Benzer Tezler

Tez No
962042
Contributions to the determination of optimized driving strategies for electric vehicles using artificial intelligence based methods
Elektrikli araçlar için yapay zeka tabanlı yöntemlerle en uygunlaştırılmış sürüş stratejilerinin belirlenmesine katkılar
UFUK BOLAT
Yüksek Lisans
İngilizce
2025
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektrik Mühendisliği Ana Bilim Dalı
DOÇ. DR. DERYA AHMET KOCABAŞ
DOÇ. DR. GÜLCİHAN ÖZDEMİR
Tez No
863624
State of charge estimation of lithium-ion batteries using machine learning approach
Makine öğrenmesi yaklaşımı kullanılarak lityum iyon pillerin şarj durumu tahmini
OSMAN ALPER ALTUN
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektrik Mühendisliği Ana Bilim Dalı
PROF. DR. EMİNE AYAZ
Tez No
950068
Efficient estimation of Shrinkage parameters in fuzzy Ridge and fuzzy Liu regression models using α-cut-based methods under multicollinearity
Çoklu bağıntı durumunda bulanık Ridge ve bulanık Liu regresyon modellerinde α-kesim tabanlı yöntemler kullanılarak Shrinkage parametrelerinin etkin tahmini
AMMAR HOMAIDA
Doktora
İngilizce
2025
İstatistik Gazi Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. MERAL EBEGİL
Tez No
939983
Dairesel kesitli konduitlerin hava giriş oranının nümerik ve makine öğrenmesi ile modellenmesi
Modeling of air inflow rate in circular conduits using numerical and machine learning methods
AYŞE ECE YAĞCI
Doktora
Türkçe
2025
İnşaat Mühendisliği Kahramanmaraş Sütçü İmam Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÜNSAL
Tez No
692595
Building sensor-based real-time predictive maintenance system by utilizing artificial intelligent techniques
Yapay akıllı teknikleri kullanarak sensör tabanlı gerçek zaman tahminli bakım sistemi kurulması
RAGHAD MOHAMMED KHORSHEED
Doktora
İngilizce
2021
Endüstri ve Endüstri Mühendisliği İstanbul Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

Geri Dön