Automated priority detection in software bugs: A comprehensive study on transformer-based encoders with contrastive learning, large language models and vector databases for enhanced efficiency
Yazılım hatalarında otomatik öncelik tespiti: Arttırılmış verimlilik için karşılaştırmalı öğrenme, büyük dil modelleri ve vektör veritabanları ile transformatör tabanlı kodlayıcılar üzerine kapsamlı bir çalışma
- Tez No: 851193
- Danışmanlar: PROF. DR. İSMAİL HAKKI TOROSLU, DR. ÖĞR. ÜYESİ ÖMER KÖKSAL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Yazılım geliştirme süreçleri, emek ve zaman yatırımı gerektiren birçok zorluğu bünyesinde barındırmaktadır. Zamanla bu zorlukların üstesinden gelmek, yazılım geliştirme ve bakım süreçlerini otomatize edebilmek için birçok araç ve teknik geliştirilmiştir. Yazılım hata raporları, kullanıcılar veya geliştiriciler tarafından programların operasyonel hatalarını belgeleyen, genellikle kod parçacıkları ve hata mesajlarını içeren metinsel açıklamalardır. Bu raporlar daha sonra hataları düzeltmek için atanan geliştirici tarafından incelenir. Hata düzeltme süreçlerinin otomatikleştirilmesi, belirli bir hata raporuna atanacak en uygun geliştiricinin belirlenmesini, hata düzeltme süresinin tahmin edilmesini, öncelik düzeyinin tahmin edilmesini vb. içerir. Bu tez, en son teknoloji sınıflandırma tekniklerini kullanarak otomatik yazılım hata raporu öncelik tespitine odaklanmaktadır. Oldukça başarılı olan dönüştürücü tabanlı kodlayıcı sınıflandırıcılar, açık kaynak veri kümeleri kullanılarak ince ayar eğitimi kullanılarak yazılım alanına uyarlanır. Öte yandan Büyük Dil Modelleri (LLM'ler), öncelik sınıfı tahmini için yapılandırılabilen, metin üretimi için özel olarak eğitilmiş, yakın zamanda popüler hale gelen dönüştürücü tabanlı kod çözücü ağlarıdır. LLM çıktısını istenen formatta doğru bir şekilde şekillendirmek için, ağı nihai sınıflandırma görevine ve etki alanına göre koşullandırmak için Bilgi İyileştirmeyle Geliştirilmiş Üretim (RAG) kullanılır. Vektör veritabanları, hata raporlarındaki metin içeriğinin kosinüs benzerliğine göre saklanmasına ve çıkarım sırasında ilgili örneklerin alınmasına yardımcı olur.
Özet (Çeviri)
Software development processes include many challenges that require human effort and time investment. In time, many tools and techniques are developed to address these challenges and automate parts of software development and maintenance. Software bug reports are textual descriptions, often accompanied by code snippets and error logs, written by users or developers documenting operational failures of programs. These reports are later examined by the assigned developer to fix the bug. Automating the bug fixing pipeline helps determine the most suitable developer to assign to a given bug report, predict the bug fix time, estimate a priority level an so on. This thesis focuses on automated software bug report priority detection using state-of-the-art classification techniques. Widely successful transformer-based encoder classifiers are adapted to software domain via fine-tuning using open source datasets. Large Language Models (LLMs), on the other hand, are recently popularized transformer decoder networks specifically trained for text generation, which can be configured for priority class prediction. In order to accurately shape LLM output into desired format, Retrieval Augmented Generation (RAG) is used to condition the network to the downstream task and domain. Vector databases help store textual content in the bug reports according to cosine similarity and retrieve related instances during inference.
Benzer Tezler
- Endüstriyel çalışma ortamlarında otomatik aydınlık kontrolü
Automatic lighting control on industry
METİN ORTATAŞ
Yüksek Lisans
Türkçe
2015
Mühendislik BilimleriBozok ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ORHAN ER
- İnvaziv meme karsinom olgularında her2 ekpresyonunun sısh (gümüş insitu hibridizasyon)yöntemiyle tespit edilerek sonuçların immünohistokimyasal ve fısh (floresan insitu hibridizasyon) yöntemleriyle karşılaştırılması
Determination of her2 status in invasive ductal breast carcinoma using sish and correlation between fish and ihc
BETÜL ÜNAL
Tıpta Uzmanlık
Türkçe
2011
PatolojiAkdeniz ÜniversitesiTıbbi Patoloji Ana Bilim Dalı
PROF. DR. FATMA ŞEYDA KARAVELİ
- Savunma sanayii için problem temelli kavramsal teknoloji veritabanı model önerisi
Problem based technology database for defense industry – conceptual model proposal
UMUT YILMAZ
Yüksek Lisans
Türkçe
2015
Savunma ve Savunma TeknolojileriKara Harp Okulu KomutanlığıTeknoloji Yönetimi Ana Bilim Dalı
YRD. DOÇ. DR. CELAL EVCİ
- Metisilin dirençli staphylococcus aureus ve vankomisin dirençli enterokok suşlarında daptomisine duyarlılıklarının invitro e-test yöntemiyle araştırılması
Investigation of sensitivity of daptomycin with invitro e-test method in strains of vancomycin-resistant enterococcus and methicillin resistant staphylococcus aureus
NURAY ARI
Tıpta Uzmanlık
Türkçe
2015
Tıbbi BiyolojiFırat ÜniversitesiTıbbi Mikrobiyoloji Ana Bilim Dalı
PROF. DR. ZÜLAL AŞÇI TORAMAN
- Sistemik hidroksiklorokin kullanan hastalarda retinal toksisitenin araştırılması
Research on retinal toxicity on patients systematically using hydroxychloroquine
MİNE GÜL KIRBOĞA
Tıpta Uzmanlık
Türkçe
2015
Göz HastalıklarıNecmettin Erbakan ÜniversitesiGöz Hastalıkları Ana Bilim Dalı
PROF. MEHMET OKKA