Geri Dön

Automated priority detection in software bugs: A comprehensive study on transformer-based encoders with contrastive learning, large language models and vector databases for enhanced efficiency

Yazılım hatalarında otomatik öncelik tespiti: Arttırılmış verimlilik için karşılaştırmalı öğrenme, büyük dil modelleri ve vektör veritabanları ile transformatör tabanlı kodlayıcılar üzerine kapsamlı bir çalışma

  1. Tez No: 851193
  2. Yazar: EYÜP HALİT YILMAZ
  3. Danışmanlar: PROF. DR. İSMAİL HAKKI TOROSLU, DR. ÖĞR. ÜYESİ ÖMER KÖKSAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 69

Özet

Yazılım geliştirme süreçleri, emek ve zaman yatırımı gerektiren birçok zorluğu bünyesinde barındırmaktadır. Zamanla bu zorlukların üstesinden gelmek, yazılım geliştirme ve bakım süreçlerini otomatize edebilmek için birçok araç ve teknik geliştirilmiştir. Yazılım hata raporları, kullanıcılar veya geliştiriciler tarafından programların operasyonel hatalarını belgeleyen, genellikle kod parçacıkları ve hata mesajlarını içeren metinsel açıklamalardır. Bu raporlar daha sonra hataları düzeltmek için atanan geliştirici tarafından incelenir. Hata düzeltme süreçlerinin otomatikleştirilmesi, belirli bir hata raporuna atanacak en uygun geliştiricinin belirlenmesini, hata düzeltme süresinin tahmin edilmesini, öncelik düzeyinin tahmin edilmesini vb. içerir. Bu tez, en son teknoloji sınıflandırma tekniklerini kullanarak otomatik yazılım hata raporu öncelik tespitine odaklanmaktadır. Oldukça başarılı olan dönüştürücü tabanlı kodlayıcı sınıflandırıcılar, açık kaynak veri kümeleri kullanılarak ince ayar eğitimi kullanılarak yazılım alanına uyarlanır. Öte yandan Büyük Dil Modelleri (LLM'ler), öncelik sınıfı tahmini için yapılandırılabilen, metin üretimi için özel olarak eğitilmiş, yakın zamanda popüler hale gelen dönüştürücü tabanlı kod çözücü ağlarıdır. LLM çıktısını istenen formatta doğru bir şekilde şekillendirmek için, ağı nihai sınıflandırma görevine ve etki alanına göre koşullandırmak için Bilgi İyileştirmeyle Geliştirilmiş Üretim (RAG) kullanılır. Vektör veritabanları, hata raporlarındaki metin içeriğinin kosinüs benzerliğine göre saklanmasına ve çıkarım sırasında ilgili örneklerin alınmasına yardımcı olur.

Özet (Çeviri)

Software development processes include many challenges that require human effort and time investment. In time, many tools and techniques are developed to address these challenges and automate parts of software development and maintenance. Software bug reports are textual descriptions, often accompanied by code snippets and error logs, written by users or developers documenting operational failures of programs. These reports are later examined by the assigned developer to fix the bug. Automating the bug fixing pipeline helps determine the most suitable developer to assign to a given bug report, predict the bug fix time, estimate a priority level an so on. This thesis focuses on automated software bug report priority detection using state-of-the-art classification techniques. Widely successful transformer-based encoder classifiers are adapted to software domain via fine-tuning using open source datasets. Large Language Models (LLMs), on the other hand, are recently popularized transformer decoder networks specifically trained for text generation, which can be configured for priority class prediction. In order to accurately shape LLM output into desired format, Retrieval Augmented Generation (RAG) is used to condition the network to the downstream task and domain. Vector databases help store textual content in the bug reports according to cosine similarity and retrieve related instances during inference.

Benzer Tezler

  1. Endüstriyel çalışma ortamlarında otomatik aydınlık kontrolü

    Automatic lighting control on industry

    METİN ORTATAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Mühendislik BilimleriBozok Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ORHAN ER

  2. İnvaziv meme karsinom olgularında her2 ekpresyonunun sısh (gümüş insitu hibridizasyon)yöntemiyle tespit edilerek sonuçların immünohistokimyasal ve fısh (floresan insitu hibridizasyon) yöntemleriyle karşılaştırılması

    Determination of her2 status in invasive ductal breast carcinoma using sish and correlation between fish and ihc

    BETÜL ÜNAL

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2011

    PatolojiAkdeniz Üniversitesi

    Tıbbi Patoloji Ana Bilim Dalı

    PROF. DR. FATMA ŞEYDA KARAVELİ

  3. Savunma sanayii için problem temelli kavramsal teknoloji veritabanı model önerisi

    Problem based technology database for defense industry – conceptual model proposal

    UMUT YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Savunma ve Savunma TeknolojileriKara Harp Okulu Komutanlığı

    Teknoloji Yönetimi Ana Bilim Dalı

    YRD. DOÇ. DR. CELAL EVCİ

  4. Metisilin dirençli staphylococcus aureus ve vankomisin dirençli enterokok suşlarında daptomisine duyarlılıklarının invitro e-test yöntemiyle araştırılması

    Investigation of sensitivity of daptomycin with invitro e-test method in strains of vancomycin-resistant enterococcus and methicillin resistant staphylococcus aureus

    NURAY ARI

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2015

    Tıbbi BiyolojiFırat Üniversitesi

    Tıbbi Mikrobiyoloji Ana Bilim Dalı

    PROF. DR. ZÜLAL AŞÇI TORAMAN

  5. Sistemik hidroksiklorokin kullanan hastalarda retinal toksisitenin araştırılması

    Research on retinal toxicity on patients systematically using hydroxychloroquine

    MİNE GÜL KIRBOĞA

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2015

    Göz HastalıklarıNecmettin Erbakan Üniversitesi

    Göz Hastalıkları Ana Bilim Dalı

    PROF. MEHMET OKKA