Geri Dön

An investigation of issue labeling in open source software projects using large language models

Açık kaynak kodlu yazılım projelerinde sorun etiketlemenin büyük dil modelleri kullanılarak incelenmesi

  1. Tez No: 895563
  2. Yazar: İREM SELİN DENİZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖZDEN ÖZCAN TOP, PROF. DR. ALTAN KOÇYİĞİT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Bilişim Sistemleri Bilim Dalı
  13. Sayfa Sayısı: 127

Özet

Açık kaynak kodlu yazılım projelerinin gelişen dünyasında, etkili sorun yönetimi, proje başarısını sürdürmenin temel bir unsuru olmaya devam etmektedir. Sorun raporları, yazılım ürünleri ile ilgili hataları bildirmek, yeni özellikler talep etmek veya sorular sormak amacıyla oluşturuldukları için değerli bilgiler sağlar. Kalite açısından büyük ölçüde farklılık gösteren çok sayıda sorun raporu, çalışmaları önceliklendirmek ve kaynakları etkili bir şekilde yönetmek için doğru sorun sınıflandırma mekanizmalarını gerektirir. Doğru şekilde atanan sorun etiketleri, etkili proje yönetimi ve sorun yönetimini geliştirmek amacıyla gerçekleştirilen araştırmaların güvenilirliği açısından kritik öneme sahiptir, çünkü bu araştırmalar genellikle atanmış olan sorun etiketlerini gerçek referans değer olarak varsayar. Bu çalışma, sorun yönetim süreçlerini iyileştirmek için açık kaynak kodlu yazılım geliştirme projelerindeki atanan sorun etiketlerinin güvenilirliğini değerlendirmeyi amaçlamaktadır. Araştırma, GitHub'da bulunan açık kaynak kodlu yazılım geliştirme projelerinden iki sorun raporu veri kümesi toplanmasını içermektedir. Sorun etiketi sınıflandırması kapsamında en gelişkin büyük dil modelleri ile deneyler gerçekleştirilmiştir. Ayrıca, atanan sorun etiketlerinin, sorun raporlarının içeriği açısından ilgisini değerlendirmek için nitel bir analiz yapılmıştır. Sorun raporları üzerinde gerçekleştirilen deneysel çalışma, atanan etiketler ile sorun raporlarının asıl içeriği arasında önemli bir uyumsuzluk olduğunu ortaya koymuştur. Çalışma ayrıca, en gelişkin büyük dil modellerinin sorun etiketlerini sınıflandırmadaki etkinliğini gösterirken açık kaynak kodlu yazılım geliştirme projelerinde sorun etiketlerinin güvenilirliğine ilişkin endişeleri vurgulamıştır.

Özet (Çeviri)

In the evolving landscape of open source software projects, effective issue management remains a pivotal aspect of sustaining project success. Issue reports provide valuable information as they are created for reporting bugs, requesting new features, or asking questions about a software product. The high number of issue reports, which vary widely in quality, requires accurate issue classification mechanisms to prioritize work and manage resources effectively. Properly assigned issue labels are crucial for effective project management and for the reliability of research conducted to improve issue management, as such research often assumes the assigned issue labels as the ground truth. This study aims to assess the reliability of the assigned issue labels in open source software development projects to improve issue management processes. The research involves collecting two datasets of issue reports from open source software development projects hosted on GitHub. Experiments were conducted with state-of-the-art large language models for issue label classification. Furthermore, a qualitative analysis was performed to evaluate the relevance of the assigned issue labels with respect to the content of the issue reports. The empirical study performed on issue reports revealed a significant mismatch between the assigned labels and the actual content of the issue reports. The study also demonstrated the effectiveness of state-of-the-art large language models in classifying issue labels, while highlighting concerns about the reliability of issue labels in open source software development projects.

Benzer Tezler

  1. Antonio Tabucchi'nin 'Zaman Hızla Yaşlanıyor' ve 'Gittikçe Geç Olmakta' eserlerinde varlık ve zaman felsefesi izlekleri

    Concepts of being and time in philosophy in the works of Antonio Tabucchi's 'Time Ages in A Hurry' and 'It's Getting Later All the Time'

    BURCU ÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Batı Dilleri ve Edebiyatıİstanbul Üniversitesi

    Batı Dilleri ve Edebiyatları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CRISTIANO BEDIN

  2. Türkiye'de sürdürülebilir bina sertifikalı ve yerel mevzuata göre inşa edilmiş sanayi yapılarında kabuk elemanlarının çevresel etki değerlendirmesi

    Environmental impact assessment of envelope elements of industrial buildings with sustainable building certificate and costructed according to the local regulations in Turkey

    BETÜL TÜRKMEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. FETHİYE ECEM EDİS

  3. Glioma hücrelerinde rosmarinik asitin antikanser moleküler mekanizmalarının araştırılması

    Investigation of anticancer molecular mechanisms of rosmarinic acid in glioma cells

    ASLIHAN ŞENGELEN

    Doktora

    Türkçe

    Türkçe

    2023

    Biyolojiİstanbul Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. DR. EVREN ÖNAY UÇAR

  4. Enrichment of MCF7 breast cancer cells from leukocytes through continuous flow dielectrophoresis

    Dielektroforez yöntemi ile sürekli akış altında MCF7 meme kanseri hücrelerinin akyuvar hücrelerinden zenginleştirilmesi

    ZEYNEP ÇAĞLAYAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    BiyomühendislikOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HALUK KÜLAH

  5. Çocukların suça sürüklenmesinde fiziksel ve sosyo-mekansal faktörlerin etkisi

    The effect of physical and socio-spatial factors on children driven to crime

    UFUK ALTUNBAŞ

    Doktora

    Türkçe

    Türkçe

    2015

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    PROF. DR. MEHMET OCAKÇI