An investigation of issue labeling in open source software projects using large language models
Açık kaynak kodlu yazılım projelerinde sorun etiketlemenin büyük dil modelleri kullanılarak incelenmesi
- Tez No: 895563
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖZDEN ÖZCAN TOP, PROF. DR. ALTAN KOÇYİĞİT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Bilişim Sistemleri Bilim Dalı
- Sayfa Sayısı: 127
Özet
Açık kaynak kodlu yazılım projelerinin gelişen dünyasında, etkili sorun yönetimi, proje başarısını sürdürmenin temel bir unsuru olmaya devam etmektedir. Sorun raporları, yazılım ürünleri ile ilgili hataları bildirmek, yeni özellikler talep etmek veya sorular sormak amacıyla oluşturuldukları için değerli bilgiler sağlar. Kalite açısından büyük ölçüde farklılık gösteren çok sayıda sorun raporu, çalışmaları önceliklendirmek ve kaynakları etkili bir şekilde yönetmek için doğru sorun sınıflandırma mekanizmalarını gerektirir. Doğru şekilde atanan sorun etiketleri, etkili proje yönetimi ve sorun yönetimini geliştirmek amacıyla gerçekleştirilen araştırmaların güvenilirliği açısından kritik öneme sahiptir, çünkü bu araştırmalar genellikle atanmış olan sorun etiketlerini gerçek referans değer olarak varsayar. Bu çalışma, sorun yönetim süreçlerini iyileştirmek için açık kaynak kodlu yazılım geliştirme projelerindeki atanan sorun etiketlerinin güvenilirliğini değerlendirmeyi amaçlamaktadır. Araştırma, GitHub'da bulunan açık kaynak kodlu yazılım geliştirme projelerinden iki sorun raporu veri kümesi toplanmasını içermektedir. Sorun etiketi sınıflandırması kapsamında en gelişkin büyük dil modelleri ile deneyler gerçekleştirilmiştir. Ayrıca, atanan sorun etiketlerinin, sorun raporlarının içeriği açısından ilgisini değerlendirmek için nitel bir analiz yapılmıştır. Sorun raporları üzerinde gerçekleştirilen deneysel çalışma, atanan etiketler ile sorun raporlarının asıl içeriği arasında önemli bir uyumsuzluk olduğunu ortaya koymuştur. Çalışma ayrıca, en gelişkin büyük dil modellerinin sorun etiketlerini sınıflandırmadaki etkinliğini gösterirken açık kaynak kodlu yazılım geliştirme projelerinde sorun etiketlerinin güvenilirliğine ilişkin endişeleri vurgulamıştır.
Özet (Çeviri)
In the evolving landscape of open source software projects, effective issue management remains a pivotal aspect of sustaining project success. Issue reports provide valuable information as they are created for reporting bugs, requesting new features, or asking questions about a software product. The high number of issue reports, which vary widely in quality, requires accurate issue classification mechanisms to prioritize work and manage resources effectively. Properly assigned issue labels are crucial for effective project management and for the reliability of research conducted to improve issue management, as such research often assumes the assigned issue labels as the ground truth. This study aims to assess the reliability of the assigned issue labels in open source software development projects to improve issue management processes. The research involves collecting two datasets of issue reports from open source software development projects hosted on GitHub. Experiments were conducted with state-of-the-art large language models for issue label classification. Furthermore, a qualitative analysis was performed to evaluate the relevance of the assigned issue labels with respect to the content of the issue reports. The empirical study performed on issue reports revealed a significant mismatch between the assigned labels and the actual content of the issue reports. The study also demonstrated the effectiveness of state-of-the-art large language models in classifying issue labels, while highlighting concerns about the reliability of issue labels in open source software development projects.
Benzer Tezler
- Antonio Tabucchi'nin 'Zaman Hızla Yaşlanıyor' ve 'Gittikçe Geç Olmakta' eserlerinde varlık ve zaman felsefesi izlekleri
Concepts of being and time in philosophy in the works of Antonio Tabucchi's 'Time Ages in A Hurry' and 'It's Getting Later All the Time'
BURCU ÜN
Yüksek Lisans
Türkçe
2024
Batı Dilleri ve Edebiyatıİstanbul ÜniversitesiBatı Dilleri ve Edebiyatları Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CRISTIANO BEDIN
- Türkiye'de sürdürülebilir bina sertifikalı ve yerel mevzuata göre inşa edilmiş sanayi yapılarında kabuk elemanlarının çevresel etki değerlendirmesi
Environmental impact assessment of envelope elements of industrial buildings with sustainable building certificate and costructed according to the local regulations in Turkey
BETÜL TÜRKMEN
Yüksek Lisans
Türkçe
2019
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. FETHİYE ECEM EDİS
- Glioma hücrelerinde rosmarinik asitin antikanser moleküler mekanizmalarının araştırılması
Investigation of anticancer molecular mechanisms of rosmarinic acid in glioma cells
ASLIHAN ŞENGELEN
Doktora
Türkçe
2023
Biyolojiİstanbul ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
PROF. DR. EVREN ÖNAY UÇAR
- Enrichment of MCF7 breast cancer cells from leukocytes through continuous flow dielectrophoresis
Dielektroforez yöntemi ile sürekli akış altında MCF7 meme kanseri hücrelerinin akyuvar hücrelerinden zenginleştirilmesi
ZEYNEP ÇAĞLAYAN
Yüksek Lisans
İngilizce
2018
BiyomühendislikOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. HALUK KÜLAH
- Çocukların suça sürüklenmesinde fiziksel ve sosyo-mekansal faktörlerin etkisi
The effect of physical and socio-spatial factors on children driven to crime
UFUK ALTUNBAŞ
Doktora
Türkçe
2015
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. MEHMET OCAKÇI