Automated requirements classification using feature selection based on linguistic features
Dil özelliklerine göre öznitelik seçimi kullanılarak yazılım isterlerinin otomatik sınıflandırılması
- Tez No: 691664
- Danışmanlar: DR. ÖĞR. ÜYESİ FATMA BAŞAK AYDEMİR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Sistem ve Kontrol Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 86
Özet
Yazılım isterlerinin sınıflandırılması, sistemlerin ve isterlerin organize edilmesinde önemli bir sorundur ve büyük yazılım isterleri veri setlerinin işlenmesinde yaygın olarak kullanılır. Yazılım isterlerinin sınıflandırma probleminin temel bir örneği, işlevsel ve işlevsel olmayan (kalite) isterler arasındaki ayrımdır. Son nesil sınıflandırıcılar, metin n-gramları veya sözcük türleri n-gramları gibi geniş kelime özellikleri kümesi kullandıklarında en etkilidir. Bununla birlikte, özelliklerin sayısı arttıkça, yaklaşımı yorumlamak daha zor hale gelir çünkü gereksinimlerin anlamını yakalayamayan birçok gereksiz öz niteliğin de araştırılması gerekir. Bu çalışmada, yazılım gereksinim mühendis- liği için yorumlanabilir makine öğrenimi sınıflandırıcılarının oluşturulmasında bağlılık türleri gibi daha genel özniteliklerin kullanılmasını öneriyoruz. Sınıflandırıcıların nasıl çalıştığını grafiksel olarak yorumlayan araçlarla desteklenen bir öznitelik mühendisliği ile bir dizi dilsel öznitelik türetiyoruz. Önerilen öznitelikleri kullanan sınıflandırıcılar eğitim setine yüksek boyutlu öznitelik setlerini kullananlara göre biraz daha kötü performans gösterse de, bu yaklaşım genellikle doğrulama veri setlerinde daha iyi performans gösterir ve daha yorumlanabilirdir. Çalışmamızda sektör veri setlerini kullaniyoruz ve öznitelik setimizin daha da optimize edilip edilemeyeceğini keşfetmek için birkaç otomatik öznitelik seçim algoritması kullanarak deneysel çalışmalar gerçekleştiriyoruz. Bazı veri setlerinde etkileyici sonuçlar elde edilmesine rağmen otomatik seçim algoritmaları önemli bir gelişme göstermedi ve hatta ortalama olarak sonuçlar, dil öznitelikleri- ne dayalı seti kullanarak elde ettiğimiz sonuçlardan daha kötüydü.
Özet (Çeviri)
Requirements classification is an important problem in organizing the systems and requirements, and it is widely used in handling large requirements data sets. A basic example of a requirements classification problem is the distinction between the functional and non-functional (quality) requirements. The state-of-the-art classifiers are most effective when they use a large set of word features such as text n-grams or part of speech n-grams. However, as the number of features increases, it becomes more difficult to interpret the approach, because many redundant features have to be explored that do not capture the meaning of the requirements. In this study, we propose the use of more general linguistic features, such as dependency types, for the construction of interpretable machine learning classifiers for requirements engineering. Through a feature engineering effort, assisted by tools that interpret graphically how classifiers work, we derive a set of linguistic features. While classifiers that use the proposed features fit the training set slightly worse than those that use high-dimensional feature sets, this approach performs generally better on validation data sets and is more interpretable. We use industry data sets, and we perform experimental runs using several automated feature selection algorithms to explore whether our feature set can be optimized further using one of the automated selection algorithms. Although in some data sets, impressive results were obtained. the automated selection algorithms did not prove a significant improvement, and even, on average, the results were worse than the results we obtained using the set based on linguistic features.
Benzer Tezler
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Hakem atama otomasyonu için bir karar destek sistemi: Doğal dil işleme ve veri-güdümlü optimizasyon ile bütünleşik bir yaklaşım
A decision support system for reviewer assignment automation: An integrated approach with natural language processing and data-driven optimization
MELTEM AKSOY
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEDA YANIK ÖZBAY
PROF. DR. MEHMET FATİH AMASYALI
- Otobüs kapak üretim prosesinin robotik otomasyonla optimizasyonu ve triz metodolojisine uygulanması
Optimisation bus lid production with robotics automation and triz implementation
ÖMER ZURNALI
Yüksek Lisans
Türkçe
2019
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. CEVAT ERDEM İMRAK
- Secure and coordinated beamforming in 5G and beyond systems using deep neural networks
5G ve ötesi sistemlerde derin sinir ağları kullanarak güvenli ve koordineli hüzmeleme
UTKU ÖZMAT
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET AKİF YAZICI
DR. ÖĞR. ÜYESİ MEHMET FATİH DEMİRKOL
- Devre bağlaşmalı telefon şebekesi için yönlendirme yazılımı tasarımı
Software design of routing for circuit switched telephone network
TAHİR GÜN
Yüksek Lisans
Türkçe
1992
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiYRD. DOÇ. DR. ÜMİT AYGÖLÜ