Yazılım içerikli soru-cevap sitelerine metin madenciliğinin uygulanması
Application of text mining to software related question-answer websites
- Tez No: 670434
- Danışmanlar: DR. ÖĞR. ÜYESİ NİLGÜN GÜLER BAYAZIT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Matematik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 57
Özet
Yazılım teknolojileri çok hızlı değişmektedir. Bu değişimleri analiz etmek için anket vb. yapmanın maliyeti yüksek olabilir. Bunun yerine, yazılım içerikli soru-cevap sitelerini veri kümesi olarak kullanıp, metin madenciliği yöntemleri uygulamak alternatif bir çözümdür. Bu tezde, özel bir araştırma konusu için veri kümesinin filtrelenmesi, kümelenmesi ve analiz edilmesi süreçleri araştırılmıştır. Bu adımları bir örnek üzerinde göstermek için araştırma konusu olarak Java programlama dili seçilmiştir. Veri kaynağı olarak, Stack Overflow açık veri kümesi kullanılmıştır. İlk olarak, Stack Overflow veri kümesinde Java ile ilgili sorulmuş tüm iletileri (soru ve cevapları) bulmak için kosinüs benzerliği kullanan pratik bir yaklaşım önerilmiş olup, bu metot daha önceki metotlarla karşılaştırılmıştır. Daha sonra, oluşturulan derlem üzerinde Gizli Dirichlet Ayırımı yöntemi kullanılarak konu modelleme uygulanmıştır ve ana konular tespit edilmiştir. Ayrıca konular ve anahtar kelimeler zaman dilimlerine göre analiz edilmiştir. Son olarak, konuların değişme eğilimlerini kıyaslamak için bir yaklaşım önerilmiştir.
Özet (Çeviri)
Software technologies have changed very rapidly. Conducting surveys etc. to analyze these changes can be costly. Instead, using software related Q&A (question-answer) websites as a dataset and applying text mining methods is an alternative solution. In this thesis, the processes of filtering, clustering and analyzing the dataset for a specific research topic was investigated. To demonstrate these steps on an example, Java programming language was chosen as the research topic. As data source, Stack Overflow public dataset was used. Firstly, it was employed a practical approach to extract the Java related all posts (questions and answers) from the Stack Overflow dataset using cosine similarity and this method was compared with previous methods. Then, topic modelling was applied by using Latent Dirichlet Allocation on the created corpus and main topics were determined. In addition, the topics and keywords were analyzed according to time frames. Finally, an approach was proposed to investigate tendencies of these topics to change.
Benzer Tezler
- İnternet ve İslam: Din sosyolojisi açısından dini siteler üzerine bir araştırma
Internet and Islam: A study on religious sites in respect sociology of religion
RECEP VARDİ
- Durum tabanlı öğrenci modeli ile zeki öğretim sistemi (ZÖS) tasarımı
A design of intelligent tutoring system (ITS) via case based student modelling
ATAKAN KÖREZ
Yüksek Lisans
Türkçe
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiElektronik-Bilgisayar Ana Bilim Dalı
PROF. DR. A. YILMAZ ÇAMURCU
YRD. DOÇ. DR. BUKET DOĞAN
- Simpoez: Mimari nesne üzerine mereolojik bir yaklaşım
Simpoiesis: A mereological approach on architectural object
ERHAN SEVİNÇ
Yüksek Lisans
Türkçe
2021
Mimarlıkİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
DOÇ. DR. SEMA ALAÇAM
- Din öğretiminde öğretmen yetiştirme
Başlık çevirisi yok
HABİP GÜMÜŞ
Yüksek Lisans
Türkçe
1999
Eğitim ve ÖğretimHarran ÜniversitesiFelsefe ve Din Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. ŞÜKRÜ KEYİFLİ
- Din kültürü ve ahlak bilgisi öğretmenlerinin pedagojik formasyon yeterlikleri
Başlık çevirisi yok
MUHAMMED ŞEVKİ AYDIN