Analysis of the evolution of scientific topics using text mining techniques
Bilimsel konuların evriminin metin madenciliği yöntemleri ile analizi
- Tez No: 764930
- Danışmanlar: DOÇ. DR. TEVFİK AYTEKİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Yıllar içerisinde metin kümelerin sayısı ve boyutunun artması ile metinlerden manuel olarak bilgi çıkarımının zorlaşması sonucunda, metinlerin otomatik olarak analiz edilme ihtiyacı doğmuştur. Veri madenciliğinin bir alt kümesi olan metin madenciliği; sınıflandırma, kümeleme, konu modelleme gibi yöntemlerle metin kümelerini analiz etmeye çalışmaktadır. Konu modelleme yöntemleri dokümanlardaki gizli konuların çıkarılmasını sağlar. Konu modellemede konu sayısının ve model parametrelerinin belirlenmesi ve çıkarılan konuların ne hakkında olduğunun tespiti, üzerinde çalışılmaya devam edilen ana problemlerdendir. Bu tez kapsamında uzun bir zaman dönemi için toplanan bilimsel makalelerden gizli konuların tespiti, yorumlanması ve yıllar içerisinde tartışılan konuların değişimi ile ilgili genel bir sonuç elde edilmek istenmiştir. Bu amaçla iki farklı bilim tarihi dergisinden makaleler toplanarak datasetler oluşturulmuş; konu modelleme yöntemlerinden LDA ve NMF ile kümeleme yöntemlerinden K-Means kullanılarak yıllara göre en çok konuşulan konular çıkarılıp, karşılaştırılmış ve yorumlanmıştır. Dergilerin kapsamı göz önünde bulundurularak çıkarılan konu kategorilerinin tezde uygulanan modeller sonucunda yıllar içerisinde popülaritesinin nasıl değiştiği ile bu konuların yıllar içerisinde hangi kelimeler ile temsil edildikleri belirlenmeye çalışılmıştır.
Özet (Çeviri)
Over the years, with the increasing number and size of text data, extracting and interpreting information from these data has become complex and there is a need for automatic analysis of texts. Text mining, a part of data mining, tries to make sense of large text datasets with classification, clustering and topic modeling methods. Topic modeling methods aim to extract hidden topics behind documents. In topic modeling, determining the model parameters and how the topics are obtained in the model are the main issues that continue to be studied in this field. Within the scope of the thesis, it is aimed to extract and interpret the hidden topics from the scientific publications that were collected over a long period of time, as a consequence it was desired to obtain results related to the change in the topics discussed over the years. Using Latent Dirichlet Allocation and Nonnegative Matrix Factorization which are topic modeling methods and K-Means which is clustering method the most mentioned topics by years have been extracted, compared and interpreted. It has been analyzed how the topics have changed in these journals over the years. On the other hand, it has been showed to how the words of topics have changed over the years and which words represent the related topics.
Benzer Tezler
- Yükseköğretimde akademik yayın performansının izlenmesi süreci: Bilimetri temelli bir iş zekâsı modeli
The process of monitoring academic publishing performance in higher education: A scientometry-based business intelligence model
MUHAMMET DAMAR
Doktora
Türkçe
2020
Eğitim ve ÖğretimDokuz Eylül Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. ONUR ÖZVERİ
DOÇ. DR. GÜZİN ÖZDAĞOĞLU
- Tıp fotoğrafçılığı ve tıptaki uygulamaların fotoğraf sanatında kullanımı
Medical photography and using medical practice in photographic art
AHMET REMZİ TÜLÜCE
Yüksek Lisans
Türkçe
2010
Güzel SanatlarMarmara ÜniversitesiFotoğraf Ana Sanat Dalı
PROF. BARBAROS GÜRSEL
- 1929-1946 tarihleri arasında Cumhuriyet Gazetesinde yayımlanmış arkeoloji içerikli haberlerin bir değerlendirmesi
An evaluation of archeology news published on Cumhuriyet Newspaper between 1929 and 1946
SABAHAT NAĞME BAŞARAN
Yüksek Lisans
Türkçe
2019
Arkeolojiİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BİLGE AR
- Türkçe hedef tabanlı duygu analizi için alt görevlerin incelenmesi–hedef terim, hedef kategori ve duygu sınıfı belirleme
Inspecting sub tasks of aspect based sentiment analysis in Turkish language–opinion target expression, aspect category and sentiment polarity detection
FATİH SAMET ÇETİN
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜLŞEN ERYİĞİT
- İlköğretim fen bilimleri öğretim programı, ders kitapları ve öğretmenlerin model kullanım yaklaşımlarının araştırılması
Investigation of model use approaches of elementary science curriculum, textbooks and teachers
EROL ALTAY
Yüksek Lisans
Türkçe
2020
Eğitim ve ÖğretimZonguldak Bülent Ecevit ÜniversitesiMatematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı
DOÇ. DR. NİLÜFER DİDİŞ KÖRHASAN