Geri Dön

Analysis of the evolution of scientific topics using text mining techniques

Bilimsel konuların evriminin metin madenciliği yöntemleri ile analizi

  1. Tez No: 764930
  2. Yazar: BUSE AÇIKALIN
  3. Danışmanlar: DOÇ. DR. TEVFİK AYTEKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Yıllar içerisinde metin kümelerin sayısı ve boyutunun artması ile metinlerden manuel olarak bilgi çıkarımının zorlaşması sonucunda, metinlerin otomatik olarak analiz edilme ihtiyacı doğmuştur. Veri madenciliğinin bir alt kümesi olan metin madenciliği; sınıflandırma, kümeleme, konu modelleme gibi yöntemlerle metin kümelerini analiz etmeye çalışmaktadır. Konu modelleme yöntemleri dokümanlardaki gizli konuların çıkarılmasını sağlar. Konu modellemede konu sayısının ve model parametrelerinin belirlenmesi ve çıkarılan konuların ne hakkında olduğunun tespiti, üzerinde çalışılmaya devam edilen ana problemlerdendir. Bu tez kapsamında uzun bir zaman dönemi için toplanan bilimsel makalelerden gizli konuların tespiti, yorumlanması ve yıllar içerisinde tartışılan konuların değişimi ile ilgili genel bir sonuç elde edilmek istenmiştir. Bu amaçla iki farklı bilim tarihi dergisinden makaleler toplanarak datasetler oluşturulmuş; konu modelleme yöntemlerinden LDA ve NMF ile kümeleme yöntemlerinden K-Means kullanılarak yıllara göre en çok konuşulan konular çıkarılıp, karşılaştırılmış ve yorumlanmıştır. Dergilerin kapsamı göz önünde bulundurularak çıkarılan konu kategorilerinin tezde uygulanan modeller sonucunda yıllar içerisinde popülaritesinin nasıl değiştiği ile bu konuların yıllar içerisinde hangi kelimeler ile temsil edildikleri belirlenmeye çalışılmıştır.

Özet (Çeviri)

Over the years, with the increasing number and size of text data, extracting and interpreting information from these data has become complex and there is a need for automatic analysis of texts. Text mining, a part of data mining, tries to make sense of large text datasets with classification, clustering and topic modeling methods. Topic modeling methods aim to extract hidden topics behind documents. In topic modeling, determining the model parameters and how the topics are obtained in the model are the main issues that continue to be studied in this field. Within the scope of the thesis, it is aimed to extract and interpret the hidden topics from the scientific publications that were collected over a long period of time, as a consequence it was desired to obtain results related to the change in the topics discussed over the years. Using Latent Dirichlet Allocation and Nonnegative Matrix Factorization which are topic modeling methods and K-Means which is clustering method the most mentioned topics by years have been extracted, compared and interpreted. It has been analyzed how the topics have changed in these journals over the years. On the other hand, it has been showed to how the words of topics have changed over the years and which words represent the related topics.

Benzer Tezler

  1. Yükseköğretimde akademik yayın performansının izlenmesi süreci: Bilimetri temelli bir iş zekâsı modeli

    The process of monitoring academic publishing performance in higher education: A scientometry-based business intelligence model

    MUHAMMET DAMAR

    Doktora

    Türkçe

    Türkçe

    2020

    Eğitim ve ÖğretimDokuz Eylül Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ONUR ÖZVERİ

    DOÇ. DR. GÜZİN ÖZDAĞOĞLU

  2. Tıp fotoğrafçılığı ve tıptaki uygulamaların fotoğraf sanatında kullanımı

    Medical photography and using medical practice in photographic art

    AHMET REMZİ TÜLÜCE

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Güzel SanatlarMarmara Üniversitesi

    Fotoğraf Ana Sanat Dalı

    PROF. BARBAROS GÜRSEL

  3. 1929-1946 tarihleri arasında Cumhuriyet Gazetesinde yayımlanmış arkeoloji içerikli haberlerin bir değerlendirmesi

    An evaluation of archeology news published on Cumhuriyet Newspaper between 1929 and 1946

    SABAHAT NAĞME BAŞARAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Arkeolojiİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BİLGE AR

  4. Türkçe hedef tabanlı duygu analizi için alt görevlerin incelenmesi–hedef terim, hedef kategori ve duygu sınıfı belirleme

    Inspecting sub tasks of aspect based sentiment analysis in Turkish language–opinion target expression, aspect category and sentiment polarity detection

    FATİH SAMET ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜLŞEN ERYİĞİT

  5. İlköğretim fen bilimleri öğretim programı, ders kitapları ve öğretmenlerin model kullanım yaklaşımlarının araştırılması

    Investigation of model use approaches of elementary science curriculum, textbooks and teachers

    EROL ALTAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Eğitim ve ÖğretimZonguldak Bülent Ecevit Üniversitesi

    Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı

    DOÇ. DR. NİLÜFER DİDİŞ KÖRHASAN