Geri Dön

Doğal dil işleme ile metin kümelemesinde denetimsiz öğrenme yöntemleri

Unsupervised learning methods for text clustering in natural language processing

  1. Tez No: 939430
  2. Yazar: AHMAD NURİYEV
  3. Danışmanlar: PROF. DR. ALİ SEBETCİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: OSTİM TEKNİK ÜNİVERSİTESİ
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 61

Özet

Bu tez çalışması, metin kümelemesi alanında denetimsiz öğrenme yöntemlerinin uygulanmasını ve farklı algoritmaların karşılaştırmasını derinlemesine incelemektedir. Metin kümelemesi, büyük veri setlerini anlamak ve analiz etmek için önemli bir araçtır ve bu bağlamda, K-Ortalamalar (K-Means), Hiyerarşik Kümeleme, Gizli Dirichlet Ayırımı (LDA), Yoğunluk Tabanlı Kümeleme (DBSCAN) ve Büyük Dil Modelleri gibi çeşitli algoritmalar kullanılmıştır. Çalışmanın odak noktası, bu algoritmaların performansını ve etkisini belirlemektir. Özellikle, Llama ve GPT-4o modellerinin içerik analizi konusundaki esnekliği sayesinde, şiirlerin tematik ayrışımı gerçekleştirilmiş ve her bir modelin güçlü ve zayıf yönleri detaylı bir şekilde ele alınmıştır. Elde edilen bulgular, metinlerin belirli temalar altında sınıflandırılmasının yanı sıra, araştırmacılara geniş veri kümeleri üzerinde daha etkili analiz yapma imkânı sunmaktadır. Bu çalışma, metin kümelemesi alanında yeni yaklaşımlar önererek, gelecekteki araştırmalar için bir temel sağlamayı amaçlamaktadır.

Özet (Çeviri)

This thesis provides an in-depth examination of the application of unsupervised learning methods in text clustering and a comprehensive comparison of various algorithms. Text clustering is a crucial tool for understanding and analyzing large datasets. In this context, algorithms such as K-Means, Hierarchical Clustering, Latent Dirichlet Allocation (LDA), Density-Based Clustering (DBSCAN), and Large Language Models have been employed. The primary focus of the study is to evaluate the performance and effectiveness of these algorithms. Particularly, the flexibility of the Llama and GPT-4o models in content analysis has enabled the thematic differentiation of poems, allowing for a detailed discussion of the strengths and weaknesses of each model. The findings provide researchers with the opportunity to conduct more effective analyses on large datasets by classifying texts under specific themes. This study aims to propose new approaches in the field of text clustering, thereby laying a foundation for future research.

Benzer Tezler

  1. Üretim sürecinin doğal dil işleme ile düzenlenmesi

    Manufacturing process modeling with natural language processing

    HATİCE AY

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri MühendisliğiEskişehir Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜRKAN ÖZTÜRK

  2. Detection and management of personal data with an ontology-based approach

    Kişisel verilerin ontoloji tabanlı yaklaşım ile tespiti ve yönetiminin sağlanması

    PINAR BİL ATASOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FERDA NUR ALPASLAN

  3. Doğal dil işleme teknikleri ile metin dosyalarından çoktan seçmeli soru üretilmesi

    Generating multiple choice questions from text files with natural language processing techniques

    ENES SAĞIROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilim ve TeknolojiAtatürk Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERDAR AYDIN

  4. Bilgisayar bilimleri alanında yapılan Türkçe akademik yayınların doğal dil işleme yöntemleri ile incelenmesi

    Analysing Turkish academic papers in computer science using natural language processing techniques

    CANER KARA

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ECİR UĞUR KÜÇÜKSİLLE

  5. Metin madenciliğinde kategorik değişkenler için benzetim katsayılarının kullanılması üzerine bir çalışma

    A study on the use of simulation coefficients for categorical variables in text mining

    EMİNE EDA ÇAM

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    EkonometriDokuz Eylül Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. LEVENT ŞENYAY