Doğal dil işleme ile metin kümelemesinde denetimsiz öğrenme yöntemleri
Unsupervised learning methods for text clustering in natural language processing
- Tez No: 939430
- Danışmanlar: PROF. DR. ALİ SEBETCİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: OSTİM TEKNİK ÜNİVERSİTESİ
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 61
Özet
Bu tez çalışması, metin kümelemesi alanında denetimsiz öğrenme yöntemlerinin uygulanmasını ve farklı algoritmaların karşılaştırmasını derinlemesine incelemektedir. Metin kümelemesi, büyük veri setlerini anlamak ve analiz etmek için önemli bir araçtır ve bu bağlamda, K-Ortalamalar (K-Means), Hiyerarşik Kümeleme, Gizli Dirichlet Ayırımı (LDA), Yoğunluk Tabanlı Kümeleme (DBSCAN) ve Büyük Dil Modelleri gibi çeşitli algoritmalar kullanılmıştır. Çalışmanın odak noktası, bu algoritmaların performansını ve etkisini belirlemektir. Özellikle, Llama ve GPT-4o modellerinin içerik analizi konusundaki esnekliği sayesinde, şiirlerin tematik ayrışımı gerçekleştirilmiş ve her bir modelin güçlü ve zayıf yönleri detaylı bir şekilde ele alınmıştır. Elde edilen bulgular, metinlerin belirli temalar altında sınıflandırılmasının yanı sıra, araştırmacılara geniş veri kümeleri üzerinde daha etkili analiz yapma imkânı sunmaktadır. Bu çalışma, metin kümelemesi alanında yeni yaklaşımlar önererek, gelecekteki araştırmalar için bir temel sağlamayı amaçlamaktadır.
Özet (Çeviri)
This thesis provides an in-depth examination of the application of unsupervised learning methods in text clustering and a comprehensive comparison of various algorithms. Text clustering is a crucial tool for understanding and analyzing large datasets. In this context, algorithms such as K-Means, Hierarchical Clustering, Latent Dirichlet Allocation (LDA), Density-Based Clustering (DBSCAN), and Large Language Models have been employed. The primary focus of the study is to evaluate the performance and effectiveness of these algorithms. Particularly, the flexibility of the Llama and GPT-4o models in content analysis has enabled the thematic differentiation of poems, allowing for a detailed discussion of the strengths and weaknesses of each model. The findings provide researchers with the opportunity to conduct more effective analyses on large datasets by classifying texts under specific themes. This study aims to propose new approaches in the field of text clustering, thereby laying a foundation for future research.
Benzer Tezler
- Üretim sürecinin doğal dil işleme ile düzenlenmesi
Manufacturing process modeling with natural language processing
HATİCE AY
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri MühendisliğiEskişehir Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜRKAN ÖZTÜRK
- Detection and management of personal data with an ontology-based approach
Kişisel verilerin ontoloji tabanlı yaklaşım ile tespiti ve yönetiminin sağlanması
PINAR BİL ATASOY
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FERDA NUR ALPASLAN
- Doğal dil işleme teknikleri ile metin dosyalarından çoktan seçmeli soru üretilmesi
Generating multiple choice questions from text files with natural language processing techniques
ENES SAĞIROĞLU
Yüksek Lisans
Türkçe
2022
Bilim ve TeknolojiAtatürk ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERDAR AYDIN
- Bilgisayar bilimleri alanında yapılan Türkçe akademik yayınların doğal dil işleme yöntemleri ile incelenmesi
Analysing Turkish academic papers in computer science using natural language processing techniques
CANER KARA
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ECİR UĞUR KÜÇÜKSİLLE
- Metin madenciliğinde kategorik değişkenler için benzetim katsayılarının kullanılması üzerine bir çalışma
A study on the use of simulation coefficients for categorical variables in text mining
EMİNE EDA ÇAM
Yüksek Lisans
Türkçe
2019
EkonometriDokuz Eylül ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. LEVENT ŞENYAY