Doğal dil işlemede destek vektör makineleri
Support vector machines in natural language processing
- Tez No: 928432
- Danışmanlar: DOÇ. DR. ÖZGE ELMASTAŞ GÜLTEKİN
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 120
Özet
Bu tezde, Doğal Dil İşleme (DDİ) alanında Destek Vektör Makineleri (DVM) yöntemlerinin uygulanabilirliği araştırılmaktadır. Doğal Dil İşleme, insan diliyle etkileşimde bulunan sistemlerin geliştirilmesi için bir dizi algoritma ve teknik sunar. Özellikle metin sınıflandırması, duygu analizi ve dil modeli oluşturma gibi görevlerde, DVM gibi Makine Öğrenimi algoritmaları, yüksek doğruluk ve genelleme yetenekleri ile öne çıkmaktadır. Bu çalışma, DVM'nin farklı veri kümeleri üzerinde DDİ problemlerine nasıl adapte edilebileceğini ve sonuçlarının nasıl optimize edilebileceğini ele almaktadır. Çalışma kapsamında, Word2Vec ve BERT gibi metin vektörleştirme teknikleri kullanılarak oluşturulan özellik kümeleri ile DVM modelleri eğitilmiştir. Özellikle, farklı kernel fonksiyonları ve hiperparametre ayarlarının, model performansı üzerindeki etkileri incelenmiştir. DVM'nin DDİ'deki avantajları ve sınırlamaları, hem teorik hem de deneysel analizlerle tartışılmıştır. Bu tezde kullanılan yöntemler, metin tabanlı veri setlerinde DVM modellerinin başarısını değerlendirmek için kapsamlı deneyler gerçekleştirmiştir. Farklı veri kümeleri ve özellik çıkarım teknikleri kullanılarak yapılan deneyler, model doğruluğu, hassasiyet, özgüllük ve F1 skoru gibi metriklerle karşılaştırılmıştır. DVM modellerinin performansı, diğer Makine Öğrenimi yöntemleriyle de kıyaslanarak sonuçların genel geçerliliği değerlendirilmiştir. Sonuç olarak, bu çalışma, Destek Vektör Makinelerinin Doğal Dil İşleme problemlerinde güçlü bir sınıflandırıcı olarak kullanılabileceğini göstermektedir. Elde edilen bulgular, DVM'nin metin sınıflandırmasında etkili bir seçenek olduğunu ve doğru özellik çıkarım teknikleri ile performansının daha da iyileştirilebileceğini ortaya koymaktadır.
Özet (Çeviri)
In this thesis, the applicability of Support Vector Machines (SVM) in the field of Natural Language Processing (NLP) is investigated. Natural Language Processing offers a set of algorithms and techniques for developing systems that interact with human language. In tasks such as text classification, sentiment analysis, and language model creation, machine learning algorithms like SVM stand out due to their high accuracy and generalization capabilities. This study examines how SVM can be adapted to NLP tasks on different datasets and how the results can be optimized. In this study, SVM models were trained using feature sets created through text vectorization techniques like Word2Vec and BERT. In particular, the effects of different kernel functions and hyperparameter settings on model performance were investigated. The advantages and limitations of SVM in NLP were discussed through both theoretical and experimental analyses. The methods employed in this thesis involve extensive experiments to evaluate the success of SVM models on text-based datasets. The experiments, conducted using different datasets and feature extraction techniques, compared model accuracy, sensitivity, specificity, and F1 score. The performance of SVM models was also evaluated in comparison with other machine learning methods to assess the overall validity of the results. In conclusion, this study demonstrates that Support Vector Machines can be effectively used as a strong classifier in Natural Language Processing problems. The findings show that SVM is a viable option for text classification and that its performance can be further enhanced with the correct feature extraction techniques.
Benzer Tezler
- Doğal dil işlemede ileri seviye metin sınıflandırma: Transformer'ın rolü
Advanced text classification in natural languageprocessing: The role of transformer
MERT HALİL DURAK
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİnönü ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CENGİZ HARK
- Doğal dil işlemede makine öğrenme yöntemlerinin şair tanıma problemi üzerinde kıyaslanması
Comparison of machine learning methods in natural language processing on the poet recognition problem
AYKHAN BAGHIROV
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOSTİM TEKNİK ÜNİVERSİTESİYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ SEBETCİ
- Hiperspektral görüntü analizinde ileri spektral ve uzamsal yöntemler
Advanced spectral and spatial methods for hyperspectral image analysis
İBRAHİM ONUR SIĞIRCI
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN BİLGİN
- Üretken rakip ağlar ile Türkçe metin üretimi
Turkish text generation with generative adversarial networks
BARIŞ GÜCÜK
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RAFET DURGUT
- Semantic land cover and land use classification using deep convolutional neural networks
Derin evrişimsel sinir ağları ile arazi kullanımı ve arazi örtüsünün anlamsal sınıflandırılması
BERK GÜNEY
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. ELİF SERTEL