Geri Dön

Doğal dil işlemede destek vektör makineleri

Support vector machines in natural language processing

  1. Tez No: 928432
  2. Yazar: UĞURCAN DEMİR
  3. Danışmanlar: DOÇ. DR. ÖZGE ELMASTAŞ GÜLTEKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 120

Özet

Bu tezde, Doğal Dil İşleme (DDİ) alanında Destek Vektör Makineleri (DVM) yöntemlerinin uygulanabilirliği araştırılmaktadır. Doğal Dil İşleme, insan diliyle etkileşimde bulunan sistemlerin geliştirilmesi için bir dizi algoritma ve teknik sunar. Özellikle metin sınıflandırması, duygu analizi ve dil modeli oluşturma gibi görevlerde, DVM gibi Makine Öğrenimi algoritmaları, yüksek doğruluk ve genelleme yetenekleri ile öne çıkmaktadır. Bu çalışma, DVM'nin farklı veri kümeleri üzerinde DDİ problemlerine nasıl adapte edilebileceğini ve sonuçlarının nasıl optimize edilebileceğini ele almaktadır. Çalışma kapsamında, Word2Vec ve BERT gibi metin vektörleştirme teknikleri kullanılarak oluşturulan özellik kümeleri ile DVM modelleri eğitilmiştir. Özellikle, farklı kernel fonksiyonları ve hiperparametre ayarlarının, model performansı üzerindeki etkileri incelenmiştir. DVM'nin DDİ'deki avantajları ve sınırlamaları, hem teorik hem de deneysel analizlerle tartışılmıştır. Bu tezde kullanılan yöntemler, metin tabanlı veri setlerinde DVM modellerinin başarısını değerlendirmek için kapsamlı deneyler gerçekleştirmiştir. Farklı veri kümeleri ve özellik çıkarım teknikleri kullanılarak yapılan deneyler, model doğruluğu, hassasiyet, özgüllük ve F1 skoru gibi metriklerle karşılaştırılmıştır. DVM modellerinin performansı, diğer Makine Öğrenimi yöntemleriyle de kıyaslanarak sonuçların genel geçerliliği değerlendirilmiştir. Sonuç olarak, bu çalışma, Destek Vektör Makinelerinin Doğal Dil İşleme problemlerinde güçlü bir sınıflandırıcı olarak kullanılabileceğini göstermektedir. Elde edilen bulgular, DVM'nin metin sınıflandırmasında etkili bir seçenek olduğunu ve doğru özellik çıkarım teknikleri ile performansının daha da iyileştirilebileceğini ortaya koymaktadır.

Özet (Çeviri)

In this thesis, the applicability of Support Vector Machines (SVM) in the field of Natural Language Processing (NLP) is investigated. Natural Language Processing offers a set of algorithms and techniques for developing systems that interact with human language. In tasks such as text classification, sentiment analysis, and language model creation, machine learning algorithms like SVM stand out due to their high accuracy and generalization capabilities. This study examines how SVM can be adapted to NLP tasks on different datasets and how the results can be optimized. In this study, SVM models were trained using feature sets created through text vectorization techniques like Word2Vec and BERT. In particular, the effects of different kernel functions and hyperparameter settings on model performance were investigated. The advantages and limitations of SVM in NLP were discussed through both theoretical and experimental analyses. The methods employed in this thesis involve extensive experiments to evaluate the success of SVM models on text-based datasets. The experiments, conducted using different datasets and feature extraction techniques, compared model accuracy, sensitivity, specificity, and F1 score. The performance of SVM models was also evaluated in comparison with other machine learning methods to assess the overall validity of the results. In conclusion, this study demonstrates that Support Vector Machines can be effectively used as a strong classifier in Natural Language Processing problems. The findings show that SVM is a viable option for text classification and that its performance can be further enhanced with the correct feature extraction techniques.

Benzer Tezler

  1. Doğal dil işlemede ileri seviye metin sınıflandırma: Transformer'ın rolü

    Advanced text classification in natural languageprocessing: The role of transformer

    MERT HALİL DURAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİnönü Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CENGİZ HARK

  2. Doğal dil işlemede makine öğrenme yöntemlerinin şair tanıma problemi üzerinde kıyaslanması

    Comparison of machine learning methods in natural language processing on the poet recognition problem

    AYKHAN BAGHIROV

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOSTİM TEKNİK ÜNİVERSİTESİ

    Yazılım Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ SEBETCİ

  3. Hiperspektral görüntü analizinde ileri spektral ve uzamsal yöntemler

    Advanced spectral and spatial methods for hyperspectral image analysis

    İBRAHİM ONUR SIĞIRCI

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKHAN BİLGİN

  4. Üretken rakip ağlar ile Türkçe metin üretimi

    Turkish text generation with generative adversarial networks

    BARIŞ GÜCÜK

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAFET DURGUT

  5. Semantic land cover and land use classification using deep convolutional neural networks

    Derin evrişimsel sinir ağları ile arazi kullanımı ve arazi örtüsünün anlamsal sınıflandırılması

    BERK GÜNEY

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. ELİF SERTEL