Geri Dön

Doğal dil işlemede makine öğrenme yöntemlerinin şair tanıma problemi üzerinde kıyaslanması

Comparison of machine learning methods in natural language processing on the poet recognition problem

  1. Tez No: 878867
  2. Yazar: AYKHAN BAGHIROV
  3. Danışmanlar: PROF. DR. ALİ SEBETCİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: OSTİM TEKNİK ÜNİVERSİTESİ
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 47

Özet

Bu tez çalışması, doğal dil işleme ve makine öğrenimi alanlarında, farklı algoritmaların şair tanıma problemini çözmedeki performanslarını karşılaştırmayı amaçlamaktadır. Tezde, farklı şairlerin şiirlerinden oluşan bir veri seti kullanılarak çeşitli makine öğrenme algoritmalarının performansları değerlendirilmiştir. Çalışma kapsamında incelenen algoritmalar arasında Destek Vektör Makineleri, Gaussyen Naif Bayes, Çok Katmanlı Algılayıcı, Lojistik Regresyon, Stokastik Gradyan İnişi, Ekstra Rastgele Ağaçlar ve Aşırı Gradyan Artışı yer almaktadır. Tezde kullanılan veri seti, farklı şairlere ait şiirlerden oluşmakta ve bu veriler üzerinde yürütülen ön işlemler arasında metnin temizlenmesi, nitelik çıkarımı ve vektörleştirme işlemleri bulunmaktadır. Deneysel çalışma, her bir algoritmanın hiper-parametrelerinin optimizasyonu ve performans metriklerinin çıkarılmasını içermektedir. Bu değerlendirmeler, hangi algoritmanın şair tanıma problemi üzerinde daha yüksek performans gösterdiğini belirlemeye yardımcı olmuştur. Sonuçlar, Lojistik Regresyon, Stokastik Gradyan İnişi ve Ekstra Rastgele Ağaçlar yöntemlerinin diğer algoritmalara kıyasla daha yüksek doğruluk ve daha düşük hata oranları ile öne çıktığını göstermiştir. Performans açısından bu yöntemleri, Çok Katmanlı Algılayıcı, Aşırı Gradyan Artışı ve Destek Vektör Makineleri izlemiş, en zayıf performansı Gaussyen Naif Bayes algortiması göstermiştir. Bu sonuçlar, model seçimi yaparken sadece doğruluk oranlarına değil, aynı zamanda veri setinin özelliklerine, modelin varsayımlarına ve problem tanımına da dikkat edilmesi gerektiğini göstermektedir.

Özet (Çeviri)

This thesis compares the performance of various methods in natural language processing and machine learning in tackling the poet recognition challenge. The thesis analyzed the effectiveness of various machine learning algorithms on a data set of poems by diverse poets. The methods investigated in the study include Support Vector Machines, Gaussian Naive Bayes, Multilayer Perceptron, Logistic Regression, Stochastic Gradient Descent, Extra Random Trees, and Extreme Gradient Boosting. The data set used in the thesis comprises of poems by various poets, and preliminary operations performed on this data include text cleaning, feature extraction, and vectorization. The experimental investigation covers the optimization of each algorithm's hyperparameters as well as the extraction of performance measures. These evaluations assisted in determining which algorithm performed best on the poet recognition problem. The results showed that the Logistic Regression, Stochastic Gradient Descent, and Extra Random Trees approaches outperformed other algorithms in terms of accuracy and error rates. In terms of performance, these algorithms were followed by Multilayer Perceptron, Extreme Gradient Boosting and Support Vector Machines, with the Gaussian Naive Bayes algorithm coming in last. These findings demonstrate that when selecting a model, consideration should be given not just to accuracy rates, but also to the characteristics of the data collection, model assumptions, and problem specification.

Benzer Tezler

  1. Development of data augmentation methods to improve performance of supervised machine learning models in natural language processing

    Doğal dil işlemede denetimli makine öğrenimi modellerinin performansını arttırmak için veri zenginleştirme yöntemlerinin geliştirilmesi

    ABDUL MAJEED ISSIFU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT CAN GANİZ

  2. Augmenting a Turkish dataset for spam filtering using natural language processing techniques

    Doğal dil işleme teknikleri kullanılarak spam filtreleme için Türkçe veri kümesinin genişletilmesi

    AYŞENUR AKSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Siber Güvenlik Ana Bilim Dalı

    PROF. DR. BANU GÜNEL KILIÇ

    DOÇ. DR. CENGİZ ACARTÜRK

  3. Soru yanıtlama sistemleri için hibrid makine öğrenmesi tekniklerine dayalı bir yöntem tasarımı ve gerçekleştirimi

    The design and implementation of a method for question answering systems based on hybrid machine learning techniques

    SİNEM ÇINAROĞLU

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HASAN BULUT

  4. İstatistiksel doğal dil işlemede derin öğrenme yöntemleri kullanılarak çevrimiçi Türkçe akademik derlem çözümlenmesi

    Analysing Turkish academical corpus using deep learning methods in statistical natural language

    BARIŞ BABÜROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKahramanmaraş Sütçü İmam Üniversitesi

    Enformatik Ana Bilim Dalı

    PROF. DR. MEHMET TEKEREK

  5. Automatic generation of scientific terminology with deep learning

    Derin öğrenme ile otomatik bilim terimleri sözlüğü oluşturulması

    İPEK NUR KARAMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İLYAS ÇİÇEKLİ

    DR. GÖNENÇ ERCAN