Doğal dil işlemede makine öğrenme yöntemlerinin şair tanıma problemi üzerinde kıyaslanması
Comparison of machine learning methods in natural language processing on the poet recognition problem
- Tez No: 878867
- Danışmanlar: PROF. DR. ALİ SEBETCİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: OSTİM TEKNİK ÜNİVERSİTESİ
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 47
Özet
Bu tez çalışması, doğal dil işleme ve makine öğrenimi alanlarında, farklı algoritmaların şair tanıma problemini çözmedeki performanslarını karşılaştırmayı amaçlamaktadır. Tezde, farklı şairlerin şiirlerinden oluşan bir veri seti kullanılarak çeşitli makine öğrenme algoritmalarının performansları değerlendirilmiştir. Çalışma kapsamında incelenen algoritmalar arasında Destek Vektör Makineleri, Gaussyen Naif Bayes, Çok Katmanlı Algılayıcı, Lojistik Regresyon, Stokastik Gradyan İnişi, Ekstra Rastgele Ağaçlar ve Aşırı Gradyan Artışı yer almaktadır. Tezde kullanılan veri seti, farklı şairlere ait şiirlerden oluşmakta ve bu veriler üzerinde yürütülen ön işlemler arasında metnin temizlenmesi, nitelik çıkarımı ve vektörleştirme işlemleri bulunmaktadır. Deneysel çalışma, her bir algoritmanın hiper-parametrelerinin optimizasyonu ve performans metriklerinin çıkarılmasını içermektedir. Bu değerlendirmeler, hangi algoritmanın şair tanıma problemi üzerinde daha yüksek performans gösterdiğini belirlemeye yardımcı olmuştur. Sonuçlar, Lojistik Regresyon, Stokastik Gradyan İnişi ve Ekstra Rastgele Ağaçlar yöntemlerinin diğer algoritmalara kıyasla daha yüksek doğruluk ve daha düşük hata oranları ile öne çıktığını göstermiştir. Performans açısından bu yöntemleri, Çok Katmanlı Algılayıcı, Aşırı Gradyan Artışı ve Destek Vektör Makineleri izlemiş, en zayıf performansı Gaussyen Naif Bayes algortiması göstermiştir. Bu sonuçlar, model seçimi yaparken sadece doğruluk oranlarına değil, aynı zamanda veri setinin özelliklerine, modelin varsayımlarına ve problem tanımına da dikkat edilmesi gerektiğini göstermektedir.
Özet (Çeviri)
This thesis compares the performance of various methods in natural language processing and machine learning in tackling the poet recognition challenge. The thesis analyzed the effectiveness of various machine learning algorithms on a data set of poems by diverse poets. The methods investigated in the study include Support Vector Machines, Gaussian Naive Bayes, Multilayer Perceptron, Logistic Regression, Stochastic Gradient Descent, Extra Random Trees, and Extreme Gradient Boosting. The data set used in the thesis comprises of poems by various poets, and preliminary operations performed on this data include text cleaning, feature extraction, and vectorization. The experimental investigation covers the optimization of each algorithm's hyperparameters as well as the extraction of performance measures. These evaluations assisted in determining which algorithm performed best on the poet recognition problem. The results showed that the Logistic Regression, Stochastic Gradient Descent, and Extra Random Trees approaches outperformed other algorithms in terms of accuracy and error rates. In terms of performance, these algorithms were followed by Multilayer Perceptron, Extreme Gradient Boosting and Support Vector Machines, with the Gaussian Naive Bayes algorithm coming in last. These findings demonstrate that when selecting a model, consideration should be given not just to accuracy rates, but also to the characteristics of the data collection, model assumptions, and problem specification.
Benzer Tezler
- Development of data augmentation methods to improve performance of supervised machine learning models in natural language processing
Doğal dil işlemede denetimli makine öğrenimi modellerinin performansını arttırmak için veri zenginleştirme yöntemlerinin geliştirilmesi
ABDUL MAJEED ISSIFU
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT CAN GANİZ
- Augmenting a Turkish dataset for spam filtering using natural language processing techniques
Doğal dil işleme teknikleri kullanılarak spam filtreleme için Türkçe veri kümesinin genişletilmesi
AYŞENUR AKSOY
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiSiber Güvenlik Ana Bilim Dalı
PROF. DR. BANU GÜNEL KILIÇ
DOÇ. DR. CENGİZ ACARTÜRK
- Soru yanıtlama sistemleri için hibrid makine öğrenmesi tekniklerine dayalı bir yöntem tasarımı ve gerçekleştirimi
The design and implementation of a method for question answering systems based on hybrid machine learning techniques
SİNEM ÇINAROĞLU
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HASAN BULUT
- İstatistiksel doğal dil işlemede derin öğrenme yöntemleri kullanılarak çevrimiçi Türkçe akademik derlem çözümlenmesi
Analysing Turkish academical corpus using deep learning methods in statistical natural language
BARIŞ BABÜROĞLU
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKahramanmaraş Sütçü İmam ÜniversitesiEnformatik Ana Bilim Dalı
PROF. DR. MEHMET TEKEREK
- Automatic generation of scientific terminology with deep learning
Derin öğrenme ile otomatik bilim terimleri sözlüğü oluşturulması
İPEK NUR KARAMAN
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İLYAS ÇİÇEKLİ
DR. GÖNENÇ ERCAN