Şiir kategorisinin doğal dil işleme yöntemleri kullanılarak tahmin edilmesi
Predicting poetry category using natural language processing methods
- Tez No: 832530
- Danışmanlar: DR. ÖĞR. ÜYESİ SEDAT KORKMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Konya Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Doğal dil işleme; insanlar tarafından kullanılan dillerin (doğal dil) bilgisayarlar tarafından anlaşılmasını, yorum ve cevap üretilmesini sağlayan bilgisayar bilimleri ve dilbilim yöntemlerinin birlikte kullanıldığı bir bilim alanıdır. Doğal dil işleme, insanlarla bilgisayarların etkileşimini artırmak ve özellikle büyük veri setleri üzerinde çalışan kurumlar ve araştırmacılar için doğal dil verilerini analiz etmeyi ve anlamayı kolaylaştırmak amacıyla kendine birçok uygulama alanı bulmuştur. Bu uygulama alanlarından bir tanesi de metinlerin sınıflandırılmasıdır. Bu tezde, metin formatında olan ve farklı kategoride yazılmış olan şiirlerin önceden etiketlenmiş olan kategorilere göre sınıflandırılması üzerine çalışma yapılmıştır. Çalışmada web kazıma yöntemi ile elde edilen ve 4198 adet şiirden oluşan veri seti kullanılmıştır. Veri seti üzerinde 13 farklı doğal dil işleme adımları uygulanmıştır. Söz konusu işlemlerin yapılabilmesi için Zemberek Kütüphanesi kullanılmıştır. Sınıflandırma işlemi için altı farklı makine öğrenmesi algoritması kullanılmış, elde edilen sonuçlar değerlendirilmiş ve model performansını artırmaya yönelik hiperparametre analizi yapılmıştır. Hiperparametre analizi için GridSearchCV ve RandomizedSearchCV yöntemleri kullanılmıştır. Sınıflandırma algoritmalarının sonuçları kıyaslandığında en yüksek doğruluk oranını Random Forest ve SVM algoritmalarının verdiği görülmüştür.
Özet (Çeviri)
Natural language processing is a field of science that combines methods from computer science and linguistics to enable computers to understand, interpret and respond to human language (natural language). Natural language processing has found many applications to improve human-computer interaction and to make it easier to analyse and understand natural language data, especially for organisations and researchers working with large data sets. One such application is text classification. In this thesis, a study was conducted on the classification of poems in text format and written in different categories according to pre-labelled categories. The study used a dataset of 4198 poems obtained by web scraping. Thirteen different natural language processing steps were applied to the dataset. The Zemberek library was used to perform these operations. Six different machine learning algorithms were used for classification, the results obtained were evaluated and hyperparameter analysis was performed to improve model performance. The methods GridSearchCV and RandomizedSearchCV were used for the hyperparameter analysis. When the results of the classification algorithms were compared, it was found that the Random Forest and SVM algorithms gave the highest accuracy rate.
Benzer Tezler
- Orhan Koçak'ın eleştirisinde etkilenme endişesi
The anxiety of influence in Orhan Koçak's criticism
EMRE COŞKUN
Yüksek Lisans
Türkçe
2022
Türk Dili ve EdebiyatıHacettepe ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KORAY ÜSTÜN
- Mecmua-i Gazeliyat-ı Türki(Metin-inceleme-dizin)
Mecmua-i Gazeliyat-ı Türki(Text-examination-indeks)
HANIM YILMAZ
Yüksek Lisans
Türkçe
2017
Türk Dili ve EdebiyatıGazi ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. İSMAİL HAKKI AKSOYAK
- İngiltere British Library'deki or. 7085 numaralı şiir mecmuası (Metin-inceleme)
A poem mecmua registered in British Library, England with the number of or. 7085 (Text-analysis)
BENAY BIÇAK
Yüksek Lisans
Türkçe
2017
Türk Dili ve EdebiyatıOndokuz Mayıs ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. YAKUP POYRAZ
- Etkilenme endişesi bağlamında Ahmet Hamdi Tanpınar ve Yahya Kemal Beyatlı
Ahmet Hamdi Tanpınar and Yahya Kemal Beyatlı in the context of anxiety of influence
DİLŞAH NUR GÜNEŞ DAL
Yüksek Lisans
Türkçe
2024
Türk Dili ve EdebiyatıAnkara Yıldırım Beyazıt ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. CENGİZ KARATAŞ