Geri Dön

Şiir kategorisinin doğal dil işleme yöntemleri kullanılarak tahmin edilmesi

Predicting poetry category using natural language processing methods

  1. Tez No: 832530
  2. Yazar: EMRE YÖNET
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SEDAT KORKMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Konya Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 87

Özet

Doğal dil işleme; insanlar tarafından kullanılan dillerin (doğal dil) bilgisayarlar tarafından anlaşılmasını, yorum ve cevap üretilmesini sağlayan bilgisayar bilimleri ve dilbilim yöntemlerinin birlikte kullanıldığı bir bilim alanıdır. Doğal dil işleme, insanlarla bilgisayarların etkileşimini artırmak ve özellikle büyük veri setleri üzerinde çalışan kurumlar ve araştırmacılar için doğal dil verilerini analiz etmeyi ve anlamayı kolaylaştırmak amacıyla kendine birçok uygulama alanı bulmuştur. Bu uygulama alanlarından bir tanesi de metinlerin sınıflandırılmasıdır. Bu tezde, metin formatında olan ve farklı kategoride yazılmış olan şiirlerin önceden etiketlenmiş olan kategorilere göre sınıflandırılması üzerine çalışma yapılmıştır. Çalışmada web kazıma yöntemi ile elde edilen ve 4198 adet şiirden oluşan veri seti kullanılmıştır. Veri seti üzerinde 13 farklı doğal dil işleme adımları uygulanmıştır. Söz konusu işlemlerin yapılabilmesi için Zemberek Kütüphanesi kullanılmıştır. Sınıflandırma işlemi için altı farklı makine öğrenmesi algoritması kullanılmış, elde edilen sonuçlar değerlendirilmiş ve model performansını artırmaya yönelik hiperparametre analizi yapılmıştır. Hiperparametre analizi için GridSearchCV ve RandomizedSearchCV yöntemleri kullanılmıştır. Sınıflandırma algoritmalarının sonuçları kıyaslandığında en yüksek doğruluk oranını Random Forest ve SVM algoritmalarının verdiği görülmüştür.

Özet (Çeviri)

Natural language processing is a field of science that combines methods from computer science and linguistics to enable computers to understand, interpret and respond to human language (natural language). Natural language processing has found many applications to improve human-computer interaction and to make it easier to analyse and understand natural language data, especially for organisations and researchers working with large data sets. One such application is text classification. In this thesis, a study was conducted on the classification of poems in text format and written in different categories according to pre-labelled categories. The study used a dataset of 4198 poems obtained by web scraping. Thirteen different natural language processing steps were applied to the dataset. The Zemberek library was used to perform these operations. Six different machine learning algorithms were used for classification, the results obtained were evaluated and hyperparameter analysis was performed to improve model performance. The methods GridSearchCV and RandomizedSearchCV were used for the hyperparameter analysis. When the results of the classification algorithms were compared, it was found that the Random Forest and SVM algorithms gave the highest accuracy rate.

Benzer Tezler

  1. Augustinus estetik'ine genel bir bakış

    Başlık çevirisi yok

    AYŞE SERPİL BAHADIRLI

    Yüksek Lisans

    Türkçe

    Türkçe

    1986

    Felsefeİstanbul Üniversitesi

    PROF. DR. İSMAİL TUNALI

  2. Orhan Koçak'ın eleştirisinde etkilenme endişesi

    The anxiety of influence in Orhan Koçak's criticism

    EMRE COŞKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Türk Dili ve EdebiyatıHacettepe Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KORAY ÜSTÜN

  3. Mecmua-i Gazeliyat-ı Türki(Metin-inceleme-dizin)

    Mecmua-i Gazeliyat-ı Türki(Text-examination-indeks)

    HANIM YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Türk Dili ve EdebiyatıGazi Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. İSMAİL HAKKI AKSOYAK

  4. İngiltere British Library'deki or. 7085 numaralı şiir mecmuası (Metin-inceleme)

    A poem mecmua registered in British Library, England with the number of or. 7085 (Text-analysis)

    BENAY BIÇAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Türk Dili ve EdebiyatıOndokuz Mayıs Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. YAKUP POYRAZ

  5. Etkilenme endişesi bağlamında Ahmet Hamdi Tanpınar ve Yahya Kemal Beyatlı

    Ahmet Hamdi Tanpınar and Yahya Kemal Beyatlı in the context of anxiety of influence

    DİLŞAH NUR GÜNEŞ DAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Türk Dili ve EdebiyatıAnkara Yıldırım Beyazıt Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. CENGİZ KARATAŞ