Geri Dön

Metin sınıflandırması için sınıflandırıcı topluluğu yaklaşımları

Ensemble methods for text classification

  1. Tez No: 770698
  2. Yazar: İSMAİL TERZİ
  3. Danışmanlar: DOÇ. DR. ALPER KÜRŞAT UYSAL
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Yazılımı Bilim Dalı
  13. Sayfa Sayısı: 96

Özet

Geleneksel metin sınıflandırma yöntemleri sınıflandırılacak her metin için bir sınıflandırıcı kullanır. Çoklu Sınıflandırıcı Sistemleri sınıflandırma doğruluğunu artırmak için kullanılan popüler araştırma alanıdır. Dinamik Sınıflandırıcı Seçimi ve Dinamik Sınıflandırıcı Topluluğu Seçimi, çoklu sınıflandırıcı sistemlerinin iki popüler biçimidir. Dinamik Sınıflandırıcı Topluluğu Seçiminde sınıflandırıcı havuzundan bir sınıflandırıcı topluluğu seçilir ve kararları birleştirilir, Dinamik Sınıflandırıcı Seçiminde ise metin sınıflandırmak için sınıflandırıcı havuzundan sadece bir sınıflandırıcı seçilir. Bu tez çalışmasında, mevcut Dinamik Sınıflandırıcı Topluluğu Seçimi ve Dinamik Sınıflandırıcı Seçimi yöntemleri metin sınıflandırma problemine uygulanmış ve metin sınıflandırmada sınıflandırma doğruluğunu artırdığı gösterilmiştir. Aynı zamanda metin sınıflandırması için Dinamik Sınıflandırıcı Seçimine dayalı yeni bir yöntem olan DCS-DQ yöntemi önerilmiştir. Deneysel çalışmalarda farklı özelliklere sahip metin veri setleri kullanılmıştır. Önerilen DCS-DQ yöntemi, popüler 7 Dinamik Sınıflandırıcı Seçimi yöntemi ile karşılaştırılmıştır. Deney sonuçlarına göre, önerilen DCS-DQ yöntemi, öznitelik boyutlarının çoğunluğu için sınıflandırma doğruluğu açısından diğer 7 Dinamik Sınıflandırıcı Seçimi yönteminden daha iyi performans göstermektedir. Sonuç olarak, önerilen DCS-DQ yöntemi, metin sınıflandırması için sınıflandırma doğruluğunu önemli oranda iyileştirmektedir.

Özet (Çeviri)

Traditional text classification methods use only one classifier for each text to be classified. Multiple Classifier Systems is a popular research area used to improve classification accuracy. Dynamic Classifier Selection and Dynamic Ensemble Selection are two forms of multiple classifier systems. In Dynamic Ensemble Selection, a classifier ensemble is selected from the classifier pool and their decisions are combined, whereas in Dynamic Classifier Selection, only one classifier is selected from the classifier pool to classify text. In this thesis, existing Dynamic Ensemble Selection and Dynamic Classifier Selection methods have been applied to the text classification problem and it has been shown to increase the classification accuracy in text classification. The other contribution is, a DCS-DQ method, which is a new Dynamic Classifier Selection-based method for text classification, is proposed. In experimental studies, text datasets with different properties were used. The proposed DCS-DQ method is compared with 7 popular Dynamic Classifier Selection methods. According to the experimental results, the proposed DCS-DQ method outperforms the other 7 Dynamic Classifier Selection methods in terms of classification accuracy for the majority of feature sizes. As a result, the proposed DCS-DQ method significantly improves the classification accuracy for text classification.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. State-of-mind classification from unstructured texts using statistical features and lexical network features

    İstatistiksel öznitelikler ve sözcüksel ağ özniteliklerini kullanarak, formatsız metinlerde düşünce yapısı sınıflandırılması

    ULYA BAYRAM

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversity of Cincinnati

    Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. JOHN PESTIAN

  3. Large-scale arabic sentiment corpus and lexicon building for concept-based sentiment analysis systems

    Kavram-tabanlı duygu analizi sistemleri için büyük ölçekli arapça duygu derlemi ve sözlüğü oluşturulması

    AHMED RAOOF NASSER NASSER

    Doktora

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

  4. Dictionary ensemble based active learning for multiple instance image classification

    Çoklu örnekli görüntü sınıflandırması için sözlük topluluğu tabanlı aktif öğrenme

    GÖKHAN KOÇYİĞİT

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YUSUF YASLAN

  5. Görüş sınıflandırma için makine öğrenmesi algoritmalarına dayalı bir yöntem tasarımı ve gerçekleştirimi

    The design and implementation of a method for opinion classification based on machine learning algorithms

    AYTUĞ ONAN

    Doktora

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA SERDAR KORUKOĞLU

    YRD. DOÇ. DR. HASAN BULUT