Geri Dön

Classification of arabic text using convolutional neural networks

Konvolutıonal neural ağları kullanılan arabıc metinin sınıflandırması

  1. Tez No: 533343
  2. Yazar: BILAL SHAKIR FARAJ ALKHASAWE
  3. Danışmanlar: DR. ÖĞR. ÜYESİ FEHİM KÖYLÜ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Metin sınıflandırma, Arapça metin madenciliği, duyarlılık analizi, evrişimsel sinir ağları, derin öğrenme, Text classification, Arabic text mining, sentiment analysis, convolutional neural networks, deep learning
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Erciyes Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 84

Özet

İnternet kullanıcılarının sayısı ve çevrimiçi kullanıcı yorumları ve görüşlerinin artması, büyük ve ham verilerin oluşmasıyla sonuçlandı. Bu veriler ürün ve hizmetler hakkında önemli ama işlenmemiş geri bildirimleri içerir. Bu tür metin verilerinin analizi ilgi çekmeye yol açmaktadır. Bu araştırma alanı genellikle duygu analizi veya görüş madenciliği olarak adlandırılmaktadır. Literatürde, metin duyarlılığı analizi için farklı sınıflandırıcılar önerilmiştir. İlk başta ham metin verileri önceden işlenir ve bundan sonra bir öğrenme algoritması kullanılır. Bu algoritmalar İngilizce dili için çok iyi uygulanır. Ne yazık ki, Arapça dünyada kullanılan farklı aksanları olan ve daha morfolojik ve yaygın olarak kullanılan bir dildir. Farklı çalışmalarda Arapça metinleri sınıflandırmak için Destek Vektör Makineleri, Karar Ağaçları ve Naïve Bayes algoritmaları kullanılır. Bu çalışmada, derin öğrenme yöntemleri kullanılarak Arapça metni sınıflandırmak için evrişimsel sinir ağları (CNN) modelleri kullanılmıştır. Karşılaştırılmalı testler için LABR kitap inceleme veri seti kullanılmıştır. Sonuçlar Destek Vektör Makineleri ve Naïve Bayes algoritmaları ile karşılaştırılmıştır. Yapılan deneylerde, CNN modelinin bazı sonuçlarının SVM ve NB sınıflandırma sonuçlarından daha iyi olduğu ispatlanmıştır.

Özet (Çeviri)

The increasing amount of Internet users and the consequent increase of online user reviews, expressing their opinions, has resulted in huge and raw data. This data includes important but unprocessed feedback about products and services. This leads to a growing interest on dealing with the analysis of this type of text data. This area of research is typically called sentiment analysis or opinion mining. In the literature different classifiers are proposed for text sentiment analysis. First raw text data is preprocessed and after that a learning algorithm is used. These algorithms are applied for English language very well. Unfortunately, Arabic is more morphological and wide used language which has different accents used in the world. Support Vector Machines, Decision Trees, and Naïve Bayes algorithms are used for classifying Arabic text in different studies. In this paper, convolutional neural networks (CNN) models are used to classify the Arabic text by using deep learning methods. LABR book review dataset is used for benchmark tests. The results are compared with Support Vector Machines and Naïve Bayes algorithms. In experiments, it is shown that some results of CNN model are better than SVM and NB classification results.

Benzer Tezler

  1. Sentiment classification of arabic tweets using a novel learning sentiment-specific word embedding technique

    Yeni bir duygu-odaklı kelime gömme tekniği kullanarak arapça tvitlerin duygu sınıflandırması

    HALA MULKI

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İSMAİL BABAOĞLU

  2. Detecting multilingual offensive language in social media using deep neural networks

    Derin sinir ağlarını kullanarak sosyal medyada çokludilli saldırgan dil tespit etme

    MAHMUD BİRECİKLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SELMA AYŞE ÖZEL

  3. Metasezgisel algoritmalara dayalı öznitelik seçimi yöntemleriyle arapça metinlerin sınıflandırılması

    Development of metaheuristic algorithms and classification method of arabic texts

    SHAMIL JASIM HAMMADI AL-MOHAMMEDI

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FEHİM KÖYLÜ

  4. Öznitelik seçme teknikleri ve genetik algoritma kullanılarak etkin arapça metin sınıflandırması

    Efficient arabic text classification using feature selection techniques and genetic algorithm

    AHMED HASHIM KAREEM AL-DULAIMI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MURAT OKKALIOĞLU

  5. Multi-label and single-label text classification using standard machine learning algorithms and pre-trained BERT transformer

    Standart makine öğrenimi algoritmaları ve önceden eğitilmiş BERT transformer kullanarak çok etiketli ve tek etiketli metin sınıflandırma

    HUDA ALFIGI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ABDULKADİR GÜRER