Geri Dön

Using text representation and deep learning methods for turkish text classification

Türkçe metin sınıflama için metin temsili ve derin öğrenme yöntemlerinin kullanımı

  1. Tez No: 557059
  2. Yazar: FUNDA GÜVEN
  3. Danışmanlar: PROF. DR. SELMA AYŞE ÖZEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 138

Özet

İnternet kullanımının giderek yaygınlaşması, beraberinde dijital ortamlarda üretilen metin içeriği miktarında ciddi bir artışa neden olmuştur. Artan miktardaki metin verisini işlemek zorlaşmıştır ve bu ihtiyaca yönelik çözümler geliştirilmeye başlanmıştır. Geleneksel yöntemlere alternatif olarak daha büyük boyutlu verilerle çalışmayı mümkün kılan, derin öğrenme tabanlı sınıflayıcılar ve yapay sinir ağı tabanlı metin temsil yöntemleri geliştirilmiştir. Geliştirilen bu yöntemler kullanılarak yapılan çalışmaların büyük çoğunluğu İngilizce metinler ile yapılmıştır. Türkçe metinler için bu yöntemler son 2 ya da 3 yılda kullanılmaya başlanmıştır. Bu tezde yapay sinir ağı tabanlı kelime ve doküman temsil yöntemleri ile derin öğrenme tabanlı sınıflayıcıların farklı karakteristiklere sahip Türkçe metinlerdeki sınıflama performanslarını değerlendirmek amacıyla, duygu ve doküman sınıflama problemleri için kullanılmış, geleneksel metin temsil yöntemleri ve sınıflayıcılar ile karşılaştırılmıştır. Sınıflayıcıların bu iki problem için karşılaştırmasını yapmak amacıyla, derin öğrenme tabanlı evrişimli sinir ağları, uzun kısa süreli bellek ağları ve literatürde Türkçe metinler için sıklıkla uygulanan geleneksel sınıflayıcılar kullanılmıştır. Yapılan deneyler sonucunda yapay sinir ağı bazlı metin temsil yöntemlerinin, tf ve tf-idf ağırlıklandırma yöntemlerinin başarılarına yakın ve bazı durumlarda daha yüksek sınıflama başarısı elde ettiği gözlenmiştir. Derin öğrenme tabanlı sınıflayıcılar ise geleneksel sınıflayıcılara eşit veya daha yüksek sınıflama başarısına sahip olmuştur.

Özet (Çeviri)

The heavy use of the Internet has led to a significant increase in the amount of text content produced in online platforms. Huge amount of online textual data is difficult to process, and new techniques have begun to be developed to process online data automatically. New word and document representation methods and deep learning-based classifiers have emerged recently to work with large text datasets as an alternative way to traditional text processing methods. The vast majority of studies using these methods were done with English texts. For Turkish texts, these methods have been used in the last 2 or 3 years. In this thesis, our aim is to evaluate the performances of new text representation and deep learning-based methods on classification of Turkish texts having different characteristics to show the usability of these methods on different document types. Therefore, these methods are used for the problems of sentiment and document classification and their performances are compared with traditional text classification methods. In order to make performance comparisons of the classifiers for the two text classification tasks that studied, deep learning-based convolutional neural networks and long short-term memory networks are used; as well as traditional classifiers which frequently used for Turkish texts in the literature. In the experimental evaluations it is found that embedding methods have similar performance with the traditional tf and tf-idf weighting methods, and in some cases achieve higher classification success. Deep learning-based classifiers have equal or higher classification success than the traditional classifiers.

Benzer Tezler

  1. Geleneksel makine öğrenimi ve derin öğrenme modelleri ile Türkçe metin sınıflandırmada kelime temsil yöntemlerinin etkisi

    The effect of word representation methods on Turkish text classification with traditional machine learning and deep learning models

    NİHAL DUMAN SUNA

    Doktora

    Türkçe

    Türkçe

    2024

    İstatistikSivas Cumhuriyet Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. OĞUZ KAYNAR

  2. Görüntü işlemede derin öğrenme tabanlı süper çözünürlük uygulamaları

    Deep learning based super resolution applications in image processing

    AHENK VURAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ENDER METE EKŞİOĞLU

  3. Derin öğrenme yöntemleriyle sosyal medya analizi ve kullanıcı temsili

    Social media analysis and user representation with deep learning methods

    İBRAHİM RIZA HALLAÇ

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GALİP AYDIN

  4. Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti

    Using natural language processing techniques and deep learning algorithms for detecting spam on social networks

    REZAN BAKIR

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HASAN ERBAY

  5. Kelime gömme vektörlerinin graf dönüşümü yoluyla metin sınıflandırmada kullanımı

    Use of word embedding vectors in text classification through graph conversion

    ELİF DORUKBAŞI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. İLKER TÜRKER