Using text representation and deep learning methods for turkish text classification
Türkçe metin sınıflama için metin temsili ve derin öğrenme yöntemlerinin kullanımı
- Tez No: 557059
- Danışmanlar: PROF. DR. SELMA AYŞE ÖZEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 138
Özet
İnternet kullanımının giderek yaygınlaşması, beraberinde dijital ortamlarda üretilen metin içeriği miktarında ciddi bir artışa neden olmuştur. Artan miktardaki metin verisini işlemek zorlaşmıştır ve bu ihtiyaca yönelik çözümler geliştirilmeye başlanmıştır. Geleneksel yöntemlere alternatif olarak daha büyük boyutlu verilerle çalışmayı mümkün kılan, derin öğrenme tabanlı sınıflayıcılar ve yapay sinir ağı tabanlı metin temsil yöntemleri geliştirilmiştir. Geliştirilen bu yöntemler kullanılarak yapılan çalışmaların büyük çoğunluğu İngilizce metinler ile yapılmıştır. Türkçe metinler için bu yöntemler son 2 ya da 3 yılda kullanılmaya başlanmıştır. Bu tezde yapay sinir ağı tabanlı kelime ve doküman temsil yöntemleri ile derin öğrenme tabanlı sınıflayıcıların farklı karakteristiklere sahip Türkçe metinlerdeki sınıflama performanslarını değerlendirmek amacıyla, duygu ve doküman sınıflama problemleri için kullanılmış, geleneksel metin temsil yöntemleri ve sınıflayıcılar ile karşılaştırılmıştır. Sınıflayıcıların bu iki problem için karşılaştırmasını yapmak amacıyla, derin öğrenme tabanlı evrişimli sinir ağları, uzun kısa süreli bellek ağları ve literatürde Türkçe metinler için sıklıkla uygulanan geleneksel sınıflayıcılar kullanılmıştır. Yapılan deneyler sonucunda yapay sinir ağı bazlı metin temsil yöntemlerinin, tf ve tf-idf ağırlıklandırma yöntemlerinin başarılarına yakın ve bazı durumlarda daha yüksek sınıflama başarısı elde ettiği gözlenmiştir. Derin öğrenme tabanlı sınıflayıcılar ise geleneksel sınıflayıcılara eşit veya daha yüksek sınıflama başarısına sahip olmuştur.
Özet (Çeviri)
The heavy use of the Internet has led to a significant increase in the amount of text content produced in online platforms. Huge amount of online textual data is difficult to process, and new techniques have begun to be developed to process online data automatically. New word and document representation methods and deep learning-based classifiers have emerged recently to work with large text datasets as an alternative way to traditional text processing methods. The vast majority of studies using these methods were done with English texts. For Turkish texts, these methods have been used in the last 2 or 3 years. In this thesis, our aim is to evaluate the performances of new text representation and deep learning-based methods on classification of Turkish texts having different characteristics to show the usability of these methods on different document types. Therefore, these methods are used for the problems of sentiment and document classification and their performances are compared with traditional text classification methods. In order to make performance comparisons of the classifiers for the two text classification tasks that studied, deep learning-based convolutional neural networks and long short-term memory networks are used; as well as traditional classifiers which frequently used for Turkish texts in the literature. In the experimental evaluations it is found that embedding methods have similar performance with the traditional tf and tf-idf weighting methods, and in some cases achieve higher classification success. Deep learning-based classifiers have equal or higher classification success than the traditional classifiers.
Benzer Tezler
- Geleneksel makine öğrenimi ve derin öğrenme modelleri ile Türkçe metin sınıflandırmada kelime temsil yöntemlerinin etkisi
The effect of word representation methods on Turkish text classification with traditional machine learning and deep learning models
NİHAL DUMAN SUNA
- Görüntü işlemede derin öğrenme tabanlı süper çözünürlük uygulamaları
Deep learning based super resolution applications in image processing
AHENK VURAL
Yüksek Lisans
Türkçe
2021
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ENDER METE EKŞİOĞLU
- Derin öğrenme yöntemleriyle sosyal medya analizi ve kullanıcı temsili
Social media analysis and user representation with deep learning methods
İBRAHİM RIZA HALLAÇ
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GALİP AYDIN
- Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti
Using natural language processing techniques and deep learning algorithms for detecting spam on social networks
REZAN BAKIR
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN ERBAY
- Kelime gömme vektörlerinin graf dönüşümü yoluyla metin sınıflandırmada kullanımı
Use of word embedding vectors in text classification through graph conversion
ELİF DORUKBAŞI
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. İLKER TÜRKER