Using text representation and deep learning methods for turkish text classification
Türkçe metin sınıflama için metin temsili ve derin öğrenme yöntemlerinin kullanımı
- Tez No: 557059
- Danışmanlar: PROF. DR. SELMA AYŞE ÖZEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 138
Özet
İnternet kullanımının giderek yaygınlaşması, beraberinde dijital ortamlarda üretilen metin içeriği miktarında ciddi bir artışa neden olmuştur. Artan miktardaki metin verisini işlemek zorlaşmıştır ve bu ihtiyaca yönelik çözümler geliştirilmeye başlanmıştır. Geleneksel yöntemlere alternatif olarak daha büyük boyutlu verilerle çalışmayı mümkün kılan, derin öğrenme tabanlı sınıflayıcılar ve yapay sinir ağı tabanlı metin temsil yöntemleri geliştirilmiştir. Geliştirilen bu yöntemler kullanılarak yapılan çalışmaların büyük çoğunluğu İngilizce metinler ile yapılmıştır. Türkçe metinler için bu yöntemler son 2 ya da 3 yılda kullanılmaya başlanmıştır. Bu tezde yapay sinir ağı tabanlı kelime ve doküman temsil yöntemleri ile derin öğrenme tabanlı sınıflayıcıların farklı karakteristiklere sahip Türkçe metinlerdeki sınıflama performanslarını değerlendirmek amacıyla, duygu ve doküman sınıflama problemleri için kullanılmış, geleneksel metin temsil yöntemleri ve sınıflayıcılar ile karşılaştırılmıştır. Sınıflayıcıların bu iki problem için karşılaştırmasını yapmak amacıyla, derin öğrenme tabanlı evrişimli sinir ağları, uzun kısa süreli bellek ağları ve literatürde Türkçe metinler için sıklıkla uygulanan geleneksel sınıflayıcılar kullanılmıştır. Yapılan deneyler sonucunda yapay sinir ağı bazlı metin temsil yöntemlerinin, tf ve tf-idf ağırlıklandırma yöntemlerinin başarılarına yakın ve bazı durumlarda daha yüksek sınıflama başarısı elde ettiği gözlenmiştir. Derin öğrenme tabanlı sınıflayıcılar ise geleneksel sınıflayıcılara eşit veya daha yüksek sınıflama başarısına sahip olmuştur.
Özet (Çeviri)
The heavy use of the Internet has led to a significant increase in the amount of text content produced in online platforms. Huge amount of online textual data is difficult to process, and new techniques have begun to be developed to process online data automatically. New word and document representation methods and deep learning-based classifiers have emerged recently to work with large text datasets as an alternative way to traditional text processing methods. The vast majority of studies using these methods were done with English texts. For Turkish texts, these methods have been used in the last 2 or 3 years. In this thesis, our aim is to evaluate the performances of new text representation and deep learning-based methods on classification of Turkish texts having different characteristics to show the usability of these methods on different document types. Therefore, these methods are used for the problems of sentiment and document classification and their performances are compared with traditional text classification methods. In order to make performance comparisons of the classifiers for the two text classification tasks that studied, deep learning-based convolutional neural networks and long short-term memory networks are used; as well as traditional classifiers which frequently used for Turkish texts in the literature. In the experimental evaluations it is found that embedding methods have similar performance with the traditional tf and tf-idf weighting methods, and in some cases achieve higher classification success. Deep learning-based classifiers have equal or higher classification success than the traditional classifiers.
Benzer Tezler
- Geleneksel makine öğrenimi ve derin öğrenme modelleri ile Türkçe metin sınıflandırmada kelime temsil yöntemlerinin etkisi
The effect of word representation methods on Turkish text classification with traditional machine learning and deep learning models
NİHAL DUMAN SUNA
- Metin madenciliği ve makine öğrenimi tekniklerinin uygulanmasıyla standart inşaat sözleşmesi belgelerinin metin analizi
Text analysis of standard construction contract documents by the application of text mining and machine learning techniques
ANIL DEMİRCAN
Doktora
Türkçe
2025
İnşaat MühendisliğiDüzce Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. LATİF ONUR UĞUR
- Görüntü işlemede derin öğrenme tabanlı süper çözünürlük uygulamaları
Deep learning based super resolution applications in image processing
AHENK VURAL
Yüksek Lisans
Türkçe
2021
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ENDER METE EKŞİOĞLU
- Derin öğrenme yöntemleriyle sosyal medya analizi ve kullanıcı temsili
Social media analysis and user representation with deep learning methods
İBRAHİM RIZA HALLAÇ
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GALİP AYDIN
- Derin öğrenme algoritmaları ile personel geri bildirimlerinin sınıflandırılması ve analizi
Classification and analysis of employee feedback with deep learning algorithms
GÖKHAN YİĞİDEFE
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERAP ÇAKAR KAMAN