Comprehensive text classification study for online reviews
İnternet ortamında ki incelemeler için kavramsız metin sınıflandırma çalışması
- Tez No: 576263
- Danışmanlar: PROF. DR. MURAT EKİNCİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Karadeniz Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 54
Özet
İnternet ortamında ki incelemeler, makaleler ve haberler gibi yapılandırılmamış metinlerin artması, doğru metin sınıflandırmasını kaçınılmaz bir ihtiyaç haline getirmiştir. Bu tür modellerin oluşturulmasında en kritik adımlardan biri de özellik ağırlıklandırmadır. TF-IDF Term Frequency – Inverse Document Frequency (Terim frekansı – ters metin frekansı) bu amaç için kullanılan en popüler yöntem olmasına rağmen, bazı durumlarda sınıflandırma modelinin doğru performans göstermesini engelleyen bazı kısıtlamaları bulunmaktadır. Bu çalışmada iki alanda geliştirme yapılacaktır. Birincisi; konuşma etiketlemenin bir bölümünü kullanan orijinal TFIDF yönteminin kısıtlarını aşan iyileştirilmiş bir versiyon geliştirilecektir. İkinci geliştirme de iki gizli katmanı olan yeni bir derin sinir ağının eğitilmesidir. Çalışmalar 4 adet çok büyük veri seti üzerinde yapılmaktadır ve sonuçlar oldukça umut vericidir
Özet (Çeviri)
The need for an accurate text classification model is increasing with the increase of the unstructured text such as online reviews, articles, and news. And one of the most critical steps in building such models is feature weighting. While TFIDF is the most popular method used of that purpose, it has some limitations that prevent the classification model from performing accurately in some cases. In this work we have two main contributions, first we are introducing an improvement version of TFIDF method using part of speech tagging that will overcome the limitations of the original TFIDF equation, second, we trained a new deep neural network with two hidden layers. The studies were conducted on four large datasets and the results were promising.
Benzer Tezler
- Derin öğrenme yöntemleriyle sosyal medya analizi ve kullanıcı temsili
Social media analysis and user representation with deep learning methods
İBRAHİM RIZA HALLAÇ
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GALİP AYDIN
- Virtual landscape in serious games: A framework for enhancing the player interaction focusing on the learning rate
Ciddi oyunlarda sanal peyzaj: Öğrenme oranına odaklanarak oyuncu etkileşimini geliştirmek için çerçeve
SEPEHR VAEZ AFSHAR
Yüksek Lisans
İngilizce
2022
Peyzaj Mimarlığıİstanbul Teknik ÜniversitesiPeyzaj Mimarlığı Ana Bilim Dalı
DR. ÖĞR. ÜYESİ IKHWAN KIM
- Sosyal mühendislikte komplo tabanlı içeriklerin yapay zekâ ile analizi
Analysis of conspiracy-based content in social engineering with artificial intelligence
EMEL KOÇYİĞİT
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATİH ÇALLI
- Taxonomy and visualization of digital architecture knowledge: Proposal for a scientific online encyclopedia
Dijital mimarlık bilgisinin taksonomisi ve görselleştirilmesi: Bilimsel bir çevrim içi ansiklopedi önerisi
ESRANUR KARACİF
- Large-scale arabic sentiment corpus and lexicon building for concept-based sentiment analysis systems
Kavram-tabanlı duygu analizi sistemleri için büyük ölçekli arapça duygu derlemi ve sözlüğü oluşturulması
AHMED RAOOF NASSER NASSER
Doktora
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER