N-seviyeli gizli Dirichlet ayırımı desteği ile tür ve duygu sınıflandırma
Genre and emotion classification by support of N-stage latent Dirichlet allocation
- Tez No: 507604
- Danışmanlar: PROF. DR. BANU DİRİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 86
Özet
Haber başlıklarının türü ve sosyal medyada yapılan paylaşımların duygu durumlarına göre sınıflandırılması gelişen teknoloji ile beraber medya sektöründe kullanım açısından büyük önem taşımaktadır. Bir haberin hangi tür olduğunu anlamanın yanı sıra, kişinin çok ziyaret ettiği haber türü bulunabilmekte ve o kişiye özgü ilgi çekebilecek reklamlar gösterilebilmektedir. Ayrıca, haber ajansları için haberlerin otomatik olarak sınıflandırılması önemlidir. Sosyal medya artık iletişim için kullanılmanın ötesinde birçok alanda etkili hale gelmiştir. Kullanıcılar Facebook, Twitter, Blog gibi sosyal medya araçlarında bir olayla alakalı duygusunu, düşüncesini ve deneyimlerini paylaşabilmektedir. Ayrıca, bu araçlar haber paylaşmak ve organizasyon düzenlemek için de kullanılmaktadır. Sosyal medyada yapılan paylaşımlar ile kişi hakkında bilgi de edinilebilmektedir. Yapılan paylaşımlardaki duygulardan yola çıkarak kişinin ruh hali tahmin edilmektedir. Böylece kişiye özgü sayfalar önerilebilmektedir. Çalışmada haberlerin türlerini ve Twitter'dan paylaşılan tivitlerin hangi duyguya sahip olduğunu tespit etmek amaçlanmıştır. Yöntem olarak konu modelleme algoritması Gizli Dirichlet Ayırımı (GDA), N seviyeli bir yapıda geliştirilerek kullanılmıştır. Haberler için oluşturulan veri seti Milliyet, Mynet gibi sitelerden yararlanılarak oluşturulmuştur. Tivitlerin duygu tespitinde kullanılan veri seti de Türkçe tivitlerden oluşturulmuştur. Haber veri seti en fazla 7 sınıflı iken; tivit veri seti kızgın, korku, mutlu, üzgün ve şaşkın duygu türü olmak üzere 5 sınıftan oluşmuştur. Sistemi modellerken kelimelerin kökleri alınmıştır. Köklerin çıkarılması işleminde Zemberek, Snowball ve kelimenin ilk 5 karakterini kök alan yöntemler kullanılmıştır. Haber ve Tivit veri setleri için önce klasik GDA yöntemi ile haberler için konu, tivitler için duygu ataması yapılmış ve sonrasında gerçek etiket değerleri ile karşılaştırarak bir başarı hesaplanmıştır. Klasik GDA yöntemini referans alarak aşamalı olarak değiştirilen GDA yöntemi ile tekrardan konu ve duygu belirleme işlemi yapılarak başarının arttığı gözlemlenmiştir. N-seviyeli GDA yöntemi kullanılarak her haber ve tivit için çıkarılmış olan özellikler kullanılarak Naive Bayes, Multinomial Naive Bayes, Destek Vektör Makineleri, Rastgele Orman ve Çok Katmanlı Algılayıcı gibi makine öğrenmesi yöntemleri kullanılarak sınıflandırıcılar ile sistemin başarısı ölçülmüştür.
Özet (Çeviri)
Classification of news headlines and social media based emotions are of great importance in terms of their use in the media sector, along with developing technology. In addition to understanding what kind of news is, you can find the type of news that the person has visited and can show ads that can attract that person's interest. It is also important to automatically classify news for news agencies. Social media has become more effective in many areas beyond communication. Users can share their feelings, thoughts and experiences with an event in social media tools like Facebook, Twitter, Blog. These tools are also used to share news and organize events. Information about the person can also be obtained through sharing in the social media. The mood of the person is estimated by going out of the shared feelings. Thus, personalized pages can be offered. The purpose of the study was to determine the types of news and the feelings of the tweets shared on Twitter. As a method, the subject modeling algorithm has been developed and used in a N-stage structure of the Latent Dirichlet Allocation (LDA). The data set created for the news was created by using sites like Milliyet, Mynet. The dataset used in the detection of the feelings of tweets was also created from Turkish tweets. While the news dataset has a maximum of 7 classifications; the dataset consists of five classes: angry, fear, happy, sad and confused. When modeling the system, the words are rooted. In the process of removing the roots, Zemberek, Snowball and the first 5 characters of words are used. For the news and tweets data sets, the classical LDA method was used first for the news, the emotion assignment for the tweets, and then a success by comparing with the actual label values. It has been observed that success has been achieved by using the GDA method, which was gradually changed with reference to the classical GDA, by performing the subject and feeling determination process from the other. Using the N-stage GDA method, the performance of the system with classifiers was measured using machine learning methods such as Naive Bayes, Multinomial Naive Bayes, Support Vector Machines, Random Forest and Multilayer Perceptron, using features extracted for each news and tweets.
Benzer Tezler
- Novel methods for security mechanisms and key management techniques in wireless networks based on signcryption and hybrid cryptography
Kablosuz ağlarda güvenlik mekanizmaları ve anahtar yönetim teknikleri için signcryption ve hibrid kriptografi temelli yeni yöntemler
ATTİLA ALTAY YAVUZ
Yüksek Lisans
İngilizce
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ.DR. FATİH ALAGÖZ
- Ortam-tabanlı modülasyonlu özgün sistem tasarımları
Novel system design with media-based modulation
İBRAHİM YILDIRIM
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM ALTUNBAŞ
DOÇ. ERTUĞRUL BAŞAR
- Derin öğrenme ile cerrahi video anlama
Surgical video understanding with deep learning
ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DUYGU SARIKAYA
- Extensive cryptanalysis of authenticated encryption with associated data algorithm colm
İlgili veri içeren asıllanmış şifreleme algoritması colm'un kapsamlı kriptanalizi
SIRRI ERDEM ULUSOY
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÖNDER EFE
DOÇ. DR. ORHUN KARA
- Gizli ve görünür hatalara maruz sistemlerde en iyi bakım politikasının belirlenmesi
Determining the best maintenance policy in systems exposed to self announcing and non-self announcing failures
MAHMUT İBRAHİM ULUCAK
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri MühendisliğiTOBB Ekonomi ve Teknoloji ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SALİH TEKİN