Geri Dön

N-seviyeli gizli Dirichlet ayırımı desteği ile tür ve duygu sınıflandırma

Genre and emotion classification by support of N-stage latent Dirichlet allocation

  1. Tez No: 507604
  2. Yazar: ZEKERİYA ANIL GÜVEN
  3. Danışmanlar: PROF. DR. BANU DİRİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 86

Özet

Haber başlıklarının türü ve sosyal medyada yapılan paylaşımların duygu durumlarına göre sınıflandırılması gelişen teknoloji ile beraber medya sektöründe kullanım açısından büyük önem taşımaktadır. Bir haberin hangi tür olduğunu anlamanın yanı sıra, kişinin çok ziyaret ettiği haber türü bulunabilmekte ve o kişiye özgü ilgi çekebilecek reklamlar gösterilebilmektedir. Ayrıca, haber ajansları için haberlerin otomatik olarak sınıflandırılması önemlidir. Sosyal medya artık iletişim için kullanılmanın ötesinde birçok alanda etkili hale gelmiştir. Kullanıcılar Facebook, Twitter, Blog gibi sosyal medya araçlarında bir olayla alakalı duygusunu, düşüncesini ve deneyimlerini paylaşabilmektedir. Ayrıca, bu araçlar haber paylaşmak ve organizasyon düzenlemek için de kullanılmaktadır. Sosyal medyada yapılan paylaşımlar ile kişi hakkında bilgi de edinilebilmektedir. Yapılan paylaşımlardaki duygulardan yola çıkarak kişinin ruh hali tahmin edilmektedir. Böylece kişiye özgü sayfalar önerilebilmektedir. Çalışmada haberlerin türlerini ve Twitter'dan paylaşılan tivitlerin hangi duyguya sahip olduğunu tespit etmek amaçlanmıştır. Yöntem olarak konu modelleme algoritması Gizli Dirichlet Ayırımı (GDA), N seviyeli bir yapıda geliştirilerek kullanılmıştır. Haberler için oluşturulan veri seti Milliyet, Mynet gibi sitelerden yararlanılarak oluşturulmuştur. Tivitlerin duygu tespitinde kullanılan veri seti de Türkçe tivitlerden oluşturulmuştur. Haber veri seti en fazla 7 sınıflı iken; tivit veri seti kızgın, korku, mutlu, üzgün ve şaşkın duygu türü olmak üzere 5 sınıftan oluşmuştur. Sistemi modellerken kelimelerin kökleri alınmıştır. Köklerin çıkarılması işleminde Zemberek, Snowball ve kelimenin ilk 5 karakterini kök alan yöntemler kullanılmıştır. Haber ve Tivit veri setleri için önce klasik GDA yöntemi ile haberler için konu, tivitler için duygu ataması yapılmış ve sonrasında gerçek etiket değerleri ile karşılaştırarak bir başarı hesaplanmıştır. Klasik GDA yöntemini referans alarak aşamalı olarak değiştirilen GDA yöntemi ile tekrardan konu ve duygu belirleme işlemi yapılarak başarının arttığı gözlemlenmiştir. N-seviyeli GDA yöntemi kullanılarak her haber ve tivit için çıkarılmış olan özellikler kullanılarak Naive Bayes, Multinomial Naive Bayes, Destek Vektör Makineleri, Rastgele Orman ve Çok Katmanlı Algılayıcı gibi makine öğrenmesi yöntemleri kullanılarak sınıflandırıcılar ile sistemin başarısı ölçülmüştür.

Özet (Çeviri)

Classification of news headlines and social media based emotions are of great importance in terms of their use in the media sector, along with developing technology. In addition to understanding what kind of news is, you can find the type of news that the person has visited and can show ads that can attract that person's interest. It is also important to automatically classify news for news agencies. Social media has become more effective in many areas beyond communication. Users can share their feelings, thoughts and experiences with an event in social media tools like Facebook, Twitter, Blog. These tools are also used to share news and organize events. Information about the person can also be obtained through sharing in the social media. The mood of the person is estimated by going out of the shared feelings. Thus, personalized pages can be offered. The purpose of the study was to determine the types of news and the feelings of the tweets shared on Twitter. As a method, the subject modeling algorithm has been developed and used in a N-stage structure of the Latent Dirichlet Allocation (LDA). The data set created for the news was created by using sites like Milliyet, Mynet. The dataset used in the detection of the feelings of tweets was also created from Turkish tweets. While the news dataset has a maximum of 7 classifications; the dataset consists of five classes: angry, fear, happy, sad and confused. When modeling the system, the words are rooted. In the process of removing the roots, Zemberek, Snowball and the first 5 characters of words are used. For the news and tweets data sets, the classical LDA method was used first for the news, the emotion assignment for the tweets, and then a success by comparing with the actual label values. It has been observed that success has been achieved by using the GDA method, which was gradually changed with reference to the classical GDA, by performing the subject and feeling determination process from the other. Using the N-stage GDA method, the performance of the system with classifiers was measured using machine learning methods such as Naive Bayes, Multinomial Naive Bayes, Support Vector Machines, Random Forest and Multilayer Perceptron, using features extracted for each news and tweets.

Benzer Tezler

  1. Novel methods for security mechanisms and key management techniques in wireless networks based on signcryption and hybrid cryptography

    Kablosuz ağlarda güvenlik mekanizmaları ve anahtar yönetim teknikleri için signcryption ve hibrid kriptografi temelli yeni yöntemler

    ATTİLA ALTAY YAVUZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ.DR. FATİH ALAGÖZ

  2. Ortam-tabanlı modülasyonlu özgün sistem tasarımları

    Novel system design with media-based modulation

    İBRAHİM YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM ALTUNBAŞ

    DOÇ. ERTUĞRUL BAŞAR

  3. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  4. Extensive cryptanalysis of authenticated encryption with associated data algorithm colm

    İlgili veri içeren asıllanmış şifreleme algoritması colm'un kapsamlı kriptanalizi

    SIRRI ERDEM ULUSOY

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ÖNDER EFE

    DOÇ. DR. ORHUN KARA

  5. Gizli ve görünür hatalara maruz sistemlerde en iyi bakım politikasının belirlenmesi

    Determining the best maintenance policy in systems exposed to self announcing and non-self announcing failures

    MAHMUT İBRAHİM ULUCAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri MühendisliğiTOBB Ekonomi ve Teknoloji Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SALİH TEKİN