Geri Dön

Gizli Dirichlet ayırımı kullanılarak COVID-19 salgını döneminde yayınlanan internet haberlerinin konu modellemesi

Topic modeling of internet news during the COVID-19 epidemic using the latent Dirichlet allocation

  1. Tez No: 754319
  2. Yazar: ALP KARAOSMANOĞLU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYSUN GÜRAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Doğuş Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 90

Özet

Bu tez çalışmasının amacı Koronavirüs Pandemisi sürecinde yayınlanan internet haber metinlerinin üzerinde Gizli Dirichlet Ayırımı (Latent Dirichlet Allocation, LDA, GDA) yapılarak konu modelleme işlemlerinin gerçekleştirilmesi ve sonuçların araştırılmasıdır. Bu amaçla; internet üzerinde yayın yapan 9 farklı haber kaynağında yayınlanan; 10 farklı kategorideki haber metinleri üzerinde araştırmalar yapılmış ve sonuçlar yorumlanmıştır. Ayrıca tez çalışmasında; her bir haberin içeriğinde bulunan tüm kelimelerin köklerinin elde edilmesi aşamasında Türkçe dilini destekleyen bir Doğal Dil İşleme metodu olan Zemberek'ten faydalanılmıştır. Haberlerin bulunduğu her bir kategori için duygusal durum sonucunu ortaya koyan VADER'den yararlanılarak, aylık olarak haberlerin duygusal durumu ortaya çıkarılmıştır. Bu çalışma yapılırken kullanılan veri kümeleri tamamen sıfırdan oluşturulmuş ve ilgili haber mecralarından bu haberler yeni geliştirilen kod yapılarıyla ve botlar vasıtasıyla elde edilmiştir. Çalışmada her bir kategori içerisinde en fazla yer alan konu başlıkları belirlenmiş ve dönemsel olarak bu başlıkların hangi günlük konular ile ilgili olduğu tespit edilmeye çalışılmıştır.

Özet (Çeviri)

The aim of this thesis study is to perform the topic modeling processes and investigate the results by making Latent Dirichlet Allocation (LDA) on the internet news published during the Coronavirus Pandemic period. For these purposes, related researches were carried out on the news published in 9 different news sources and in 10 different categories on the internet, and the results were interpreted. In addition, in the thesis study; Zemberek, a Natural Language Processing method that supports the Turkish language, was used in the process of obtaining the roots of all the words in the content of each news. The emotional state of the news was revealed on a monthly basis by using VADER, which reveals the emotional state result for each category of news. The datasets used in this study were created completely new and these news from the relevant news channels were obtained by means of bots with newly developed code structures. In the study, the most common topics in each category were determined and it was tried to determine which daily topics these topics were related to periodically.

Benzer Tezler

  1. Global goals, local voices: A multinational comparative sentiment and topic analysis of public transportation in the context of SDGs

    Küresel hedefler, yerel sesler: Sürdürülebilir kalkınma amaçları bağlamında toplu taşımaya yönelik ülkelerin karşılaştırmalı duygu ve konu analizi

    ASLIGÜL AKSAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE CAMGÖZ AKDAĞ

  2. Yapay zeka yöntemleri ile uzaktan eğitimdeki sorunların tespiti ve öğrencilerin akademik performanslarının tahmin edilmesi

    Detecting the problems in distance education and predicting the academic performance of students by using artificial intelligence methods

    HALİT IRMAK

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    DOÇ. DR. ZÜMRÜT ECEVİT SATI

  3. Yazılım içerikli soru-cevap sitelerine metin madenciliğinin uygulanması

    Application of text mining to software related question-answer websites

    AHMET SAMET ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NİLGÜN GÜLER BAYAZIT

  4. N-seviyeli gizli Dirichlet ayırımı desteği ile tür ve duygu sınıflandırma

    Genre and emotion classification by support of N-stage latent Dirichlet allocation

    ZEKERİYA ANIL GÜVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BANU DİRİ

  5. Gizli dirichlet ayrımı ve Word2vec yöntemlerinin birleşimi ile özgün bir metin temsil modeli geliştirilmesi

    Combining latent dirichlet allocation and Word2vec for a novel document representation model

    HALİL İBRAHİM ÇELENLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEVİNÇ İLHAN OMURCA

    DOÇ. DR. MURAT CAN GANİZ