Gizli Dirichlet ayırımı kullanılarak COVID-19 salgını döneminde yayınlanan internet haberlerinin konu modellemesi
Topic modeling of internet news during the COVID-19 epidemic using the latent Dirichlet allocation
- Tez No: 754319
- Danışmanlar: DR. ÖĞR. ÜYESİ AYSUN GÜRAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Doğuş Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 90
Özet
Bu tez çalışmasının amacı Koronavirüs Pandemisi sürecinde yayınlanan internet haber metinlerinin üzerinde Gizli Dirichlet Ayırımı (Latent Dirichlet Allocation, LDA, GDA) yapılarak konu modelleme işlemlerinin gerçekleştirilmesi ve sonuçların araştırılmasıdır. Bu amaçla; internet üzerinde yayın yapan 9 farklı haber kaynağında yayınlanan; 10 farklı kategorideki haber metinleri üzerinde araştırmalar yapılmış ve sonuçlar yorumlanmıştır. Ayrıca tez çalışmasında; her bir haberin içeriğinde bulunan tüm kelimelerin köklerinin elde edilmesi aşamasında Türkçe dilini destekleyen bir Doğal Dil İşleme metodu olan Zemberek'ten faydalanılmıştır. Haberlerin bulunduğu her bir kategori için duygusal durum sonucunu ortaya koyan VADER'den yararlanılarak, aylık olarak haberlerin duygusal durumu ortaya çıkarılmıştır. Bu çalışma yapılırken kullanılan veri kümeleri tamamen sıfırdan oluşturulmuş ve ilgili haber mecralarından bu haberler yeni geliştirilen kod yapılarıyla ve botlar vasıtasıyla elde edilmiştir. Çalışmada her bir kategori içerisinde en fazla yer alan konu başlıkları belirlenmiş ve dönemsel olarak bu başlıkların hangi günlük konular ile ilgili olduğu tespit edilmeye çalışılmıştır.
Özet (Çeviri)
The aim of this thesis study is to perform the topic modeling processes and investigate the results by making Latent Dirichlet Allocation (LDA) on the internet news published during the Coronavirus Pandemic period. For these purposes, related researches were carried out on the news published in 9 different news sources and in 10 different categories on the internet, and the results were interpreted. In addition, in the thesis study; Zemberek, a Natural Language Processing method that supports the Turkish language, was used in the process of obtaining the roots of all the words in the content of each news. The emotional state of the news was revealed on a monthly basis by using VADER, which reveals the emotional state result for each category of news. The datasets used in this study were created completely new and these news from the relevant news channels were obtained by means of bots with newly developed code structures. In the study, the most common topics in each category were determined and it was tried to determine which daily topics these topics were related to periodically.
Benzer Tezler
- Global goals, local voices: A multinational comparative sentiment and topic analysis of public transportation in the context of SDGs
Küresel hedefler, yerel sesler: Sürdürülebilir kalkınma amaçları bağlamında toplu taşımaya yönelik ülkelerin karşılaştırmalı duygu ve konu analizi
ASLIGÜL AKSAN
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. HATİCE CAMGÖZ AKDAĞ
- Yapay zeka yöntemleri ile uzaktan eğitimdeki sorunların tespiti ve öğrencilerin akademik performanslarının tahmin edilmesi
Detecting the problems in distance education and predicting the academic performance of students by using artificial intelligence methods
HALİT IRMAK
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
DOÇ. DR. ZÜMRÜT ECEVİT SATI
- Yazılım içerikli soru-cevap sitelerine metin madenciliğinin uygulanması
Application of text mining to software related question-answer websites
AHMET SAMET ŞAHİN
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NİLGÜN GÜLER BAYAZIT
- N-seviyeli gizli Dirichlet ayırımı desteği ile tür ve duygu sınıflandırma
Genre and emotion classification by support of N-stage latent Dirichlet allocation
ZEKERİYA ANIL GÜVEN
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BANU DİRİ
- Gizli dirichlet ayrımı ve Word2vec yöntemlerinin birleşimi ile özgün bir metin temsil modeli geliştirilmesi
Combining latent dirichlet allocation and Word2vec for a novel document representation model
HALİL İBRAHİM ÇELENLİ
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEVİNÇ İLHAN OMURCA
DOÇ. DR. MURAT CAN GANİZ