Haber metinleri üzerinde makine öğrenmesi yöntemleri ile duygu analizi
Sensiment analysis using machine learning methods on news text
- Tez No: 925228
- Danışmanlar: DR. ÖĞR. ÜYESİ METİN TURAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: İstanbul Ticaret Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 72
Özet
Haber metinlerinde yer alan duygular analiz edilerek, bu haberlerin toplum üzerindeki etkileri değerlendirilebilir. Bu kapsamda Türkçe metinlerde geniş yelpazede duygu analizi çalışmalarının yetersiz olduğu ve bu eksik alanın çözümüne yönelik yaptığımız bu çalışma ile Türkçe haber metinlerinde makine öğrenmesi yöntemleriyle özellikle şiddete yönelik“korku”,“mutluluk”,“öfke”,“üzüntü”ve“şaşkınlık”duyguları tespit etmek hedeflenmiştir. Türkçe dil yapısı da dikkate alınarak çalışmaya özel hazırlanan bir külliyat üzerinde sıfat ve isim ayrışımı yapılarak TF-IDF ve Double Normalizasyon yöntemleri ile bu çalışmaya özgü sözlük grupları oluşturulmuştur. Bu sözlük grupları ile makine öğrenmesi yöntemleri (Çok Katmanlı Sinir Ağları (MLP), Destek Vektör Makineleri (SVM), Rastgele Orman (RF), LightGBM, XGBoost, GPT-2, BERT, DistilBERT ve XLM ROBERTa) kullanılarak haber metinleri üzerinde duygu analizi sınıflandırılması sağlanmıştır. Değerlendirme metrikleri olarak F1-ölçütü, doğruluk, geri çağırma ve hassasiyet kullanılmıştır. Model eğitiminde Double Normalizasyon ile oluşturulan sözlük grubu, GPT-2 modeli, Kafes Arama (Grid Search) optimizasyon yöntemi ve çapraz doğrulama ile kullanılarak elde edilen en yüksek 0,99 F1-ölçütü ve 0,99 doğruluk değerleri elde edilmiştir. Bu çalışmada elde edilen sonuçların ve veri setinin Türkçe metinlerde duygu sınıflandırması yapılmasına yönelik gelecekteki benzer çalışmalara ışık tutması beklenmektedir.
Özet (Çeviri)
By analyzing the emotions in news texts, the effects of these news on society can be evaluated. In this context, considering the inadequacy of wide-ranging sentiment analysis studies on Turkish texts, and aiming to solve this missing area, this study aims to detect emotions such as“fear”,“happiness”,“anger”,“sadness”and“surprise”especially towards violence in Turkish news texts using machine learning methods. By performing adjective and noun separation on a corpus specially prepared for the study by also taking into account the Turkish language structure, dictionary groups specific to this study were created using TF-IDF and Double Normalization methods. With these dictionary groups, machine learning methods (Multilayer Neural Networks (MLP), Support Vector Machines (SVM), Random Forest (RF), LightGBM, XGBoost, GPT-2, BERT, DistilBERT and XLM ROBERTa) were used to classify sentiment analysis on news texts. F1-score, accuracy, recall and precision were used as evaluation metrics. In model training, the dictionary group created with Double Normalization, GPT-2 model, Grid Search optimization method and cross validation were used to obtain the highest F1-score of 0.99 and accuracy values of 0.99. It is expected that the results and dataset obtained in this study will shed light on similar future studies on sentiment classification in Turkish texts.
Benzer Tezler
- Understanding twitter users' behaviour by social network analysis during disasters
Afet durumunda twıtter kullanıcılarının sosyal ağ analizi ile davranışını anlama
GÖZDE MERVE DEMİRCİ
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ITIR SATOĞLU
DOÇ. DR. GÜLÜSTAN DOĞAN
- Müşteri yorumları üzerinde metin analitiği çalışmaları ve yorumların makine öğrenmesi algoritmaları ile modellenmesi
Başlık çevirisi yok
MUHAMMED IŞIK
Yüksek Lisans
Türkçe
2019
Mühendislik Bilimleriİstanbul Medeniyet ÜniversitesiUygulamalı Matematik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELİF KARAKAYA
- Multilevel sentiment analysis in Arabic
Arapça için çok düzeyli duygu analizi
AHMED NASSAR
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EBRU AKÇAPINAR SEZER
- Kısa metinlerde varlık ismi tanıma
Named entity recognition on Turkish short texts
BEYZA EKEN
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators
Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi
MAHMUT SAMİ SİVRİ
Doktora
İngilizce
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ