Geri Dön

Açık kaynak istihbaratı için metin madenciliği teknikleri kullanılarak insan duygularının analizi

Analysis of human emotions using text mining techniques for open-source intelligence

  1. Tez No: 745065
  2. Yazar: SHAHIN AHMADOV
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYTUĞ BOYACI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Milli Savunma Üniversitesi
  10. Enstitü: Atatürk Stratejik Araştırmalar ve Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 111

Özet

Bu çalışmanın amacı farklı dillerde konuşan insanların aynı konuları nasıl yorumladıklarını öğrenmek ve elde edilen sonuçları kıyaslayarak bakış açıları arasındaki farkı ortaya koymaktadır. Bu çalışmada sosyal medya platformu Intagram üzerinden Azerbaycan, Türk, Rus ve İngiliz dillerinde Ayasofya'nın cami olarak ilan edilmesi, Kazakistan'da doğal gaz zammıyla başlayan itiraz olayları, Türkiye'de oluşan doğal afetler, Ukrayna krizi ve Covid-19 salgını olmak üzere 5 konuda yapılan yorumlar veri seti olarak kullanılmıştır. Dört dilde metinler ağ ortamından yüklenerek, ön işlemlerden geçtikten sonra veri madenciliği ve makine öğrenmesi konuları baz alınarak Python programlama dilinde yazılmış uygulama vasıtasıyla metin 8 farklı kategoriye ayrılmıştır. Çalışmada makine öğrenmesi yöntemlerinden olan Rastgele Karar Ormanları, K- Yakın Komşu Algoritması, Karar Ağaçları, Destek Vektör Makinesi, Naive Bayes Algoritması, Lojistik Regresyon kullanılarak kesinlik, duyarlılık ve F1 skoru sonuç olarak elde edilmiştir. Sonuçlar karşılaştırılarak Lojistik Regresyon yönteminin en yüksek netice elde ettiği tespit edilmiştir. Lojistik Regresyon yöntemi kullanılarak duygu analizi modeli oluşturulmuş ve her bir konu için duygu analizi yapılmış ve sonuçlar karşılaştırılmıştır. Çalışma beş bölümden oluşmaktadır. Birinci bölüm giriş yazısı ve tezin amacından bahsetmektedir. İkinci bölüm genel kavramlar, veri madenciliği, metin madenciliği, makine öğrenmesi, hakkında bilgilerden oluşmaktadır. Üçüncü bölümde duygu analizi alanında literatür taraması yapılmış ve farklı dillerde yazılmış metinler üzerinde yapılan duygu analizi yöntemleri hakkında araştırma yapılmıştır. Dördüncü bölüm makine öğrenmesi modelinin oluşumundan ve kullanılan materyal, metottan bahsetmektedir. Son bölümde tezde kullanılan verinin toplanması, metnin ön işlenmesi ve duygu analizi yapıldıktan sonra metnin kategorilere ayrılması sonuçları açıklanmıştır, farklı dillerdeki veriler üzerinde yapılmış uygulamalar sonrası sonuçlar karşılaştırılmış ve gelecek çalışmalar için öneriler sunulmuştur.

Özet (Çeviri)

The aim of the thesis is to learn how people who speak different languages interpret the same topics and to compare the results obtained and reveal the difference between their perspectives. In this thesis, a sentiment analysis application was designed using the Python programming language and the natural language processing algorithms in the texts, which were taken as a data set of comments in Azerbaijani, Turkish, Russian and English languages from social media. After loading the texts in four languages from the network environment, after preprocessing, the text was divided into 8 different categories (neutral, fear, joy, anger, sadness, surprise, disgust, shame) by means of the application written in Python programming language based on data mining and machine learning topics. This thesis consists of five chapters. The first chapter talks about the introduction and the purpose of the thesis. The second part consists of information about general concepts, data mining, text mining, machine learning, sentiment analysis and social media. Third chapter is a literature review about sentiment analysis methods on texts written in different languages. The fourth chapter talks about the formation of the machine learning model and the material and method used. In the last section, the results of collecting the data used in the thesis, pre-processing the text, and categorizing the text after the sentiment analysis were explained, the results were compared after the applications made on the data in different languages, evaluations were made and suggestions for future studies were presented.

Benzer Tezler

  1. Önleyici kolluk faaliyetleri kapsamında sosyal medyada veri madenciliği: Suçları önlemek için Twitter Analytic'i kullanma

    Data mining in social media for preventive policing activities: Using Twitter Analytics for crime prevention

    EMRE CİHAN ATEŞ

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Disiplinlerarası Adli Bilimler Ana Bilim Dalı

    DOÇ. DR. GAZİ ERKAN BOSTANCI

  2. Açık kaynak istihbaratında sosyal medya kullanımının analizi

    Analysis of social media use in open source intelligence

    ELİF TİRYAKİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Uluslararası İlişkilerMilli Savunma Üniversitesi

    İstihbarat Çalışmaları Ana Bilim Dalı

    PROF. DR. BARIŞ ÖZDAL

  3. Açık kaynak istihbaratı teknikleri kullanılarak teknoloji istihbaratı model önerisi

    Proposal for a technology intelligence model utilizing open source intelligence techniques

    SELÇUK BAYER

    Doktora

    Türkçe

    Türkçe

    2024

    Bilim ve Teknolojiİstanbul Ticaret Üniversitesi

    Sanayi Politikaları ve Teknoloji Yönetimi Ana Bilim Dalı

    DOÇ. DR. SABRİ ÖZ

  4. Açık kaynak istihbaratı (OSINT) için Türkçe içerik temelli kişilik özellikleri tahmini

    Prediction of Turkish content-based personality traits for open source intelligence (OSINT)

    MUHAMMED ALİ KOŞAN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. HACER KARACAN

    DR. ÖĞR. ÜYESİ BURCU AYŞEN ÜRGEN

  5. Sosyal medya istihbaratı ile Twitter gündemlerinin PANAS-T ölçeğine göre incelenmesi

    Examining Twitter agendas by social media intelligence according to PANAS-T scale

    TAN HASKOL

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma Üniversitesi

    İstihbarat Çalışmaları Ana Bilim Dalı

    DOÇ. DR. BURAK MİL