Geri Dön

Türkçe mikrobloglarda ironi tespiti

Irony detection in Turkish microblogs

  1. Tez No: 618468
  2. Yazar: AHMET KARABAŞ
  3. Danışmanlar: PROF. DR. BANU DİRİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 61

Özet

Sosyal medyada kendini ifade eden insanların sayısı her geçen gün artmaktadır. İnsanların bir konu hakkındaki düşüncelerini paylaşmada önemli bir yeri bulunan Twitter'da her gün 500 milyon tivit atılmaktadır. Böyle büyük bir veri içerisinde elle sınıflandırma yapmak oldukça zorlu bir iştir. Bu sebeple otonom sistemler, yazılımlar vs. kullanarak sınıflandırma yapmak büyük önem taşımaktadır. İroni, söylenen bir şeyin tam tersi anlamının kastedildiği bir tabirdir. Söylenen ya da yapılan fiil, ciddi imajı altında, karşıt konuşmayı ya da fiili, çelişki noktasına çekmeyi hedeflemektedir. Son zamanlarda tivitler üzerinden duygu durumu analizinde başarılı sonuçlar alınmasının ardından ironi tespiti konusunda da çalışmalar yapılmıştır. Ancak bu konu, duygu tespitine göre daha zorlayıcıdır. Yüzyüze konuşmada ironi tespitini yapmak daha kolayken, yazılı iletişimde bunu anlamak normal insanlar için bile zor olabilmektedir. Twitterdaki karakter limiti, bazı insanların yazım hataları ve noktalama konusunda dikkatsizliği sınıflandırma metodlarının uygulanmasına engel olmaktadır. Bu nedenle ilk olarak tivitlerde önişleme adımlarının uygulanması zorunlu hale gelmiştir. Sonrasında ise özellik çıkarımları yapılarak ironiyi tespit etmek amaçlanmıştır. Bu çalışmada, verilerin düzeltilmesinden sonra makine öğrenmesi ve derin öğrenme algoritmaları farklı parametrelerle uygulanmış ve alınan sonuçların başarısı incelenerek karşılaştırılmıştır. Sonuçta, en başarılı modeller / algoritmalar sırasıyla 0,82 ve 0,83 F-skor veren Hiperparametre Optimizasyonu ve Attention Tabanlı Bidirectional LSTM olmuştur.

Özet (Çeviri)

The number of people who express themselves in social media is increasing day by day. Twitter, which is an important place for people to share their thoughts on a topic has 500 million tweets sent per day. In such a large data manual classification is a very challenging task. Therefore, using autonomous systems, software etc. for classification is of great importance. The irony is the expression in which the meaning of the opposite is said. The action that is said or done is intended to draw the contradiction or action under the serious image to the point of contradiction. In recent years, after successful results in the sentiment analysis with tweets, studies have been conducted on irony detection as well. However, this issue is more challenging than sentiment analysis. While it is easier to determine the irony in face-to-face conversation, it can be difficult for normal people to understand it in written communication. The character limit on Twitter, typing and punctuation errors of some people hamper the direct implementation of classification methods. For this reason, it is necessary to apply the preprocessing steps in the tweets. Afterwards, it is aimed to determine the irony by extracting features. In this study, after the preprocessing of the data, the machine learning and deep learning algorithms were applied with different parameters and the success of the results were examined and compared. As a result the most successful models/algorithms were Hyperparameter Optimization on Deep Neural Networks and Attention Based Bidirectional LSTM Model yielding an F-score of 0.82 and 0.83, respectively.

Benzer Tezler

  1. Mikrobloglarda içerik madenciliği

    Content mining of microblogs

    MUSTAFA ÖZGÜR CİNGİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BANU DİRİ

  2. Emotion analysis on Turkish tweets

    Türkçe tweet'lerde duygu analizi

    SİNEM DEMİRCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR KARAGÖZ

    PROF. DR. İSMAİL HAKKI TOROSLU

  3. Dijital medyada fanatizm: futbola ilişkin sosyal ağlarda nefret söylemi

    Fanaticism on digital media: hate speech related to football on social networks

    MERVE APSAR GÜZELKOKAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Radyo-TelevizyonGalatasaray Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    DOÇ. DR. ÖZLEM DANACI YÜCE

  4. Sosyal medyada içeriğin yayılımı ve kullanıcıların paylaşım motivasyonları: Türkiye'de Twitter kullanıcılarının retweet pratiği üzerine bir araştırma

    User generated content diffusion in social media and users' sharing motivations: A research on Twitter users' retweet practice in Turkey

    BURAK POLAT

    Doktora

    Türkçe

    Türkçe

    2021

    GazetecilikMarmara Üniversitesi

    Gazetecilik Ana Bilim Dalı

    PROF. DR. NECMİ EMEL DİLMEN

  5. Sosyal Hizmet bölümü öğrencilerinin sosyal medya kullanımları ile öğrenme tutumları arasındaki ilişkinin incelenmesi (Ankara örneği)

    Investigation of the relationship between social media use and learning attitudes of Social Work students (Ankara sample)

    RECEP KARAKAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Sosyal HizmetlerAnkara Üniversitesi

    Sosyal Hizmet Ana Bilim Dalı

    DOÇ. DR. GONCA POLAT