Geri Dön

Twitter'da Türkçe veriler üzerinde hakaret suçu analizi

Insult crime analysis over Turkish data on twitter

  1. Tez No: 476757
  2. Yazar: NEVZAT ERÇOLAK
  3. Danışmanlar: YRD. DOÇ. DR. HÜSEYİN ÇAKIR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Bilişim Enstitüsü
  11. Ana Bilim Dalı: Adli Bilişim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 103

Özet

Sosyal medya insanların düşüncelerini ve günlük hayatta yaşadıklarını paylaştıkları, spor, siyaset, magazin ve buna benzer haber niteliği taşıyan içeriklerin bulunduğu bir platformdur. Sosyal medyada bu tür paylaşımlarla birlikte tehdit, şantaj, hakaret ve buna benzer birçok suç unsuru taşıyan paylaşımlarda yer almaktadır. Bu tezde, yaygın olarak kullanılan sosyal medya platformlarından Twitter ortamında yapılan paylaşımlar kullanılarak metin sınıflandırma kapsamında hakaret suçunun kategorilere ayrılması üzerinde çalışılmıştır. Sosyal medya ortamlarında yapılan paylaşımların, önceden tanımlanmış kategorilerle etiketleme işleminin gerçekleştirildiği metin sınıflandırma yöntemleriyle gruplandırılması mümkündür. Çalışma kapsamında kanunlar çerçevesinde insanların internet ve sosyal medya platformlarında maruz kalabileceği suçlardan hakaret suçunun incelenmesine karar verilmiştir. Hem metin sınıflandırma yöntemleri hem de sınıflandırma aşamasında makine öğrenmesi teknikleri kullanılarak hakaret suçu analizi için örnek bir sınıflandırma modeli oluşturulmuştur. Çalışma, belirlenen anahtar kelimelerle bulunan Türkçe tweetler kullanılarak hakaret ya da hakaret değil şeklinde iki kategoride yapılmıştır. Çalışma kapsamında farklı önişleme ve sınıflandırma yöntemleri uygulanarak bunların metin sınıflandırmadaki etkisi incelenmiştir. Farklı öznitelik ve sınıflandırma tekniklerinden elde edilen en iyi sonuç olarak Destek Vektör Makineleri yöntemiyle %95,4 oranındaki değer bulunmuştur. Çalışma kapsamında son olarak metin sınıflandırma ve dil işleme çalışmaları için uygulanan yöntemlerin otomatik olarak yapılması amacıyla Türkçe Twitter paylaşımların içeriklerini işleyebilen bir prototip geliştirilmiştir. Bu prototiple yeni veri setleri oluşturularak sınıflandırma başarı yüzdesinin iyileştirilmesi amaçlanmıştır.

Özet (Çeviri)

Social media is a platform that people share their ideas and their daily lives, and contains sports, politics, magazine and other similar areas that can be qualified as news. Aside from these kind of sharing, social media is also a house of threads, blackmails, insults and many other forms of crime elements. In this thesis, by using posts on Twitter, one of the most widely used social media platforms, the catagorization of insult crime was studied in the scope of text classification. It is certainly possible to group posts on social media platforms with text classification, in ahice tagging process of text is made by predefined categories. In the scope of this research, within the safe limits of law, speficially crime of insult was analyzed among the crimes that people are exposed to in internet and social media platforms. By using not only text classification methods but also machine learning in the classification phase, an example classification model was created for crime of insult analysis. The study was carried out in two categories,“insult”or“not insult”and tweets used in the study were obtained by the search of predefined Turkish keywords. In the scope of this study different pre-processing and classification techniques were performed, and effect of these techniques on text classification were investigated. Among the best results obtained from different attributes and classification methods, Support Vector Machine method was used and 95,4% accuracy achieved. Finally a prototype application that is able to process the content of Turkish tweet posts was developed in the purpose of automatically applying methods used in text classification and language processing. By using this prototype application, new data sets were created in the intent of enhancement of the classification accuracy.

Benzer Tezler

  1. Sosyal medyada bireyleri linç etmeye iten etkenler üzerine nitel bir araştırma

    A qualitative study on factors leading individuals to lynch on social media

    RIZA PARLAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    GazetecilikOndokuz Mayıs Üniversitesi

    İletişim Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SİNAN KAYA

  2. Hasankeyf'in medyatikleşen ve dijitalleşen toplumsal belleği: Twitter'da metin madenciliği araştırması

    Mediatic and digital memory of Hasankeyf: A text mining research on Twitter

    ESRA TANİ

    Doktora

    Türkçe

    Türkçe

    2022

    Sosyolojiİstanbul Üniversitesi

    Halkla İlişkiler ve Tanıtım Ana Bilim Dalı

    PROF. DR. HATUN BOZTEPE TAŞKIRAN

  3. Twitter'da metin madenciliği ve duygu analizi ile uzaktan eğitim memnuniyetinin incelenmesi

    Examination of distance education satisfaction with text mining and sentiment analysis on Twitter

    AHMET EMRE ÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilim ve TeknolojiAtatürk Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA KESKİNKILIÇ

  4. Twitter verisi üzerinde Covid-19'a karşı etkili olan ilaçların doğal dil işleme kullanılarak analizi

    Analysis of drugs effective against Covid-19 using natural language processing on Twitter data

    ORHAN TALHA KUM

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER BADAY

  5. Tviter verileri üzerinde sınıflandırma algoritmaları kullanarak hisse senedi değerleri için yön tahmini

    Direction estimation for stock values by using classification algorithms on twitter data

    MUSTAFA VEHBİ TÜRKALP

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BARIŞ KOÇER