Twitter'da Türkçe veriler üzerinde hakaret suçu analizi
Insult crime analysis over Turkish data on twitter
- Tez No: 476757
- Danışmanlar: YRD. DOÇ. DR. HÜSEYİN ÇAKIR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Bilişim Enstitüsü
- Ana Bilim Dalı: Adli Bilişim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 103
Özet
Sosyal medya insanların düşüncelerini ve günlük hayatta yaşadıklarını paylaştıkları, spor, siyaset, magazin ve buna benzer haber niteliği taşıyan içeriklerin bulunduğu bir platformdur. Sosyal medyada bu tür paylaşımlarla birlikte tehdit, şantaj, hakaret ve buna benzer birçok suç unsuru taşıyan paylaşımlarda yer almaktadır. Bu tezde, yaygın olarak kullanılan sosyal medya platformlarından Twitter ortamında yapılan paylaşımlar kullanılarak metin sınıflandırma kapsamında hakaret suçunun kategorilere ayrılması üzerinde çalışılmıştır. Sosyal medya ortamlarında yapılan paylaşımların, önceden tanımlanmış kategorilerle etiketleme işleminin gerçekleştirildiği metin sınıflandırma yöntemleriyle gruplandırılması mümkündür. Çalışma kapsamında kanunlar çerçevesinde insanların internet ve sosyal medya platformlarında maruz kalabileceği suçlardan hakaret suçunun incelenmesine karar verilmiştir. Hem metin sınıflandırma yöntemleri hem de sınıflandırma aşamasında makine öğrenmesi teknikleri kullanılarak hakaret suçu analizi için örnek bir sınıflandırma modeli oluşturulmuştur. Çalışma, belirlenen anahtar kelimelerle bulunan Türkçe tweetler kullanılarak hakaret ya da hakaret değil şeklinde iki kategoride yapılmıştır. Çalışma kapsamında farklı önişleme ve sınıflandırma yöntemleri uygulanarak bunların metin sınıflandırmadaki etkisi incelenmiştir. Farklı öznitelik ve sınıflandırma tekniklerinden elde edilen en iyi sonuç olarak Destek Vektör Makineleri yöntemiyle %95,4 oranındaki değer bulunmuştur. Çalışma kapsamında son olarak metin sınıflandırma ve dil işleme çalışmaları için uygulanan yöntemlerin otomatik olarak yapılması amacıyla Türkçe Twitter paylaşımların içeriklerini işleyebilen bir prototip geliştirilmiştir. Bu prototiple yeni veri setleri oluşturularak sınıflandırma başarı yüzdesinin iyileştirilmesi amaçlanmıştır.
Özet (Çeviri)
Social media is a platform that people share their ideas and their daily lives, and contains sports, politics, magazine and other similar areas that can be qualified as news. Aside from these kind of sharing, social media is also a house of threads, blackmails, insults and many other forms of crime elements. In this thesis, by using posts on Twitter, one of the most widely used social media platforms, the catagorization of insult crime was studied in the scope of text classification. It is certainly possible to group posts on social media platforms with text classification, in ahice tagging process of text is made by predefined categories. In the scope of this research, within the safe limits of law, speficially crime of insult was analyzed among the crimes that people are exposed to in internet and social media platforms. By using not only text classification methods but also machine learning in the classification phase, an example classification model was created for crime of insult analysis. The study was carried out in two categories,“insult”or“not insult”and tweets used in the study were obtained by the search of predefined Turkish keywords. In the scope of this study different pre-processing and classification techniques were performed, and effect of these techniques on text classification were investigated. Among the best results obtained from different attributes and classification methods, Support Vector Machine method was used and 95,4% accuracy achieved. Finally a prototype application that is able to process the content of Turkish tweet posts was developed in the purpose of automatically applying methods used in text classification and language processing. By using this prototype application, new data sets were created in the intent of enhancement of the classification accuracy.
Benzer Tezler
- Sosyal medyada bireyleri linç etmeye iten etkenler üzerine nitel bir araştırma
A qualitative study on factors leading individuals to lynch on social media
RIZA PARLAK
Yüksek Lisans
Türkçe
2022
GazetecilikOndokuz Mayıs Üniversitesiİletişim Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SİNAN KAYA
- Hasankeyf'in medyatikleşen ve dijitalleşen toplumsal belleği: Twitter'da metin madenciliği araştırması
Mediatic and digital memory of Hasankeyf: A text mining research on Twitter
ESRA TANİ
Doktora
Türkçe
2022
Sosyolojiİstanbul ÜniversitesiHalkla İlişkiler ve Tanıtım Ana Bilim Dalı
PROF. DR. HATUN BOZTEPE TAŞKIRAN
- Twitter'da metin madenciliği ve duygu analizi ile uzaktan eğitim memnuniyetinin incelenmesi
Examination of distance education satisfaction with text mining and sentiment analysis on Twitter
AHMET EMRE ÖZ
Yüksek Lisans
Türkçe
2023
Bilim ve TeknolojiAtatürk ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA KESKİNKILIÇ
- Twitter verisi üzerinde Covid-19'a karşı etkili olan ilaçların doğal dil işleme kullanılarak analizi
Analysis of drugs effective against Covid-19 using natural language processing on Twitter data
ORHAN TALHA KUM
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER BADAY
- Tviter verileri üzerinde sınıflandırma algoritmaları kullanarak hisse senedi değerleri için yön tahmini
Direction estimation for stock values by using classification algorithms on twitter data
MUSTAFA VEHBİ TÜRKALP
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BARIŞ KOÇER