Türkçe youtube yorumları üzerınde spam filtreleme
Spam fi̇lteri̇ng on turki̇sh youtube comments
- Tez No: 637251
- Danışmanlar: DOÇ. DR. ALPER KÜRŞAT UYSAL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: Türkçe
- Üniversite: Eskişehir Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
- Sayfa Sayısı: 58
Özet
İnternet kullanımının gün geçtikçe yaygınlaşmasına paralel olarak sosyal medya kullanım oranları da hızla artış göstermektedir. Sosyal medya kullanıcıları tarafından en çok tercih edilen platformlardan biri de YouTube'tur. YouTube kullanımının artması beraberinde bazı problemleri de getirmiştir. Genellikle paylaşılan video içerikleriyle alakası olmayan, reklam amaçlı ve sürekli tekrarlayan istenmeyen (spam) yorumlar boşuna kaynak kullanımına sebep olmaktadır. Bu çalışmada, YouTube yorumları üzerinde istenmeyen yorumların otomatik tespit edilmesi amaçlanmaktadır. Bu amaca ilişkin daha önce yapılan çalışmaların araştırma sonuçları, metin sınıflandırma problemlerinin çözümü için diğer dillerde gerekli sistemler geliştirilse de Türkçe için yapılan çalışmaların oldukça sınırlı olduğunu göstermiştir. Bu tezde Türkçe Youtube yorumlarından oluşan veri setleri oluşturulmuş ve veri setleri üzerinde otomatik metin sınıflandırma algoritmalarının performansları değerlendirilmiştir. Bu tezin önemli bir katkısı da gelecek akademik çalışmalarda kullanılmak üzere erişime açık olacak Türkçe veri setleri oluşturulmuş olmasıdır. Çalışmada, Weka doğal dil işleme aracı kullanılarak doğruluk ve hız açısından iyi sonuçlar veren sınıflandırma algoritmalarının performansları karşılaştırılmıştır. Doğruluk değerleri açısından bakıldığında SMO ve Rastgele Orman makine öğrenimi algoritmaları Türkçe Youtube yorumları sınıflandırma problemi üzerinde diğerlerine göre daha başarılı olarak görünmektedir.
Özet (Çeviri)
In parallel with the increasing spread of Internet usage, social media usage rates are also increasing rapidly. One of the most preferred platforms by social media users is YouTube. Increased use of YouTube has brought some problems. Repeated spam comments, which are unrelated with shared video content and used for advertising purposes, cause usage of resources unnecessarily in general. This study aims to detect spam comments automatically on YouTube comments. Research results of previous studies performed for this purpose showed that although systems were developed for solving text classification problems in other languages, these kinds of studies for Turkish language were quite limited. In this thesis, datasets consisting of Turkish Youtube comments were created and the performance of automatic text classification algorithms were evaluated on the datasets. An important contribution of this thesis is the creation of Turkish datasets that will be available for use in future academic studies. In the study, the performances of classification algorithms that yield good results in terms of accuracy and speed were compared using the Weka natural language processing tool. In terms of accuracy values, the SMO and Random Forest machine learning algorithms appear to be more successful on the Turkish Youtube comments classification problem than others.
Benzer Tezler
- Mobil uygulama algılarının karşılaştırılması
Comparison of mobile application perceptions
GÖKBERK ESER
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÇAĞRI ŞAHİN
- Music non-literate virtuosi: the 'Alaylı' metal band performer
Nota okuyamayan virtüyözler: 'Alaylı' metal grubu icracısı
HALE FULYA SOĞANCI
- Youtube seyahat kanallarının kişilerin seyahat ilgi ve motivasyonları üzerine etkileri
The effects of Youtube travel channels on people's travel interests and motivations
SEVİLAY AYDIN
Yüksek Lisans
Türkçe
2020
İletişim BilimleriKocaeli Üniversitesiİletişim Tasarımı ve Bilişim Teknolojileri Ana Bilim Dalı
DOÇ. DR. İSMAİL KESKİN
- 'Gerçek hayat hikâyeleri' sunumu ile medyanın travmatize ettiği toplum: Sosyolojik bir değerlendirme
Society traumatized by the media with 'real life stories': A sociological evaluation
MEHTAP NUR BİTMEZ
- Geçici kamusal yerleştirme sanatının kolektif akılda kalıcılığı üzerine Tate Modern Müzesi türbin salonu içerisinde bir inceleme
An examination of the collective memorability of temporary public installation art in the turbine hall of the tate Modern Museum
İPEK ÖZER
Yüksek Lisans
Türkçe
2023
Güzel SanatlarYıldız Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. SENEM KAYMAZ