Geri Dön

Derin sinir ağı yöntemleri ile Wikipedia toksik yorum sınıflandırması

Wikipedia toxic comment classification via deep neural networks

  1. Tez No: 686760
  2. Yazar: METE ÖZDEMİR
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ALİ ZAFER DALAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Giresun Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 49

Özet

Teknoloji'nin ilerlemesi ve internet erişiminin yayılması ile birlikte çevrim içi bilgi paylaşımı da ciddi oranda artış göstermiştir. Özellikle çevrim içi forum ve sosyal medya gibi platformlarda insanlar birbirleri ile bilgi paylaşımı yapıp özgürce yorum yapıp paylaşabilmektedirler. Bu sayede bilgiye ulaşmak çok daha kolay bir hale gelmiştir. Fakat bu platformlarda bilgi paylaşımının yanı sıra içinde bir ya da daha fazla bireyi rencide edecek yorumlar da paylaşılmaktadır. Bunun olumsuz bir sonucu olarak da faydalı paylaşım yapan kişilerin bir kısmının artık çevrim içi paylaşımlardan uzak durdukları görülmektedir. Çalışma kapsamında kullanılan veriler Kaggle internet sitesindeki bir yarışma için paylaşılan Wikipedia toksik yorum verilerinden alınmıştır. Veri setindeki rencide edici, nefret dolu, hakaret veya taciz içerikli yorumlar yarışma için 6 başlık altında sınıflandırılmıştır. Bu başlıklar“toxic”,“severe toxic”,“obscene”,“threat”,“insult”ve“identity hate”'dir. Bu tez kapsamında; kelime gömme işlemi için Keras kütüphanesi, model içindeki ağırlıkları optimize etmek için Adam optimizasyon algoritması, toksik yorumların sınıflandırılması için LSTM, Bi-LSTM ve GRU algoritmaları kullanılmıştır. Doğruluk ve F1 skor metrikleri ile performans ölçümü yapılmıştır. Her bir yöntem 30 kez çalıştırılıp elde edilen doğruluk ve F1 skor metrikleri üzerinden istatistiksel olarak karşılaştırıldığında yöntemler arasında bir fark olmadığı gözlemlenmiştir.

Özet (Çeviri)

With the technological developments and global Internet usage, online information sharing has increased considerably. Especially on platforms such as online forums and social media, people can share information with each other and comment freely on topics. Thus, it has become much easier to access information. However, insulting comments may be shared on these platforms apart from information sharing. As a negative result of this condition, it seems that some of who make useful shares, begin avoiding online sharing. The data used within the research has been collected from Wikipedia toxic comment data which was shared for a competition on Kaggle website. Insulting, hateful, offending or harassing comments have been classified under 6 titles. These titles are“toxic”,“severe toxic”,“obscene”,“insult”,“threat”,“identity hate”. Within the concept of this study, Keras library was used for word embeddings, Adam optimizer algorithm was used for optimizing weights in the models; LSTM, Bi-LSTM and GRU algorithms were used for classifying toxic comments. Performance measurements were carried out by accuracy and F1 score metrics. Each method was processed 30 times and when compared statistically on collected accuracy and F1 score metrics, it has been observed that there is no difference between the methods.

Benzer Tezler

  1. Derin öğrenme yöntemleri ile Türkçede bağlılık ayrıştırma

    Dependency parsing with deep learning methods in Turkish

    MÜCAHİT ALTINTAŞ

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Derin tekrarlayan sinir ağı yöntemleri ile Erzurum Biyolojik Atıksu Arıtma Tesisinin performans tahmini

    Performance forecasting of biological wastewater treatment plant using deep recurrent neural network methods

    SIRRI BALLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET COŞKUNÇAY

  3. Derin sinir ağı yöntemleri kullanılarak alzheimer hastalığının mr görüntüleri üzerinde sınıflandırılması

    Classification of alzheimer's disease on mr using deep neural network methods

    ESRA YÜZGEÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUHAMMED TALO

  4. Borsa verilerinin derin öğrenme ve yapay sinir ağı yöntemleri ile tahmin edilmesi

    Forecasting time series with deep learning and artificial intellgence

    ALİ İSA TAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Elektrik ve Elektronik Mühendisliğiİstanbul Arel Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKALP TULUM

  5. Derin öğrenme yöntemleri ile görüntü sahteciliği tespiti

    Image forgery detection using deep learning techniques

    AHMET KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik MühendisliğiBursa Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEMAL HANİLÇİ