Derin sinir ağı yöntemleri ile Wikipedia toksik yorum sınıflandırması
Wikipedia toxic comment classification via deep neural networks
- Tez No: 686760
- Danışmanlar: DR. ÖĞR. ÜYESİ ALİ ZAFER DALAR
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Giresun Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 49
Özet
Teknoloji'nin ilerlemesi ve internet erişiminin yayılması ile birlikte çevrim içi bilgi paylaşımı da ciddi oranda artış göstermiştir. Özellikle çevrim içi forum ve sosyal medya gibi platformlarda insanlar birbirleri ile bilgi paylaşımı yapıp özgürce yorum yapıp paylaşabilmektedirler. Bu sayede bilgiye ulaşmak çok daha kolay bir hale gelmiştir. Fakat bu platformlarda bilgi paylaşımının yanı sıra içinde bir ya da daha fazla bireyi rencide edecek yorumlar da paylaşılmaktadır. Bunun olumsuz bir sonucu olarak da faydalı paylaşım yapan kişilerin bir kısmının artık çevrim içi paylaşımlardan uzak durdukları görülmektedir. Çalışma kapsamında kullanılan veriler Kaggle internet sitesindeki bir yarışma için paylaşılan Wikipedia toksik yorum verilerinden alınmıştır. Veri setindeki rencide edici, nefret dolu, hakaret veya taciz içerikli yorumlar yarışma için 6 başlık altında sınıflandırılmıştır. Bu başlıklar“toxic”,“severe toxic”,“obscene”,“threat”,“insult”ve“identity hate”'dir. Bu tez kapsamında; kelime gömme işlemi için Keras kütüphanesi, model içindeki ağırlıkları optimize etmek için Adam optimizasyon algoritması, toksik yorumların sınıflandırılması için LSTM, Bi-LSTM ve GRU algoritmaları kullanılmıştır. Doğruluk ve F1 skor metrikleri ile performans ölçümü yapılmıştır. Her bir yöntem 30 kez çalıştırılıp elde edilen doğruluk ve F1 skor metrikleri üzerinden istatistiksel olarak karşılaştırıldığında yöntemler arasında bir fark olmadığı gözlemlenmiştir.
Özet (Çeviri)
With the technological developments and global Internet usage, online information sharing has increased considerably. Especially on platforms such as online forums and social media, people can share information with each other and comment freely on topics. Thus, it has become much easier to access information. However, insulting comments may be shared on these platforms apart from information sharing. As a negative result of this condition, it seems that some of who make useful shares, begin avoiding online sharing. The data used within the research has been collected from Wikipedia toxic comment data which was shared for a competition on Kaggle website. Insulting, hateful, offending or harassing comments have been classified under 6 titles. These titles are“toxic”,“severe toxic”,“obscene”,“insult”,“threat”,“identity hate”. Within the concept of this study, Keras library was used for word embeddings, Adam optimizer algorithm was used for optimizing weights in the models; LSTM, Bi-LSTM and GRU algorithms were used for classifying toxic comments. Performance measurements were carried out by accuracy and F1 score metrics. Each method was processed 30 times and when compared statistically on collected accuracy and F1 score metrics, it has been observed that there is no difference between the methods.
Benzer Tezler
- Derin öğrenme yöntemleri ile Türkçede bağlılık ayrıştırma
Dependency parsing with deep learning methods in Turkish
MÜCAHİT ALTINTAŞ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Derin tekrarlayan sinir ağı yöntemleri ile Erzurum Biyolojik Atıksu Arıtma Tesisinin performans tahmini
Performance forecasting of biological wastewater treatment plant using deep recurrent neural network methods
SIRRI BALLİ
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET COŞKUNÇAY
- Derin sinir ağı yöntemleri kullanılarak alzheimer hastalığının mr görüntüleri üzerinde sınıflandırılması
Classification of alzheimer's disease on mr using deep neural network methods
ESRA YÜZGEÇ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUHAMMED TALO
- Borsa verilerinin derin öğrenme ve yapay sinir ağı yöntemleri ile tahmin edilmesi
Forecasting time series with deep learning and artificial intellgence
ALİ İSA TAŞ
Yüksek Lisans
Türkçe
2020
Elektrik ve Elektronik Mühendisliğiİstanbul Arel ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKALP TULUM
- Derin öğrenme yöntemleri ile görüntü sahteciliği tespiti
Image forgery detection using deep learning techniques
AHMET KORKMAZ
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik MühendisliğiBursa Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMAL HANİLÇİ