Geri Dön

Klasik makine öğrenme algoritmaları ve transformer modeli ile Türkçe tweet duygu analizi

Turkish tweet sentiment analysis with classical machine learning algorithms and transformer model

  1. Tez No: 892633
  2. Yazar: ASLI GÜRSOY
  3. Danışmanlar: DOÇ. DR. ABDUL HAFIZ ABDULHAFIZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Hasan Kalyoncu Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Teknolojik çağın başlamasıyla birlikte birçok uygulama günümüzde popüler hale gelmiştir. Bunlardan biri de Twitter'dır (Yeni adıyla X). Bu platform sayesinde birçok kullanıcı kişisel düşünce ve fikirlerini yazıyla, resimle ya da video ile paylaşabilmektedir. Paylaşılan bu veriler birçok insanın ilgisini çekmektedir. Bu verilerden kişisel çıkarım yapmak isteyen bilim insanınları, akademisyen ya da başka bir meslek grubundan insanlar çalışmalarını bu yönde yapmaktadır. Örneğin suçlu profili oluşturmak isteyen bir polis twitlerden bunu yapma amacıyla çalışma yürütebilir ya da bir reklam ajansı kişinin yazdıklarına ya da paylaştığı resimlere bakarak kişiye özel reklam üretebilir ve bu sayede ürün satıcıları ürünlerini hızlı bir şekilde satabilir. Bu tezde ise yüksek oranda doğruluk oranı aldığımız bir duygu analizi çalışması yapılmıştır. Bu çalışmada hazır bir Türkçe Tweet verisi üzerinden duygu sınıflandırılması amaçlandı. Bu veri seti 5 farklı etiketle ayrılmış 4000 veriyi içermektedir. Bu ham veri seti üzerinde ön işleme uygulandı. Ön işlemden geçen veri seti eğitim ve test olarak ayrıldı. Klasik makine öğrenmesi algoritmalarının performansları ölçüldü. Bu performanslar doğruluk, kesinlik, duyarlılık ve F1 skorunun yanı sıra makro ve ağırlıklı ortalama açısından ölçülmüştür. Ayrıca, her algoritma için hesaplanan karışıklık matrisi verilmiştir. En yüksek doğruluk oranına %96,88 ile Yığın algoritması ulaşılmıştır. Bu çalışmada ayrıca derin öğrenme alanı içerisinde olan önceden eğitimiş bir Transformer modeli kullanılmıştır. Veri seti eğitim, doğrulama ve test olarak ayrılmıştır. Aynı şekilde performansı doğruluk, kesinlik, geri çağırma ve F1 skoru açısından ölçülmüştür ve her algoritma için hesaplanan karışıklık matrisi verilmiştir. Bu model ile %93 doğruluk oranına ulaşılmıştır.

Özet (Çeviri)

With the onset of the technological age, many applications have become popular today. One of these is Twitter (Newly known as X). Thanks to this platform, many users can share their personal thoughts and ideas with text, pictures or videos. These shared data attract the attention of many people. Scientists, academicians or other professionals who want to make personal inferences from these data do their work in this direction. For example, a police officer who wants to create a criminal profile can use tweets to do this, or an advertising agency can create personalized advertisements by looking at what a person writes or the pictures he/she shares, and thus product sellers can sell their products quickly. In this thesis, a sentiment analysis study was conducted in which we received a high accuracy rate. In this study, it was aimed to classify emotions using a ready-made Turkish Tweet data. This data set includes 4000 data which is separated by 5 different labels. Pre-processing was applied on this raw dataset. The pre-processed dataset was divided into training and testing. Performances were measured with classical machine learning models. These performances were measured in terms of accuracy, precision, recall, and F1 score as well as macro and weighted averages. Additionally, the confusion matrix calculated for each algorithm is given. The Stack algorithm achieved the highest accuracy rate of 96.88%. Also in this study, a pre-trained Transformer model, which is in the field of deep learning, was also used. The data set is divided into training, validation and testing. Likewise, its performance was measured in terms of accuracy, precision, recall and F1 score, and the confusion matrix calculated for each algorithm is given. 93% accuracy rate was achieved with this model.

Benzer Tezler

  1. Geleneksel makine öğrenimi ve derin öğrenme modelleri ile Türkçe metin sınıflandırmada kelime temsil yöntemlerinin etkisi

    The effect of word representation methods on Turkish text classification with traditional machine learning and deep learning models

    NİHAL DUMAN SUNA

    Doktora

    Türkçe

    Türkçe

    2024

    İstatistikSivas Cumhuriyet Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. OĞUZ KAYNAR

  2. COVID-19 mutasyonlarının tespitinde yapay zeka tabanlı algoritmaların kullanılması

    Use of artificial intelligence-based algorithms in detecting COVID-19 mutations

    MEHMET BURUKANLI

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NEJAT YUMUŞAK

  3. Takım çalışması esaslı demontaj hattı işgören atama ve dengeleme problemi için oyun teorisi odaklı yaklaşımlar

    Game theory-oriented approaches for multi-manned disassembly line worker assignment and balancing problem

    YILDIZ KÖSE

    Doktora

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. EMRE ÇEVİKCAN

    DR. ÖĞR. ÜYESİ SİNAN ERTEMEL

  4. Boyut arttırma yöntemleri kullanılarak eeg sinyallerinden derin öğrenme tabanlı şizofren durum tespiti

    Deep learning based schizophrenia status determination from eeg signals using dimension augmentation methods

    ZÜLFİKAR ASLAN

    Doktora

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik MühendisliğiDicle Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET AKIN

  5. Ayırıcı tanının güç olduğu bir durumda makine öğrenme yöntemleri ile demans ve hafif kognitif bozukluk ayırt ediciliğinin değerlendirilmesi

    Evaluation of dementia and mild cognitive disorders with machine learning methods in a situation where the differential diagnosis is difficult

    CELAL ŞENER

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilim ve TeknolojiDokuz Eylül Üniversitesi

    Medikal İnformatik Ana Bilim Dalı

    PROF. DR. PEMBE KESKİNOĞLU