Geri Dön

Klasik makine öğrenme algoritmaları ve transformer modeli ile Türkçe tweet duygu analizi

Turkish tweet sentiment analysis with classical machine learning algorithms and transformer model

  1. Tez No: 892633
  2. Yazar: ASLI GÜRSOY
  3. Danışmanlar: DOÇ. DR. ABDUL HAFIZ ABDULHAFIZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Hasan Kalyoncu Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Teknolojik çağın başlamasıyla birlikte birçok uygulama günümüzde popüler hale gelmiştir. Bunlardan biri de Twitter'dır (Yeni adıyla X). Bu platform sayesinde birçok kullanıcı kişisel düşünce ve fikirlerini yazıyla, resimle ya da video ile paylaşabilmektedir. Paylaşılan bu veriler birçok insanın ilgisini çekmektedir. Bu verilerden kişisel çıkarım yapmak isteyen bilim insanınları, akademisyen ya da başka bir meslek grubundan insanlar çalışmalarını bu yönde yapmaktadır. Örneğin suçlu profili oluşturmak isteyen bir polis twitlerden bunu yapma amacıyla çalışma yürütebilir ya da bir reklam ajansı kişinin yazdıklarına ya da paylaştığı resimlere bakarak kişiye özel reklam üretebilir ve bu sayede ürün satıcıları ürünlerini hızlı bir şekilde satabilir. Bu tezde ise yüksek oranda doğruluk oranı aldığımız bir duygu analizi çalışması yapılmıştır. Bu çalışmada hazır bir Türkçe Tweet verisi üzerinden duygu sınıflandırılması amaçlandı. Bu veri seti 5 farklı etiketle ayrılmış 4000 veriyi içermektedir. Bu ham veri seti üzerinde ön işleme uygulandı. Ön işlemden geçen veri seti eğitim ve test olarak ayrıldı. Klasik makine öğrenmesi algoritmalarının performansları ölçüldü. Bu performanslar doğruluk, kesinlik, duyarlılık ve F1 skorunun yanı sıra makro ve ağırlıklı ortalama açısından ölçülmüştür. Ayrıca, her algoritma için hesaplanan karışıklık matrisi verilmiştir. En yüksek doğruluk oranına %96,88 ile Yığın algoritması ulaşılmıştır. Bu çalışmada ayrıca derin öğrenme alanı içerisinde olan önceden eğitimiş bir Transformer modeli kullanılmıştır. Veri seti eğitim, doğrulama ve test olarak ayrılmıştır. Aynı şekilde performansı doğruluk, kesinlik, geri çağırma ve F1 skoru açısından ölçülmüştür ve her algoritma için hesaplanan karışıklık matrisi verilmiştir. Bu model ile %93 doğruluk oranına ulaşılmıştır.

Özet (Çeviri)

With the onset of the technological age, many applications have become popular today. One of these is Twitter (Newly known as X). Thanks to this platform, many users can share their personal thoughts and ideas with text, pictures or videos. These shared data attract the attention of many people. Scientists, academicians or other professionals who want to make personal inferences from these data do their work in this direction. For example, a police officer who wants to create a criminal profile can use tweets to do this, or an advertising agency can create personalized advertisements by looking at what a person writes or the pictures he/she shares, and thus product sellers can sell their products quickly. In this thesis, a sentiment analysis study was conducted in which we received a high accuracy rate. In this study, it was aimed to classify emotions using a ready-made Turkish Tweet data. This data set includes 4000 data which is separated by 5 different labels. Pre-processing was applied on this raw dataset. The pre-processed dataset was divided into training and testing. Performances were measured with classical machine learning models. These performances were measured in terms of accuracy, precision, recall, and F1 score as well as macro and weighted averages. Additionally, the confusion matrix calculated for each algorithm is given. The Stack algorithm achieved the highest accuracy rate of 96.88%. Also in this study, a pre-trained Transformer model, which is in the field of deep learning, was also used. The data set is divided into training, validation and testing. Likewise, its performance was measured in terms of accuracy, precision, recall and F1 score, and the confusion matrix calculated for each algorithm is given. 93% accuracy rate was achieved with this model.

Benzer Tezler

  1. Metin madenciliği ve makine öğrenimi tekniklerinin uygulanmasıyla standart inşaat sözleşmesi belgelerinin metin analizi

    Text analysis of standard construction contract documents by the application of text mining and machine learning techniques

    ANIL DEMİRCAN

    Doktora

    Türkçe

    Türkçe

    2025

    İnşaat MühendisliğiDüzce Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. LATİF ONUR UĞUR

  2. Araç rotalama probleminde GPS verilerinin yapay zekâ algoritmaları ile analizi

    Analysis of GPS data using artificial intelligence algorithms in vehicle routing problem

    EBRU ERDEM

    Doktora

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TOLGA AYDIN

    PROF. DR. BURAK ERKAYMAN

  3. Geleneksel makine öğrenimi ve derin öğrenme modelleri ile Türkçe metin sınıflandırmada kelime temsil yöntemlerinin etkisi

    The effect of word representation methods on Turkish text classification with traditional machine learning and deep learning models

    NİHAL DUMAN SUNA

    Doktora

    Türkçe

    Türkçe

    2024

    İstatistikSivas Cumhuriyet Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. OĞUZ KAYNAR

  4. COVID-19 mutasyonlarının tespitinde yapay zeka tabanlı algoritmaların kullanılması

    Use of artificial intelligence-based algorithms in detecting COVID-19 mutations

    MEHMET BURUKANLI

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NEJAT YUMUŞAK

  5. Sanal ortam verileri ile yapay zeka tabanlı dinamik tahminleme modeli geliştirilmesi

    Developing an dynamic estimation model based on artificial intelligence with online data

    ADEM ÇAYIR

    Doktora

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Üniversitesi-Cerrahpaşa

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FATİH TÜYSÜZ