Klasik makine öğrenme algoritmaları ve transformer modeli ile Türkçe tweet duygu analizi

Turkish tweet sentiment analysis with classical machine learning algorithms and transformer model

PDF İndir

Tez No: 892633
Yazar: ASLI GÜRSOY
Danışmanlar: DOÇ. DR. ABDUL HAFIZ ABDULHAFIZ
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2024
Dil: Türkçe
Üniversite: Hasan Kalyoncu Üniversitesi
Enstitü: Lisansüstü Eğitim Enstitüsü
Ana Bilim Dalı: Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 85

Özet

Teknolojik çağın başlamasıyla birlikte birçok uygulama günümüzde popüler hale gelmiştir. Bunlardan biri de Twitter'dır (Yeni adıyla X). Bu platform sayesinde birçok kullanıcı kişisel düşünce ve fikirlerini yazıyla, resimle ya da video ile paylaşabilmektedir. Paylaşılan bu veriler birçok insanın ilgisini çekmektedir. Bu verilerden kişisel çıkarım yapmak isteyen bilim insanınları, akademisyen ya da başka bir meslek grubundan insanlar çalışmalarını bu yönde yapmaktadır. Örneğin suçlu profili oluşturmak isteyen bir polis twitlerden bunu yapma amacıyla çalışma yürütebilir ya da bir reklam ajansı kişinin yazdıklarına ya da paylaştığı resimlere bakarak kişiye özel reklam üretebilir ve bu sayede ürün satıcıları ürünlerini hızlı bir şekilde satabilir. Bu tezde ise yüksek oranda doğruluk oranı aldığımız bir duygu analizi çalışması yapılmıştır. Bu çalışmada hazır bir Türkçe Tweet verisi üzerinden duygu sınıflandırılması amaçlandı. Bu veri seti 5 farklı etiketle ayrılmış 4000 veriyi içermektedir. Bu ham veri seti üzerinde ön işleme uygulandı. Ön işlemden geçen veri seti eğitim ve test olarak ayrıldı. Klasik makine öğrenmesi algoritmalarının performansları ölçüldü. Bu performanslar doğruluk, kesinlik, duyarlılık ve F1 skorunun yanı sıra makro ve ağırlıklı ortalama açısından ölçülmüştür. Ayrıca, her algoritma için hesaplanan karışıklık matrisi verilmiştir. En yüksek doğruluk oranına %96,88 ile Yığın algoritması ulaşılmıştır. Bu çalışmada ayrıca derin öğrenme alanı içerisinde olan önceden eğitimiş bir Transformer modeli kullanılmıştır. Veri seti eğitim, doğrulama ve test olarak ayrılmıştır. Aynı şekilde performansı doğruluk, kesinlik, geri çağırma ve F1 skoru açısından ölçülmüştür ve her algoritma için hesaplanan karışıklık matrisi verilmiştir. Bu model ile %93 doğruluk oranına ulaşılmıştır.

Özet (Çeviri)

With the onset of the technological age, many applications have become popular today. One of these is Twitter (Newly known as X). Thanks to this platform, many users can share their personal thoughts and ideas with text, pictures or videos. These shared data attract the attention of many people. Scientists, academicians or other professionals who want to make personal inferences from these data do their work in this direction. For example, a police officer who wants to create a criminal profile can use tweets to do this, or an advertising agency can create personalized advertisements by looking at what a person writes or the pictures he/she shares, and thus product sellers can sell their products quickly. In this thesis, a sentiment analysis study was conducted in which we received a high accuracy rate. In this study, it was aimed to classify emotions using a ready-made Turkish Tweet data. This data set includes 4000 data which is separated by 5 different labels. Pre-processing was applied on this raw dataset. The pre-processed dataset was divided into training and testing. Performances were measured with classical machine learning models. These performances were measured in terms of accuracy, precision, recall, and F1 score as well as macro and weighted averages. Additionally, the confusion matrix calculated for each algorithm is given. The Stack algorithm achieved the highest accuracy rate of 96.88%. Also in this study, a pre-trained Transformer model, which is in the field of deep learning, was also used. The data set is divided into training, validation and testing. Likewise, its performance was measured in terms of accuracy, precision, recall and F1 score, and the confusion matrix calculated for each algorithm is given. 93% accuracy rate was achieved with this model.

Benzer Tezler

Tez No
968429
Metin madenciliği ve makine öğrenimi tekniklerinin uygulanmasıyla standart inşaat sözleşmesi belgelerinin metin analizi
Text analysis of standard construction contract documents by the application of text mining and machine learning techniques
ANIL DEMİRCAN
Doktora
Türkçe
2025
İnşaat Mühendisliği Düzce Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. LATİF ONUR UĞUR
Tez No
955487
Araç rotalama probleminde GPS verilerinin yapay zekâ algoritmaları ile analizi
Analysis of GPS data using artificial intelligence algorithms in vehicle routing problem
EBRU ERDEM
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Atatürk Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TOLGA AYDIN
PROF. DR. BURAK ERKAYMAN
Tez No
859818
Geleneksel makine öğrenimi ve derin öğrenme modelleri ile Türkçe metin sınıflandırmada kelime temsil yöntemlerinin etkisi
The effect of word representation methods on Turkish text classification with traditional machine learning and deep learning models
NİHAL DUMAN SUNA
Doktora
Türkçe
2024
İstatistik Sivas Cumhuriyet Üniversitesi
İşletme Ana Bilim Dalı
PROF. DR. OĞUZ KAYNAR
Tez No
879079
COVID-19 mutasyonlarının tespitinde yapay zeka tabanlı algoritmaların kullanılması
Use of artificial intelligence-based algorithms in detecting COVID-19 mutations
MEHMET BURUKANLI
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Sakarya Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NEJAT YUMUŞAK
Tez No
960631
Sanal ortam verileri ile yapay zeka tabanlı dinamik tahminleme modeli geliştirilmesi
Developing an dynamic estimation model based on artificial intelligence with online data
ADEM ÇAYIR
Doktora
Türkçe
2025
Endüstri ve Endüstri Mühendisliği İstanbul Üniversitesi-Cerrahpaşa
Endüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. FATİH TÜYSÜZ

Geri Dön