A robust and hybrid machine learning model for university satisfaction estimation on Turkish Twitter feeds
Türkçe Twitter yayınlarında üniversite memnuniyeti tahmini için sağlam ve hibrit bir makine öğrenme modeli
- Tez No: 881188
- Danışmanlar: DOÇ. DR. FERHAT BOZKURT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Veri Analizi, Türk Üniversiteleri, Makine Öğrenmesi, Doğal Dil İşleme, Data Analysis, Turkish Universities, Machine learning, Natural Language Processing
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Son yıllarda hükümetler ve kuruluşlar arasında, kamuoyunun görüşlerini anlamak ve hizmetlerinin kalitesini artırmak için sosyal ağ verilerini kullanmaya yönelik artan bir ilgi vardır. Sonuç olarak, bireylerin Türk kurumlarından memnuniyet derecesinin değerlendirilmesine olan ihtiyaç giderek artmaktadır. Twitter, Türkiye'deki yaygın kullanımı ve öğrencilerden, mezunlardan, öğretmenlerden ve kamuoyundan Türkiye'deki üniversiteler hakkında filtresiz görüşler sunabilmesi nedeniyle tercih edilen mecra olarak seçildi. Yöntemler: Yöntemimiz, 17.793 manuel olarak etiketlenmiş tweetten oluşan orijinal bir veri kümesi toplayarak başlanmıştır. Sonrasında, son teknoloji ürünü BERT tabanlı transformatörler, derin öğrenme stratejileri ve geleneksel makine öğrenimi modelleri gibi çeşitli yöntemleri karşılaştırmıştır. Ayrıca, CNN-BiLSTM ve BERT-BiLSTM-CNN başta olmak üzere farklı teknikleri bir araya getiren hibrit modeller kullanılmıştır. Bulgular: Türkçe duyarlılığını analiz etmek için, geleneksel makine öğrenimi sınıflandırıcıları arasında TF-IDF ağırlıklı BoW ile SVM, F1 Puanı açısından yaklaşık 0,8327 elde ederek en iyi sonuçları elde etmiştir. Ayrıca, CNN-BiLSTM 0,8330'luk bir F1 Puanı elde etmiştir. BERT transformatörleri kullanılarak elde edilen daha iyi sonuçlar F1 Puanı açısından 0,8400'ün üzerine çıkmıştır. Sonuçlar: BERT, BiLSTM ve CNN tekniklerini birleştiren yeni önerilen BERT-BiLSTM-CNN modelimiz, 0,9191'in üzerinde etkileyici bir doğruluk oranı, 0,8709 F1 Puanı ve 0,9574 Eğri Altındaki Alan (AUC) göstermiştir. Bu sonuçlar, modelin en son teknoloji olduğu düşünülen modellerden daha iyi performans gösterdiğini ve Türkçe duygu analiziyle ilişkili dilsel karmaşıklıkların üstesinden gelebildiğini gösterdi.
Özet (Çeviri)
In recent years, there has been a growing interest among governments and organizations in using social network data to understand public opinions and improve the quality of their facilities. Subsequently, there is an increasing need to assess the degree of satisfaction among individuals with Turkish institutions. Twitter was chosen as the preferred medium due to its widespread usage in Turkiye and its ability to provide unfiltered viewpoints from students, graduates, teachers, and public users about Turkish schools and institutions. Methods: Our method started by collecting an original dataset consisting of 17,793 manually annotated tweets. After that, they compared several methods, such as state-of-the-art BERT-based transformers, deep learning strategies, and conventional machine learning models. Furthermore, hybrid models that combine various techniques, especially CNN-BiLSTM and BERT-BiLSTM-CNN, were employed. Findings: For analyzing Turkish sentiment, among conventional machine learning classifiers SVM with BoW with TF-IDF weighting obtained the best results achieving around 0.8327 in terms of F1 Score. Moreover, CNN-BiLSTM obtained an F1 Score of 0.8330. Better results obtained using BERT transformers reached over 0.8400 in terms of F1 Score. Results: Our novel proposed BERT-BiLSTM-CNN model, which combined the BERT, BiLSTM, and CNN techniques, demonstrated an impressive accuracy rate of over 0.9019, an F1 Score of 0.8709, and an Area Under Curve (AUC) of 0.9574. These results demonstrated that the model outperformed the models that were considered to be state-of-the-art, and it can deal with the linguistic complexities that are associated with Turkish sentiment analysis.
Benzer Tezler
- Yapay zekâ-tabanlı hibrit anomali tespit ve klinik karar destek teknikleri ile kardiyovasküler hastalıkların ve COVİD-19'un otomatik tespiti
Artificial intelligence-based hybrid anomaly detection and clinical decision support techniques for automated detection of cardiovascular diseases and COVİD-19
MERVE BEGÜM TERZİ
Doktora
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ORHAN ARIKAN
- Yumuşak hesaplama yöntemlerinin geliştirilmesi ve elektriksel sürücülerdeki uygulamaları
The improvement of soft computing methods and its applications in electric drives
MEHMET KARAKÖSE
Doktora
Türkçe
2005
Elektrik ve Elektronik MühendisliğiFırat ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ.DR. ERHAN AKIN
- MRS verileri kullanılarak makine öğrenmesi yöntemleri ile MS hastalığının teşhis ve sınıflandırılması
Diagnosis and classification of MS disease with machine learning methods using MRS data
ZİYA EKŞİ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. CEMİL ÖZ
- Performance of laminated glass subjected to blast and impact loading
Patlama ve darbe yüklemesine maruz kalan lamine camın yapısal performansı
MOHELDEEN HEJAZI
Doktora
İngilizce
2024
Makine Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ SARI
- Zararlı yazılımların tespiti için hibrit sistem tasarımı
Hybrid system design for malicious software detection
KERİM CAN KALIPCIOĞLU
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Uludağ ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CENGİZ TOĞAY
DR. ÖĞR. ÜYESİ ESRA NERGİS YOLAÇAN