Makine öğrenmesi yöntemleri kullanılarak uzaktan eğitim konulu Türkçe tweetlerin duygu analizi
Turkish tweets on distance education using machine learning methods sentiment analysis
- Tez No: 747080
- Danışmanlar: DOÇ. DR. İSMAİL BABAOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Konya Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Teknolojinin gelişmesi beraberinde sosyal medya platformlarının da gelişerek büyük kullanıcı kitlelerine ulaşmasına yol açmıştır. Kişiler sosyal medya platformları kullanarak diğer kişilerle iletişim kurabildiği gibi, meydana gelen toplumsal olaylar karşısında, bir ürün ya da bir konu hakkında ortak bir başlıkta bu platformlarda bir araya gelerek duygu ve düşüncelerini paylaşabilmektedir. Bu paylaşımlar duygu analizi çalışmaları için birçok alanda kullanılabilir büyük bir veri kaynağı oluşturmaktadır. Duygu analizi çalışmaları ile bu veriler işlenip analiz edilerek, ilgili konu hakkında olumlu, olumsuz veya tarafsız duygu ifadeleri belirlenebilmektedir. 2020 yılının ocak ayında başlayan ve tüm dünyayı etkisi altına alan korona virüs salgını ile ülke genelinde birtakım tedbirler alınmaya başlanmış, bu tedbirler kapsamında da Mart 2020'den itibaren uzaktan eğitim sürecine geçilmiştir. Bu çalışmada sosyal medya platformu Twitter'da paylaşılan uzaktan eğitim konulu Türkçe tweetler elde edilerek veri ön işleme tabi tutulmuş ve ayrıca zemberek kütüphanesi ile normalleştirilerek işlenebilir bir hale getirilmiştir. Sınıflandırma aşamasında girdi olarak kullanılacak veri seti için manuel etiketleme işleminin yanı sıra farklı bir yaklaşımla dil çeviri işlemi yapılarak İngilizce dilinde doğrudan duygu çıktıları üreten TextBlob, Vader ve Bert ile modeller oluşturulmuştur. Bu modeller farklı sayısallaştırma yöntemleri (BoW, TF-IDF, Word2Vec,) ve farklı makine öğrenmesi algoritmaları (LR, SGD, SVM, RF, NB) ile kullanılarak en iyi performansı gösteren sınıflandırma modeli üzerinden yapılan paylaşımların duygu analizi gerçekleştirilmiştir. Türkçe metinlerin manuel etikete sahip olduğu yapıda en iyi TF-IDF – LR ikilisi ile 0.79'luk bir sınıflandırma başarısı elde edilmiştir. Manuel yöntemle etiketlendirilen tarafsız olarak işaretlenmiş metinler veri setinden çıkarıldığında başarı oranının arttığı ve BoW – LR ikilisinin 0.84'lük oranla en iyi sonucu verdiği görülmüştür. Dil çeviri işlemi ile hazır modeller tarafından etiketlenerek oluşturulan modellerde Türkçe metinler için istenilen seviyede bir başarı elde edilememiştir.
Özet (Çeviri)
The development of technology has led to the development of social media platforms and reaching large user masses. People can communicate with other people by using social media platforms, and they can come together on these platforms to share their feelings and thoughts on a common topic about a product or a topic, in the face of social events that occur. These shares constitute a large data source that can be used in many fields for sentiment analysis studies. With sentiment analysis studies, these data can be processed and analyzed, and positive, negative or neutral emotional expressions about the relevant subject can be determined. With the corona virus epidemic, which started in January 2020 and affected the whole world, some measures were taken across the country, and within the scope of these measures, the distance education process started in March 2020. In this study, Turkish tweets on distance education shared on the social media platform Twitter were obtained and the data were pre-processed and also normalized with the zemberek library and made processable. For the data set to be used as input in the classification phase, besides manual labeling, models were created with TextBlob, Vader and Bert, which directly produce English emotion outputs by making language translation with a different approach. For the data set to be used as input in the classification phase, besides the manual labeling process, a different approach was brought with language translation and models were created with TextBlob, Vader and Bert, which directly produce English emotion outputs. These models were used with different digitization methods (BoW, TF-IDF, Word2Vec,) and different machine learning algorithms (LR, SGD, SVM, RF, NB) and sentiment analysis of the shares made on the best performing classification model was performed. In the structure where Turkish texts have manual tags, 0.79 classification success was achieved with the best TF-IDF – LR pair. When the texts labeled with the manual method and marked as neutral were removed from the data set, it was seen that the success rate increased and the BoW – LR pair gave the best result with a ratio of 0.84. In the models created by labeling ready-made models with the language translation process, the desired level of success for Turkish texts was not achieved.
Benzer Tezler
- InSAR ve makine öğrenmesi yöntemleri kullanılarak yüzey hareketlerinin zaman serileri ile modellenmesi: İstanbul Havalimanı örneği
Time series modeling of surface movements using InSAR and machine learning methods: The case study of Istanbul Airport
NUR YAĞMUR
Doktora
Türkçe
2023
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. NEBİYE MUSAOĞLU
PROF. DR. ERDAL ŞAFAK
- Modeling educational data with machine learning methods
Eğitim verilerinin makine oğrenmesi algoritmaları kullanılarak modellenmesi
AYŞE İLKNUR DİLEK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür ÜniversitesiMatematik ve Bilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET FATİH UÇAR
- Hava lidar verilerinin yapa zeka yöntemleri kullanılarak sınıflandırılması ve filtrelenmesi
Classification and filtering of airborne lidar data by using artificial intelligence methods
BURCU BAYASLI
Yüksek Lisans
Türkçe
2021
Jeodezi ve FotogrametriYıldız Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALPER ŞEN
- Ortofoto haritalardan ağaç türlerinin otomatik olarak bölütlenmesi
Tree species classification from high resolution digital orthophoto maps
AKHTAR JAMIL
Doktora
Türkçe
2018
Jeodezi ve FotogrametriYıldız Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
PROF. DR. BÜLENT BAYRAM
- Derin öğrenme tabanlı süper çözünürlük teknikleri kullanarak JPEG sıkıştırma kaybının iyileştirilmesi
Recovering JPEG compression loss via deep learning-based super resolution techniques
MUHAMMET BOLAT
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
PROF. DR. LÜTFİYE DURAK ATA
DR. NURULLAH ÇALIK