Sentiment analysis of Arabs in Turkey using deep learning on social media data
Sosyal medya verileri üzerinde derin oğrenme kullanılarak Türkeyedeki Arabların duygu analizi
- Tez No: 765624
- Danışmanlar: DOÇ. DR. YÜKSEL ÇELİK, DR. ÖĞR. ÜYESİ VEDAT TÜMEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 80
Özet
Günümüzde insanlar sosyal medyayı fikirlerini özgürce ve kesintisiz olarak ifade edebilecekleri bir paylaşım noktası olarak değerlendirmektedir. İnsanlar anlık haber takibi, haberlerin ya da yapılan paylaşımların altına duygu ve düşüncelerini yorum olarak yazmaktadırlar. Sosyal Medya sitelerinde çok sayıda paylaşım yapıldığından yüksek boyutlarda veri oluşmaktadır. Bu verilen işlenmesi için yenilikçi ve daha etkin yöntemler geliştirilmektedir. Aaraştırmacılar, daha etkili ve doğru analizlere olanak sağlayan duygu analizi çalışmalarıyla ilgilenmektedir. Bu tez, Türkiye'nin Arap görüşleri hakkında Twitter'dan toplanan yeni bir veri seti ve bu veriseti üzerinde yapılan Arapça duygu analizlerini sunmaktadır (Arabic Sentiment Analysis, ASA). Günümüzde en önemli sosyal paylaşım sitelerinden biri olan Twitter, API üzerinden twitleri toplamasına ve bunlar üzerinden farklı analiz yapılmasına ayrıca yazılım çalışmaları geliştirmelerine olanak sağlamaktadır. Veri setimizin çok lehçeli Arapça olması ve Türkiye ekonomisi, turizm, gıda ve siyaset gibi çoklu alan olması işimizi daha da zorlaştırmaktadır. Twitler topladıktan sonra içeriğine göre olumlu ve olumsuz duygular şeklinde elle etiketlenerek veri setine dönüştürülmüştür. Veri seti 1583 olumlu ve 1553 olumsuz olmak üzere toplam 3136 tweet içermektedir. Yeni oluşturulan veri setini içeriğine göre olumlu veya olumsuz duygular olarak sınıflandırmak için derin öğrenmeye dayalı bir Arapça duygu analizi (Arabic sentiment analysis, ASA) yaklaşımı önerilmiştir. Önerilen ASA yaklaşımında, öznitelik çıkarmak için Word2Vec ve Arapça Dönüştürücülerden Çift Yönlü Kodlayıcı Temsilleri (AraBERT) kullanılmıştır. Daha sonra ikili sınıflandırma için çift yönlü uzun kısa süreli bellek, Evrişimli sinir ağları ve ileri beslemeli sinir ağları uygulanmıştır. Ayrıca, ASA yaklaşımı için AraBERT tabanlı bir transformatör otomatik sınıflandırıcı uygulanmıştır. Bu çalışmada, önceden eğitilmiş AraBERT'in Word2Vec'ten daha iyi performans gösterdiği ve otomatik sınıflandırıcının en yüksek doğruluğu sağladığı tespit edilmiştir.
Özet (Çeviri)
Social Media (SM) has attracted many people from different races and cultures as people consider SM sites as a sharing point where they can freely and uninterruptedly express their opinions. Since many shares are made on SM sites, high-dimensional data is generated. Innovative and more efficient methods for processing this data are being developed. Researchers are interested in sentiment analysis studies that allow more effective and accurate analysis. This thesis presents a new data set about Arab opinions about Turkey collected from Twitter and the Arabic Sentiment Analysis (ASA) on this dataset. Twitter, one of the most important social networking sites today, allows collecting tweets via API, analyzing them differently, and developing software studies. Our data set is multi-dialectic Arabic and has multiple fields, such as Turkish economy, tourism, food, and politics, which makes our job even more difficult. After collecting the tweets, they were hand-crafted as positive and negative emotions according to their content and converted into an annotated data set. The data set contains 3136 tweets divided into 1583 positive and 1553 negative ones. A deep learning-based Arabic sentiment analysis (ASA) approach has been proposed to classify the newly created dataset as positive or negative emotions according to its content. Word2Vec and Bidirectional Encoder Representations (AraBERT) are used in the proposed ASA approach to extract features. Then, bidirectional long short-term memory, Convolutional neural networks, and feedforward neural networks were applied for the binary classification. In addition, a transformer auto classifier based on AraBERT has been applied for the ASA approach. This study determined that the pre-trained AraBERT outperformed Word2Vec and the automatic classifier provided the highest accuracy.
Benzer Tezler
- Türkiye'deki askeri darbelerin lise tarih ders kitaplarına etkileri: 27 mayıs 1960-12 mart 1971 örneği
Başlık çevirisi yok
HÜSEYİN YÜRÜK
Yüksek Lisans
Türkçe
2017
Eğitim ve ÖğretimMarmara ÜniversitesiOrtaöğretim Sosyal Alanlar Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. COŞKUN YILMAZ
- An analysis of Turkey's migration policies and Syrian refugees from 2011 to present day: open door policies and security approach
2011'den günümüze Suriyeli mülteciler ve Türkiye'nin göç politikalarına dair bir çözümleme: Açık sınır kapısı politikaları ve güvenlikçi yaklaşım
YUNUS EMRE KIRKPINAR
Yüksek Lisans
İngilizce
2022
Kamu YönetimiManisa Celal Bayar ÜniversitesiSiyaset Bilimi ve Uluslararası İlişkiler Ana Bilim Dalı
DOÇ. DR. AHMET UÇAR
- The Baghdad Pact: An Anglo-American quest for policy in the middle east
Bağdat Paktı: Ortadoğuda bir İngiliz-Amerikan politika arayışı
YUSUF TURAN ÇETİNER
Yüksek Lisans
İngilizce
1995
Uluslararası İlişkilerİhsan Doğramacı Bilkent ÜniversitesiY.DOÇ.DR. NUR BİLGE CRİSS
- Cost analysis of sediment removal techniques from reservoir
Rezervuardan rüsubat kaldırma tekniklerinin maliyet analizi
TUÇE ARAS
Yüksek Lisans
İngilizce
2009
İnşaat MühendisliğiOrta Doğu Teknik Üniversitesiİnşaat Mühendisliği Bölümü
DOÇ. MURAT GÜNDÜZ
YRD. DOÇ. ŞAHNAZ TİĞREK
- Sentiment classification of arabic tweets using a novel learning sentiment-specific word embedding technique
Yeni bir duygu-odaklı kelime gömme tekniği kullanarak arapça tvitlerin duygu sınıflandırması
HALA MULKI
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSMAİL BABAOĞLU