Improving machine learning methods for social media data in Turkish
Türkçe sosyal ortam verileri için makine öğrenme yöntemlerinin geliştirilmesi
- Tez No: 663064
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖZLEM AKTAŞ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Bu çalışmada Türkçe duygu analizi için sözlük ve makine öğrenmesi tabanlı yaklaşımları birleştiren hibrit (karma) bir yöntem geliştirilmiştir. Sözlük tabanlı kısımda kullanılmak üzere, SentiTürkNet eş anlamlılar sözlüğü olan ASDICT ile genişletilerek bir duygu analizi sözlüğü oluşturulmuştur. Bunun yanında, makine öğrenmesi tarafında Naïve Bayes, Support Vector Machines ve J48 adlı üç gözetimli öğrenme algoritması ile sınıflandırma sorunu çözülmüştür. Hibrit yöntemimiz bu iki yaklaşımı özellik üretimi algoritmamızı kullanarak yeni bir sözlük tabanlı değer hesaplayıp ve bunu makine öğrenmesi sınıflandırıcılarına yeni bir özellik olarak ekleyerek birleştirmektedir. Film, otel ve Twitter olmak üzere üç farklı veri seti üzerinde sınamalar gerçekleştirilmiştir. Türkçe'nin morfolojik yapısından kaynaklı dilbilimsel zorluklara rağmen, deneysel sonuçlar çalışmamızın doğruluk oranını diğer çalışmalara göre ortalama %7 artırdığını göstermektedir. Sonuç olarak, çalışmamızın katkıları şunlardır: Bu çalışma Türkçe duygu analizi için geliştirilmiş ilk hibrit yaklaşımdır. Ayrıca, pozitif ve negatif anlamı kaybetmemek için kök çözümleme algoritması iyileştirilmiştir. Son olarak, ilk kapsamlı polarite sözlüğü olan STN genişletilerek eSTN adında daha kapsamlı bir sözlük oluşturulmuştur.
Özet (Çeviri)
In this thesis, we have presented a hybrid methodology, which combines the lexicon-based and machine learning (ML)-based approaches for sentiment analysis in Turkish. To use on the lexicon-based side, we have generated a sentiment dictionary by extending SentiTürkNet with a synonym dictionary, ASDICT. Besides this, we have tackled the classification problem with three supervised classifiers, Naive Bayes, Support Vector Machines, and J48, on the ML side. Our hybrid methodology combines these two approaches by generating a new lexicon-based value according to our proposed feature generation algorithm and feeds it as one of the features to ML classifiers. We have experimented on three different datasets such as Movie, Hotel, and Twitter. Despite the linguistic challenges caused by the morphological structure of Turkish, the experimental results show that it improves the accuracy by 7% on average. In conclusion, we have achieved these contributions in our study: It is the first hybrid approach for Turkish sentiment analysis. We have also adapted lemmatization in natural language processing for Turkish SA to preserve the positive and negative meanings of tokens. Finally, we have generated eSTN by extending STN, which is the first comprehensive polarity lexicon for Turkish.
Benzer Tezler
- Makine öğrenmesi yardımıyla zincir restoran gıda satışlarının tahmin edilmesi ve hava durumunun etkisinin incelenmesi
Forecasting food sales on chain restaurant and investigating weather effect on sales by using machine learning methods
SEZGİ ŞENER
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. BAŞAR ÖZTAYŞİ
- An investigation of feature selection methods for machine learning
Makine öğrenmesi için öznitelik seçim yöntemlerinin incelenmesi
BUSE NUR BALTACIOĞLU
Yüksek Lisans
İngilizce
2024
BiyoistatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. İDİL YAVUZ
- Detecting multilingual offensive language in social media using deep neural networks
Derin sinir ağlarını kullanarak sosyal medyada çokludilli saldırgan dil tespit etme
MAHMUD BİRECİKLİ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SELMA AYŞE ÖZEL
- Yerel yönetimlerde yapay zeka destekli memnuniyet analizi
Başlık çevirisi yok
SERVET AKSU
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÜsküdar ÜniversitesiYapay Zeka Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NURİ BİNGÖL
- Designing and debiasing binary classifiers for irony and satire detection
İroni ve satir tespiti için ikili sınıflandırma modellerinin tasarlanması ve önyargıdan arındırılması
ASLI UMAY ÖZTÜRK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. PINAR KARAGÖZ