Doğal dil işleme yöntemleriyle Türkçe sosyal medya verileri üzerinde duygu analizi
Sentiment analysis with natural language processing methods on Turkish social media data
- Tez No: 462765
- Danışmanlar: YRD. DOÇ. DR. METİN ZONTUL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: İstanbul Aydın Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 91
Özet
İnternetin sürekli olarak gelişmesi ve hayatımızın vazgeçilmesi olması ile beraber birtakım sosyal paylaşım siteleri ortaya çıkmıştır. İnsanların fikirlerini paylaştığı ve etkileşimde bulunduğu bu sosyal medya platformları veri kaynağı açısından bilim insanlarının adresi olmuştur. İnsanlar günümüzde istedikleri bilgiye internet üzerinden yaptıkları aramalarla kolaylıkla ulaşabilmektedir. İnternetteki bilgilerin çoğu geribildirime açık olup bu geri bildirimler anketler ve forum siteleri aracılığıyla yeni fikirlerin analizi için toplanmaktadır. Çok fazla internet kullanıcısı olmasından dolayı geri bildirimlerin insan tarafından analiz edilmesi çok zordur. İşte bu noktada duygu analizi kavramı ortaya çıkmıştır. Duygu analizi, metinlerdeki bir konu hakkındaki duygu ve düşüncenin analiz edilerek duygunun pozitif ve negatif olarak sınıflandırılmasını amaçlar. Öznitelik seçimi sınıflandırma performansı ve başarısını arttırmak için günümüzde sıklıkla kullanılmaktadır. Bu seçimde farklı metotlar kullanılmakta olup amaçlanan veri kümesi içinden sınıflandırmadaki başarıyı etkileyen alakasız niteliklerin devre dışı bırakılıp önemli niteliklerin seçilmesidir. Bu şekilde başarı oranı arttırılabilir. Bu tez çalışmasında günlük konuşma dili ile yazılan Türkçe metinlerden öznitelik seçimine odaklanılmış olup detaylı ön işlemeden geçen veri üzerinde destek vektör makineleri, yapay sinir ağları ve centroid tabanlı sınıflandırma algoritmaları kullanılmıştır. 3 ayrı GSM operatörünün takipçilerine ait tweetler üzerinde Gini İndeks, Bilgi Kazancı ve Genetik Algoritma 3 farklı sınıflandırma algoritmasıyla hibrit olarak kullanılmıştır. Özellikle boyut indirgemede önemli bir yere sahip olan ve sezgisel olarak çalışan genetik algoritma ile destek vektör makineleri hibrit olarak kullanıldığında 3 farklı GSM operatörü için de %100 başarı elde edilmiştir.
Özet (Çeviri)
Several social media websites are showed up as Internet's improving continously and becoming an irreplaceable part of our lives. Those sites that people share their opinions and interact with others have become the address of scientists in terms of data source. People can access any information they need easily by doing research on Internet these days. Many of the data are open for feedbacks and these feedbacks are gathered for analyses of new ideas by surveys and forum sites. It is too hard to analyze feedbacks by a person as there are so many Internet users. At this point, emotion analysis concept showed up. Emotion analysis is aimed at classify the emotion as positive and negative by analyze the emotion and thought about a topic in texts. Entity property selection is used frequently nowadays in order to increase the performance and success in classification. Different methods are used in this selection and it is selecting the important qualities by eliminating the irrelevant features that affect the success in classification in target data set. Thus, hit ratio may increase. In this thesis, feature selection from Turkish texts written as colloquial is focused and support vector machine, artificial neural networks and centroid based classification algorithms are used on data that has detailed preprocessing. Gini Index, Information Gain and Genetic Algorithm are used as hybrids with 3 different classification algorithms on tweets belonging to 3 different GSM operators' followers. 100% success is achieved for 3 different GSM operators when genetic algorithm, which works as intuitively and has an important role in dimension reduction, and support vector machines are used hybridly.
Benzer Tezler
- Sosyal Ağlarda Duygu Analizi için Hibrit Bir Yöntem Geliştirilmesi
Development of a Hybrid Method for Sentiment Analysis in Social Networks
MUHAMMET SİNAN BAŞARSLAN
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATİH KAYAALP
- Çizge evrişimli sinir ağları kullanılarak metin sınıflandırma
Text classification using graph convolutional networks
RUKİYE ÖZDEMİR TEKİR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ABDURRAHİM AKGÜNDOĞDU
- Algoritmaların gazeteciliğe etkisi: Algoritmik habercilik
The effect of algorithms on journalism: Algorithmic journalism
OĞUZ AVCI
Yüksek Lisans
Türkçe
2024
GazetecilikAtatürk ÜniversitesiGazetecilik Ana Bilim Dalı
DOÇ. DR. ASLIHAN ZİNDEREN
- Sosyal medyadaki Türkçe sahte haberlerin derin öğrenme yaklaşımıyla tespiti ve sınıflandırılması
Detection and classification of fake news in Turkish on social media using a deep learning approach
GÜLSÜM KAYABAŞI KORU
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiAdli Bilişim Ana Bilim Dalı
PROF. DR. ÇELEBİ ULUYOL
- Yazım kurallarına uygun yazılmamış türkçe metinleri makine çevirisi yöntemleriyle normalleştirme
Normalizing non-canonical turkish texts using machine translation approaches
TALHA ÇOLAKOĞLU
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ