Geri Dön

Derin öğrenme yaklaşımları kullanarak Türkçe metinlerden anlamsal çıkarım yapma

Semantic inference from Turkish texts using deep learning approaches

  1. Tez No: 534423
  2. Yazar: NERGİS PERVAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ HACER YALIM KELEŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 79

Özet

Günümüzde, Facebook veya Twitter gibi sosyal medya platformları aracılığıyla belirli konular üzerine görüşlerin paylaşılması, web blogları veya e-ticaret sitelerindeki ürün yorumları araştırmacılara çok sayıda yorumlanabilir kullanıcı düşüncesine erişimi sağladı. İnsanlar, bu kanallar aracılığıyla diğer kullanıcıların da düşüncelerini etkileyen kendi deneyimlerini ve düşüncelerini sergilemektedir. Ayrıca firmalar tüketicilerin ürünlerinden ve kendilerinden memnun olup olmadıklarını belirten yorumları önemsemektedirler. Duygu analizi, ürün yorumları, film yorumları ve tweet'ler gibi öznel kısa metinlerin veya görüntülerin pozitiflik veya negatiflik düzeylerine göre sınıflandırıldığı aktif bir çalışma alanıdır. Ancak, bu tür görüşler genellikle Doğal Dil İşleme açısından zorlaştırıcı olan resmî olmayan, gündelik bir dille yansıtılmaktadır. Bu çalışmada, çeşitli kategorilerde ürünler satan bir web sitesi aracılığıyla toplanan Türkçe kullanıcı yorumları analiz edilmektedir. Cümlelerin gürültülü ve günlük konuşma dilindeki doğasını koruyarak, pozitif veya negatif anlam içeren her bir kelimenin vektör temsillerini öğrenen bir word2vec modeli eğitilmektedir ve eğitilmiş kelime temsilleri kullanılarak bir temel yöntem olarak Rastgele Orman (Random Forest - RF) modeli geliştirilmiştir. Klasik örüntü tanıma tekniklerine ek olarak, derin öğrenme yaklaşımlarından ikisi olan Uzun Kısa-Vadeli Hafıza (Long Short-Term Memory - LSTM) ve Genişleyen Evrişimsel Sinir Ağları (Dilated Convolutional Neural Networks - D-CNN) modelleri, duygu sınıflandırma için Türkçe word2vec modeli kullanılarak geliştirilmiştir. D-CNN modeline kıyasla, daha az parametre hesaplamasına sahip olması, çalışma zamanının daha kısa olması ve daha yüksek bir doğruluğa ulaşması açısından LSTM ile daha etkili sonuçlara ulaşılmıştır.

Özet (Çeviri)

Today, sharing views on specific topics through social media platforms, such as Facebook or Twitter, web blogs, or product reviews in e-commerce sites enabled researchers to access huge amount of interpretable user thoughts. People exhibit their experiences and opinions through these channels, which influences other users' choices as well. Moreover, companies care about the comments that say whether consumers are satisfied with their products and themselves. Sentiment analysis is an active research topic in which subjective short texts such as product reviews, movie reviews, tweets or images are classified according to the level of their positivity or negativity. However, such opinions are usually reflected with an informal, casual language which makes them challenging from the Natural Language Processing (NLP) perspective. In this study, Turkish reviews of users collected through a website that sells products in various categories is presented. Keeping the noisy and informal nature of the sentences, a word2vec model that learns the vector representations of each word in the positive or negative is trained and a Random Forest as a baseline method is developed using trained word embeddings. In addition to standard pattern recognition techniques, an LSTM and a Dilated CNN models, two of the deep learning approaches, were developed by using the Turkish word2vec model for sentiment classification. Compared to the D-CNN model, more effective results were achieved with LSTM with regard to have less parameter computation, shorter execution time and higher accuracy.

Benzer Tezler

  1. Metin madenciliği tekniklerini kullanarak faaliyet bazlı proje yönetiminde bilgi yönetimi süreçleri için derin öğrenme modeli

    Deep learning model for knowledge management processes in activity based project management using text mining techniques

    ESRA KARASU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri Mühendisliğiİstanbul Üniversitesi-Cerrahpaşa

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERSİN NAMLI

  2. Çok dilli duygu analizi

    Multilingual sentiment analysis

    DİLEK DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İstatistikAnkara Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. OLÇAY ARSLAN

  3. A novel deep learning approach for controlled multi-topic text generation

    Kontrollü çok konulu metin üretimi için yeni bir derin öğrenme yaklaşımı

    CANSEN ÇAĞLAYAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. KASIM MURAT KARAKAYA

  4. Deep learning based offline handwritten character recognizer systems with a multilingual handwritten character dataset

    Derin öğrenme tabanlı çevirimdışı etkileşimsiz el yazılı karakter tanıma sistemleri ile çok dilli el yazısı karakter veri seti

    GAYE EDİBOĞLU BARTOS

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. YAŞAR HOŞCAN

    DOÇ. DR. ÉVA NAGYNÉ HAJNAL

  5. Türkçe klinik metinlerin derin öğrenme yaklaşımları ile sınıflandırılması

    Classification of Turkish clinical notes using deep learning techniques

    HAZAL TÜRKMEN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OĞUZ DİKENELLİ