Geri Dön

User behavior analysis on e-commerce using NLP techniques

NLP teknikleri kullanarak e-ticarette kullanıcı davranışı analizi

  1. Tez No: 818951
  2. Yazar: ASMAA SAMI MIRDAN MIRDAN
  3. Danışmanlar: DOÇ. DR. SELİM BUYRUKOĞLU, DR. ÖĞR. ÜYESİ MOHAMMED RASHAD BAKER BAKER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Çankırı Karatekin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 75

Özet

Bu çalışma, küçük ve büyük ölçekli işletmeler için satış tahminlerini ve müşteri sadakatini kolaylaştırmada duygu analizi (SA) ve makine öğrenmesi (ML) potansiyelini derinlemesine bir inceleme sunmaktadır. Bloglar, sosyal ağlar ve inceleme portalları dahil olmak üzere çevrimiçi platformlar, pazarlama manzarasını dönüştürmüş, tüketicilerin ürün incelemelerinden popüler kültüre kadar çok çeşitli konularda fikirlerini ifade etmelerini mümkün kılmıştır. Bu dijital platformlar sadece müşteri katılımını teşvik etmekle kalmaz, aynı zamanda işletmelere stratejik satış tahminleri ve müşteri ilişkileri yönetiminde hayati önem taşıyan tahmini analizler için paha biçilmez bir veri kaynağı sağlar. Bu çalışmada, tüketici duygusunun zengin bir temsili olan kapsamlı bir ürün inceleme tweetleri veri seti derledik. Verinin bütünlüğünü ve alakasını sağlamak için, potansiyel gürültü ve tutarsızlıkları hafifleten sıkı ön işleme metodolojilerine başvurduk. Temizleme aşamasını takiben, bir lexicon ve kural tabanlı duygu analiz aracı olan Valence Aware Dictionary and sEntiment Reasoner (VADER)'i bir dizi makine öğrenmesi algoritmasıyla birlikte kullandık. Hedefimiz, satış tahminine yardımcı olmak için ürün incelemelerinin duygu kutuplaşmasını sınıflandırmanın en etkili yolunu belirlemekti. Bulgularımız, VADER'ın duygu analizinde dikkate değer avantajlar sunduğunu, ancak ML tekniklerinin ürün incelemelerinin kutuplaşmasını sınıflandırmada daha üstün doğruluk sunduğunu ortaya koymaktadır. Daha spesifik olarak, lojistik regresyon (LR), bu bağlamda en iyi performans gösteren algoritma olarak bulunmuştur. Doğruluk, hassasiyet, geri çağırma, F1-skoru, Matthews korelasyon katsayısı (MCC) ve eğri altındaki alan (AUC) dahil olmak üzere çok sayıda değerlendirme metriğinde, LR iv sürekli olarak diğer algoritmalardan daha üstün performans sergileyerek, ürün incelemelerinde duygu sınıflandırması için en uygun seçenek olarak konumunu sağlamlaştırmıştır. Dikkat çekici şekilde, XGBoost ve Stochastic Gradient Descent (SGD) gibi diğer algoritmalar da rekabetçi performans sergilemiştir. Model yorumlanabilirliği ana endişe olmadığı ve daha yüksek model karmaşıklığına izin verilebilecek durumlarda makul alternatifler olarak hizmet edebilirler. Bu bulgular, SA ve ML'in işletmelere, müşteri duygusunu anlama, satışları tahmin etme ve sonuç olarak müşteri sadakat stratejilerini güçlendirme konusunda sağlam araçlar sağlama potansiyelini aydınlatan yeni bir bilgi birikimine katkıda bulunur. Bu çalışmanın sonuçları, iş dünyasındaki çeşitli paydaşlar için önemli gerçek dünya faydaları vaat eden akademi ötesine uzanmaktadır.

Özet (Çeviri)

This study presents an in-depth investigation into the potential for sentiment analysis (SA) and machine learning (ML) in facilitating the sales prediction and customer retention processes for both small and large-scale businesses. Online platforms including blogs, social networks, and review portals have transformed the marketing landscape, enabling consumers to voice their opinions on a vast array of topics, from product reviews to popular culture. These digital platforms not only foster customer engagement, but also provide businesses with an invaluable data source for predictive analysis, essential in strategic sales forecasting and customer relationship management. In this study, we compiled a comprehensive dataset of product review tweets, serving as a rich representation of consumer sentiment. To ensure the integrity and relevance of the data, we engaged in rigorous preprocessing methodologies, mitigating potential noise and inconsistencies. Following the cleaning phase, we utilized the Valence Aware Dictionary and sEntiment Reasoner (VADER), a lexicon and rule-based sentiment analysis tool, in conjunction with several machine learning algorithms. The objective was to ascertain the most effective means of classifying the sentiment polarity of product reviews, subsequently aiding in sales prediction. Our findings reveal that while VADER offers notable benefits in sentiment analysis, ML techniques present superior accuracy in classifying the polarity of product reviews. More specifically, logistic regression (LR) was found to be the top-performing algorithm in this context. Across a multitude of evaluation metrics, including accuracy, precision, recall, F1-score, Matthews correlation coefficient (MCC), and area under the curve (AUC), LR consistently outperformed its ii counterparts, thus solidifying its position as the most apt choice for sentiment classification in product reviews. Notably, other algorithms such as XGBoost and Stochastic Gradient Descent (SGD) also demonstrated competitive performance. They can serve as plausible alternatives in situations where model interpretability is not the prime concern and a higher degree of model complexity is permissible. These findings contribute to an emerging body of knowledge, illuminating the potential of SA and ML in providing businesses with robust tools for understanding customer sentiment, predicting sales, and consequently enhancing customer retention strategies. The implications of this study extend beyond academia, promising substantial real-world benefits for various stakeholders in the business sphere.

Benzer Tezler

  1. Recommender system construction using latent semantic analysis and data mining methods on e-commerce data

    E-ticaret verisi üzerinde gizli anlamsal analiz ve veri madenciliği yöntemleri kullanılarak öneri sistemi geliştirilmesi

    ARİF GÖRKEM ÖZER

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İSMAİL HAKKI TOROSLU

  2. Web portallarında kullanıcı davranışlarının yerinde tespiti ve web madenciliğinde kullanımı için yenilikçi bir yaklaşım

    An innovative approach for on-premises detection of user behaviors on web portals and its use in web mining

    ÖZKAN CANAY

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. ÜMİT KOCABIÇAK

  3. A comprehensive analysis on citizen adoption of e-government services: A cross-cultural analysis

    Başlık çevirisi yok

    ÇİĞDEM AKKAYA TÜRKAVCI

    Doktora

    İngilizce

    İngilizce

    2016

    İşletmeTechnische Universität München

    İşletme Ana Bilim Dalı

    PROF. DR. HELMUT KRCMAR

  4. An intelligent system for ranking e-commerce customer reviews to boost engagement

    Müşteri etkileşimini artırmak için e-ticaret müşteri yorumlarını sıralayan akıllı sistem

    ERTUĞRUL YÜCEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. TOLGA KAYA

  5. Sosyal medya madenciliğinde insan duygularının ve tepkilerinin analizi

    Analysis of human emotions and reactions in social media mining

    ULVI ISGANDARLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAMZA EROL