Discovering market insights from online product reviews through sentiment analysis
Çevrimiçi müşteri yorumları ile duygu analizi ve pazar payı için bir içgörü aracı
- Tez No: 952982
- Danışmanlar: DR. ÖĞR. ÜYESİ ERKAN IŞIKLI
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 101
Özet
Çevrimiçi alışveriş giderek daha fazla kullanılmakta, insanlar satın alacakları ürün ve hizmetleri karşılaştırıp, deneyimleri hakkında yorum yapmaktadır. Her geçen gün hayatımızda daha çok yer edinen dijital platformlar aracılığıyla yapılan değerlendirmeler paylaşılmaktadır. Bu tür müşteri geri bildirimleri, pazarlama zekası uygulamaları için değerli bir kaynaktır. Dijital platformlarda oluşturulan içeriklere kolayca erişilebilmekte ve çevrimiçi ürün yorumları, öğrenme algoritmaları kullanılarak analiz edilebilmektedir. İşletmeler sundukları ürün ve hizmetler için değer yaratabilecek önemli bir imkana sahiptirler. Çevrimiçi platformlarda sürekli artan müşteri değerlendirmeleri nedeniyle manuel yaklaşımlar, analiz için yetersiz kalabilir. Süreci otomatikleştirme ihtiyacı, analiz araçlarının gelişimini de beraberinde getirmiştir. Böylece, müşteri yorumlarını otomatik olarak değerlendirebilen veri analiz sistemleri oluşturmak gerekli hale gelmiştir. Dijital platformlardan içgörü elde etmek için doğal dil işleme araçlarını ve derin öğrenme algoritmalarını kullanan duygu analizi, işletmelerin müşteri ile arasındaki iletişimin duygusal değerini belirleyebilir ve müşteriler hakkında daha fazla bilgi sahibi olmalarına yardımcı olabilir. Üretilen toplam verinin %80'ini temsil eden yapılandırılmamış veri kullanılarak etkili pazarlama stratejileri tasarlanabilir. Duyguları, anahtar kelimeleri ve hedef alanları belirlemek için yapılandırılmamış veriyi analiz etmek, işletmelerin pazar araştırmaları için etkili bir araç olarak konumlandırılabilir. Öte yandan pazarlamacılar, müşterilerinin sorun yaşadıkları alanları bulmak, darboğazları belirlemek ve pazardaki rakiplerinden farklılaşabilmek için duygu analizini kullanabilir. Bu çalışmada, duygu ve pazar analizinin sistematik bir değerlendirmesi sunulmuştur. Geliştirilen hibrit çözümün bulguları paylaşılmış ve bir Türkçe doğal dil işleme uygulaması gerçekleştirilmiştir. Teknolojik gelişmeler ve COVID-19 pandemisi şartları ile dijital platformların ve e-ticaretin hızla büyümesinden bahsedilmiştir. Halihazırda iyi bir büyüme trendi yaklayan e-ticaretin, pandemi nedeniyle herkesin evlere kapanması ile nasıl ivmelenerek büyüdüğü üzerinde durulmuştur. Giderek hayatımızda daha büyük yer edinen dijital pazaryerlerindeki müşteri deneyimi ve davranışları tartışılmıştır. E-ticaret hacmi ile ilgili Türkiye'ye ve Dünya'ya ait makro göstergeler incelenmiştir. Son dönemde e-ticaretin hangi etmenlerden etkilendiği ve gelecekte hangi trendleri takip edebileceği hakkında bir çerçeve oluşturulmuştur. Dijital platformlarda sunulan deneyim göz önünde bulundurularak, müşteri memnuniyeti ve sadakatinin nasıl ölçülebileceği ile ilgili araştırmalar üzerinde durulmuştur. Dijital kanallarda işletmeler ve müşteri arasındaki ilişkiyi etkileyen ve şekillendiren hususlar tanımlanmış ve ölçümü için hangi metriklerin takip edilebileceği tartışılmıştır. Müşteri memnuniyeti ve sadakatinin e-ticaret platformlarındaki deneyimi iyileştirmek için nasıl kullanılabileceği ve karlılık üzerindeki etkisi tartışılmıştır. Literatür taraması, metin ve pazar analitiği olmak üzere iki ana başlık altında yapılmıştır. Metin analitiği bölümünde, ilk olarak metin sınıflandırılması incelenmiştir. Metin sınıflandırması yaparken kullanılan yöntemlerden bahsedilmiş ve sınıflandırma performansının nasıl değerlendirileceği açıklanmıştır. Metnin bir duygu sınıfına atanması görevini içeren duygu analizi için metin verisinin öğrenme modeline girdi oluşturacak şekilde nasıl hazırlandığı anlatılmıştır. Temsil için kullanılan kelime gömülmelerinden bahsedilmiş ve kelime gömülmelerinde aynı anlama gelen iki kelimenin nasıl temsil edileceği tartışılmıştır. Doğal dil işleme problemlerinin çözümünde kullanılan derin öğrenme ayrıntılı olarak açıklanmış ve metin verisi ile nasıl çalışabileceği anlatılmıştır. Metin verisi ile çalışmanın getirdiği zorluklar tanımlanmış ve derin öğrenme algoritmalarının bu zorluklar ile mücadele etmek için ne tür yöntemler geliştirdiği açıklanmıştır. İlk defa öğrenme yerine benzer doğal dil işleme problerimden edinilen bilgi ve birikimin nasıl kullanılabileceği aktarımlı öğrenim başlığı altında incelenmiştir. Son zamanlarda NLP problemlerinde sıkça kullanılan dikkat mekanizmalarının teorik arka planı anlatılmış ve dönüştürücü mimarisi ile sunduğu çözüm önerisi incelenmiştir. Müşterilerin ürün ve hizmetlere ilişkin ne düşündüklerini göstermesinin yanı sıra, duygu analizinin pazar hakkında nasıl bilgi sağlayabileceği tartışılmıştır. Çevrimiçi ürün yorumları kullanılarak bir pazarlama aracının gelişimi gösterilmiştir. Bu araç, müşterilerin pazarda faaliyet gösteren rakipler hakkında içgörü kazanmasına imkan sağlayacak şekilde tasarlanmıştır. Ayrıca analiz sonuçları ürün ve hizmetlerdeki eksikleri tamamlamak için kullanılabilir ve satıcıların rekabette öne geçmelerine yardımcı olabilir. Müşterilerin dijital platformlarda yaşadıkları deneyimin öğrenilmesine imkan sağlar, müşterilerin memnuniyet düzeyleri hakkında bilgi verir ve dijital kanallar ile etkileşimin nasıl gerçekleştiğinin incelenebilmesine imkan sağlar. Bunların yanında duygu analizi, bir ürün veya hizmetin hedef ve/veya potansiyel müşteri kitlesi tarafından nasıl algılandığının değerlendirmesine yardımcı olur. Çevrimiçi pazaryerlerinin müşterileri ile etkileşime geçtikleri dijital kanalların çeşitlenmesi, pazar analitiği süreçlerini şekillendirmektedir. Pazar analitiği, işletmelerdeki karar vericilerin müşteri odağında pazar stratejilerini şekillendirebilmeleri için bir araç olarak kullanılabilir. İşletmelerin pazarlama verisi ile operasyonel ve finansal hedeflerine ulaşmaları için etkili bir araçtır. Bu kapsamda pazar analitiği ile ilgili ilk incelenen metrik pazar payı olmuştur. İşletmelerin mevcut durumlarını ve takip edecekleri pazar hedeflerini belirlemeleri için kullandıkları en önemli metriklerden biri olan pazar payı incelenmiştir. Ayrıca odağına müşterileri alan ve müşteri harcamalarından işletmelerin aldıkları payı gösteren ihtiyaç payı ve cüzdan payı metrikleri açıklanmıştır. Bireysel ve toplu olmak üzere özelleşen cüzdan payı incelenmiştir. Türkçe duygu analizi ile ilgili çalışmalar göz önüne alındığında, genelde geleneksel makine öğrenmesi metodları ile gerçekleştirildiği, son zamanlarda derin öğrenme ve dönüştürücü mimarisini kullanan modellerin de popülerleştiği görülmüştür. Film ve otel yorumları, sosyal medyadaki gönderiler, online platformlarda ürün ve hizmetlere yapılan yorumlar başta olmak üzere birçok alanda duygu analizi yapılmaktadır. Çalışılan alana göre çeşitli hacimlerdeki veri ile analiz çalışmaları gerçekleştirilmektedir. Hem manuel hem de otomatik olarak veri işaretleme süreci tamamlanmaktadır. Metin verisinin bir öğrenme modeline girdi oluşturacak şekilde nasıl hazırlandığına ait örnek çalışmalar da incelenmiştir. Duygu sınıflandırması görevi için kullanılan modeller ayrıntılı olarak aktarılmıştır. Duygu sınıflandırıcı olarak kullanılan BERT modelinde, metin verisinin işlenebilir hale gelmesi için jetonlar ile nasıl temsil edildiği anlatılmıştır. Kullanılan kelime gömülmesi metodunun kelimeler arasındaki anlamsal ilişkiyi nasıl temsil ettiği tartışılmıştır. BERT'in metin sınıflandırma görevleri için sunduğu çözüm önerisi ayrıntılı olarak gösterilmiştir. Modelleme aşamasında ön eğitim ve ince ayar görevlerinin dikkat mekanizmaları ile öğrenme sürecini nasıl gerçekleştirdiği anlatılmıştır. Modelin değerlendirilmesi ve performans metriklerinin nasıl izlenmesi gerektiği hakkında bilgilendirme yapılmıştır. Bu çalışma kapsamında gerçekleştirilen analiz yöntemleri, duygu ve pazar analizi, açıklanmıştır. Duygu analizinin ayrıntı seviyeleri aktarılmış ve sondan eklemeli bir dil olan Türkçe dilindeki doğal dil işleme problemerinde karşılaşılan zorluklardan bahsedilmiştir. Cüzdan Payı Kuralı'nın ne olduğu, nasıl kullanıldığı aktarılmıştır. Cüzdan payının işletmelerin finansalları üzerinde nasıl bir etki oluşturabileceği ve öğrenilen bu etkiyi nasıl avantaja dönüştürebilecekleri tartışılmıştır. Tasarlanan hibrit çözüm, bir e-ticaret pazaryerindeki çevrimiçi müşteri yorumları kullanılarak uygulanmıştır. Veri analizi, ürün kategorilerinin belirlenmesi, veri işaretleme, veri setinin işlenebilmesi için yapılan ayarlamalar, veri ön işleme, veri setinin test ve eğitim olarak ayrılması, metin verisinin kelime gömülmeleri ile temsili, modelleme ve tahminlerin üretilmesi adım adım anlatılmıştır. Öğrenme modelinin ürettiği tahminler, cüzdan payı kuralını hesaplayan model için girdi oluşturmuştur. Müşterilerin satıcılara ayırdıkları cüzdan payları tahmin edilerek, satıcıların pazarlama aktivitelerinde kullanabilecekleri bir araç geliştirilmiştir. Metin sınıflandırmasında 2-sınıflı, 3-sınıflı ve 5-sınıflı modeller değerlendirilmiş ve 3-sınıflı sınıflandırma ile ilerlemeye karar verilmiştir. Kılıf kategorisi için tahmin başarısı 0.8631, erkek parfümü için 0.8626 ve cep telefonu için 0.9016 olarak bulunmuştur. Cüzdan payı kuralı, müşteri bazlı cüzdan payını hesapladığı için veri setindeki müşteri yorumları oluşturulan müşterilere rastgele atanmıştır. Atanan müşteri sayısının cüzdan payı tahminindeki etkisinin araştırılması için 100, 300 ve 500 adet müşteri için rastgele atama işlemi gerçekleştirilmiş ve sonuçlar değerlendirilmiştir. En yüksek müşteri sayısının, en düşük hata ile tahmin yapılabilmesine olanak sağladığı görülmüştür. Üç kategori için toplanan müşteri yorumlarının her kategoride 500 müşteriden alındığı varsayılarak yorumlar müşterilere rastgele dağıtılmış ve satıcılara ayırdıkları cüzdan payları hesaplanmıştır. Bu çalışmanın geliştirilmesi ve iyileştirilmesi için gelecek dönemde göz önünde bulundurulabilecek konular hakkında bir ön araştırma da yapılmıştır. Duygu analizinde kullanılan öğrenme modelinin otomatik ve düzenli olarak eğitilebileceği bir yapı önerilmektedir. Ayrıca çevrimiçi müşteri yorumlarının hangi deneyim alanını hedeflediğinin tespiti ve hedefe ait duygu sınıfı ataması ile daha ayrıntılı bir analizin yapılabileceği üzerinde durulmuştur.
Özet (Çeviri)
Online shopping is increasingly preferred, products and services are compared, and customer reviews are shared on numerous digital platforms thanks to the successive iterations of the web and the widespread of the Internet. This type of customer feedback is of great value for marketing activities. As the content created on digital platforms is easily accessible and the sentiment of text data can be analyzed using various learning algorithms, marketers can conveniently produce market intelligence about product and service perceptions and customer behaviors. Due to the continuously expanding volume of customer evaluations, approaches based on manual analysis are insufficient to provide a broad perspective of consumer opinions for a product. The need to automate the process has led to the development of various analysis tools. As a result, it has become necessary to build data analysis systems that can automatically evaluate customer reviews and summarize their behavior and opinions. Using natural language processing tools and deep learning algorithms to extract insights from digital platforms, sentiment analysis can identify the emotional value of communications for businesses and help marketers understand their customers better. More effective marketing strategies can be designed using unstructured data. Accordingly, analyzing unstructured data to identify aspects, sentiments, emotions, keywords, and purposes can help to improve the market research of a business. Furthermore, marketers may also use data analysis to find customer pain points, determine their bottlenecks, and track their competitors. This study essentially presents a systematic review of text and market analytics. It also delivers detailed findings and theoretical backgrounds of Turkish NLP applications, transformers, and market research methods. Firstly, the rapid growth of digital platforms and e-commerce under technological improvements and pandemic conditions is acknowledged. During the lockdown, how e-commerce, which had already experiened a significant growth trend, accelerated and grew is explained. Secondly, how to determine the metrics that measure consumer habits and behaviors in digital marketplaces are discussed. Macro-level indicators related to e-commerce volume are given for both Turkey and the world. A framework for which factors have affected e-commerce recently and which trends it can follow in the future is presented. Thirdly, research on how customer satisfaction and loyalty can be measured considering a customer's experience on digital platforms is conducted. Issues that affect and shape customer relations in digital channels are defined, and which metrics to follow for their measurement is discussed. Finally, the first chapter investigates how customer satisfaction and loyalty can improve customer experience in e-commerce platforms and their impact on profitability. The literature related to text analytics and market research is thoroughly reviewed. In the text analytics section, the classification of texts is primarily discussed. Sentiment analysis involves the task of assigning text data to a sentiment class. The methods used in text classification are mentioned, and the ways to evaluate classification performance are explained. Subsequently, how to represent text data that is to be introduced as an input to an NLP model is explained. The word embeddings used to describe text data are mentioned, and their positive and negative aspects are explained. An example discussing how two words with the same meaning can make a difference in word embeddings is provided. Natural language processing problems are sought to be answered by deep learning. The fundamentals of deep learning are explained in detail, and how it can work with text data is presented. The difficulties of working with text data are defined, and the methods developed for deep learning algorithms to overcome these difficulties are described. Using the knowledge and experience gained from similar natural language processing problems instead of learning from scratch is examined under the heading of transferred learning. Finally, the theoretical background of attention mechanisms, which are frequently used in the solution of NLP problems, is explained. The solution proposed by the transformers is examined. Sentiment analysis helps businesses monitor their customers' perceptions of their products and provides market intelligence about the ecosystem. Online product reviews may be a significant data source for gaining market insights and analyzing the competitors. It also allows for learning what customers in the target segment think about the competitors that are operating in the same market. These deep insights help fill gaps in products and services and help sellers stay ahead of the competition. In addition, understanding customers' experience on digital platforms provides information about customers' satisfaction levels and enables to monitor their interactions with the digital channels. In addition, sentiment analysis helps one evaluate how a customer group perceives a product or service. Diversifying digital channels used by online platforms shape the marketing analytics processes. Market strategies are reshaped with insights gained from the market using analytical tools. These tools can be used effectively for businesses to achieve their operational and financial goals with the help of marketing data. The first metric examined in marketing analytics within this context is the market share, which is one of the most critical metrics used by businesses to determine their current situation and the market targets to be followed. In addition, the need share and the wallet share metrics, which focus on customers and show the share of businesses in customer expenditures, are explained. Two different approaches to the wallet share, where customers are examined individually and evaluated cumulatively, are also discussed. The literature on Turkish sentiment analysis has generally employed traditional machine learning methods; however, models using deep learning and transformative architecture have recently become more popular. Sentiment analysis has been studied in various fields, using movie reviews, hotel reviews, social media shares, and online marketplaces reviews. The size of data sets, the way data annotation is performed (manually vs. automatically), and the data preprocessing methods are the main differentiators of these studies. Consequently, the end-to-end sentiment classification task is examined step by step. Firstly, how tokens represent text data for the BERT model, used as a sentiment classifier, and how the word embedding method used means the semantic relationship in the text is described. BERT's solution proposals, especially for text classification tasks, are shown in detail. Then, how the pre-training and fine-tuning tasks perform the learning process using attention mechanisms in the modeling phase, and performance monitoring metrics are explained. The level of detail of the sentiment analysis is given, and difficulties encountered in the natural language processing problems in an agglutinative language, Turkish, are explained. The wallet allocation rule and how the sellers can use it to determine a better market strategy is explained. Furthermore, how the wallet share can affect the financials and how the enterprises can turn this information into an advantage knowing this effect is discussed. Experiences are gained using customer reviews on an e-commerce marketplace for online sellers within the scope of this study. Data analysis, how product categories are determined, data annotation, adjustments to the data set, data preprocessing, identifying testing and training data sets, tokenization of text data, modeling, generating predictions, and performance monitoring processes are described. The model's outputs, estimation results, are introduced as inputs to calculate the wallet share. Finally, the wallet shares that the customers have allocated to the sellers are counted. Different multi-class classification model alternatives (5-class, 3-class, and 2-class) are evaluated, and the 3-class classification is eventually selected. The 3-class classification weighted-averaged f1 scores are 0.8631 for the category of case, 0.8626 for men's perfume, and 0.9016 for mobile phones. Since the wallet allocation rule calculates the customer-based wallet share, the reviews are randomly assigned to the customers. The models are developed using different customer sizes (100, 300, and 500) to see the effects on estimating the wallet share. The model developed with the biggest customer size gives the lowest absolute error. The assumption can be summarized that the wallet shares calculated with the online reviews - collected from three categories, grouped into three sentiment classes, and received from 500 customers. Needs for improvement are specified, and a brief guideline is identified for topics that can be considered in future work. The learning model's automatic retraining structure is proposed, and aspect-based sentiment analysis is described.
Benzer Tezler
- Liberal bir aktör olarak Avrupa Birliği: Avrupa komşuluk politikasının eleştirel analizi
European Union as a liberal power: A critical analysis of European neighbourhood policy
BÜŞRA KILIÇ
Doktora
Türkçe
2023
Siyasal BilimlerMarmara ÜniversitesiUluslararası İlişkiler Ana Bilim Dalı
PROF. DR. RAMAZAN GÖZEN
- A metric learning based system for retail product recognition and novel class discovery
Metrik öğrenme tabanlı ürün tanıma ve yeni ürün keşfetme sistemi
İBRAHİM ŞAMİL YALÇINER
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL
- Tüketici ürünlerinde dijitalleşme ve internetin kullanıcı deneyimine etkileri: Bir çamaşır makinesi üzerinden inceleme
The effects of digitization of consumer products and internet on user experience: A case-study on a washing machine
GÖŞENAY AKKAN
Yüksek Lisans
Türkçe
2019
Endüstri Ürünleri TasarımıMimar Sinan Güzel Sanatlar ÜniversitesiEndüstri Ürünleri Tasarımı Ana Bilim Dalı
DOÇ. DR. HIZIR TENGÜZ ÜNSAL
- Strategic management in developing countries: A case study on Iran's SMEs-after sanctions lift
Gelişmekte olan ülkelerde stratejik yönetim: İran KOBİ'lerinde bir araştırma, ambargonun kaldırılmasından sonra
ABBAS SAMADI
Yüksek Lisans
İngilizce
2017
İşletmeİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. LUTFİHAK ALPKAN
- Endüstri 4.0'ın karakteristiği ve yeni dünya düzeninde toplumsal eşitsizlikler
Characteristics of the industry 4.0 age and social inequalities in the new world order
İDİL ERDOĞAN