Geri Dön

Analyzing and predicting e-commerce customer behaviors using process mining techniques

E-ticarette müşteri davranışlarının süreç madenciliği ile analizi ve tahmin edilmesi

  1. Tez No: 948194
  2. Yazar: BİLAL TOPALOĞLU
  3. Danışmanlar: PROF. DR. BAŞAR ÖZTAYŞİ, DOÇ. DR. ONUR DOĞAN
  4. Tez Türü: Doktora
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 163

Özet

Teknoloji ve ticaretteki gelişmeler, özellikle yeni binyılın başından bu yana tüketicilere ulaşmanın iki önemli itici gücü haline geldi. Sürekli artan ürün çeşitliliği ve pazarlara erişim için geliştirilen yeni kanallar ticareti kolaylaştırmaktadır. Bu açıdan, e-ticaret çağımızın öne çıkan inovasyonlarından biridir. Ortaya koydukları faydalarla birlikte, inovasyonların da kendi gelişim eğrilerinde gözlenen belirli problemleri olabilmektedir. Geleneksel perakende kanallarına bakışla, e-ticaret alanında dikkat çeken konulardan bir tanesi önemli ölçüde düşük seyreden satışa dönüştürme oranıdır. Satışa dönüştürme oranı, genel olarak perakendede ve dolayısı ile e-ticarette kullanılan temel performans göstergelerinden bir tanesidir. E-ticarette satışa dönüştürme oranı ortalama olarak %1,5 seviyelerinde ölçülmekteyken, geleneksel mağaza kanalında bu oranının %15'in altında düşmesi önlem alınmasını gerektiren bir durumdur. Mağaza kanalı ve e-ticaret arasında on katı aşan fark, e-ticaretin çözülmesi gereken temel problemlerinden birinin satışa dönüştürme oranının arttırılması olduğunu göstermektedir. Problemlerinin yanı sıra, e-ticaret birtakım avantajları ve çözüm fırsatlarını da içinde barındırmaktadır. E-ticarette mağaza kanalına kıyasla oldukça maliyet etkin ve detaylı bir şekilde ziyaretçilerin izlerini sürebilmek mümkündür. Örnek olarak, bir ziyaretçinin e-ticaret sitesine geliş kaynağı bilinebilmekte, hangi ürünlere baktığı, hangilerini incelediği, neleri sepetine ekleyip sonuçta hangi ürünleri satın aldığı izlenebilmektedir. Ticaretin şeklinin değişmesi, tüketici davranışlarının da gelişimine etki etmektedir. E-ticaretin sunduğu kolaylıklara bağlı olarak mağaza ziyaretçilerinin geleneksel kanala kıyasla daha serbest davranabildikleri öne sürülebilir. Örneğin, onlarca ürünü sepete atıp birkaç gün sonra satın alma işlemini tamamlama şeklinde bir davranış fizikî mağaza ortamında istisnaî olarak gözlenebilecekken, bu davranış e-ticaret müşterileri için sıradan sayılabilir. Bu çalışma kapsamında, satışa dönüştürme oranını iyileştirmeye katkı sunma amacıyla öncelikle gelişen müşteri davranışlarının anlaşılması ve e-ticarette bütünsel bir ziyaretçi deneyim haritasının çıkarılması gerektiğini savunuyoruz. Satışa dönüştürme oranının arttırılmasına yönelik gerçekleştirilen tahminleme ve ürün önerme gibi çalışmaların ise elde edilen analizlerle geliştirilip daha başarılı hale getirilmesini hedefledik. Özetle, e-ticaret alanında yapılan diğer birçok çalışmadan farklı olarak bütünsel ve aşamalı bir akış izledik. E-ticarette müşteri davranışlarının analizi ve haritalanması için süreç madenciliğinden yararlandık. 2000'li yılların sonuna kadar olan dönemde süreçlerin tanımlanması ve iyileştirilmesi süreç analistleri tarafından manuel olarak gerçekleştirilmekte, yapılan görüşmeler ve çalıştaylarda elde edilen bilgilerle hazırlanan süreçler sıklıkla gerçek uygulamayı tam olarak yansıtmamaktaydı. Süreç madenciliği ile elde edilen süreçler ise sistem logları kullanılarak elde edilir ve daha objektif akışlar içerir. Süreç madenciliği oldukça kısa bir süre içinde organizasyonlar tarafından hızla benimsenmiş, süreçleri yönetmek ve iyileştirmek için ön plana çıkan bir yaklaşım haline gelmiştir. Bu açıdan süreç madenciliği, veri bilimi alanındaki önemli inovasyonlardan biridir. Daha önce de vurguladığımız üzere her inovasyon beraberinde yeni problemler de getirmektedir. Süreç madenciliği de bundan muaf değildir. Süreç madenciliği alanındaki önemli problemlerden biri yapısal olmayan süreçlerdir. Yapısal olmayan süreçler daha gerçekçi süreçler elde etmekle birlikte ortaya çıkan anlaşılması güç diyagramlardır. Özellikle e-ticaret alanında yapılan süreç madenciliği çalışmalarında yapısallık boyutunun ele alınmamış olması, çalışmamızın ilk aşamalarını bu probleme odaklamamıza yol açtı. Ancak, bu noktada süreç madenciliği çıktılarının yapısallığının ölçümüne yönelik mevcut yöntemler veri boyutu nedeniyle kullanmak zorunda olduğumuz DFG notasyonuna uygun değildi. Ayrıca, genel süreç yapısallığı kriterleri de yeni gelişen süreç madenciliğine hitap etmiyordu. Bu şartlar altında ilk çalışmamızı süreç madenciliği için bir yapısallık ölçütü geliştirme konusunda gerçekleştirdik. Bu amaçla, ilk olarak hazırladığımız bir algoritma ile sentetik bir süreç diyagramı havuzu oluşturduk. Daha sonra konu uzmanları bu diyagramları yapısallık durumu açısından sınıflandırdı. Böylece bir sınıflama problemi için gerekli veri setini elde ettik. Lojistik regresyon kullanarak bu problemi modelledik ve süreç madenciliği özelinde bir yapısallık ölçütü geliştirdik. İkinci aşamada, yirmi milyondan fazla satırdan oluşan bir veri setinde e-ticaret müşterilerinin veya potansiyel müşterilerinin web sitesini ziyaret esnasında oluşturdukları sistemsel izleri (loglar) inceleyerek müşteri satın alma davranışlarının süreç madenciliği tekniği ile analizini gerçekleştirdik. Bu kapsamda aktivite, davranış ve süreç seviyesinde olmak üzere üç ana müşteri deneyimi kategorisi tanımladık. Ayrıca, sekiz temel müşteri davranışı ile ziyaret başlangıcı ve bitişindeki sepet durumuna göre sekiz süreç ortaya koyduk. Süreç madenciliği ile elde ettiğimiz diyagramların yapısallığını ilk aşamada geliştirdiğimiz yapısal ölçütü ile test ettik. Ek olarak sekiz süreci birleştirerek araştırmalarıza göre e-ticarette ilk uçtan uca müşteri deneyimi haritasını oluşturduk ve bununla bağlantılı yeni e-ticaret metriklerini önerdik. İkinci aşama sonunda e-ticaret müşteri davranışlarını anlama hedefine kullandığımız veri seti bağlamında ulaştık. Ancak, yapısallık ölçütünün kullanımına bağlı olarak süreç diyagramlarının elde edilmesi tekrarlı ve zahmetli bir çalışmaydı. Bu noktada işleyişi otomatikleştirmek amacıyla bir çalışma daha gerçekleştirdik. Bir topaklama algoritması geliştirerek ilk aşamada elde ettiğimiz yapısallık ölçütünü bu algoritmanın karar kriteri olarak kullandık. Algoritmayı süreç madenciliği alanında kullanılan bilinen veri setlerinde ve ikinci aşamada kullandığımız veri setinde test ettik. Elde ettiğimiz sonuçlar geliştirdiğimiz algoritmanın yapısal süreç diyagramları elde etmede başarılı olduğunu gösterdi. İlave olarak, yaptığımız çalışmada ANOVA sonuçları algoritmanın sadece DFG notasyonunda değil süreç madenciliğinde sıkça tercih edilen Petri netler için de kullanabileceğini ortaya koydu. Dördüncü ve beşinci aşamalarda elde ettiğimiz e-ticaret müşteri davranışları analizini e-ticarette ürün önerme ve tahminleme çalışmalarında kullanmaya odaklandık. Literatür taramasında oturum tabanlı öneri sistemlerinin (SBRS) yapay sinir ağlarından faydalanarak özellikle GNN bazlı algoritmalarla iyi sonuçlar verdiğini tespit ettik. Ancak, yeni GNN algoritmaları geliştirmek yerine mevcut algoritmaların sonuçlarını iyileştirmenin daha yüksek potansiyeli olması ve tercih ettiğimiz bağlamsal filtreleme alanındaki çalışmaların azlığı nedeniyle bu alana yöneldik. İkinci aşamada tanımladığımız ve en yüksek sıklıkta görülen keşfetme ve derinleşme davranışlarını dördüncü çalışmada veri seti olarak kullanmaya karar verdik. Ayrıca SBRS çalışmalarında sık kullanılan bir veri setini de bu kapsamda işledik. SBRS alanındaki herkese açık başarılı beş algoritmayı seçerek kullandığımız veri setlerinin farklı varyantlarında denemeler yaptık. Elde ettiğimiz sonuçlar önerdiğimiz bağlamsal filtreleme bazlı yöntemin mevcut algoritmaların performanslarını Recall@20 için %50 ve MRR@20 için %60'a varan oranda iyileştirdi. Böylece e-ticarette müşteri davranışlarının analizinden ve anlaşılmasından yola çıkarak web sitesi ziyaretçilerine daha doğru ürünler önerebilmeyi sağladık ve bağlantılı olarak satışa dönüştürme oranına etki edebilecek bütünsel bir yaklaşım sunduk. Son olarak, çalışmamızda SBRS'nin yanı sıra süreç madenciliğinde son dönemde ilgi gören bir konu olan sonraki aktivitenin tahmini konusuna da yer verdik. SBRS alanında yoğun olarak kullanılan GNN bazlı algoritmaların e-ticarette konusunda yapılan süreç madenciliği araştırmalarında kullanılmadığını tespit ettik. GNN kullanarak ikinci aşamada elde ettiğimiz alt veri setleriyle ve kıyaslama amaçlı iki veri setinde daha denemeler yaptık. Sonuçlar önerdiğimiz algoritmanın özellikle çalışma süresi olarak literatürdeki önde gelen yaklaşımlara göre daha iyi olduğunu gösterdi. Diğer metriklerde de mevcut algoritmalara yakın sonuçlar gözledik. Sonuç olarak, bu çalışmada, ziyaretçi davranışlarını süreç madenciliği yoluyla derinlemesine analiz ederek e-ticarette dönüşüm oranlarını artırmaya yönelik kapsamlı bir yaklaşım ortaya koyduk. Daha doğru ve otomatik süreç keşfi sağlayan yeni bir yapılandırılmışlık ölçütü geliştirilip doğruladık. Araştırmaya ayrıca davranışsal bağlamı dahil ederek ürün mevcut öneri sistemlerinin sonuçlarını iyileştirdik ve geleneksel yöntemlerden daha iyi performans gösteren GNN tabanlı bir sonraki adım tahmin algoritması sunduk. Genel olarak, elde ettiğimiz bulgular süreç madenciliğini davranışsal içgörülerle birleştirmenin çevrimiçi müşteri yolculuğunu optimize etmede değerini ortaya koymaktadır.

Özet (Çeviri)

Advancements in technology and commerce have been the drivers for improving consumer reach since the beginning of the new millennium. Ever-growing product ranges and the new channels to access the markets facilitate trade. From this perspective, e-commerce is regarded as one of the most significant innovations of today. Despite all the improvements they bring to people's lives, innovations come with specific problems. For example, conversion rates in e-commerce are significantly lower than in traditional brick-and-mortar channel. In general for retail and specifically in e-commerce, conversion rate (CR) is one of the most important performance indicators. On average, the e-commerce CR is around 1.5%, whereas in the traditional brick-and-mortar retail, immediate action is required when it falls below 15%. The fact that e-commerce has a conversion rate ten times lower than traditional channel indicates that increasing CR is among the fundamental challenges in e-commerce that require a solution. In addition to its advantages, e-commerce provides tools to address its challenges. For example, in e-commerce, vast amount of visitor data can be collected and analyzed to find solutions. Unlike traditional channels, e-commerce provides quick, easy, and unobtrusive records on visitors' activities, which are known as clickstream data. Using clickstream data it is possible to detect and track the source of traffic, which products a specific visitor browsed or compared, which products were added to cart and purchased. The evolution of trade is also shaping new consumer behaviors. It can be argued that e-commerce channel visitors are acting more freely compared with the traditional channel customers which is related with the advantages that e-commerce provides For instance, in traditional retail, it is rare for a customer to add numerous items to their cart and finalize the purchase days later. On the other hand, this behavior is common among e-commerce customers. In the scope of this study, it was argued that so as to improve CR, first of all it is a prerequisite to understand emerging visitor behaviors and map an end-to-end visitor journey map in e-commerce. Following that, it was aimed at improving the results of the studies such as prediction and product recommendation which are mainly done to improve CR by using the outcomes of the e-commerce visitor journey analysis. In summary, unlike most studies in the e-commerce domain, a holistic and phased was adopted approach. In this thesis, process mining was utilized for analyzing and mapping the e-commerce visitor journeys. Until the late 2000s, process analysis and improvement initiatives were conducted manually by process analysts. The resulting process diagrams obtained by using the information collected during interviews and workshops often did not align with actual process instances. On the contrary to this, the process diagrams mapped with process mining algorithms are produced by using system logs and they consist of more objective flows. As a result, process mining was adopted by many organizations in a very short time period and has become an outstanding approach for managing and improving the processes. From this perpsective, process mining is a groundbreaking inovation in data science. As mentioned earlier, innovations come with both advantages and challenges. Process mining is not exempted from that. One of the biggest challenges in process mining is dealing with unstructured processes. A key characteristic of unstructured processes is the hard to understand process diagrams resulting from creating more realistic process flows. In the early phases of this research, the focus was on unstructured processes, particularly due to the lack of studies on the structuredness dimension in process mining using e-commerce clickstream data. However, at this point the existing measures for the outcomes of process mining structuredness were mostly not applicable for DFG notation which was needed to be used due to the dataset size. Additionally, measures developed for process diagrams before process mining emerged as a discipline were not suitable for the purpose. Given these constraints, initial research was conducted to develop a structuredness measure for process mining. In line with this objective, first of all a synthetic process diagram dataset was created algorithmically. After that, subject matter experts classified elements of this visual dataset in terms of their structuredness. This process resulted in a dataset suitable for a classification problem. Then this problem was modelled with logistic regression and developed a structuredness measure for process mining. In the second phase, using a real-life big dataset which has over twenty-million rows, activity-, behavior-, and process-level e-commerce visitor journeys was defined. Exploitation and exploration were the most common journeys, and it was revealed that journeys with exploration behavior had significantly lower conversion rates. At the process level, the backbones of eight journeys were mapped and their qualities were tested with the empirical structuredness measure. By using cart statuses at the beginning and end of these journeys, a high-level end-to-end e-commerce journey that can be used to improve recommendation performance was obtained. Additionally, new metrics were proposed to evaluate online user journeys and to benchmark e-commerce journey design success. By the end of the second phase, a milestone in understanding e-commerce visitor behaviors based on the dataset was reached. However, the procedure that was applied to discover process mining diagrams in which the structuredness measure was used was iterative and labor-intensive. At that point, an additional research was initiated to automatize this task. By utilizing the process mining structuredness measure, an algorithm was developed. The proposed algorithm was tested by manipulating the algorithm parameters using several scenarios created from eight different datasets. Experiments demonstrated that the proposed approach was capable of helping process mining researchers and practitioners obtain better process discovery outcomes. The results indicated that with high-quality user perception models, it was possible to satisfy users' expectations while saving considerable time. The algorithm's outputs were also tested with Petri nets. ANOVA results showed that the clusters obtained using proposed algorithm had significantly better fitness and simplicity values. In the fourth and fifth phases, the focus was on leveraging e-commerce customer behavior analysis for product recommendation and prediction. From the literature, it was confirmed that Session-based Recommender Systems (SBRS) had significant potential for improving conversion rates in e-commerce by assisting visitors to find products and services that suit their preferences. Many SBRS models have progressively improved recommendation performance for the same datasets. Instead of developing even more complex algorithms than the existing ones, in the fourth phase,the focus was on harnessing the context of visitor behaviors and decided to use exploration and exploitation behaviors as a contextual pre-filtering. In addition, a new strategy for reorganizing session logs to have better contextual settings. The proposed methodology was tested using five existing SBRS models, which were run with variants of two publicly available session logs. Experiments on the exploration and exploitation of visitor behaviors showed that with more homogeneous datasets, improvements exceeding 50% in Recall@20 and 60% in MRR@20 could be achieved compared to the baseline implementation of existing SBRS models. In the last phase, next activity prediction was applied which is an emerging process mining technique. It was identified that the commonly used GNN-based algorithms in the SBRS domain had not been considered in process mining studies with e-commerce clickstream data, so a GNN-based next activity prediction algorithm was developed. It was then tested with both clickstream and business process data. Next, the results were benchmarked against two prominent next activity prediction algorithms from the literature. Experiments showed that GNN-based algorithms outperformed LSTM-based approaches in e-commerce datasets. A comparison of runtimes, especially for larger datasets, revealed that proposed approach was clearly superior to the benchmarked methodologies. In conclusion, in this study a comprehensive approach was presented to improving e-commerce conversion rates by deeply analyzing visitor behaviors through process mining. A new structuredness measure was developed and validated for enabling more accurate and automated process discovery. Product recommendation systems were also enhanced by incorporating behavioral context and a GNN-based next activity prediction algorithm was introduced that outperformed traditional methods. Overall, the findings highlighted the value of combining process mining with behavioral insights to optimize the online customer journey.

Benzer Tezler

  1. Kümeleme yöntemleri ile müşteri kanal göçü analizi

    Customer channel migration analysis with clustering methods

    GİZEM ÇALIŞKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET YASİN ULUKUŞ

  2. Discovering market insights from online product reviews through sentiment analysis

    Çevrimiçi müşteri yorumları ile duygu analizi ve pazar payı için bir içgörü aracı

    MUHAMMET ALİ KADIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERKAN IŞIKLI

  3. Satış adedini etkileyen değişkenlerin keşfi ve duyarlılık analizi uygulaması: E-ticaret örneği

    Discovery of variables affecting the number of sales and application of sensitivity analysis: E-commerce example

    RABİA AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. FETHİ ÇALIŞIR

  4. Bir e-ticaret firması için rfm analizi ve kümeleme algoritmaları kullanılarak müşteri segmentasyonu ve analizi

    Customer segmentation using rfm analysis and customer segmentation and analysis with using clustering algorithms

    HAVVA GÜLSÜM ERARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikİstanbul Medeniyet Üniversitesi

    Uygulamalı Matematik ve Hesaplamalı Bilimler Ana Bilim Dalı

    DOÇ. DR. RÜYA ŞEN

  5. Analyzing factors that influence customer decision on buying second-hand products from online platforms

    Müşterilerin çevrim içi platformlardan ikinci el ürün satın alma kararlarını etkileyen faktörlerin analizi

    MELİS ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Yönetim Bilişim SistemleriBoğaziçi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. SONA MARDİKYAN