A multi-class approach to next session and in-session purchase prediction with real-time e-commerce data using machine learning techniques
Makine öğrenmesi modelleri ile gerçek zamanlı e-ticaret datasını kullanarak gelecek oturum ve oturum içi satın alım tahmini
- Tez No: 881075
- Danışmanlar: PROF. BERTAN YILMAZ BADUR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
- Bilim Dalı: Hesaplamalı Bilim ve Mühendislik Bilim Dalı
- Sayfa Sayısı: 68
Özet
Makine öğrenimindeki gelişmeler, hızla büyüyen e-ticaret endüstrisi için çalışma alanları doğurmaktadır. Perakendeciler, karmaşık müşteri davranışlarını daha iyi anlamanın ve tahmin etmenin yollarını aramaktadır. Karşılaşılan iki önemli problem, müşterilerin platforma tekrar gelip gelmeyeceğini ve satın alma niyetini tahmin etmektir. Literatürde sorunları ayrı ayrı ele alan farklı teknikler kullanılmaktadır, ancak platforma gelmenin nihai amacı satın alma olduğundan, iki görev birbirine oldukça bağlıdır. Bir sonraki seansın yüksek bir satın alma güdüsüyle olup olmayacağını anlamak, alınan iş aksiyonlarını çeşitlendirmek için kritik öneme sahiptir. Tezin ana amacı, satın alma niyeti olan ve olmayan sonraki oturumları başarılı bir şekilde ayıran çok sınıflı bir tahminleme modeli geliştirmektir. 38 milyon e-ticaret oturumu toplandı. LightGBM ve LSTM algoritmalarının uygulanmasının ardından, sonuçlar karşılaştırılarak LightGBM'in daha iyi performans gösterdiği görüldü. Performansı artırmak için bir birleştirme tekniği kullanılarak tekrar platforma gelmeyecek şeklinde yapılan tahminler için %68, satın almasız yapılacak seans tahminleri için %71 ve satın alma ile sonlanacak seans tahminleri için %59 F1 puanı elde edildi. Verisetinin dengesizliğini LightGBM ve LSTM tarafından kullanılan teknikten farklı bir şekilde ele almak için düşük örnekleme tekniği kullanıldı ve F1 puanlarının sırasıyla %75, %72 ve %74'e yükseldiği gözlemlendi.
Özet (Çeviri)
Advances in machine learning yield implications for the rapidly growing e-commerce industry. Retailers are looking for ways to better understand and predict complex customer behavior. Two crucial problems that exist in the domain are predicting customers' platform engagement and purchase intent. Different techniques are employed in the literature addressing the problems separately, but the two tasks are highly dependent on each other since the ultimate goal for session engagement is purchase. Understanding if a next session will be made with a high purchase motive is critical to diversify the business actions taken. The main aim of the thesis is to develop a multi-class model that successfully distinguishes the next sessions with and without purchase intention. 38 million e-commerce sessions are collected for the specific task. Following the application of state-of-the-art LightGBM and LSTM algorithms, their results are compared, where LightGBM outperformed the latter. Additionally, a simple ensembling technique is used to increase the performance, leading to a 68% F1 score for the predictions of no session, 71% for the predictions of sessions without purchase and 59% for the predictions of sessions with purchase. Furthermore, an undersampling technique is employed to handle the imbalance differently than the technique used by LightGBM and LSTM, increasing F1 scores to 75%, 72% and 74% respectively.
Benzer Tezler
- Purchase prediction and item prediction with RNN using different user-item interactions
Farklı kullanıcı-ürün etkileşim türlerini kullanarak özyineli sinir ağları ile ürün ve satış tahminlemesi
FULYA ÇELEBİ SARIOĞLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Analysis of visual design principles in art and architecture by computer vision and learning based model
Sanat ve mimaride görsel tasarım prensiplerinin bilgisayarlı görü ve öğrenme tabanlı model ile analizi
GÖZDENUR DEMİR
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ASLI KANAN
- Mixed-anion photochromic yttrium oxyhydride and gadolinium oxyhydride: Research and applications
Karışık-anyon fotokromik itriyum oksihidrat ve gadolinyum oksihidrat: Araştırma ve uygulamaları
ELBRUZ MURAT BABA
Doktora
İngilizce
2021
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiNanobilim ve Nanomühendislik Ana Bilim Dalı
PROF. DR. ESRA ZAYİM
DR. SMAGUL KARAZHANOV
- Alt sekans profil haritaları kullanılarak protein katlanması tanıma
Protein fold recognition using subsequence profile maps
RUŞEN HALEPMOLLASI
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖMER SİNAN SARAÇ
- Kaynak kısıtlı proje programlama problemlerinin çözümü için yeni yöntem ve algoritmalar
New methods and algorithms for solving the resource-constrained project scheduling problem
İHSAN UĞUR