Geri Dön

A multi-class approach to next session and in-session purchase prediction with real-time e-commerce data using machine learning techniques

Makine öğrenmesi modelleri ile gerçek zamanlı e-ticaret datasını kullanarak gelecek oturum ve oturum içi satın alım tahmini

  1. Tez No: 881075
  2. Yazar: GİZEM SÜRHAN
  3. Danışmanlar: PROF. BERTAN YILMAZ BADUR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
  12. Bilim Dalı: Hesaplamalı Bilim ve Mühendislik Bilim Dalı
  13. Sayfa Sayısı: 68

Özet

Makine öğrenimindeki gelişmeler, hızla büyüyen e-ticaret endüstrisi için çalışma alanları doğurmaktadır. Perakendeciler, karmaşık müşteri davranışlarını daha iyi anlamanın ve tahmin etmenin yollarını aramaktadır. Karşılaşılan iki önemli problem, müşterilerin platforma tekrar gelip gelmeyeceğini ve satın alma niyetini tahmin etmektir. Literatürde sorunları ayrı ayrı ele alan farklı teknikler kullanılmaktadır, ancak platforma gelmenin nihai amacı satın alma olduğundan, iki görev birbirine oldukça bağlıdır. Bir sonraki seansın yüksek bir satın alma güdüsüyle olup olmayacağını anlamak, alınan iş aksiyonlarını çeşitlendirmek için kritik öneme sahiptir. Tezin ana amacı, satın alma niyeti olan ve olmayan sonraki oturumları başarılı bir şekilde ayıran çok sınıflı bir tahminleme modeli geliştirmektir. 38 milyon e-ticaret oturumu toplandı. LightGBM ve LSTM algoritmalarının uygulanmasının ardından, sonuçlar karşılaştırılarak LightGBM'in daha iyi performans gösterdiği görüldü. Performansı artırmak için bir birleştirme tekniği kullanılarak tekrar platforma gelmeyecek şeklinde yapılan tahminler için %68, satın almasız yapılacak seans tahminleri için %71 ve satın alma ile sonlanacak seans tahminleri için %59 F1 puanı elde edildi. Verisetinin dengesizliğini LightGBM ve LSTM tarafından kullanılan teknikten farklı bir şekilde ele almak için düşük örnekleme tekniği kullanıldı ve F1 puanlarının sırasıyla %75, %72 ve %74'e yükseldiği gözlemlendi.

Özet (Çeviri)

Advances in machine learning yield implications for the rapidly growing e-commerce industry. Retailers are looking for ways to better understand and predict complex customer behavior. Two crucial problems that exist in the domain are predicting customers' platform engagement and purchase intent. Different techniques are employed in the literature addressing the problems separately, but the two tasks are highly dependent on each other since the ultimate goal for session engagement is purchase. Understanding if a next session will be made with a high purchase motive is critical to diversify the business actions taken. The main aim of the thesis is to develop a multi-class model that successfully distinguishes the next sessions with and without purchase intention. 38 million e-commerce sessions are collected for the specific task. Following the application of state-of-the-art LightGBM and LSTM algorithms, their results are compared, where LightGBM outperformed the latter. Additionally, a simple ensembling technique is used to increase the performance, leading to a 68% F1 score for the predictions of no session, 71% for the predictions of sessions without purchase and 59% for the predictions of sessions with purchase. Furthermore, an undersampling technique is employed to handle the imbalance differently than the technique used by LightGBM and LSTM, increasing F1 scores to 75%, 72% and 74% respectively.

Benzer Tezler

  1. Purchase prediction and item prediction with RNN using different user-item interactions

    Farklı kullanıcı-ürün etkileşim türlerini kullanarak özyineli sinir ağları ile ürün ve satış tahminlemesi

    FULYA ÇELEBİ SARIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF YASLAN

  2. Analysis of visual design principles in art and architecture by computer vision and learning based model

    Sanat ve mimaride görsel tasarım prensiplerinin bilgisayarlı görü ve öğrenme tabanlı model ile analizi

    GÖZDENUR DEMİR

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ASLI KANAN

  3. Mixed-anion photochromic yttrium oxyhydride and gadolinium oxyhydride: Research and applications

    Karışık-anyon fotokromik itriyum oksihidrat ve gadolinyum oksihidrat: Araştırma ve uygulamaları

    ELBRUZ MURAT BABA

    Doktora

    İngilizce

    İngilizce

    2021

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Nanobilim ve Nanomühendislik Ana Bilim Dalı

    PROF. DR. ESRA ZAYİM

    DR. SMAGUL KARAZHANOV

  4. Alt sekans profil haritaları kullanılarak protein katlanması tanıma

    Protein fold recognition using subsequence profile maps

    RUŞEN HALEPMOLLASI

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÖMER SİNAN SARAÇ

  5. Kaynak kısıtlı proje programlama problemlerinin çözümü için yeni yöntem ve algoritmalar

    New methods and algorithms for solving the resource-constrained project scheduling problem

    İHSAN UĞUR

    Doktora

    Türkçe

    Türkçe

    1987

    İşletmeİstanbul Teknik Üniversitesi

    PROF.DR. ATAÇ SOYSAL