Geri Dön

Dengesiz veri seti ile bir e-ticaret şirketi için satın alma eğilimi tahmini

Prediction of propensity to buy for an e-commerce company with an unbalanced dataset

  1. Tez No: 833201
  2. Yazar: ZEYNEP RENDECİ
  3. Danışmanlar: DOÇ. DR. GÜLDER KEMALBAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 44

Özet

Günümüzde çevrimiçi alışveriş alışkanlıklarının artması ile müşteriler, birçok farklı firmanın ürününe ulaşarak fiyat karşılaştırması yapmaları sonucunda satın almaya karar vermektedirler. Bu durum e-ticaret şirketleri arasında rekabeti arttırırken, geçmiş alışveriş verilerinden hareketle müşterilerin gelecekteki satın alma eğilimlerini tahmin etmenin önemini ortaya çıkarmıştır. Müşteriler, tüm alternatifleri inceledikten sonra bile fiyatta veya kalitede beklenti sebebi ile alışveriş yapmadıkları bilinmektedir. Bu nedenle, müşteri davranışlarını, isteklerini tahmin etmek, müşteriye uygun iletişim ve pazarlama faaliyetleri yapmak firmaların pazardaki satış performansını artırmaktadır. Satış performansını artıracak analitik çözümlerden biri de müşterilerin satın alma eğiliminin tahmin edilmesidir. Satın alma eğilimi verisinde genellikle sınıf dengesizliği problemi ile karşılaşılmaktadır. Sınıf dengesizliği problemi, sınıflandırma analizinin performansını düşürürken yanlı tahmin yapılmasına sebep olmaktadır. Bu çalışmada, sınıf dengesizliğine sahip bir veri seti üzerinden sınıflama analizi yapılacaktır. Çalışmada, dengesiz veri problemini gidermek için iki farklı yöntem kullanılacaktır: İlki, dengesiz veri seti için en uygun kesim noktası ROC analizi ile bulunacaktır. İkincisi, yeniden örnekleme teknikleri kullanılarak veri seti dengeli hale getirilecektir. ROC analizi için Youden indeksi, duyarlılık=kesinlik kriteri; yeniden örnekleme teknikleri için aşırı örnekleme alt örnekleme ve sentetik veri üretilmesi kullanılacaktır. Dengesiz veri setini sınıflandırmak için lojistik regresyon analizi yöntemi kullanılacaktır. Araştırmanın amacı, dengesiz veri seti ile sınıflandırma analizi yaparken ROC analizi ve yeniden örnekleme tekniklerinin model performansına etkisini incelemek ve en başarılı performans gösteren modeli belirlemektir. Çalışmanın yöntemi, bir e-ticaret şirketine ait veri seti üzerinde uygulanacaktır. Çalışmadan elde edilecek sonuçlara göre, müşterilerin alışveriş yapma ya da yapmama eğilimlerini sınıflandırmanın e-ticaret şirketlerinin pazarlama faaliyetlerine yön vererek karlarını arttırmalarına yardımcı olması umulmaktadır.

Özet (Çeviri)

Today, with the increase in online shopping habits, customers decide to purchase as a result of price comparisons by reaching the products of many different companies. While this situation increases the competition among e-commerce companies, it has revealed the importance of predicting the future purchasing tendencies of customers based on past shopping data. Class imbalance problem is usually encountered in purchasing propensity data. This problem reduces the performance of classification analysis and causes biased estimation. In this study, classification analysis will be done on a data set with class imbalance. Two different methods will be used to solve the unbalanced data problem: First, the most suitable cutoff point for the unbalanced data set will be found by ROC analysis. Second, the data set will be balanced using resampling techniques. Youden Index, and recall=precision criterion will be used for ROC analysis. Over sampling, under sampling and synthetic data generation will be used for resampling techniques. The unbalanceed data set will be classified by logistic regression analysis method. The aim of the research is to examine the effect of ROC analysis and resampling techniques on the model performance while performing classification analysis with an unbalanced data set and to determine the model with the most successful performance. The method of the study will be applied on the data set of an e-commerce company. According to the results of the study, it is hoped that predicting customers' propensity to buy will help e-commerce companies to increase their profits by directing their marketing activities.

Benzer Tezler

  1. E-ticaret ve dijital pazarlama sektöründe makine öğrenmesi algoritmaları kullanılarak müşteri kaybı tahmini

    Customer churn prediction using machine learning algorithms in e-commerce and digital marketing industry

    YASİN SARIYILDIZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BARIŞ TEKİN TEZEL

  2. Күндөлүк эсеп тартыштыгы көйгөйү жана анын туруктуулугу: кыргызстан мисалында

    Cari açık problemi ve sürdürülebilirlik: Kırgızistan örneği

    UUBOLSUN NURKAMİLOVA

    Yüksek Lisans

    Kırgızca

    Kırgızca

    2023

    EkonomiKırgızistan-Türkiye Manas Üniversitesi

    İktisat Ana Bilim Dalı

    DR. ZAMİRA ÖSKÖNBAEVA

  3. Sınıflandırma yöntemlerinin performansının üretilmiş ve gerçek veri setleri kullanılarak incelenmesi

    Analyzing the performance of classification methods using generated and real datasets

    ÇİĞDEM KADAİFÇİ YANMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. EYLEM DENİZ HOWE

  4. Structural convergence and its impacts on trade and growth in African countries

    Yapısal yakınlaşma ve Afrika ülkelerinde ticaret ve büyüme üzerindeki etkileri

    ALI BAKO OUSMANE

    Doktora

    İngilizce

    İngilizce

    2022

    EkonomiMarmara Üniversitesi

    İktisat Ana Bilim Dalı

    PROF. DR. MEHMET ŞİŞMAN

  5. Makine öğrenme yöntemleriyle öğrencilerin akademik performanslarının farklı öznitelik seçim teknikleri uygulanarak sınıflandırılması

    Classification of students' academic performance by different feature selection techniques by machine learning methods

    SEMA KAYALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin Üniversitesi

    Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SERKAN SAVAŞ