Dengesiz veri seti ile bir e-ticaret şirketi için satın alma eğilimi tahmini
Prediction of propensity to buy for an e-commerce company with an unbalanced dataset
- Tez No: 833201
- Danışmanlar: DOÇ. DR. GÜLDER KEMALBAY
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 44
Özet
Günümüzde çevrimiçi alışveriş alışkanlıklarının artması ile müşteriler, birçok farklı firmanın ürününe ulaşarak fiyat karşılaştırması yapmaları sonucunda satın almaya karar vermektedirler. Bu durum e-ticaret şirketleri arasında rekabeti arttırırken, geçmiş alışveriş verilerinden hareketle müşterilerin gelecekteki satın alma eğilimlerini tahmin etmenin önemini ortaya çıkarmıştır. Müşteriler, tüm alternatifleri inceledikten sonra bile fiyatta veya kalitede beklenti sebebi ile alışveriş yapmadıkları bilinmektedir. Bu nedenle, müşteri davranışlarını, isteklerini tahmin etmek, müşteriye uygun iletişim ve pazarlama faaliyetleri yapmak firmaların pazardaki satış performansını artırmaktadır. Satış performansını artıracak analitik çözümlerden biri de müşterilerin satın alma eğiliminin tahmin edilmesidir. Satın alma eğilimi verisinde genellikle sınıf dengesizliği problemi ile karşılaşılmaktadır. Sınıf dengesizliği problemi, sınıflandırma analizinin performansını düşürürken yanlı tahmin yapılmasına sebep olmaktadır. Bu çalışmada, sınıf dengesizliğine sahip bir veri seti üzerinden sınıflama analizi yapılacaktır. Çalışmada, dengesiz veri problemini gidermek için iki farklı yöntem kullanılacaktır: İlki, dengesiz veri seti için en uygun kesim noktası ROC analizi ile bulunacaktır. İkincisi, yeniden örnekleme teknikleri kullanılarak veri seti dengeli hale getirilecektir. ROC analizi için Youden indeksi, duyarlılık=kesinlik kriteri; yeniden örnekleme teknikleri için aşırı örnekleme alt örnekleme ve sentetik veri üretilmesi kullanılacaktır. Dengesiz veri setini sınıflandırmak için lojistik regresyon analizi yöntemi kullanılacaktır. Araştırmanın amacı, dengesiz veri seti ile sınıflandırma analizi yaparken ROC analizi ve yeniden örnekleme tekniklerinin model performansına etkisini incelemek ve en başarılı performans gösteren modeli belirlemektir. Çalışmanın yöntemi, bir e-ticaret şirketine ait veri seti üzerinde uygulanacaktır. Çalışmadan elde edilecek sonuçlara göre, müşterilerin alışveriş yapma ya da yapmama eğilimlerini sınıflandırmanın e-ticaret şirketlerinin pazarlama faaliyetlerine yön vererek karlarını arttırmalarına yardımcı olması umulmaktadır.
Özet (Çeviri)
Today, with the increase in online shopping habits, customers decide to purchase as a result of price comparisons by reaching the products of many different companies. While this situation increases the competition among e-commerce companies, it has revealed the importance of predicting the future purchasing tendencies of customers based on past shopping data. Class imbalance problem is usually encountered in purchasing propensity data. This problem reduces the performance of classification analysis and causes biased estimation. In this study, classification analysis will be done on a data set with class imbalance. Two different methods will be used to solve the unbalanced data problem: First, the most suitable cutoff point for the unbalanced data set will be found by ROC analysis. Second, the data set will be balanced using resampling techniques. Youden Index, and recall=precision criterion will be used for ROC analysis. Over sampling, under sampling and synthetic data generation will be used for resampling techniques. The unbalanceed data set will be classified by logistic regression analysis method. The aim of the research is to examine the effect of ROC analysis and resampling techniques on the model performance while performing classification analysis with an unbalanced data set and to determine the model with the most successful performance. The method of the study will be applied on the data set of an e-commerce company. According to the results of the study, it is hoped that predicting customers' propensity to buy will help e-commerce companies to increase their profits by directing their marketing activities.
Benzer Tezler
- E-ticaret ve dijital pazarlama sektöründe makine öğrenmesi algoritmaları kullanılarak müşteri kaybı tahmini
Customer churn prediction using machine learning algorithms in e-commerce and digital marketing industry
YASİN SARIYILDIZ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BARIŞ TEKİN TEZEL
- Күндөлүк эсеп тартыштыгы көйгөйү жана анын туруктуулугу: кыргызстан мисалында
Cari açık problemi ve sürdürülebilirlik: Kırgızistan örneği
UUBOLSUN NURKAMİLOVA
Yüksek Lisans
Kırgızca
2023
EkonomiKırgızistan-Türkiye Manas Üniversitesiİktisat Ana Bilim Dalı
DR. ZAMİRA ÖSKÖNBAEVA
- Sınıflandırma yöntemlerinin performansının üretilmiş ve gerçek veri setleri kullanılarak incelenmesi
Analyzing the performance of classification methods using generated and real datasets
ÇİĞDEM KADAİFÇİ YANMAZ
Yüksek Lisans
Türkçe
2024
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. EYLEM DENİZ HOWE
- Structural convergence and its impacts on trade and growth in African countries
Yapısal yakınlaşma ve Afrika ülkelerinde ticaret ve büyüme üzerindeki etkileri
ALI BAKO OUSMANE
- Makine öğrenme yöntemleriyle öğrencilerin akademik performanslarının farklı öznitelik seçim teknikleri uygulanarak sınıflandırılması
Classification of students' academic performance by different feature selection techniques by machine learning methods
SEMA KAYALI
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin ÜniversitesiElektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERKAN SAVAŞ