Predictive modeling of return occurrence in e-commerce apparel market: A comparative study of logistic regression, LASSO, XGBoost and Random Forest techniques
E-ticaret giyim pazarında iade tahmini modelleme: Lojistik regresyon, LASSO, XGBoost ve Rastgele Orman tekniklerinin karşılaştırmalı bir çalışması
- Tez No: 871010
- Danışmanlar: YRD. DOÇ. DR. YASEMİN LİMON KAHYAOĞLU, DOÇ. DR. FEHMİ TANRISEVER
- Tez Türü: Yüksek Lisans
- Konular: İşletme, Business Administration
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Ekonomi ve Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: İşletme Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 65
Özet
Bu çalışma, Türkiye'de faaliyet gösteren bir e-ticaret şirketinin giyim segmentinde iade oluşumu için tahmin modelinin geliştirilmesine odaklanmaktadır. Şirket tarafından sağlanan verileri kullanarak, araştırma çeşitli makine öğrenimi tekniklerini kullanarak iade oluşumları üzerinde çeşitli faktörlerin etkisini keşfetmektedir. Modeller, ürün, tedarikçi, müşteri ve alışveriş bilgileri ile ilgili tahmin edici değişkenlerin yanı sıra bu değişkenlerin etkileşimini de içerecek şekilde geliştirilmiştir. Nihai modeli basitleştirmek ve en etkili değişkenleri seçmek için LASSO uygulanmıştır. Modeller, AUC skoru, doğruluk, kesinlik ve duyarlılık gibi performans metrikleri ile karşılaştırılmıştır. Lojistik regresyon modelinin AUC skoru açısından XGBoost ve Rastgele Orman'dan daha iyi performans sergilediği görülmektedir.
Özet (Çeviri)
This study focuses on the development of a predictive model for return occurrence in the apparel segment of an e-commerce company based in Turkey. Leveraging data provided by the company, the research employs various machine learning techniques to explore the impact of various factors on return. Models are developed, incorporating predictor variables related to product, supplier, customer and shopping information with the final model also including interaction of these variables. LASSO is applied to simplify the final model and select the most relevant variables. Performance metrics; AUC score, accuracy, precision, and recall are evaluated for the models, with comparisons made between logistic regression, LASSO, XGBoost, and Random Forest. Findings indicate that logistic regression models outperform XGBoost and Random Forest in terms of AUC score.
Benzer Tezler
- Purchase prediction and item prediction with RNN using different user-item interactions
Farklı kullanıcı-ürün etkileşim türlerini kullanarak özyineli sinir ağları ile ürün ve satış tahminlemesi
FULYA ÇELEBİ SARIOĞLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Catchment scaled drought analysis: Integrated climate and hydrological perspectives
Havza ölçeğinde kuraklık analizi: Entegre iklim ve hidrolojik perspektifleri
SAEED VAZIFEHKHAH
Doktora
İngilizce
2018
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ERCAN KAHYA
- Elektronik kartların saha verilerine dayalı güvenilirlik analizi
Reliability analysis of electronic boards based on field data
SALİH VEHBİ CÖMERT
Yüksek Lisans
Türkçe
2015
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUSTAFA ALTUN
- Antenna design for breast cancer detection and machine learning approach for birth weight prediction
Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı
HALUK KIRKGÖZ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR KURT