Geri Dön

E-ticaret ve dijital pazarlama sektöründe makine öğrenmesi algoritmaları kullanılarak müşteri kaybı tahmini

Customer churn prediction using machine learning algorithms in e-commerce and digital marketing industry

  1. Tez No: 849458
  2. Yazar: YASİN SARIYILDIZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ BARIŞ TEKİN TEZEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Veri Bilimi Bilim Dalı
  13. Sayfa Sayısı: 104

Özet

E-ticaretin büyümesiyle birlikte sektördeki rekabet ortamı da artmış ve bu durum bazı şirketlerde müşteri kaybına neden olmuştur. Kaybedilen bir müşterinin yerini doldurmak amacıyla yeni bir müşteri kazanmaya çalışmanın maliyeti, mevcut bir müşteriyi elde tutmanın maliyetinden çok daha fazladır. Bu çalışmada müşteri kaybını erkenden tahminleyip önlemek amacıyla makine öğrenmesi algoritmaları kullanılarak bir müşteri kaybı tahmin modeli geliştirmek amaçlanmıştır. Geliştirilen modellerde müşterilerin app ve web analytics verileri ile birlikte müşteri ilişkileri yönetim sistemi (crm) ve satın alma bilgilerini de içeren bir e-ticaret veriseti kullanılmıştır. Veriseti dengesiz bir dağılıma sahip olduğu için SMOTE, SMOTE-Tomek Links ve maliyet duyarlı öğrenme yöntemleri uygulanarak toplam 16 farklı tahmin modeli oluşturulmuştur. Bu modeller arasından maliyet duyarlı XGBoost modeli müşteri kayıplarını en iyi tahmin eden model olarak belirlenmiştir. Bu modelin performansı hiperparametre optimizasyonu ile artırılmış ve modeldeki ağaç sayısı düşürülerek aşırı öğrenme (overfitting) riski azaltılmıştır. Oluşan final modeli test veriseti ile test edildiğinde yüzde 94,14 accuracy, yüzde 76,64 recall ve yüzde 78,36 F1 oranı elde edilmiştir. Model aynı zamanda beklenen değer yaklaşımı (expected value framework) ile değerlendirildiğinde modelin hayata geçirilmesinin şirkete kar sağlayacağı görülmüştür. Geliştirilen müşteri kaybı tahmin modeli ile kaybedilme olasılığı yüksek olan müşterilerin nasıl tahminleneceği ve bu müşterilerin kaybedilmemesi için hangi dijital pazarlama stratejilerinin uygulanması gerektiği aktarılmıştır.

Özet (Çeviri)

With the growth of e-commerce, the competitive environment in the sector has increased and this has led to customer churn in some companies. The cost of trying to acquire a new customer to replace a lost customer is much higher than the cost of retaining an existing customer. This study aims to develop a customer churn prediction model using machine learning algorithms to predict and prevent customer churns early. In the developed models, an e-commerce database is used which includes customers' app and web analytics data as well as crm and purchase information. Since the dataset has an imbalanced distribution, a total of 16 different prediction models were created by applying SMOTE, SMOTE-Tomek Links and cost-sensitive learning methods. Among these models, the cost-sensitive XGBoost model was the best customer churn prediction model. The performance of this model was improved by hyperparameter optimization and the risk of overfitting was reduced by reducing the number of trees in the model. When the final model was tested with the test dataset, 94.14 percent accuracy, 76.64 percent recall and 78.36 percent F1 ratio were obtained. At the same time, when the model is evaluated with the expected value framework, it is seen that the implementation of the model will be profitable for the company. With the customer churn prediction model developed, it was explained how to predict customers who are likely to be lost and which digital marketing strategies should be implemented to retain these customers.

Benzer Tezler

  1. İkili değişkenli verilerde Boole cebri yardımıyla bir sınıflandırma algoritmasının oluşturulması ve dijital reklamcılık üzerine uygulanması

    A classification algorithm for binary variable data using Boolean algebra and an application on digital advertising

    HAYDAR EKELİK

    Doktora

    Türkçe

    Türkçe

    2023

    Ekonometriİstanbul Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. MUSTAFA TEKİN

  2. Investigation of embedding methods on gnn basedrecommender models

    Çizge sinir ağı temelli öneri sistemleriüzerinde kullanılan gömme tipinin etkisinin araştırılması

    MUSTAFA AKER

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF YASLAN

  3. Üretimde kullanılan operatör destek odaklı artırılmış gerçeklik teknolojilerinin kullanılabilirlik kavramı kapsamında değerlendirilmesi

    Evaluation of operator support-based augmented reality technologies used in production within the concept of usability

    OSMAN ER

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALP ÜSTÜNDAĞ

  4. The effects of digital marketing tools on intermediaries' satisfaction in Turkish marine insurance market

    Türk nakliyat sigortaları pazarında dijital pazarlama araçlarının aracı memnuniyeti üzerindeki etkileri

    TAHİR KİRAZLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    SigortacılıkBahçeşehir Üniversitesi

    İşletme (İngilizce) Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SAMET AYDIN

  5. Türkiye'de havayolu şirketlerinin tanıtım çalışmalarının yolcuların karar verme sürecine etkisi

    The impact of promotional activities of airline companies in Turkey on decision making process of passengers

    NURAN KARAAĞAOĞLU

    Doktora

    Türkçe

    Türkçe

    2020

    Halkla İlişkilerMaltepe Üniversitesi

    Halkla İlişkiler ve Tanıtım Ana Bilim Dalı

    DOÇ. DR. GÜRDAL ÜLGER