A comparative study for customer churn analysis via machine learning algorithms
Optimizasyon tekniklerini kullanarak müşteri kayıp analizi
- Tez No: 721691
- Danışmanlar: PROF. DR. SENİYE ÜMİT FIRAT, DR. BANU ÇALIŞ USLU
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 76
Özet
Bu tezin amacı, etkili bir müşteri kayıp tahmini (CCP) metodolojisine göre makine öğrenme algoritmalarının değerlendirilmesinin açıklayıcı bir analizini sağlamaktır. Hızla gelişen Müşteri İlişkileri Yönetimi (CRM) alanında, müşteri kaybetme eğiliminde olan müşterileri elde tutmak için uygun bir CCP metodolojisi önermek için, müşterilerden gelen hacimli bir veri setinden müşteri kaybını tahmin etmek için bir dizi veri madenciliği analizi yapılmıştır. Bu analizlerde açık kaynaklı bir veri madenciliği yazılımı olan WEKA'da oluşturulan makine öğrenimi (ML) algoritmaları kullanılmıştır. Ayrıca, sınıflandırma yaparken algoritmanın takip ettiği karar yolunu göstermek için bir karar ağacı modelinin Python uygulaması yapılmıştır. Çalışma boyunca, Türkiye'deki özel bir telekomünikasyon şirketinden sırasıyla 195712, 32905 ve 228617 olay sayılarına sahip bireysel, kurumsal ve birleşik veri kümeleri kullanılarak müşteri kaybı tahminine ilişkin bir dizi deneysel analiz yapılmıştır. Müşteri kayıp durumunun tahmini için altı veri madenciliği algoritması değerlendirildi: Lojistik Regresyon, Naive Bayes, J48 ve RandomForest, Bagging ve Boosting gibi ELM algoritmaları. RandomForest, RandomTree'yi kullanırken, Bagging temel öğrenme algoritması olarak J48'i kullanıyor. Deneysel analizler, CCP için uygulanan bu tür veri madenciliği analizlerine dayalı olarak gelecekteki müşteri kayıplarının olasılığının belirlenmesi için bazı karar ağaçlarının ve topluluk ML sınıflandırıcılarının etkinliğini doğrulamak için şirketin tarihsel veritabanından elde edilen gerçek dünya veri kümeleri ile gerçekleştirilir. Sonuçlar, J48'in tüm veri kümelerine göre Naive Bayes'ten daha iyi performans gösterdiğini ve Lojistik Regresyon sınıflandırıcı algoritmasına çok benzer sonuçlar verdiğini göstermektedir. Ayrıca, Bagging büyük boyutlu veritabanını çözmediğinden ve J48, bireysel ve eksiksiz veri setlerinde benzer doğru sonuçlar verdiğinden, müşteri kaybı tahmini için Bagging'in yanı sıra J48 karar ağacı sınıflandırıcısı da seçilebilir.
Özet (Çeviri)
The purpose of this thesis is to provide a descriptive analysis of the assessment of machine learning algorithms to an effective customer churn prediction (CCP) methodology. In the rapidly developing field of Customer Relation Management (CRM), to propose a convenient CCP methodology in order for retaining the customers who tends to churn, a set of data-mining analyses has been conducted to predict customer churn from a bulky dataset from customers with certain attributes in a telecommunication company by using machine learning (ML) algorithms built in an open-source data mining software, WEKA. Additionally, a Python implementation of a decision tree model has been made in order to show the followed decision path of the algorithm while classifying. Throughout the study, a set of experimental analyses with regards to customer churn prediction are conducted by using residential, corporate and combined datasets with number of incidences of 195712, 32905, and 228617 respectively from a private telecommunication company in Turkey. Six data mining algorithms have been evaluated for prediction of the customer churn status: Logistic Regression, Naive Bayes, J48, and ELM schemes such as RandomForest, Bagging, and Boosting. RandomForest uses RandomTree whereas the Bagging uses J48 as a base learner. The experimental analyses are conducted with real-world datasets acquired from the historical database of the company to validate the effectiveness of some decision tree and ensemble ML classifiers for determination of likelihood of future churning customers based on such data mining analyses implemented for CCP. The results show that the J48 outperforms Naïve Bayes based on all datasets and it provides very similar results as the Logistic Regression classifier scheme. Besides, since Bagging has not solved the large-sized database and J48 has given similar accurate results in the residential and complete data sets, J48 decision tree classifier can be chosen as well as Bagging for customer churn prediction.
Benzer Tezler
- Modelling service quality measurement instruments by using neural networks
Hizmet kalitesi ölçüm araçlarının sinir ağları kullanılarak modellenmesi
AŞİYAN MERİÇ
Yüksek Lisans
İngilizce
2003
Endüstri ve Endüstri MühendisliğiBaşkent ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. FAZİL ALİOĞLU
- The effects of different information sources on consumer decisions: A comparative study on company and youtuber generated contents
Farklı bilgi kaynaklarının tüketici kararlarına etkisi: Şirketler ve youtuberlar tarafından oluşturulan içerikler üzerine karşılaştırmalı bir çalışma
ECEM BİLGE ÇOLAK
Yüksek Lisans
İngilizce
2018
İşletmeİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. DERYA KARAKAŞ
- Müşteri karlılık analizinde faaliyet tabanlı ile zaman etkenli faaliyet tabanlı maliyet yöntemlerinin karşılaştırmalı olarak incelenmesi: Seyahat acentası örnek olayı
A comparative study of activity-based costing and time driven activity based costing in customer profitability analysis: Travel agency case study
VELİ ERDİNÇ ÖREN
Doktora
Türkçe
2011
TurizmAkdeniz ÜniversitesiTurizm İşletmeciliği ve Otelcilik Ana Bilim Dalı
PROF. DR. NİLÜFER TETİK
- A comparative study on design of Turkish coffee brewing machines for self-service: 'Telve', 'Kahwe' and 'Gondol'
Self servis kullanıma yönelik Türk kahvesi pişirme makineleri tasarımları üzerine karşılaştırmalı bir çalışma: 'Telve', 'Kahve' ve 'Gondol'
SELEN BAŞARIR
Yüksek Lisans
İngilizce
2005
Endüstri Ürünleri Tasarımıİzmir Yüksek Teknoloji EnstitüsüEndüstri Ürünleri Tasarımı Ana Bilim Dalı
Y.DOÇ.DR. ÖNDER ERKARSLAN
- Örgüt kültürü ile personel motivasyonu arasındaki ilişkiye yönelik karşılaştırmalı bir araştırma: Türkiye ve Afganistan örneği
A comparative study of the relationship between organizational culture and personel motivation: Example of Turkey and Afghanistan
MOHAMMAD AREF ROOZI
Yüksek Lisans
Türkçe
2021
İşletmeManisa Celal Bayar Üniversitesiİşletme Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEMRA TETİK