A comparative study for customer churn analysis via machine learning algorithms
Optimizasyon tekniklerini kullanarak müşteri kayıp analizi
- Tez No: 721691
- Danışmanlar: PROF. DR. SENİYE ÜMİT FIRAT, DR. BANU ÇALIŞ USLU
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 76
Özet
Bu tezin amacı, etkili bir müşteri kayıp tahmini (CCP) metodolojisine göre makine öğrenme algoritmalarının değerlendirilmesinin açıklayıcı bir analizini sağlamaktır. Hızla gelişen Müşteri İlişkileri Yönetimi (CRM) alanında, müşteri kaybetme eğiliminde olan müşterileri elde tutmak için uygun bir CCP metodolojisi önermek için, müşterilerden gelen hacimli bir veri setinden müşteri kaybını tahmin etmek için bir dizi veri madenciliği analizi yapılmıştır. Bu analizlerde açık kaynaklı bir veri madenciliği yazılımı olan WEKA'da oluşturulan makine öğrenimi (ML) algoritmaları kullanılmıştır. Ayrıca, sınıflandırma yaparken algoritmanın takip ettiği karar yolunu göstermek için bir karar ağacı modelinin Python uygulaması yapılmıştır. Çalışma boyunca, Türkiye'deki özel bir telekomünikasyon şirketinden sırasıyla 195712, 32905 ve 228617 olay sayılarına sahip bireysel, kurumsal ve birleşik veri kümeleri kullanılarak müşteri kaybı tahminine ilişkin bir dizi deneysel analiz yapılmıştır. Müşteri kayıp durumunun tahmini için altı veri madenciliği algoritması değerlendirildi: Lojistik Regresyon, Naive Bayes, J48 ve RandomForest, Bagging ve Boosting gibi ELM algoritmaları. RandomForest, RandomTree'yi kullanırken, Bagging temel öğrenme algoritması olarak J48'i kullanıyor. Deneysel analizler, CCP için uygulanan bu tür veri madenciliği analizlerine dayalı olarak gelecekteki müşteri kayıplarının olasılığının belirlenmesi için bazı karar ağaçlarının ve topluluk ML sınıflandırıcılarının etkinliğini doğrulamak için şirketin tarihsel veritabanından elde edilen gerçek dünya veri kümeleri ile gerçekleştirilir. Sonuçlar, J48'in tüm veri kümelerine göre Naive Bayes'ten daha iyi performans gösterdiğini ve Lojistik Regresyon sınıflandırıcı algoritmasına çok benzer sonuçlar verdiğini göstermektedir. Ayrıca, Bagging büyük boyutlu veritabanını çözmediğinden ve J48, bireysel ve eksiksiz veri setlerinde benzer doğru sonuçlar verdiğinden, müşteri kaybı tahmini için Bagging'in yanı sıra J48 karar ağacı sınıflandırıcısı da seçilebilir.
Özet (Çeviri)
The purpose of this thesis is to provide a descriptive analysis of the assessment of machine learning algorithms to an effective customer churn prediction (CCP) methodology. In the rapidly developing field of Customer Relation Management (CRM), to propose a convenient CCP methodology in order for retaining the customers who tends to churn, a set of data-mining analyses has been conducted to predict customer churn from a bulky dataset from customers with certain attributes in a telecommunication company by using machine learning (ML) algorithms built in an open-source data mining software, WEKA. Additionally, a Python implementation of a decision tree model has been made in order to show the followed decision path of the algorithm while classifying. Throughout the study, a set of experimental analyses with regards to customer churn prediction are conducted by using residential, corporate and combined datasets with number of incidences of 195712, 32905, and 228617 respectively from a private telecommunication company in Turkey. Six data mining algorithms have been evaluated for prediction of the customer churn status: Logistic Regression, Naive Bayes, J48, and ELM schemes such as RandomForest, Bagging, and Boosting. RandomForest uses RandomTree whereas the Bagging uses J48 as a base learner. The experimental analyses are conducted with real-world datasets acquired from the historical database of the company to validate the effectiveness of some decision tree and ensemble ML classifiers for determination of likelihood of future churning customers based on such data mining analyses implemented for CCP. The results show that the J48 outperforms Naïve Bayes based on all datasets and it provides very similar results as the Logistic Regression classifier scheme. Besides, since Bagging has not solved the large-sized database and J48 has given similar accurate results in the residential and complete data sets, J48 decision tree classifier can be chosen as well as Bagging for customer churn prediction.
Benzer Tezler
- Enhancing customer churn prediction using advanced hyperparameter optimization: A comparative analysis with machine learning models
İlerı düzey hiperparametre optimizasyonu kullanarak müşteri kaybı tahmininin iyileştirilmesi: Makine öğrenmesı modelleri ile karşılaştırmalı bir analiz
MALAK KHALID AHMED ALNAAJI
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBüyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
ASSOC. PROF. ATINÇ YILMAZ
- Ağ trafiği tahmininde makine öğrenmesi algoritmalarının karşılaştırmalı analizi
A comparative analysis of machine learning algorithms on network traffic forecasting
BUSE DİLAN USLAN
Yüksek Lisans
Türkçe
2025
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. FERHAN ÇEBİ
- Modelling service quality measurement instruments by using neural networks
Hizmet kalitesi ölçüm araçlarının sinir ağları kullanılarak modellenmesi
AŞİYAN MERİÇ
Yüksek Lisans
İngilizce
2003
Endüstri ve Endüstri MühendisliğiBaşkent ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. FAZİL ALİOĞLU
- The effects of different information sources on consumer decisions: A comparative study on company and youtuber generated contents
Farklı bilgi kaynaklarının tüketici kararlarına etkisi: Şirketler ve youtuberlar tarafından oluşturulan içerikler üzerine karşılaştırmalı bir çalışma
ECEM BİLGE ÇOLAK
Yüksek Lisans
İngilizce
2018
İşletmeİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. DERYA KARAKAŞ
- A comparative study of private and public banks in libya: Service quality and customer satisfaction
Libya'daki özel ve kamu bankalarinin karşilaştirmali bir çalişmasi: Hizmet kalitesi ve müşteri memnuniyeti
AYUOB SEDIG ELHADI SAUD
Yüksek Lisans
İngilizce
2025
Yönetim Bilişim SistemleriANKARA BİLİM ÜNİVERSİTESİYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. GÖRKEM ERDOĞAN