Customer churn analysis based on machine learning by using data mining techniques in telecommunication sector
Telekomünikasyon sektöründe veri madencilik tekniklerini kullanarak makine öğrenmesine dayalı müşteri terk analizi
- Tez No: 563793
- Danışmanlar: DOÇ. DR. AŞKIN DEMİRAĞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Yeditepe Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 147
Özet
Günümüzde artan rekabet ortamında, işletmeler için müşterilerin ihtiyaç, talep ve beklentilerini yakından takip ederek en uygun ve en hızlı şekilde cevap verme zorunluluğu doğurmuştur. Müşterilerle karşılıklı faydaya dayanan ilişkiler geliştirerek müşteri sadakatini kazanmayı ve bu sayede işletmeye uzun vadeli fayda sağlamayı amaçlanmaktadır. Günümüzde yeni müşteriler kazanmanın maliyeti, varolan müşterileri bünyesinde tutmanın maliyetinden çok daha fazladır. Bu yüzden ayrılacağı önceden tahmin edilen müşterilere promosyon, indirim, hediye ya da avantajlar sağlanması müşterinin ayrılmasını engelleyebilecek ve böylece şirketler uzun vadede daha fazla kâr elde edebileceklerdir. Ancak yapılacak yanlış tahminler, ayrılmayacak müşteriye ayrılacakmış gibi davranmamıza neden olabilir. Bu da müşteriye gereksiz promosyon ya da hediye uygulanmasını gerektirir. Yani şirket için bunun anlamı, gereksiz para kaybıdır. Bu nedenle ayrılacak müşteriyi doğru tahmin etmekte şirketler için önemlidir. İşletmeler, teknolojinin de yardımıyla farklı kaynaklardan topladıkları verileri çeşitli veri madenciliği yöntemleriyle inceleyerek müşterilere ait daha geçerli bilgiler elde edebilmekte ve bu sayede müşterilerle daha etkili bir iletişim geliştirebilmektedir ve devamlılığını sağlayabilmektedir. Bu tez çalışmasında telekomünikasyon Şirketine ait müşteri verileri üzerinde ayrılacak müşterileri önceden tahmin edebilmek amacıyla çeşitli veri madenciliği teknikleri ve makine öğrenmesi yöntemlerinden olan sınıflandırma algoritmaları kullanılmıştır. Bu analiz için kullanılan veri seti 7166 müşteriye ait en etkili 100 özellik ve müşterinin terk edip terk etmediğine dair sınıf etiketinden oluşmaktadır. Veri setindeki müşterilerin 328'i churn etmiştir ve churn etme durumunu en yüksek oranla tahmin etme amaçlanmıştır. Train test split ile veri seti %70 - %30 oranında eğitim ve test veri setine ayrılmıştır. Data üzerinde scale ve log dönüşümleri yapılmıştır. En etkili 100 feature seçilerek analize alınmıştır. Sınıflandırma algoritmaları ile elde edilen modellerin performansları incelenmiştir. Bu çalışmada telekomünikasyon Şirketine ait müşteri verileri üzerinde makine öğrenmesi algoritmaları Logistic Regression, K Nearest Neighbour (KNN), Naive Bayes, Random Forest, Decision Tree, Support Vector Machine ve Gradient Boosting algoritmaları kullanılarak müşteri ayrılma analizi yapılmış ve söz konusu algoritmaların bu analiz için etkinliği belirlenmeye çalışılmıştır. En yüksek tutarlılık oranını sahip olan algoritmalar 0.72 ile K Nearest Neighbour ve Random Forest olmuştur. 0.65 ile Logistic Regression, 0.62 ile Support Vector Machine, 0.61 ile Gradient Boosting, 0.57 ile Naive Bayes ve 0.56 ile Decision Tree sonuç vermiştir.
Özet (Çeviri)
In today's increasingly competitive environment, it is necessary to follow the needs, demands, and expectations of customers closely for the enterprises and to respond in the most appropriate and fastest way. It aims to gain customer loyalty by developing mutual relations with customers and thus to provide long term benefit to the enterprise. Today, the cost of earning new customers is much more than the cost of keeping existing customers. Providing promotions, rebates, gifts or benefits to the customers who are anticipated to churn will be able to hinder the churn customer and thus make more profit in the long term. However, if the wrong prediction is made, this causes unnecessary promotions or gifts to the customer. So for the company, this means a waste of unnecessary money. Therefore, it is important for companies to correctly estimate the churn customer. With the help of technology, enterprises can analyze the data they collect from different sources by using various data mining methods and obtain more valid information about the customers and thus develop more effective communication with customers and ensure their continuity. In this thesis, various data mining techniques and classification algorithms of machine learning were used in order to predict the churn on customer data belonging to the telecommunication company. In the data set, there are 7166 customers' data and there is a flag whether the customer churn or not. Also, 328 customers of the data set have churn label. It aims to estimate churn customers with the highest rate. With the train test split, the data set is divided into 70% - 30% training and test data set. Scale and log transformations are performed on data. The 100 most effective features were selected. The performance of the models obtained by classification algorithms is examined. In this study, customers' data are analyzed with machine learning algorithms by using the Logistic Regression, K Nearest Neighbour (KNN), Naive Bayes, Random Forest, Decision Tree, Support Vector Machine and Gradient Boosting algorithms. K Nearest Neighbour and Random Forest have 0.72 accuracy score that the highest accuracy score among algorithms used. Logistic Regression has 0.65 accuracy score, Support Vector Machine has 0.62 accuracy score, Gradient Boosting has 0.61 accuracy score, Naive Bayes has 0.57 accuracy score and Decision Tree has 0.56 accuracy score.
Benzer Tezler
- A comparative study for customer churn analysis via machine learning algorithms
Optimizasyon tekniklerini kullanarak müşteri kayıp analizi
ZEYNEP UYAR ERDEM
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri MühendisliğiMarmara ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SENİYE ÜMİT FIRAT
DR. BANU ÇALIŞ USLU
- Farklı platformlarda sunulan f2p oyunlarındaki satın alma kararlarının makine öğrenmesi yöntemleriyle tahmin edilmesi
Prediction of purchasing decisions in f2p games offered on different platforms with machine learning methods
KAAN ARIK
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
PROF. DR. SEDA TOLUN TAYALI
DOÇ. DR. MURAT GEZER
- Alışveriş merkezleri için çeşitli çevresel faktörlere göre müşteri adedi tahminleme çalışması
Estimation of customer numbers for shopping centers according to various environmental factors
ÇAĞATAY ÖZDEMİR
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEZİ ÇEVİK ONAR
- RFMLP based customer segmentation and customer churn analysis in heavy equipment industry using customer transactions data
İş makinesi sektöründe müşteri işlem verilerini kullanarak RFMLP tabanlı müşteri segmentasyonu ve müşteri kayıp analizi
MUSTAFA ÇAMLICA
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. FETHİ ÇALIŞIR
- Ağaç temelli makine öğrenmesi yöntemleri ile telekomünikasyon sektöründe müşteri kayıp analizi
Customer churn analysis in the telecommunications sector using tree-based machine learning methods
BAŞAK CEREN SEÇİK GÖÇER
Yüksek Lisans
Türkçe
2024
MatematikYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM EMİROĞLU