Telekomünikasyon sektörü için veri madenciliği ve makine öğrenmesi teknikleri ile ayrılan müşteri analizi
Churn analysis for telecommunication sector with data mining and machine learning
- Tez No: 691011
- Danışmanlar: DOÇ. DR. MUSTAFA CEM KASAPBAŞI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: İstanbul Ticaret Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Son yıllarda şirketler arası rekabetin artmasıyla beraber aboneliğinden ayrılacak müşterilerin tahmin edilmesi oldukça önemli hale gelmiştir. Ayrılan müşteri analizi, veri madenciliği, makine öğrenmesi ve derin öğrenme gibi yapay zekâ alanlarında sıklıkla karşılaşılan analiz çeşitlerinden biridir. Özellikle telekomünikasyon, sigortacılık ve bankacılık gibi sektörlerde yaygın olarak kullanılmaktadır. Bu çalışma da veri madenciliği ve makine öğrenmesi teknikleri ile aboneliğini sonlandırma ihtimali olan müşterileri tahmin etmeyi amaçlamaktadır. Bu çalışma Lojistik Regresyon, Karar Ağacı, Yapay Sinir Ağları, Torbalama (Bagging) ve Artırma (Boosting) sınıflandırma modelleri kullanılarak arasından en iyi sonucu bulmayı önermiştir. Veri setinde sınıf dengesizliği olduğu için SMOTE (Synthetic Minority Oversampling Technique) ve ADASYN (Adaptive Synthetic Sampling Method) tekniği ile örnekleme yapılmıştır. Bu çalışmada, 2 adet tahmin modeli önerilmiştir ve tahmin modelleri Veri Seti, Veri Ön İşleme, Veri Örnekleme, Değerlendirme olarak 4 farklı aşamadan oluşmaktadır. Veri Ön İşleme aşamasında, kullanılmayan ve önemsiz özniteliklerin veri setinden çıkartılması, normalizasyon, şifreleme ve aşırı örnekleme gibi birçok yöntem kullanılmıştır. Performans ölçütü olarak Doğruluk Oranı, Geri Çağırma (Recall), Hassasiyet (Precision) ve Özgünlük (Specificity), Dengelenmiş Doğruluk Oranı gibi birçok değer kullanılmıştır. Performans ölçütlerine göre en iyi tahmin modeli, ADASYN örnekleme yöntemi kullanılan model olmuştur. Sınıflandırma yöntemi olarak en iyi sonucu veren LightGBM (Light Gradient Boosting Machine) tekniği olmuştur. Önerilen modeller arasında Veri Ön İşleme ve Veri Örnekleme aşamalarında farklılıklar bulunmaktadır. Bu çalışmada önerilen tahmin modellerinin eğitim süresi, benzer çalışmalara göre daha iyi performans sağladığı tespit edilmiştir. Ayrıca bu çalışmada, sadece 58 öznitelik kullanarak 172 öznitelik kullanan benzer çalışmaların başardığına çok yakın sonuçlar elde edilmiştir.
Özet (Çeviri)
With the increasing competition among companies in recent years, it has become very important to estimate the customers who are churned. Churn is one of the most common types of analysis, especially in areas such as data mining, machine learning and deep learning. It is widely used in sectors such as telecommunications, insurance and banking. In this study, it purpose to predict customers who may end their subscription with data mining and machine learning techniques. This study proposed to find the best result from using Logistic Regression, Decision Tree, Artificial Neural Network, Bagging and Boosting classification models. For the data set was unstable, sampling was performed using SMOTE (Synthetic Minority Oversampling Technique) and ADASYN (Adaptive Synthetic Sampling Method) technique. In the study, 2 prediction models are proposed and the proposed prediction models consist of 4 different phases as Data Set, Data Pre-Processing, Data Sampling and Evaluation. In the Data Pre-Processing phase, many methods were used, such as removing unused and unimportant features from the data set, normalization, encoding and oversampling. Accuracy Rate, Recall, Precision and Specificity, Balanced Accuracy Rate and Area Under the ROC Curve (ROC-AUC) value were used as performance measures. Considering the performance measures, the best prediction model suggested was the model using ADASYN sampling method. As the classification method, the best success was the LightGBM (Light Gradient Boosting Machine) technique. There are differences in the Data Pre-Processing and Data Sampling stages phases the proposed models. It was determined that the prediction models proposed in this study provide better performance than similar studies. Also, in this study, results very close to those achieved by similar studies using 172 features using only 58 features were obtained.
Benzer Tezler
- A comparison of the performance of ensemble classification methods in telecom costumer churn analysis
Telekomünikasyon sektörü müşteri ayrılma analizinde birleştirmeli sınıflandırma yöntemleri performanslarının karşılaştırması
GÖKÇE KALABALIK
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET CUDİ OKUR
- System design for internet of things and network coding applications in the wireless personal area networks
Nesnelerin interneti için sistem tasarımı ve kablosuz kişisel alan ağlarında ağ kodlama uygulamaları
GÖRKEM ÖZVURAL
Yüksek Lisans
İngilizce
2015
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜNEŞ KARABULUT KURT
- Telekomünikasyon sektörünün veri madenciliği yöntemleri ile incelenmesi: Uluslararası Telekomünikasyon Birliği üye ülkeleri örneği
Investigation of telecommunication sector with data mining methods: The case of International Telecommunication Union member states
GÜRKAN KOLAYLI
Doktora
Türkçe
2023
Yönetim Bilişim SistemleriTrakya Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. FATMA LORCU
- Churn prediction in telecommunication sector
Telekom sektörleri için topluluk sınıflandırıcılarla ayrılma tahmini
FAIZA HASSAN MOHAMED
Yüksek Lisans
İngilizce
2021
Endüstri ve Endüstri Mühendisliğiİstanbul Ticaret ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
Assist. Prof. Dr. MUSTAFA CEM KASAPBAŞI
- Cep telefonu kullanıcı davranışı modelleme
Mobile phone user behavior modelling
DUYGU SİNANÇ
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞEREF SAĞIROĞLU