Telekomünikasyon sektöründe müşteri kayıp analizi
Customer churn analysis in telecommunication industry
- Tez No: 473065
- Danışmanlar: YRD. DOÇ. DR. FATİH KAYAALP
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: Türkçe
- Üniversite: Düzce Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 126
Özet
İnsanların ihtiyaçlarına göre tüketim tercihleri farklılıklar gösterir. Müşteriye yatırım yapan kurumlar da bu tercihleri öngöremezler. Özellikle müşteri odaklı kurumlar yeni müşteri kazanma ve eldeki müşteriyi memnun ederek müşteri kaybını önlemeye çalışırlar. Müşteri odaklı sektörlerden birisi olan Telekomünikasyon şirketleri de müşteri kazanmak ve mevcut müşterilerini kaybetmemek isterler. İşte bu noktada çeşitli yollar ile müşterilerinin kaybını tahmin etmeye yönelik çalışmalar yaparlar. Bu tez çalışmasında, veri madenciliği ve makine öğrenmesi yöntemlerinden olan sınıflandırma algoritmaları ile müşteri kayıp analizi yapılmıştır. Bu analiz yapılırken makine öğrenmesi süreci adımlarından olan veri madenciliği üzerine çapraz endüstri standart süreç modeli (CRISP) kullanılmıştır. Sınıflandırma algoritmaları ile elde edilen modellerin performansları çapraz geçerleme ve hold-out performans yöntemleri ile değerlendirilmiştir. Çapraz geçerleme katı olarak 4 kat, 5 kat ve 10 kat çapraz geçerleme kullanılmıştır. 4 kat, 5 kat ve 10 kat çapraz geçerleme ile performans değerlendirmesinde karar ağaçları algoritmaları ile kurulan modeller, diğer modellere göre daha iyi bir performans göstermiştir. En iyi performansı gösteren C4.5 karar ağacı algoritmasının performansı yaklaşık olarak 0.98'dir. C4.5 karar ağacından sonra sırasıyla ID3 ve gini karar ağaçları, k-en yakın komşu ve bayes algoritmaları ile oluşturan modeller gelmektedir. k-en yakın komşu algoritması karar ağaçlarından sonra gelse de performansı C4.5 karar ağacına yakındır. Hold-out yöntemi ile veri seti %60-%40, %75-%25, %80-%20 ayrım oranlarına sahip sırasıyla eğitim ve test veri setine ayrılmıştır. Bu veri setleri üzerinde yapılan performans değerlendirmelerinde ise k-kat çapraz geçerlemedeki gibi benzer sonuç veren C4.5 karar ağacı en iyi performansı göstermiştir. Sonrasında k-kat çapraz geçerleme performans yönteminde yakın değerlere sahip olduğu ID3 ve Gini karar ağaçlarını geçen k-en yakın komşu algoritması olmuştur. En son sırada ise bayes algoritması yer almaktadır. k-en yakın komşu algoritmasının ID3 ve Gini karar ağaçlarını geçmesi hold-out ile rastgele ayrımda daha iyi performans göstermesinden dolayıdır. Veri madenciliği programı olarak kullanılan R sayesinde veri görselleştirme üzerine de bir çalışma yapılmıştır. Bu çalışmalara ek olarak sınıflandırma algoritmalarından en iyi sonucu veren C4.5 Karar ağacı algoritması ile oluşturulan model R paketlerinden Shiny ile web uygulaması yapılarak dinamik hale getirilmiştir.
Özet (Çeviri)
Consumption preferences of people vary depending on their needs. And, institutions investing in clients cannot predict these preferences. Especially, customer-oriented institutions try to gain new customers and prevent customer churn by satisfying existing customers. Telecommunications industry is one of the customer-oriented industries. Telecommunication companies also want to gain customers, without losing existing customers. At this point, they engage in prediction of customer churn using various methods. In this thesis study, customer churn analysis was performed with classification algorithms, which are among the data mining and machine learning methods. In carrying out this analysis, the Cross Industry Standard Process for Data Mining (CRISP) model, which is one of the machine learning process steps, was used. The thesis was explained through the steps of the CRISP model from identification of problem to model selection. The performances of the models obtained by the classification algorithms were evaluated by the cross-validation and hold-out performance methods. The 4-fold, 5-fold and 10-fold cross-validations were used. Models built with decision tree algorithms in performance evaluation with 4-fold, 5-fold and 10-fold cross-validation showed better performance than the other models. The performance of the best performing C4.5 decision tree was approximately 0.98. The C4.5 decision tree was followed by the models created with ID3, Gini decision trees, k-nearest neighbors and Bayes algorithms, respectively. Although the k-nearest neighbor algorithm comes after the decision trees, its performance was closer to that of C4.5 decision tree. In the performance evaluations performed on the training-test dataset with the 60-40%, 75-25% and 80-20% separation ratios with the hold-out method, respectively, the best-performing was the C4.5 decision tree, similar to that of k-fold cross-validation performance. This was followed by ID3 and Gini decision tree and k-nearest neighbor algorithm, with close values as in k-fold cross-validation performance method. The Bayes algorithm had the worst performance. Since the k-nearest neighbor algorithm ID3 and Gini perform better at random distinction with hold-out of decision trees. A study on data visualization has also been carried out through R which is used as a data mining program. In addition to these studies, C4.5, which gives the best result from the classification algorithms, has been rendered dynamic by making web application with Shiny from the R packets generated by the decision tree algorithm.
Benzer Tezler
- Telekomünikasyon sektöründe müşteri kayıp analizi
Customer churn analysis in telecommunication industry
İMRAN ÖZCAN
Yüksek Lisans
Türkçe
2022
Endüstri ve Endüstri MühendisliğiHaliç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÇAĞRI ÖZGÜN KİBİROĞLU
- Telekomünikasyon sektöründe müşteri segmentasyonu ve müşteri kayıp analizi
Customer segmentation and customer churn analysis in the telecommunication sector
RAMİS BAŞKAL
Yüksek Lisans
Türkçe
2019
Bilim ve TeknolojiHaliç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÜLVİYE HACIZADE
- Öznitelik seçimi ile telekomünikasyon sektöründe kayıp müşteri analizi
Customer churn analysis in telecommunication sector by feature selection
HANDAN DONAT
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri Mühendisliğiİstanbul Üniversitesi-CerrahpaşaEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. TARIK KÜÇÜKDENİZ
- Ağaç temelli makine öğrenmesi yöntemleri ile telekomünikasyon sektöründe müşteri kayıp analizi
Customer churn analysis in the telecommunications sector using tree-based machine learning methods
BAŞAK CEREN SEÇİK GÖÇER
Yüksek Lisans
Türkçe
2024
MatematikYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM EMİROĞLU
- Telekomünikasyon sektöründe müşteri sınıflandırma ve kayıp analizi
In the telecommunication industry customer classification and loss analysis
MERVE AYDOĞDU ÖZEL
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiHaliç ÜniversitesiMühendislik Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÇAĞRI ÖZGÜN KİBİROĞLU