Enhancing customer churn prediction using advanced hyperparameter optimization: A comparative analysis with machine learning models
İlerı düzey hiperparametre optimizasyonu kullanarak müşteri kaybı tahmininin iyileştirilmesi: Makine öğrenmesı modelleri ile karşılaştırmalı bir analiz
- Tez No: 956846
- Danışmanlar: ASSOC. PROF. ATINÇ YILMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 117
Özet
Müşteri kaybı tahmini, gelir kaybını önlemek amacıyla müşterilerini elde tutması gereken şirketler için hayati öneme sahiptir. Makine öğrenmesi modelleri, churn tahmininde uygulandığında faydalı olsa da, bu modellerin etkinliği büyük ölçüde model seçimi, özellik mühendisliği, özellik çıkarımı ve hiperparametre optimizasyonuna bağlıdır. Bu çalışma, dokuz farklı ML modelinin performanslarını karşılaştırarak söz konusu bilgi alanlarını ele almaktadır. Özellik mühendisliği ve daha ileri düzeyde ön işleme adımları olarak abonelik süresi kümeleme, ödeme gecikmesi normalizasyonu ve müşteri yaşam boyu değeri hesaplaması kullanılmıştır. Sınıf dengesizliği sorununu çözmek için SMOTE aşırı örnekleme tekniği uygulanmıştır. Lojistik Regresyon, Karar Ağaçları, Rastgele Orman, XGBoost, LightGBM, Extra Trees, k-En Yakın Komşu, Gradyan Artırımı ve Sinir Ağları olmak üzere dokuz makine öğrenmesi modeli eğitilmiş ve hiperparametreleri GridSearchCV ve Bayesyen Optimizasyon ile ayarlanmıştır. Özellik temsilini geliştirmek amacıyla Temel Bileşenler Analizi (PCA), Otokodlayıcılar ve Özellik Kümeleme gibi özellik çıkarım teknikleri denenmiştir. Bu teknikler arasında, Özellik Kümeleme model performansını hafifçe artırarak en iyi sonucu vermiştir. Deneysel sonuçlara göre, GridSearchCV ve Özellik Kümeleme kullanılan LightGBM modeli %94.51 F1-skoru ve %99.70 geri çağırma (recall) değeriyle en yüksek başarıyı göstermiştir ve eğitim süresi daha kısa olmuştur. Bayesyen Optimizasyon ile kullanılan XGBoost modeli ise aynı F1 performansını (%94.40) vermiş ancak daha düşük bir tahmin (inference) süresine sahip olmuştur. Özellikle Karar Ağaçları gibi daha az karmaşık modellerde, özellik çıkarımında fark edilir bir iyileşme görülmemiş; F1-skorunda %5'lik bir artış elde edilmiştir. Bu çalışmanın sonuçları, dengesiz sınıflandırma problemlerinin çözümünde özellikle özel ayarlamalar yapılmış özellik çıkarımının önemini ortaya koymaktadır. Gelecek çalışmalarda model açıklanabilirliği, yeni özellik çıkarım yaklaşımları ve disiplinler arası uygulamalar ele alınacaktır.
Özet (Çeviri)
Customer churn prediction is essential to companies that must retain their customers in order to prevent a loss of revenue. While machine learning (ML) models have been beneficial when applied in churn prediction, the beneficence of the models heavily depends on model selection, feature engineering, feature extraction, and hyperparameter optimization. These knowledge areas are addressed in this study by comparing the performances of nine ML models. Feature engineering and higher-level preprocessing such as tenure clustering, payment delay, and computation of customer lifetime value were utilized. SMOTE oversampling was utilized to address class imbalance. Nine machine learning models—Logistic Regression, Decision Trees, Random Forest, XGBoost, LightGBM, Extra Trees, k-Nearest Neighbors, Gradient Boosting, and Neural Networks—were trained and hyperparameters were tuned with GridSearchCV and Bayesian Optimization. Feature extraction techniques such as Principal Component Analysis (PCA), Autoencoders, and Feature Agglomeration were tried in the study for improving feature representation. Among them, Feature Agglomeration slightly improved the model performance and produced the best result. Experimental results showed that LightGBM using GridSearchCV and Feature Agglomeration gave the maximum F1-score of 94.51% and 99.70% recall with a smaller training time. XGBoost with Bayesian Optimization had the same F1 performance of 94.40% but lower inference time. There was improvement noticed in feature extraction, in less complex models like Decision Trees, with a 5% improvement in F1-score. The results of the present study exemplify the importance of feature extraction special tuning solving imbalanced classification. Future work will be on model explainability, new feature extraction, and interdisciplinary applications.
Benzer Tezler
- Ağ trafiği tahmininde makine öğrenmesi algoritmalarının karşılaştırmalı analizi
A comparative analysis of machine learning algorithms on network traffic forecasting
BUSE DİLAN USLAN
Yüksek Lisans
Türkçe
2025
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. FERHAN ÇEBİ
- Enhancing customer propensity estimation success using social media data
Sosyal medya verisi kullanarak müşteri eğilim modellerinin tahmin başarısının arttırılması
HÜSNİYE IRMAK ÇATALOĞLU
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TEVFİK AYTEKİN
- Using predictive analytics methods for credit risk analysis
Başlık çevirisi yok
DENİZ YAVUZ
Yüksek Lisans
İngilizce
2020
BankacılıkYeditepe ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKHAN ŞAHİN
- Airline customer data analytics integrated with social network information
Sosyal ağ bilgisi ile bütünleştirilmiş havayolu müşterisi veri analitiği
AHMET BİROL ÇAVDAR
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTürk Hava Kurumu ÜniversitesiMühendislik Yönetimi Ana Bilim Dalı
PROF. DR. ALİ ÇOBAN
YRD. DOÇ. DR. NİLGÜN FERHATOSMANOĞLU
- Enhancing customer loyalty through collaborative co-creation of CSR initiatives evidence from Pakistan's engineering industries
İş birliğine dayalı kurumsal sosyal sorumluluk girişimleri ile müşteri bağlılığının artırılması: Pakistan mühendislik endüstrilerinden kanıtlar
ALİ RAZA KHAN
Yüksek Lisans
İngilizce
2024
İstanbul Gedik ÜniversitesiMühendislik Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUĞBAY BURÇİN GÜMÜŞ