Geri Dön

Enhancing customer churn prediction using advanced hyperparameter optimization: A comparative analysis with machine learning models

İlerı düzey hiperparametre optimizasyonu kullanarak müşteri kaybı tahmininin iyileştirilmesi: Makine öğrenmesı modelleri ile karşılaştırmalı bir analiz

  1. Tez No: 956846
  2. Yazar: MALAK KHALID AHMED ALNAAJI
  3. Danışmanlar: ASSOC. PROF. ATINÇ YILMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 117

Özet

Müşteri kaybı tahmini, gelir kaybını önlemek amacıyla müşterilerini elde tutması gereken şirketler için hayati öneme sahiptir. Makine öğrenmesi modelleri, churn tahmininde uygulandığında faydalı olsa da, bu modellerin etkinliği büyük ölçüde model seçimi, özellik mühendisliği, özellik çıkarımı ve hiperparametre optimizasyonuna bağlıdır. Bu çalışma, dokuz farklı ML modelinin performanslarını karşılaştırarak söz konusu bilgi alanlarını ele almaktadır. Özellik mühendisliği ve daha ileri düzeyde ön işleme adımları olarak abonelik süresi kümeleme, ödeme gecikmesi normalizasyonu ve müşteri yaşam boyu değeri hesaplaması kullanılmıştır. Sınıf dengesizliği sorununu çözmek için SMOTE aşırı örnekleme tekniği uygulanmıştır. Lojistik Regresyon, Karar Ağaçları, Rastgele Orman, XGBoost, LightGBM, Extra Trees, k-En Yakın Komşu, Gradyan Artırımı ve Sinir Ağları olmak üzere dokuz makine öğrenmesi modeli eğitilmiş ve hiperparametreleri GridSearchCV ve Bayesyen Optimizasyon ile ayarlanmıştır. Özellik temsilini geliştirmek amacıyla Temel Bileşenler Analizi (PCA), Otokodlayıcılar ve Özellik Kümeleme gibi özellik çıkarım teknikleri denenmiştir. Bu teknikler arasında, Özellik Kümeleme model performansını hafifçe artırarak en iyi sonucu vermiştir. Deneysel sonuçlara göre, GridSearchCV ve Özellik Kümeleme kullanılan LightGBM modeli %94.51 F1-skoru ve %99.70 geri çağırma (recall) değeriyle en yüksek başarıyı göstermiştir ve eğitim süresi daha kısa olmuştur. Bayesyen Optimizasyon ile kullanılan XGBoost modeli ise aynı F1 performansını (%94.40) vermiş ancak daha düşük bir tahmin (inference) süresine sahip olmuştur. Özellikle Karar Ağaçları gibi daha az karmaşık modellerde, özellik çıkarımında fark edilir bir iyileşme görülmemiş; F1-skorunda %5'lik bir artış elde edilmiştir. Bu çalışmanın sonuçları, dengesiz sınıflandırma problemlerinin çözümünde özellikle özel ayarlamalar yapılmış özellik çıkarımının önemini ortaya koymaktadır. Gelecek çalışmalarda model açıklanabilirliği, yeni özellik çıkarım yaklaşımları ve disiplinler arası uygulamalar ele alınacaktır.

Özet (Çeviri)

Customer churn prediction is essential to companies that must retain their customers in order to prevent a loss of revenue. While machine learning (ML) models have been beneficial when applied in churn prediction, the beneficence of the models heavily depends on model selection, feature engineering, feature extraction, and hyperparameter optimization. These knowledge areas are addressed in this study by comparing the performances of nine ML models. Feature engineering and higher-level preprocessing such as tenure clustering, payment delay, and computation of customer lifetime value were utilized. SMOTE oversampling was utilized to address class imbalance. Nine machine learning models—Logistic Regression, Decision Trees, Random Forest, XGBoost, LightGBM, Extra Trees, k-Nearest Neighbors, Gradient Boosting, and Neural Networks—were trained and hyperparameters were tuned with GridSearchCV and Bayesian Optimization. Feature extraction techniques such as Principal Component Analysis (PCA), Autoencoders, and Feature Agglomeration were tried in the study for improving feature representation. Among them, Feature Agglomeration slightly improved the model performance and produced the best result. Experimental results showed that LightGBM using GridSearchCV and Feature Agglomeration gave the maximum F1-score of 94.51% and 99.70% recall with a smaller training time. XGBoost with Bayesian Optimization had the same F1 performance of 94.40% but lower inference time. There was improvement noticed in feature extraction, in less complex models like Decision Trees, with a 5% improvement in F1-score. The results of the present study exemplify the importance of feature extraction special tuning solving imbalanced classification. Future work will be on model explainability, new feature extraction, and interdisciplinary applications.

Benzer Tezler

  1. Ağ trafiği tahmininde makine öğrenmesi algoritmalarının karşılaştırmalı analizi

    A comparative analysis of machine learning algorithms on network traffic forecasting

    BUSE DİLAN USLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. FERHAN ÇEBİ

  2. Enhancing customer propensity estimation success using social media data

    Sosyal medya verisi kullanarak müşteri eğilim modellerinin tahmin başarısının arttırılması

    HÜSNİYE IRMAK ÇATALOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. TEVFİK AYTEKİN

  3. Using predictive analytics methods for credit risk analysis

    Başlık çevirisi yok

    DENİZ YAVUZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    BankacılıkYeditepe Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN ŞAHİN

  4. Airline customer data analytics integrated with social network information

    Sosyal ağ bilgisi ile bütünleştirilmiş havayolu müşterisi veri analitiği

    AHMET BİROL ÇAVDAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTürk Hava Kurumu Üniversitesi

    Mühendislik Yönetimi Ana Bilim Dalı

    PROF. DR. ALİ ÇOBAN

    YRD. DOÇ. DR. NİLGÜN FERHATOSMANOĞLU

  5. Enhancing customer loyalty through collaborative co-creation of CSR initiatives evidence from Pakistan's engineering industries

    İş birliğine dayalı kurumsal sosyal sorumluluk girişimleri ile müşteri bağlılığının artırılması: Pakistan mühendislik endüstrilerinden kanıtlar

    ALİ RAZA KHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    İstanbul Gedik Üniversitesi

    Mühendislik Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUĞBAY BURÇİN GÜMÜŞ