Makine öğrenmesi algoritmaları kullanılarak modem verisi üzerinden müşteri memnuniyetinin tahmini
Estimation of customer satisfaction using machine learning algorithms over modem
- Tez No: 898802
- Danışmanlar: DR. ÖĞR. ÜYESİ İBRAHİM ZOR
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 83
Özet
Verinin aktarılması, ayrıştırılması ve algoritmaların test edilmesi gibi tüm süreçlerde KNIME Analitik Platformu kullanılmıştır. Modem verileri haftalık bazda ele alınmış ve indirme-yükleme verileri kategorize edilerek 6 farklı saat diliminde değerlendirilmiştir. Sınıflandırma analizinde ise AutoML üzerinden çalışmalar yapılmıştır. Burada değerlendirilen algoritmalar; Sade Bayes, Lojistik Regresyon, Sinir Ağları, Gradyan Artırma Ağaçları, Karar Ağacı, Rastgele Orman ve XGBoost'dur. Kullanılan kütüphane ve platformlar ise; Genelleştirilmiş Doğrusal Modeller için H2O yazılımı, Derin Öğrenme için Keras Kütüphanesi ve diğer birçok algoritma için H2O AutoML (Otomatik Edilmiş Makine Öğrenmesi) çatısıdır. Bu çalışmada amaç memnuniyetsiz müşterileri belirlemektir. Dengesiz bir veri kümesi ile çalışma yapıldığından dolayı farklı veri çoklama teknikleri kullanılmıştır. Memnuniyetsiz müşterileri bulmak için modemlere ait sorunlu sinyal bilgisi ve arıza kaydı bırakan abonelere ait veriler üzerinden işaretleme yapılmıştır. Uygulama sonucunda, veriye Temel Bileşenler Analizi yöntemi ile 4 Temel Bileşen indirgemesi yapılması ve sonrasında verinin rastgele seçilerek SMOTE (Synthetic Minority Over-sampling) tekniği ile verinin zenginleştirilmesi modeli iyileştirmiştir. Genel olarak ağaç algoritmaları dengesiz veri üzerinden sınıflandırma problemini çözmede daha iyi sonuçlar vermiştir. Algoritmalar arasında seçim yapmak için Duyarlılık (TPR) ve Seçicilik (TNR) değerlerinin geometrik ortalaması (GBA), ağırlıklı ortalaması (WPN) ve Bookmaker Informedness (BM) kriterleri kullanılmıştır. Bu ölçütlerdeki sonuçların birbirine yakın olmasından dolayı, FP (False Positive – Yanlış Pozitif) oranı daha düşük üzerinden değerlendirme yapılmıştır. Bunun seçilmesinin nedeni memnuniyetsiz müşteriye yapılacak olan yatırım maliyetini düşürmektir. Burada uygulanan 10 adet algoritma ve kütüphane içerisinden en iyi sonuçları XGBoost algoritmasının verdiği görülmüştür.
Özet (Çeviri)
The KNIME Analytics Platform was used throughout all processes, including data transfer, parsing, and algorithm testing. Modem data was analyzed weekly, and download-upload data was categorized and evaluated across six different time slots. For classification analysis, AutoML was utilized, assessing algorithms such as Naive Bayes, Logistic Regression, Neural Networks, Gradient Boosted Trees, Decision Trees, Random Forest, and XGBoost. The libraries and platforms used include H2O software for Generalized Linear Models, the Keras library for Deep Learning, and H2O AutoML for various other algorithms. The aim of this study is to identify dissatisfied customers. Different sampling methods were used due to working with an unbalanced dataset. Data from modems with faulty signal information and data from subscribers who left a service complaint were used for labeling. The model was improved by reducing the data to four Principal Components using Principal Component Analysis (PCA) and then enriching it with the SMOTE (Synthetic Minority Over-sampling) technique. Tree-based algorithms yielded better results in solving the classification problem on imbalanced data. Algorithms were evaluated based on the geometric mean of Sensitivity (TPR) and Specificity (TNR), weighted average (WPN), and Bookmaker Informedness (BM) criteria. Due to the closeness of the results, the False Positive (FP) rate was chosen as the final criterion to minimize the investment cost in dissatisfied customers. XGBoost provided the best results among the ten algorithms applied.
Benzer Tezler
- Perakende hazır giyim firmasında makine öğrenmesi yöntemleriyle satış tahmini
Sales forecasting in a retail fashion company using machine learning methods
ŞEYMA GÖNEN HALICI
Yüksek Lisans
Türkçe
2024
İşletmeİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. FERHAN ÇEBİ
- Model tabanlı kestirimci bakım ile kalan faydalı ömür tahmini
Estimation of remaining useful life with model based predictive maintenance
ENGİN MÖNGÜ
Doktora
Türkçe
2022
Mühendislik Bilimleriİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
DOÇ. DR. HULUSİ GÜLSEÇEN
- Developing a life insurance recommendation system using machine learning methods
Makine öğrenme yöntemleri kullanarak hayat sigortası öneri sistemi geliştirmesi
ASLI HAZAL AKALTUN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBüyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
DOÇ. DR. TEVFİK AYTEKİN
- Advanced mobility robustness optimization techniques in mobile heterogeneous networks with the inclusion of 5G
5G dahil mobil heterojen ağlarda gelişmiş mobilite sağlamlık optimizasyon tekniği
WAHEEB SALIM ABDULRAB TASHAN
Doktora
İngilizce
2023
Elektrik ve Elektronik MühendisliğiKocaeli ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. SULTAN ALDIRMAZ ÇOLAK
- Elektrik dağıtım şebekelerinde teknik olmayan kayıp kaçakların makine öğrenmesi ile tespiti
Non-technical loss detection on electricity distrubution grids with machine learning
MUSTAFA ÇELİKPENÇE
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. FERZAT ANKA