RFMLP based customer segmentation and customer churn analysis in heavy equipment industry using customer transactions data
İş makinesi sektöründe müşteri işlem verilerini kullanarak RFMLP tabanlı müşteri segmentasyonu ve müşteri kayıp analizi
- Tez No: 713829
- Danışmanlar: PROF. DR. FETHİ ÇALIŞIR
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 75
Özet
Teknoloji ve bilgi sistemlerindeki gelişmelerle birlikte tonlarca veri oluşturuldu ve gelecekte de oluşturulmaya devam edecek. Günümüz dünyasında işletmeler zorlayıcı iş dünyasında bir ayakta kalabilmek için verilerden yararlanmak zorundadır. Şirketler uzun vadede daha başarılı olmak ve daha iyi kararlar verebilmek adına veriden yararlanmaya çalışmaktadır. Verinin doğru ve verimli kullanılması şirketler için kaçınılmazdır. Şirketlerin aldığı aksiyonlar ve günlük operasyonları sonucu üretilen veri günden güne artmaktadır, bu durum oldukça iyi görünse de bu veriden anlamlı içgörü elde etmenin karmaşıklığı gibi dezavantajları da vardır. Değişen ve zorlayıcı pazar koşullarında müşteriyi tanımak ve anlamak başarının anahtarı gibi görünüyor. Şirketler başarılı olmak için müşterilerini tanımalı ve onları anlamalıdırlar. Şirketlerin veritabanlarında depolanan oldukça büyük miktarda veri mevcuttur bunlara örnek olarak müşteri bilgi verisi, etkileşim verisi, işlem verisi, davranış verisi ve tutum verisi verilebilir. İş uzmanlarının bu derece çeşitlendirilmiş veriden anlamlı içgörüler elde etmenin yollarını bulması gerekmektedir. Verinin miktarı ve boyutu arttığında, veriden anlamlı bilgileri elde etmenin karmaşıklığı da artmaktadır. Bu nedenle iş uzmanları analitik ve güncel yöntemler kullanmalıdırlar. Uzun vadede başarılı olmak için şirketler finansal gelirlerini artırmanın yollarını aramalı, müşteri hizmet seviyelerini geliştirmeli ve daha iyi müşteri deneyimi sağlamanın yöntemlerini bulmaya yatırım yapmalıdırlar. Günümüz iş ortamında şirketler en önemli varlıklarının müşterileri olduğunu anladılar ve bu nedenle müşterileri ve onların isteklerini anlamak için yatırım yapmalıdırlar. Müşteri segmentasyonu şirketlere müşterilerini tanıma, onların gereksinimlerini anlama ve en önemli olan müşterileri belirleme fırsatı vermektedir. Bu nedenle şirketler müşteri segmentasyonu akışı kurgulamak için çeşitli yatırımlar yapmalıdırlar. Şirketler, işlerini sürdürmek için yeni müşteriler bulmalı ve onlarla sözleşme yapmalıdır. Yeni müşteriler bulmak önemlidir, ancak mevcut müşterileri elde tutmak da oldukça önemlidir. Kârlı müşterilerle uzun vadeli sözleşmeler yapmak, kârı artırmak için kaçınılmazdır. Şirketle uzun vadeli ilişki içinde olan müşteriler daha fazla kâr sağlar, zorlu piyasa koşullarına karşı daha az duyarlı olur ve şirket için olumlu yönlendirmelerde bulunabilirler. Yeni müşteri bulmak mevcut müşterinin kaybolmasını önlemekten çok daha zorlayıcı ve maliyetlidir. Geçmiş müşteri bilgileri verisi, şirketlerin müşteri kaybıyla mücadele etmesinde oldukça yüksek bir öneme sahiptir. Şirketler, rekabetçi pazarlarda ayakta kalabilmek için tahmine dayalı modeller kullanarak gelecekteki müşteri kayıplarını tespit etmelidir. Müşteri kayıpları müşteri davranışları gözlemlenerek tahminlenebilmektedir. Müşteri kayıp analizi yöntemleri, şirketlerin risk altındaki müşterilere karşı bir takım önlemler almasına olanak tanıyabilmektedir. Farklı müşterilerin, farklı tercih ve öncelikleri vardır, bu nedenle onlarla proaktif bir yaklaşımla iletişim kurmak, onları elde tutmak için oldukça önemlidir. Dijital pazarlar, iletişim sektörleri, perakende satış ve otomotiv endüstrisi gibi birçok farklı sektörde müşteri kayıp analizi projeleri yapılabilmektedir. Kayıp analizinde makine öğrenmesi ve matematiksel modelleme teknikleri kullanılmaktadır. Makine öğrenmesi yapay zekanın bir alt dalıdır ayrıca sistemlere ve bilgisayarlara geçmiş deneyimlerden öğrenme ve geliştirme fırsatı vermektedir. Makine öğrenmesi kendi kendine veriye erişebilen ve insan yardımı olmadan veriden öğrenebilen bilgisayar programları geliştirmeye odaklanmaktadır. Makine öğrenmesi ile gelecekteki bir olayın sonucu tahmin edilebilir veya insanlar tarafından tespit edilmesi zor olan kalıpları ortaya çıkarılabilir. Kullanıcılar, anlamlı içgörü elde etmek, olaylar araı ilişkileri bulmak ve olayların gelecekteki sonuçlarını tahmin etmek için makine öğrenmesinden faydalanmaktadırlar. Gözetimli öğrenme, makine öğrenmesinin bir alt dalıdır ve her bir kaydı için hedef değişkeninde bilinen bir değer olan verisetini işleyebilmektedir. Sınıflandırma ve regresyon modelleri gözetimli öğrenmeye örnek olarak verilebilir. Gözetimsiz öğrenme ise hedef değişkeni tanımlı olmayan verisetlerinin kullanıldığı makine öğrenmesinin başka bir alt dalıdır. Gözetimsiz öğrenmeden önceden tanımlanmış bir çıktı bulunmamaktadır. Kümeleme, anomali tespiti, birliktelik analizi ve gizli değişken modelleri gözetimsiz öğrenme modellerine örnek olarak verilebilir. İnşaat işlerinin sanayileşmesi ile birlikte hem verimlilik hem de üretkenlik açısından iş makinelerine olan ihtiyaç artmaktadır. İş makinesi sektörünün pazar büyüklüğü günden güne artmaktadır. Altyapı, madencilik, ormancılık ve tarım gibi iş makinelerinin kullanıldığı bir çok sektör bulunmaktadır. Türkiye, iş makineleri sektöründe aktif bir pazara ve rekabet açısından oldukça zorlu koşullara sahiptir. Bu nedenle Türkiye iş makineleri pazarında bulunan firmalar, müşterilerini anlamak ve müşteri kayıplarını azaltmak adına projeler tamamlamalıdır. Bu çalışmanın ana hedefi, Türkiye'de faaliyet gösteren iş makinesi sektörünün önde gelen firmalarından Borusan-CAT'in müşteri işlem verisini kullanarak müşteri segmentleri oluşturmak ve her bir müşteriye kayıp olasılıkları atamak olarak özetlenebilir. Bu bağlamda şirketin veritabanından 2018 – 2020 dönemi için müşteri işlem verisi çekildi ardından ham verinin çalışmada kullanılabilmesi adına veri ön işleme aşaması tamamlanmıştır. Değişkenlerin ve müşteri segmentlerinin önemine karar verebilmek adına şirketin 5 yöneticisinin katılımıyla Analitik Hiyerarşi Süreci'nden yararlanılmıştır. Değişkenlerin önemine karar verildikten sonra, k-ortalama kümeleme olarak bilinen gözetimsiz makine öğrenmesi algoritması ile müşteri segmentasyonu tamamlanmıştır. Bu kapsam 4 farklı müşteri segmenti oluşturulmuştur. Analitik Hiyerarşi Yöntemi ile elde edilen ağırlıkların kullanılması ile her bir müşteri segmentinin önemi hesaplanmıştır. Müşteri segmentasyonun ardından müşteri kayıp analizi tamamlanmıştır. Müşteri kayıp analizi lojistik regresyon, destek vektör makineleri, k en yakın komşu ve rastgele orman olarak bilinen gözetimli öğrenme teknikleriyle tamamlanmıştır. Her bşr algoritmanın performansı diğerleri ile karşılaştırıldığında, bu çalışmada gelecekteki müşteri kayıplarını tahmin etmek konusunda Rastgele Orman algoritması en başarılı ve en yüksek doğruluk oranına sahip olan algoritma olarak belirlenmiştir. Algoritmaların varsayımları kontrol edildiğine herhangi bir ihlal bulunmamaktadır, böylece her bir algoritma bu çalışmada kullanılabilir. Müşteri kayıp analizi ile veri setinde bulunan her bir müşteri gelecekte kaybedilecek veya kaybedilmeyecek olacak şekilde etiketlenmiştir. Şirketler, bu bilgileri gelecekteki olası müşteri kayıplarını engellemek adına çeşitli projelerde kullanabilirler. Bu çalışmanın katkıları, Türkiye'de faaliyetlerine devam eden bir şirketin müşteri işlem verisini kullanarak, zaman-etkin ve verimli bir makine öğrenmesi algoritması ile RFMLP tabanlı müşteri segmentasyonunun uygulanması ve müşteri kayıp analizinin gözetimli makine öğrenmesi algoritmaları ile uygulanması olarak özetlenebilir. Bu çalışma ile 4 farklı müşteri segmenti oluşturulmuş ve müşteri kayıp analizi yüksek doğruluk oranıyla hesaplanmıştır. İş makinesi sektöründeki firmalar bu çalışmadan farklı müşteri gruplarını belirlemek, müşteri profilleri oluşturmak , müşteri ilişkileri yönetimi ve pazarlama stratejilerini yönetebilmek ve kaynak tahsisini yüksek verimlilikle tamamlamak adına faydalanabilir.
Özet (Çeviri)
With the enhancement in technology and information systems, tons of data have been created and will be created in the future. In today's world, businesses must utilize from data to survive in a challenging environment. For long-term success and to make a better decision, companies are trying to use data. Correct and efficient usage of data is inevitable for companies. Amount of data that is created by companies' actions is getting higher day by day, this situation seems to be good however it has some disadvantages such as the complexity of getting meaningful insights from data. Understanding and identifying the customer seems key to success in the changing and challenging market places. Companies should know and recognize their customers to become successful. Massive amount of data of customers stored in databases such as customer information data, transaction data, interaction data, behavioral data, attitudinal data etc. Business experts need to find ways to extract meaningful insights from such diversified data. The complexity of extracting valuable information from data gets challenging when amount and dimensionality of data is increased. That's why business experts should use analytical and up-to-date methods. To become successful in the long run, companies should seek ways to increase their financial incomes, enhance their customer service levels and invest in finding ways of improved customer experience. In today's business environment companies realized that their most important asset is their customers, therefore they need to invest to understand their customers and their requirements. Customer segmentation gives opportunities to companies to identify their customers, understand their requirements, and recognize the most important customers. Thus companies should invest to create continuous customer segmentation stream. Companies should need to find and contract with new customers in order to maintain business. Finding new customers is important, but customer retention is also critical. Creating long-term contracts with profitable customers is inevitable to increase profits. Customers who are in the long run with the company create more profits and they are likely to be less sensitive to chalenging market conditions and they can provide positive referrals. Attracting new customers is very hard and more costly than preventing the current customer from churning. Historical customer information data is very important for companies to combat with customer churn. Companies should detect future churners by using predictive models to survive competitive markets. Prediction of churn can be completed by observing customer behavior or individual behaviors that have signs of attrition. Churn analysis methods allow companies to take some actions against customers at risk. Different customers need different preferences; thus, proactively communicating with them is critical to retain them in the customer list. Churn analysis projects are completed in many different industries such as digital markets, communication industries, banking, insurance, retail stores, online platforms and automative industries. Usage of mathematical modelling and machine learning techniques is unavoidable during prediction process. In order to have long term success companies need to find ways to prevent their customers from churning. Machine learning is a sub-field of artificial intelligence that gives learning and improvement opportunities from past experiences to systems and computers. Machine learning generally focuses on developing computer programs that can access data and learn from data without human assistance. By using machine learning one can predict a future outcome or uncover patterns that are hard to spot by humans. Users apply machine learning algorithms to uncover meaningful insights, find relations and predict future results of events. Supervised learning is one of the sub-fields of machine learning that can handle and use labeled datasets which is a dataset that has known values for each record of the target variable. Classification and regression models can be represented as categories of supervised learning. Unsupervised learning is another sub-field of machine learning that is used when it comes to an unlabeled dataset or in other words there are no predefined outcomes in unsupervised learning algorithms. Clustering, anomaly detection, association mining and latent variable models are categories of unsupervised learning. With the industrialization of construction work, the need for heavy equipment is increased for both efficiency and productivity. The market size of the machinery industry is also growing. There are many sectores in which heavy equipment is used such as infrastructure, mining, agriculture, forestry. Turkey has also an active market in the heavy equipment industry and has very challenging conditions for competition. Therefore in Turkey's heavy equipment market, companies should complete projects in order to understand their customers and prevent them from churning. The main target of this study is creating customer segments with customer transaction data of one of the leading heavy equipment industry companies, Borusan-CAT operating in Turkey which is a solution partner of Caterpillar Inc., and assigning churn probabilities to each customer. Customer transaction data is collected for the 2018 – 2020 period from complex database of the company. Data pre-processing step is completed in order to use raw data in this study. To decide the importance of the variables and customer segments Analytical Hierarchy Process was used 5 managers of the company respond a questionnare. After deciding the weight importance of the variables customer segmentation was completed with one of the unsupervised machine learning algorithms known as k-means clustering. 4 different customer segments were created. The importance of each customer segment was calculated with the help of weights that is result of Analytical Hierarchy Method. After customer segmentation, customer churn analysis was conducted. Churn analysis was completed with the help of supervised machine learning algorithms such as Logistic Regression, Support Vector Machines, Random Forest, and k-Nearest Neighbors. By comparing performance of each algorithm with the others, Random Forest was found as the most successful algorithm with highest accuracy rate in this study when it comes to predicting the customers who will churn in upcoming periods. There are no violations of the assumptions of each algorithm, therefore each of them can be used in this study. With customer churn analysis, each customer in the dataset labeled as churners or non-churners. Companies can use this information in order to complete such projects to prevent possible churners from churning in the future. Contributions of this study can be said as applying RFMLP based customer segmentation with a time-effective and efficient machine learning algorithm and applying customer churn analysis with the help of supervised machine learning algorithms to the customer transaction data of one of the biggest heavy equipment companies in Turkey. With this study 4 different customer segments are created and customer churn prediction is completed with high accuracy. Companies in the heavy equipment industry can utilize from this study to identify different customer groups and profile them, they manage their CRM and marketing strategies and allocation of resources can be completed with high effectiveness.
Benzer Tezler
- Hepatit B virus genotiplerinin S geninin nükleotid dizi analizi ve RFLP yöntemleri ile belirlenmesi
Analysis of S. gene nucleotide sequence of hepatitis B. virus cenotypes and determining them with RFLP methods
NEVCİVAN ŞENTÜRKER GÜLDAŞ
Doktora
Türkçe
2002
MikrobiyolojiDokuz Eylül ÜniversitesiMikrobiyoloji ve Klinik Mikrobiyoloji Ana Bilim Dalı
PROF. DR. Y. HAKAN ABACIOĞLU
- p53 yolağında yer alan mdm2 ve p53 genlerinde görülen tek nükleotid polimorfizimlerinin meme kanserli hastalarda araştırılması
Research of single nucleotide polymorphisms found in MDM2 and p53 genes in p53 pathway on patients with breast cancer
BAHADDİN ARI
Yüksek Lisans
Türkçe
2008
BiyolojiÇukurova ÜniversitesiBiyoloji Ana Bilim Dalı
DOÇ. DR. HATİCE KORKMAZ GÜVENMEZ
PROF. DR. HİKMET AKKIZ
- Acil servise başvuran akut koroner sendrom hastalarında peroksizom proliferatör aktive reseptör alfa, gama polimorfizminin araştırılması
Investigation of peroxisome proliferator-activated protein alpha and gamma gene polymorphism in acute coronary syndrome patients admidted to emergency department
AYKUT KEMANCI
Tıpta Uzmanlık
Türkçe
2021
BiyofizikPamukkale ÜniversitesiAcil Tıp Ana Bilim Dalı
PROF. DR. İBRAHİM TÜRKÇÜER
- Koroner arter hastalarında matriks metaloproteinaz-2 ve anjiotensin dönüştürücü enzim gen polimorfizminin araştırılması
Research of matrix metalloproteinase-2 and angiotensin converting enzyme gene polymorphism in coronary artery disease.
KADRİ GÖKÇE
Tıpta Uzmanlık
Türkçe
2018
İlk ve Acil YardımPamukkale ÜniversitesiAcil Tıp Ana Bilim Dalı
PROF. DR. İBRAHİM TÜRKÇÜER
- Akciğer kanserinde metabolik polimorfizmin ilaç rezistansındaki rolü
The role of metabolic polymorphism in drug resistance in lung cancer
CELALETTİN SEMİH KUNAK
Doktora
Türkçe
2005
Eczacılık ve FarmakolojiAnkara ÜniversitesiFarmasötik Toksikoloji Ana Bilim Dalı
PROF. DR. MÜMTAZ İŞCAN