Veri madenciliği yöntemleriyle paslanmaz çelik sektöründe satış tahmini
Forecasting the sales volumes at stainless steel sector by using data mining methods
- Tez No: 452033
- Danışmanlar: DOÇ. DR. SEZGİN IRMAK
- Tez Türü: Doktora
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Veri Madenciliği, Model Ağaçlar, Kümeleme Analizi, Zaman Serileri, Satış Tahmini, Data Mining, Model Trees, Clustering Analysis, Time Series, Sales Forecasting
- Yıl: 2016
- Dil: Türkçe
- Üniversite: Akdeniz Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 155
Özet
Ülkemiz paslanmaz çelik talebi büyük oranda ithal olarak karşılanmaktadır. Paslanmaz çeliğin ikamesi olmayan pahalı bir ürün olması, yaygın kullanımı ve ithal olarak karşılanması gibi nedenlerle paslanmaz çelik satış tahmini, gerek ülke ekonomisi gerekse sektörde faaliyet gösteren ithalatçı firmalar için önem arz etmektedir. Bu çalışmada paslanmaz çelik sektöründe faaliyet gösteren farklı sektörlerdeki firmalara paslanmaz çelik ara mamulleri satan ithalatçı bir firmanın satış tahmini gerçekleştirilmiştir. Firma satış verileri, toplam ve sektörlere göre düzenlenmiştir. Model Ağaç yöntemiyle Toplam ve sektörel satışların etkilendiği makro ekonomik değişkenler belirlenmiş ve geçmiş, günümüz ve geleceğe dair bilgiler veren tahmin edici modeller oluşturulmuştur. Hiyerarşik kümeleme analiziyle sektör hareketleri incelenerek ve benzer sektörlerin gruplandırılmasıyla satış hareketlerini içeren hiyerarşik zaman serisi elde edilmiştir. Hiyerarşik zaman serisi satış tahmini ARIMA ve Üstel Düzgünleştirme yöntemleriyle gerçekleştirilmiştir. Toplam ve sektörlere göre satış tahminleri ise Destek Vektör Regresyon (DVR), Gauss Süreç Regresyon (GSR) ve Çok Katmanlı Algılayıcı (ÇKA) yöntemleri ile modellenmiştir. Veri ön işleme aşamasında firmanın günlük satış verileri ve müşteri kodları eşleştirilerek, firmanın satış yaptığı 16 sektör belirlenmiştir.Firmanın satış stratejisine göre ağırlıklı olan Makine, Metal, Endüstriyel Mutfak ve Yapı-İnşaat sektörlerine ait satış rakamlarıyla, aylık satış bilgilerini içeren veri setleri hazırlanmıştır. Bu sektörler dışında kalan ve satıştaki payı az olan sektörler Diğer Sektör adıyla birleştirilmiştir. Satış veri setlerine paslanmaz çelik sektörünü etki edebilecek bağımsız değişkenler eklenerek veri hazırlama süreci tamamlanmıştır. Model Ağaçlar yöntemiyle, Toplam ve Diğer Sektör satışlarını etkileyen en önemli değişkenin Dolar Kuru olduğu, Makine, Metal ve Yapı-İnşaat sektör satışlarını etkileyen en önemli değişkenin Üretici Fiyat Endeksi olduğu , Endüstriyel Mutfak sektör satışlarını etkileyen en önemli değişkenin Sanayi Ciro Endeksi olduğu gözlenmiştir. Hiyerarşik Kümeleme analizi sonucunda Makine, Metal, Endüstriyel Mutfak, Yapı-İnşaat ve Diğer Sektör satış hareketleri, benzerlik özelliğine göre 2 kümede toplanmışlardır. İlk kümede (A düğümünde) Makine, Metal ve Endüstriyel Mutfak modelleri, ikinci kümede (B düğümünde) Yapı-İnşaat ve Diğer sektör satışları yer almıştır. Hiyerarşik yapıdaki Toplam Satış, A düğümü, B düğümü ve 5 sektör olmak üzere toplam 8 düğüm için R yazılımı ile hiyerarşik zaman serisi tahmini yapılmıştır. Tümevarım ve Optimal Birleşim olmak üzere 2 birleştirme yöntemi ile ARIMA ve Üstel düzgünleştirme yöntemleriyle toplamda 32 model oluşturulmuştur. Buna göre 32 modelin 6'sında MAPE değer %10 değerinden küçük-eşit hesaplanmıştır. Bu durumda, çalışmada uygulanan zaman serileri yöntemlerinin kısmen başarılı olduğu söylenebilir. DVR, ÇKA, GSR yöntemleriyle yapılan tahminlerde, MAPE değerleri, birinci ayda %5,53 ile %13,91 aralığında , ikinci ayda %5,05 ile %15,57 aralığında, üçüncü ayda %5,41 ile %16,9 aralığında hesaplanmıştır. Birinci aya ait tahminde, en başarılı tahmin ÇKA yöntemiyle (MAPE değeri %5,53) Toplam Satış için gerçekleşmiştir. Ayrıca kurulan 18 modelin 15'inde MAPE değeri %10'un altında hesaplanmıştır. İkinci ay için tahminde en başarılı tahmin, GSR yöntemiyle (MAPE değeri %5,05) Diğer Sektör Satışı için gerçekleşmiştir. Ayrıca 18 modelin 13'ünde MAPE değeri %10'un altında hesaplanmıştır. Üçüncü ay için tahminde en başarılı tahmin, GSR yöntemiyle (MAPE değeri %5,41) Diğer Sektör Satış için gerçekleşmiştir. Ayrıca 18 modelin 13'ünde MAPE değeri %10'un altında hesaplanmıştır. Tüm tahmin dönemleri incelendiğinde, 18 tahmin modelinin 16'sında DVR, 15'inde ÇKA , 10'unda GSR'nin başarılı olduğu söylenebilir. Tez çalışmasında toplam satışı ve sektörlere göre satışları tahmin etmede Destek Vektör Regresyon yönteminin diğer yöntemlerden daha başarılı olduğu görülmüştür.
Özet (Çeviri)
The demand of stainless steel in our country is substantially fulfilled with importation. Sales forecasting of stainless steel is important both for the importer companies operating in the sector and for national economy because of being a widely used non-substitutional expensive and imported product. In this study, the sales forecasting of an importer company which is active in stainless steel sector and selling midproducts of stainless steel to the firms in different sectors has been examined. The data on company sales were reorganized according to sectors and aggregate. Macroeconomic factors affecting total sales and sectoral sales by model tree method were determined and the predictive models informing about the past, present and future were formed. By hierarchical clustering analysis, sector movements were examined and hierarchical time series including sales movements were obtained by grouping similar sectors. Sales forecasting of hierarchical time series were made by ARIMA and Exponential Smoothing methods. The sales forecasting of total sales and sectoral sales were modelled by Support Vector Regression (SVR), Gaussian Process Regression (GPR) and Multi Layer Perceptron (MLP) methods. 16 sectors which buys stainless steel from the corporation were determined by matching the customer codes and corporation's daily sales data at the preprocessing phase of data. Data sets containing monthly sales information for Construction, Industrial Kitchen, Metal, Machinery sectors according to the sales strategy of the corporation were prepared. The sectors which are staying out of these sectors and those which have little shares on sales were gathered under the name of Other Sectors. Data preparing phase was completed by adding the independent variables which affect the sales of the stainless steel sector. It was observed by using Model Trees Method that the most important factor affecting the sales of the Industrial Kitchen Sector was Industrial Endorsement Index, the most important variable affecting the sales of Machinery, Metal, and Construction Sectors was Producer Price Index, and the most important one affecting the Total Sales and the sales of Other Sectors was Dolar Exchange Rate. Sales figures of Construction, Industrial Kitchen, Metal, Machinery and Other Sectors were gathered in 2 sets due to similarity characteristics after Hierarchical Clustering Analysis. As being the biggest cluster Machinery, Metal and Industrial Kitchen sales occured in the first cluster (A node), and in the second cluster (B node) includes Construction and Other sector sales. Hierarchical time series prediction was made for 8 nodes consisting of 5 sectors and A node, B node and Aggregated Sales in hierarchical pattern by R software. Totally 32 models were formed by ARIMA and Exponential Smoothing methods and two combination methods as Bottom up and Optimal Combination methods. According to this just 6 of 32 models' MAPE values were calculated less than or equal to 10%. Therefore it can be said that the time series methods applied in this study were partially successful. The predictions made by SVR, MLP, GPR methods, MAPE values were calculated between the intervals of 5,53%-13,91% in the first month, 5,05%-15,57% in the second month and 5,41%-16,9% in the third month. In the prediction of first month the most succesful one for Aggregated Sales actualized by MLP method (MAPE value 5,53%). In addition, 15 of 18 models' MAPE values were calculated below 10%. The most successful prediction for the second month was for the Other Sector Sales by GPR method (MAPE=5,05%). In addition, for 13 models amongst 18, MAPE values were calculated below 10%. The most succesfull prediction for the third month prediction realized for the Other Sector Sales by GPR method (MAPE value = 5,41%). In addition, MAPE values were calculated below 10% in 13 models of 18. Having analyzed all the prediction periods it can be said that SVR was succesfull in 16, MLP was succesfull in 15 and GPR was succesfull in 10 of 18 prediction models. It could be concluded that the SVR method was more succesful than the others to forecast the Aggregated Sales and the sales of each sectors.
Benzer Tezler
- Veri madenciliği yöntemleriyle sosyal medya duygu analizi
Social media sentiment analysis with data mining techniques
BATUHAN CEM ÖĞE
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATİH KAYAALP
- Veri madenciliği yöntemleriyle gübre talep tahminleme
Başlık çevirisi yok
SEMRA YALÇINTEPE
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
DOÇ. DR. MEHMET ALPER TUNGA
- Veri madenciliği yöntemleriyle hayvan hastalıklarında teşhis, prognoz ve risk faktörlerinin belirlenmesi
Determination of diagnosis, prognosis and risk factors in animal diseases using by data mining methods
PINAR CİHAN
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OYA KALIPSIZ
DOÇ. DR. ERHAN GÖKÇE
- Veri madenciliği yöntemleriyle müşteri kaybı analizi: Yazılım sektörü
Customer churn analysis with data mining methods: Software as a service(SAAS) industry
SENA KASIM
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ LEVENT ÇALLI
- Veri madenciliği yöntemleriyle depremlerin analizi
Analysis of earthquakes by means of data mining methods
ÖZAL YILDIRIM
Yüksek Lisans
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GALİP AYDIN