Sales forecasting in fashion retail industry with classical and machine learning methods
Moda perakendesi sektöründe klasik ve makine öğrenmesi metodları ile satış tahmini
- Tez No: 634839
- Danışmanlar: DOÇ. DR. TOLGA YURET
- Tez Türü: Yüksek Lisans
- Konular: Ekonomi, Economics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonomi Ana Bilim Dalı
- Bilim Dalı: Ekonomi Bilim Dalı
- Sayfa Sayısı: 68
Özet
Bu çalışma Türkiye'de ve dünyada moda perakendesi sektöründe yüzlerce mağazaya sahip olan bir firmanın, kısa dönemli talep tahmininin klasik ekonometrik yöntemler ve makine öğrenmesi modelleri ile yapılarak bu modellerin tahmin performanslarının karşılaştırılmasını kapsamaktadır. Perakende giyim sektörü tüm dünyada olduğu gibi Türkiye'de de sektörler arasında önemli bir yere sahiptir. 2018 yılı küresel tekstil ve giyim sektörü ihracat verilerine göre Türkiye 12 milyar dolar ihracat ile bu sektördeki önemli ülkelerden biri olmuştur. Bu sektör planlamadan üretime, lojistikten mağazacılığa kadar farklı fonksiyonları bünyesinde barındıran bu sektör, içerisinde moda ve trend etkisini barındırmasından dolayı hızlı değişimlerin yaşandığı dinamik bir sektördür. Bu dinamik sektörde değişikliklere hızlı adapte olmak, firmaların karlılıklarına çok önemli katkı sağlayacaktır. Bu noktada firmaların faaliyetlerini düzenlemeleri ve gerekli tedbirleri önceden almaları için talep tahmini önemli bir rol oynamaktadır. Talep tahmini bu sektörde üretim planlamasından mağaza planlamasına kadar birçok noktaya etki etmektedir. Uzun dönemli talep tahminleri firma için iş gücü yatırımından finansal kaynakların yönetilmesi, yeni mağaza açılışından koleksiyon karışımının belirlenmesine kadar birçok faaliyete önemli bir girdi oluşturur. Bu sektörde kısa dönemli talep tahmininin etki ettiği en önemli faaliyetler ise lojistik ve mağazacılık faaliyetleridir. Doğru şekilde tahmin edilemeyen talep, lojistik depolarda dar boğaza veya atıl kapasiteye neden olurken, mağazacılık tarafında ise talepten az stok gönderilmesi durumunda satış kaybına, talepten çok stok gönderilmesi durumunda mağazada stok maliyetine ve fiziksel alan kısıtları nedeniyle mağazacılık operasyonlarının aksamasına neden olacaktır. Bu çalışmada, 30 farklı mağazanın, 2 farklı stil bölümü için günlük seviyede talep tahmini yapılmıştır. Günlük seviyede yapılan bu tahmin, hangi mağazaya kaç adet ürün sevk edilmesi gerektiği kararı için bir gereklilik oluşturmaktadır. Verilen bu karar hem lojistik hem de mağazacılık faaliyetlerini ve karlılığı direk olarak etkilemektedir. Bu nedenle hem bu çalışmanın yapıldığı firmada hem de bu sektördeki farklı firmalarda uzun ve kısa dönemli talep tahmini üzerine çalışan ekipler bulunmaktadır. Gittikçe rekabetçi hale gelen bu sektörde daha doğru talep tahmini yapmak kritikleşmiştir. Bu amaçla, bu çalışmada farklı ekonometrik ve makine öğrenmesi metotları kullanılarak talep tahmini yapılmış ve bu sektör için doğruluğu en yüksek olan metot belirlenmeye çalışılmıştır. Klasik metotlar tahmin yaparken doğrusal algoritmalar kullanırken, makine öğrenmesi metotları doğrusal olmayan algoritmalar kullanmaktadır. Bu nedenle doğrusal olmayan etkilerin yüksek olduğu verilerde makine öğrenmesi metotları kullanmak doğruluğu artırmak ve bu doğrusal olmayan etkileri model içerisinde açıklayabilmek açısından faydalı olacaktır. Her iki metot, tahmin doğruluğunu artırmayı amaçlamaktadır. Klasik ekonometrik modellerin temeli matematik ve istatistiğe oturmaktadır. Regresyon, Üstsel Düzleme, Otoregressif Bütünleşmiş Hareketli Ortalama (ARIMA), Vektör Otokorelasyon ve Vektör Hata Düzeltme Modeli (VECM) metotları sıklıkla kullanılan klasik ekonometrik metotlardır. Diğer yandan yapay zekânın bir kolu olan makine öğrenmesi tahmin alanında önemli algoritmalara sahiptir. Özellikle son 10 yılda makine öğrenmesi alanında yapılan çalışmalar ve bu alanda geliştirilen algoritmalar önemli düzeyde artmıştır. Bu artışta, bu algoritmaların ortaya çıkardığı başarılı sonuçların ve pratikte uygulanabilme kolaylığının etkisi oldukça yüksektir. Fakat bu metotların bilgisayar ve bilgisayar bilimlerine fazlaca bağlı olması bu metotların dezavantajı olarak sayılabilir. Ayrıca algoritmaların işleyişindeki kara kutu özellikleri, bu algoritmaların bir diğer dezavantajı olarak yorumlanabilir. Buna karşın klasik ekonometrik yöntemler, uygulamalarının açıklama kolaylığı ile avantaj sağlamaktadır. Bu çalışmada tahmin amaçlı lineer regresyon ve ARIMA klasik ekonometrik yöntemler olarak kullanılırken makine öğrenmesi metotları olarak Torbalama Regresyon Ağacı, Aşırı Rassal Ağaçlar, Rastgele Ormanlar, Gradyan Artırma Algoritması, Uyarlamalı Artırma Algoritması ve Aşırı Gradyan Artırma Algoritması kullanılmıştır. Klasik ekonometrik yöntemlerden, yaygınlıkla kullanılan ARIMA modeli uygulanmıştır. Zaman serilerinde tahmin yapabilmek için serilerin durağan olması gerekmektedir. Bu nedenle, serilerin durağanlığını test etmek amacıyla Artırılmış Dickey Fuller (ADF) testi ve KPSS testi uygulanmıştır. Bu testler sonucu durağan çıkan veri setine ARMA modeli uygulanmıştır. Ayrıca veri setinin otokorelasyon ve kısmi otokorelasyon grafikleri incelenerek ARMA modeli parametreleri belirlenmiştir. En uygun parametreler model sonucunda çıkan Akaike Bilgi Kriteri'ne göre karar verilmiştir. Makine öğrenmesi modelleri, bağımlı değişkeni etkileyebilecek bağımsız değişkenleri kullanarak modellerin kurması açısından ARIMA'dan farklılaşmaktadır. Bu çalışma veri seti hazırlanırken, bağımlı değişkeni etkileyebilecek tüm bağımsız değişkenler veri setine dâhil edilmiştir. Fakat bu açıklayıcı değişkenlerden önemsiz olanlar Spearman, ikili korelasyon, varyans ve rastgele orman algoritması metotları ile belirlenerek veri setinden çıkarılmıştır. Modeller uygulanmadan veri seti eğitim verisi, doğrulama verisi ve test verisi olarak 3 parçaya ayrılmıştır. Veri setinin %20'si test verisi olarak kullanılmıştır. Makine öğrenmesi metotların aşırı uyma probleminin önüne geçmek için çapraz doğrulama uygulanmıştır. Makine öğrenmesi yöntemlerini değerlendirmek için bir örnekleme prosedürü olan çapraz doğrulama, aynı zamanda tahmin performansını da genellemeye yardımcı olur. Bu amaçla k katlı çapraz doğrulama metodu, k = 5 için uygulanmıştır. İkisi klasik metot, altısı makine öğrenmesi metodu olan 8 farklı metot, test verisinde ortalama mutlak sapma, hataların ortalama karekökü değerlerine göre, tahmin performansları karşılaştırılmıştır. Uyarlamalı Artırma Algoritması, verisinde ortalama mutlak sapma, hataların ortalama karekökü değerlerinde sırasıyla 38.42 ve 57.60 sonuçları ile en iyi performans gösteren metot olmuştur. Bu metodu Gradyan Artırma Algoritması takip etmiştir. Klasik metotlardan Lineer Regresyon metodu ortalama bir performans gösterirken, ARIMA metodu en vasat performansın sahibi olmuştur.
Özet (Çeviri)
This study includes the usage of classical econometric methods and machine learning models for short-term demand forecast of a fashion retail firm with hundreds of shops. Forecasting performances of different methods are compared. Retail clothing sector has an important place among all sectors both in Turkey as well as all over the world. According to the data of the global textile and clothing sector exports, Turkey has become one of the most important countries in this sector with 12 billion USD dollars in exports by 2018. This sector, which includes different functions from planning to production, logistics to merchandising, is a dynamic sector in which rapid changes occur due to impact of fashion and trend. Rapid adaptation to changes in this dynamic sector can contribute to the profitability of companies. At this point, demand forecasting plays an important role for companies to organize their activities and take necessary measures in advance. Demand forecasting affects many points in this sector, from production planning to shop planning. Long-term demand forecast is an important input for many activities for the company, from labor investment to managing financial resources, opening new stores, and determining the collection mix. The most important activities influenced by the short-term demand forecast in this sector that are logistics and merchandising activities. While the unpredictable demand can cause a bottleneck or idle capacity in logistics warehouses. On the merchandising side, less inventory than demand case can cause loss of sales while inventory more than demand can causes to inventory cost in the store and disruption of merchandising operations due to physical space constraints. In this study, demand estimation is performed for 2 different styles of 30 different stores at the daily level. This daily estimate is a requirement for the decision of how many products should be shipped to which store. This decision directly affects both logistics and merchandising activities and profitability. For this reason, there are teams working on long and short-term demand forecasting both in the company where this study is carried out and in different companies in this sector. More accurate demand forecasting has become critical in this increasingly competitive sector. For this purpose, in this study, demand forecasting is performed by using different econometric and machine learning methods and the most accurate method for this sector is tried to be determined. While classical methods use linear algorithms when making predictions, machine learning methods use nonlinear algorithms. Therefore, using machine learning methods in data with high nonlinear effects is useful in order to increase accuracy and explain nonlinear effects in the model. Both methods aim to enhance the forecasting accuracy. The basis of classical econometric models is based on mathematics and statistics. Regression, Exponential Smoothing, Autoregressive Integrated Moving Average (ARIMA), Vector Autoregressive (VAR) and Vector Error Correction Model (VECM) methods are frequently used classical econometric methods. On the other hand, machine learning, which is a branch of artificial intelligence, has important algorithms in the field of forecasting. Especially in the last 10 years, studies on machine learning and algorithms developed in this field have increased significantly. The successful results of these algorithms and the ease of application has increased the usage of these algorithms. However, these methods are highly dependent on computers and computer sciences can be considered as a disadvantage of these methods. In addition, black-box features in the functioning of algorithms can be interpreted as another disadvantage of these algorithms while classical econometric methods provide advantages with ease of explanation. In this study, linear regression and ARIMA are used as forecasting methods for classical econometric methods. Machine learning methods that are Bagging Regression Tree, Extremely Randomized Trees, Random Forest Algorithm, Gradient Boosting, Adaptive Boosting, Extreme Gradient Boosting Algorithm are applied. One of the widely used classical econometric method is ARIMA is used within this study. The series must be stationary to make predictions in the time series. Therefore, ADF test and KPSS test were used to test the stationarity of the series. ARMA model was used with the data set due to being stationary time series according to the performed test results. In addition, the parameters of the ARMA model were determined by analyzing the autocorrelation function and partial autocorrelation function of the data set. According to the evaluation of ARMA models, the most appropriate parameters were decided according to the Akaike Information Criteria (AIC). Machine learning models differ from ARIMA in terms of establishing models by using independent variables that can affect the dependent variable. While preparing this study data set, all independent variables that can influence dependent variable are included in the data set. However, it does not mean that all included features are important. Therefore, feature engineering methods such as Spearman correlation analysis, variance analysis and random forest algorithm methods are applied in order to eliminate the unnecessary independent variables from models. Before applying the methods, the data set is divided into 3 parts as training data, validation data and test data. 20% of the data set was used as test data. Cross-validation is performed to avoid the over fitting problem of machine learning methods. Cross-validation, resampling procedure for evaluating machine learning methods, also helps to generalize predictive performance. For this purpose, the k-fold cross-validation method is applied k with 5. Eight different methods where two of which are classical method and six of which are machine learning method are compared according to the means absolute error in test data and root mean square error. Adaptive Boosting Algorithm shows the highest performance with mean absolute error and root mean square error with 38.42 and 57.60, respectively. This method was followed by the Gradient Boosting Algorithm. Linear Regression method, which is one of the classical methods, has an average performance, while the ARIMA method has the most mediocre performance.
Benzer Tezler
- Makine öğrenmesi ile hazır giyim perakende sektöründe satış tahmini
Sales forecasting in apparel retail industry with machine learning
SALİH CEYLAN
Yüksek Lisans
Türkçe
2024
Bilim ve TeknolojiYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DOÇ. DR. BİROL ASLANYÜREK
- Perakende hazır giyim firmasında makine öğrenmesi yöntemleriyle satış tahmini
Sales forecasting in a retail fashion company using machine learning methods
ŞEYMA GÖNEN HALICI
Yüksek Lisans
Türkçe
2024
İşletmeİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. FERHAN ÇEBİ
- Hızlı moda sektöründe makine öğrenmesi yöntemleri ile satış miktarlarının tahmin edilmesi
Forecasting of sales quantities by machine learning methods in fast fashion sector
SİNEM ÖZTÜRK
Yüksek Lisans
Türkçe
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEDA UĞURLU
- Trend forecast and collection management in apparel retail
Moda perakende sektöründe trend tahmini ve koleksiyon planlama
RAMAZAN ARKAN
Doktora
İngilizce
2022
Endüstri ve Endüstri MühendisliğiKadir Has ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ESRA AĞCA AKTUNÇ
PROF. DR. AHMET DENİZ YÜCEKAYA
- Mathematical models for locating sales offices in Turkey for an apparel textile and fashion industry
Türkiye konfeksiyon ve moda endüstrisinde satış ofislerinin lokasyonu için matematiksel modeller
ONUR YILMAZ
Yüksek Lisans
İngilizce
2018
Endüstri ve Endüstri MühendisliğiÇankaya ÜniversitesiDR. ÖĞR. ÜYESİ NUREDDİN KIRKAVAK
DR. ÖĞR. ÜYESİ ÖZLEM TÜRKER BAYRAK