Geri Dön

Perakende hazır giyim firmasında makine öğrenmesi yöntemleriyle satış tahmini

Sales forecasting in a retail fashion company using machine learning methods

  1. Tez No: 865913
  2. Yazar: ŞEYMA GÖNEN HALICI
  3. Danışmanlar: PROF. DR. FERHAN ÇEBİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İşletme, Business Administration
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İşletme Ana Bilim Dalı
  12. Bilim Dalı: İşletme Bilim Dalı
  13. Sayfa Sayısı: 139

Özet

Küreselleşme ve rekabetin yoğun olduğu günümüzde, firmalar başarılarını sadece kendi organizasyonlarıyla değil, tedarik zincirinin tüm bileşenleriyle birlikte sağlamaktadır. Günden güne artan rekabet ve tüketicinin talep değişiklikleri, şirketleri ürün çeşitliliğini arttırmaya, fiyat rekabetine yönelmeye ve tedarik zinciri yönetimine daha fazla odaklanmaya yöneltmektedir. Tedarik zinciri yönetimi, sistemin maliyetlerini minimize ederken, aynı zamanda tatmin edici bir hizmet seviyesine ulaşabilmek için üretilen malın doğru miktarda, doğru zamanda ve doğru yerde olabilmesini sağlamak amacıyla depoları ve satış alanlarını entegre edebilmek üzere kullanılan yaklaşımların tümü olarak tanımlanmaktadır. Firmalarda tedarik zinciri performansına etki eden en önemli faktörlerden biri talebin doğru tahmin edilmesidir. Tahmin hataları, envanter maliyetlerinin artmasına, gecikmiş siparişlere, satış kayıplarına ve dolayısıyla karlılığın ve müşteri memnuniyetinin azalmasına neden olabilir. Özellikle hızla değişen ve modaya duyarlı olan perakende hazır giyim giyim sektöründe, talep tahmini stratejik bir rol oynamaktadır. Başarılı olmak, doğru zamanda doğru ürünleri sunabilmekle bağlantılıdır. Ancak, moda ürünlerinin kısa ömürlü olması, bazı ürünlerin tarihsel veri eksikliği, değişken tüketici zevkleri, ürün çeşitliliği ve dış faktörlerin etkisi nedeniyle talep tahmini yapmak hazır giyim sektörü için oldukça zorlu bir süreçtir. Çeşitli değişkenleri doğru yorumlayabilmek ve aralarındaki bağlantıları kurabilmek, moda sektöründe başarılı tahminler yapabilmek için çok önemlidir. İçerisinde birçok faktörü barındırması sebebiyle oldukça karmaşık bir konu olan talep tahmini konusunda literatürde çok sayıda yöntem bulunmaktadır. Daha önceleri talep tahminine zaman serileri gibi oldukça basit ve klasik yöntemler kullanılmaktaydı. Fakat gelişen teknoloji ve satışı etkileyen faktörlerin gittikçe artması sebebiyle bu yöntemler artık yetersiz kalmaya başlamıştır. Her ürününün satışı renk, silüet, marka imajı, hava durumu, kampanyalar, fiyat gibi çok sayıda değişkenden etkilenmektedir. Geleneksel yöntemler bu karışık problemleri çözememektedir. Öte yandan hızla gelişen teknolojiyle birlikte makine öğrenmesi algoritmaları, çok değişkenli büyük veri setlerini analiz etme yeteneği ile sektöre yeni yaklaşımlar sunmaktadır. Bu yöntemler, modanın hızına ayak uydurabilmekte, karmaşık verileri işleyebilmekte ve işletmelere daha doğru tahminler yapabilme imkanı sunmaktadır. Bu çalışmada, perakende hazır giyim sektöründe 2000 yılından bu yana faaliyet göstermekte olan bir Türk firmasından alınan verileri kullanılarak çeşitli makine öğrenmesi yöntemleriyle satış tahmini yapılmış, kullanılan yöntemler karşılaştırılmıştır. Literatür taramasında incelenen çalışmalardan hareketle uygulama için benzer alanlarda kullanılmış 7 algoritma seçilmiş ve veri setlerine en iyi yanıt veren, veri setini en iyi öğrenebilen algoritma seçimi üzerinde durulmuştur. Çalışma kapsamında iki aşamalı iki uygulama gerçekleştirilmiştir. Birinci uygulama alt kategori detayında gruplanmış olan veri seti ile gerçekleştirilmiştir. İlgili firmada planlama yapılırken sıkça kullanılan bu gruplamada, alt kategori altında birbiriyle benzerlik gösteren ürünlerin bulunduğu bilinmektedir. Veri ön işleme yapıldıktan sonra veri seti %80 eğitim, %20 validasyon ve %20 test veri seti olarak ayrılmıştır. Uygulamanın ilk adımında lineer regresyon, karar ağacı, rastgele orman, gradyan arttırma, xgboost, lightgbm ve catboost algoritmaları veri setine herhangi bir parametre ayarlaması yapılmadn uygulanmıştır. En başarılı 3 algoritma seçilmiştir. İkinci basamakta ise en başarılı algoritma olarak seçilen xgboost, lightgbm ve catboost algoritmalarına paramatre ayarlaması yapılarak modeller tekrar çalıştırılmıştır. Fakat bu adımda veri setinde bulunan ortalama stok verisi çıkartılarak, stoktan bağımsız bir satış tahmini yapılması hedeflenmiştir. En başarılı algoritma lightgbm olmuştur. İkinci uygulama kapsamında ise veri seti üst kategori detayında gruplanarak tekrar aynı adımlar uygulanmıştır. Öncelikle seçilen yedi algoritma varsayılan parametreler ile çalıştırılmış ve karşılaştırılmıştır. En başarılı algoritmalar rastgele orman, lightgbm ve catboost algoritmaları olmuştur. İkinci basamakta stok verisi çıkartılıp, parametre ayarlaması yapıldıktan sonra en iyi üç algoritma tekrar çalıştırılmıştır. Bu aşamada en başarılı algoritma catboost olmuştur. Uygulamalarda performans ölçümü için R², MSE, MAE, RMSE ve MAPE metrikleri kullanılmıştır. Elde edilen sonuçlar ortalama stok değişkeni çıkartılsa bile makine öğrenmesi yöntemlerinin umut verici olduğunu göstermiştir. Gerçek dünya açısından düşünüldüğünde doğru tahminler için değişkelerin doğru öngörülmesi gerektiği unutulmamalıdır. Üst kategori ve alt kategori detayında veri setleri ile yapılan iki uygulamanın sonuçları kıyaslandığında, alt kategori detayındaki veri seti ile daha başarılı sonuçlar alındığı görülmüştür. Daha alt ölçekteki veri ile daha detaylı tahminler yapılabileceği görülmüştür. Fakat bu sonuçlar daha farklı ürün grupları için daha geniş zaman aralığındaki veri setleri ile tekrar test edilebilir. Yüksek değişkenlik sebebiyle perakende sektöründeki çözülmesi en zor problemlerden biri olan satış tahmini konusunda makine öğrenmesi algoritmalarının başarılı sonuçlar verebileceği bu çalışma kapsamında gözlemlenmiştir. Fakat her algoritma her veri seti üzerinde aynı başarıyla çalışmamaktadır. Bu sebeple veri setine uygun algoritma seçimi oldukça önemli olmaktadır. Yapılan uygulamalar kapsamında değişkenlerin önem seviyeleri incelendiğinde özellikle ekonomik faktörlerin ön plana çıktığı görülmüştür.Veri setinin basic ürünleri içeriyor olması sebebiyle müşteri tercihleri, fiyat ve indirim oranına göre şekillenmiştir yorumu yapılabilir. Çalışma aynı zamanda, veri setindeki bağımsız değişkenler ile satışlar arasında ilişki kurulabildiğini göstermiştir. Çalışmaya başka değişkenler de entegre edilerek ya da veriler farklı detaylarda toplanrak sonuçlar geliştirilebilir ve uzmanlar için şirket planlamasında kullanılabilir hale getirilebilir.

Özet (Çeviri)

In today's globalized and highly competitive environment, companies achieve success not only through their own organizations but also by collaborating with all components of the supply chain. Increasing competition and changes in consumer demand push companies to focus more on increasing product variety, engaging in price competition, and concentrating on supply chain management. Supply chain management is defined as all approaches used to integrate warehouses and sales areas to minimize system costs while ensuring the right amount of product is in the right place at the right time to achieve a satisfactory service level. Businesses that successfully manage this chain are flexible organizations positioned close to the market, understanding customer demands, and capable of responding swiftly. One of the most critical factors affecting supply chain performance in companies is the accurate prediction of demand. Businesses need to make effective planning to determine the quantities of products they will stock, produce, or create orders for in the future. However, it will not be possible to make any planning without knowing how much demand there will be for the product they will produce or order. Therefore, one of the most important data to be used in calculations related to stocks will be the demand quantity. Demand forecasting involves calculating the probability of future demand based on past experiences. The underlying assumption of most forecasting methods is that past experiences and assumptions will continue into the future. In today's world, within the context of a competitive global market, demand forecasting serves as a guide when making decisions about the future. Companies take into account demand forecasts in activities such as production, workforce planning, determining marketing strategies, price policies, calculating cash flows and costs, as well as planning procurement and inventory. Industry managers need an efficient and reliable forecasting system when making decisions regarding all these processes. In today's world, most companies have to rely on subjective opinions in their inventory decisions because they do not know their demands definitively. In predictions where individual competence comes into play, the quantity of materials ordered may not always match the demand. Forecasting errors can lead to increased inventory costs, delayed orders, sales losses, and consequently, decreased profitability and customer satisfaction. Especially in the ready-to-wear sector, the ability to interpret customer demands accurately and balance them with supply chain capacity is a critical factor affecting supply chain performance. Accuracy in demand forecasting is one of the significant challenges faced by retail ready-to-wear companies striving for success in supply chain management. In the rapidly changing and fashion-sensitive retail ready-to-wear sector, demand forecasting plays a strategic role. Success is linked to being able to offer the right products at the right time. However, due to the short lifespan of fashion products, historical data scarcity for some items, variable consumer preferences, product variety, and the impact of external factors, demand forecasting becomes a challenging process for the ready-to-wear industry. Interpreting various variables correctly and establishing their connections is crucial to making successful predictions in the fashion sector. There are numerous methods in the literature regarding demand forecasting, which is a highly complex subject due to encompassing many factors. Previously, pretty simple and classical methods such as time series were used for demand forecasting. However, due to advancing technology and the increasing factors affecting sales, these methods have started to become insufficient. The sales of each product are influenced by numerous variables such as color, silhouette, brand image, weather conditions, campaigns, and prices. Traditional methods cannot solve these complex problems. On the other hand, machine learning has become an important tool in demand forecasting by offering a more complex and data-driven approach compared to traditional statistical methods, with the ability to model complex relationships in large datasets. Unlike traditional methods, machine learning models can make sharper and more dynamic predictions through data-driven learning. This helps businesses make critical decisions such as inventory management, production planning, and supply chain optimization more effectively. In this study, sales forecasting was conducted using various machine learning methods based on data obtained from a Turkish company operating in the retail ready-to-wear sector since 2000, and the methods used were compared. Seven algorithms used in similar areas for applications were selected based on the reviewed studies in the literature. These algorithms are linear regression, decision tree, random forest, gradient boosting, extreme gradient boosting, light gradient boosting, and category boosting. Emphasis was placed on selecting the algorithm that responds best to the datasets and learns the dataset best. In the stage of determining the factors affecting sales, the opinions of experts working in the company were obtained, and the parameters used in sales forecasting within the company were utilized. The dataset used in the study includes the sales of the women's and men's NOS (never-out-of-stock) team of a retail ready-to-wear company in Turkey between the 1st week of 2018 and the 52nd week of 2019. The products belonging to the NOS group are generally simple, basic products that are least affected by fashion trends and are available in stores for long periods. The basic dataset consists of 17 independent variables, including 8 categorical and 9 numerical variables, with the output being the predicted sales volume. Data such as year-week, month-week, season, gender, top category, sub-category, color, number of stores, average stock, average discount rate, price, special day information, and sales data were obtained from the company's database. Additionally, data collected to measure the relationship of sales with external factors such as inflation rate, dollar exchange rate, interest rate, average temperature, and average rainfall were added to the dataset. These data were retrieved from the database of the Turkish Statistical Institute. After cleaning the data obtained from the company, data preprocessing and transformation were performed. Then, the dataset was divided into an 80% training, 20% validation, and 20% test dataset for model training, hyperparameter tuning, and measuring the overall performance of the model using different data. The study conducted a two-stage application. The first application was performed with a dataset grouped at the sub-category level. In this commonly used grouping for planning in the relevant company, it is known that similar products are found under the sub-category. In the first step of the application, linear regression, decision tree, random forest, gradient boosting, xgboost, lightgbm, and catboost algorithms were applied to the dataset without any parameter adjustments. The top 3 algorithms were selected. In the second stage, xgboost, lightgbm, and catboost, chosen as the most successful algorithms, were re-run with parameter adjustments. However, in this step, the average stock data in the dataset was removed, aiming to make a sales forecast independent of stock. The most successful algorithm was lightgbm. Cross-validation was performed using the k-fold method with the best-performing algorithm identified through comparisons. Additionally, the importance levels of variables were examined. In the second application scope, the dataset was grouped at the top category level, and the same steps were repeated. Initially, the seven selected algorithms were run with default parameters and compared. The most successful algorithms were random forest, lightgbm, and catboost. After removing stock data and adjusting parameters in the second stage, the best three algorithms were re-run. In this stage, the most successful algorithm was catboost. The results were compared, and cross-validation with the k-fold method was applied on the algorithm that yielded the best outcome. After examining the importance levels of variables, the results of two applications conducted at two different detail levels were compared with each other, and all steps were interpreted. Performance measurement in all applications was conducted using R², MSE, MAE, RMSE, and MAPE metrics. The results of all metrics were compared to evaluate the algorithms. The results obtained showed that machine learning methods are promising even if the average stock variable is removed. Considering the real world, it should not be forgotten that variables must be predicted correctly for accurate predictions. When the results of the two applications conducted with datasets at the top category and sub-category levels were compared, more successful results were obtained with the sub-category level dataset. It was observed that more detailed predictions could be made with more granular data. However, these results can be retested with datasets from different time frames for different product groups. In this study, it was observed that machine learning algorithms could provide successful results in sales forecasting, which is one of the most challenging problems in the retail sector due to high variability. However, not every algorithm performs equally well on every dataset. Therefore, selecting an algorithm suitable for the dataset is crucial. When the importance levels of variables were examined within the scope of the applications, it has been observed that economic factors were prominent. Considering that the dataset contains basic products, it can be interpreted that customer preferences are shaped by price and discount rates. The study also demonstrated that relationships could be established between the independent variables in the dataset and sales. By integrating additional variables into the study or collecting data at different levels of detail, the results can be enhanced and made usable for company planning by experts.

Benzer Tezler

  1. Perakende hazır giyim endüstrisinde yapay zeka yöntemleri ile talep tahmini

    Demand forecasting with artificial intelligence methods in retail apparel industry

    İLKER GÜVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri MühendisliğiKarabük Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FUAT ŞİMŞİR

    DOÇ. DR. ÖZER UYGUN

  2. Perakende sektöründe kullanılan teknolojik ürünlerin müşteri ilişkileri üzerindeki rolünün incelenmesi

    To analyse the role of technological products in using retail industry on customer relationship management

    SERKAN KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Endüstri ve Endüstri MühendisliğiMaltepe Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. İLKÜN ORBAK

  3. Makine öğrenmesi ile hazır giyim perakende sektöründe satış tahmini

    Sales forecasting in apparel retail industry with machine learning

    SALİH CEYLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilim ve TeknolojiYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BİROL ASLANYÜREK

  4. Ögütsel bağlılık ve örgütsel sinizm arasındaki ilişkiyi belirlemeye yönelik bir araştırma

    A research study about the relation between organizational loyalty and organizational sinizm

    GÖZDE HAVVA BOZBOĞA

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İşletmeİstanbul Arel Üniversitesi

    İnsan Kaynakları Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ESRA AYDIN GÖKTEPE

  5. Z kuşağının e-perakende aracılığıyla hazır gı̇yı̇m ürünlerı̇ satın alma eğı̇lı̇mlerı̇

    Tendencies of generation Z in purchasing ready-to-wear products through e-retail

    ÖZLEM ERSOYLU MUTLUER

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    ReklamcılıkİSTANBUL NİŞANTAŞI ÜNİVERSİTESİ

    Halkla İlişkiler ve Reklamcılık Ana Bilim Dalı

    PROF. DR. GRESİ SANJE