Geri Dön

Recommanding new products with high sales potential in fashion retail: A machine learning approach

Moda perakendesinde yüksek satış potansiyeline sahip yeni ürünlerin önerilmesi: Bir makine öğrenimi yaklaşımı

  1. Tez No: 949332
  2. Yazar: ENES TEZCAN
  3. Danışmanlar: PROF. DR. ABDÜL HALİM ZAİM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 73

Özet

Moda perakendeciliği, kısa ürün yaşam döngüleri, hızla değişen tüketici tercihleri ve dalgalı pazar koşulları nedeniyle yüksek derecede değişken ve öngörülemez bir sektördür. Bu durum, özellikle yeni ürünlerin satışa sunulması öncesinde talep tahmini yapılmasını zorlaştırmaktadır. Geçmiş satış verilerine sahip olmayan ürünlerin talep potansiyelini öngörmeye çalışmak, literatürde“cold-start”problemi olarak adlandırılmakta ve moda sektöründe önemli bir operasyonel engel teşkil etmektedir. Yetersiz talep tahmini, ya stok fazlalığına ve maliyetli indirim kampanyalarına, ya da ürünün zamanında tüketiciye ulaşamaması nedeniyle kaçırılan satış fırsatlarına neden olabilir. Bu nedenle, özellikle hızlı moda dinamiklerine sahip sektörlerde cold-start problemi, yalnızca teknik bir zorluk değil, aynı zamanda stratejik bir karar problemidir. Geleneksel yöntemler genellikle tasarımcılar, satın alma yöneticileri ve pazarlama ekiplerinin sezgilerine, geçmiş deneyimlerine ve sınırlı referans ürün karşılaştırmalarına dayanmaktadır. Ancak bu sezgisel yaklaşımlar öznel, bağlama aşırı bağımlı ve çoğu zaman veri temelli sistemlere göre daha az tutarlıdır. Üstelik bu tür yöntemlerde ürünün yapısal niteliklerine dair veri (örneğin kumaş türü, kalıp, yaka tipi gibi) genellikle göz ardı edilmekte ve sezgilerle alınan kararlar, büyük ölçekli operasyonlar için yeterli şeffaflık ve ölçeklenebilirlik sağlamamaktadır. Bu çalışmada, Türkiye'nin önde gelen uluslararası ölçekli bir moda perakendecisi ile yürütülen iş birliği kapsamında, yalnızca ürün tasarımına ait yapısal özelliklere dayanarak, henüz üretilmemiş ürünlerin satış potansiyelini tahmin edebilen veri temelli bir makine öğrenimi çerçevesi sunulmaktadır. Kullanılan veri seti, herhangi bir görsel ya da zaman serisi bilgisi içermemekte; bunun yerine ürünlerin kumaş türü, kalıp, yaka formu, kol yapısı gibi kategorik özniteliklerine ve bu ürünlerin mağaza başına düşen normalize edilmiş satış oranlarına odaklanmaktadır. Satış performansını ölçmek için kullanılan gösterge, her ürünün satıldığı toplam mağaza sayısına göre normalize edilmiş satış oranıdır. Bu metrik, ürünler arasında doğrudan kıyaslama yapılmasına olanak tanırken, aynı zamanda veri setinde bulunmayan zaman serisi yapılarının eksikliğini başarılı bir şekilde telafi etmektedir. Elde edilen oranlara dayanarak, histogram tabanlı segmentasyon yöntemiyle ürünler düşük, orta ve yüksek talep seviyelerine kategorize edilmiş, bu sınıflandırma perakende şirketinin iç değerlendirme süreçleriyle tam uyum sağlamış ve model çıktılarının kolay yorumlanmasına katkıda bulunmuştur. Zaman damgalı satış verisinin olmaması, sistemin ürün geliştirme sürecinin erken aşamalarında kullanılmasını mümkün kılmakta, böylece cold-start problemine üretim öncesi safhada müdahale edebilme yeteneği kazandırmaktadır. Modelleme sürecinde XGBoost, CatBoost ve Random Forest olmak üzere üç farklı karar ağacı tabanlı algoritma kullanılmıştır. Bu algoritmalar, hedef değişkenin sıralı yapısına uygun olarak çeşitli teknik ayarlamalarla optimize edilmiş, böylece daha doğru ve tutarlı tahminler elde edilmiştir. Model performansı yalnızca doğruluk değil, aynı zamanda kapsama oranı (coverage) dikkate alınarak değerlendirilmiştir. Özellikle, modelin güvenilirlik seviyesini operasyonel risk toleransına göre ayarlamak amacıyla güven eşiği tabanlı bir değerlendirme mekanizması geliştirilmiştir. Bu sayede, daha yüksek güven eşiklerinde (örneğin %70), tahmin doğruluğu önemli ölçüde artarken, perakendeciye daha riskten kaçınan ve stratejik kararlar alabilme esnekliği sunulmuştur; daha düşük eşikler ise daha geniş bir ürün yelpazesinde keşfe olanak tanımaktadır. Elde edilen bulgular, farklı senaryolarda farklı algoritmaların üstünlük gösterdiğini ve model tercihlerinin operasyonel önceliklere göre esnek biçimde ele alınması gerektiğini ortaya koymuştur. Veriyle sınırlı kalmamak adına, Bayesyen ağlara dayalı yenilikçi bir sentetik veri üretim süreci geliştirilmiştir. Bu sistem, daha önce gözlemlenmemiş ancak yapısal olarak anlamlı ve veriyle tutarlı yeni ürün tasarımlarının oluşturulmasını mümkün kılmaktadır. Sentetik ürünler, eğitilmiş modeller aracılığıyla değerlendirilmiş ve yalnızca yüksek potansiyel taşıdığı tahmin edilen, güven eşiğini aşan ürünler öneri havuzuna dahil edilmiştir. Bu sentetik ürünlerin güvenle değerlendirilebilmesi, sistemin fiziksel örnekler üretilmeden veya müşteri geri bildirimi alınmadan önce yeni tasarımları tarama ve ürün yelpazesi planlamasında risk azaltıcı bir katman sunma yeteneğini kanıtlamıştır. Bu ürünler daha sonra uzmanlar tarafından operasyonel, estetik ve pazarlama stratejilerine uygunluk açısından değerlendirilmiş; böylece sistem çıktılarının saha geçerliliği ilk kez test edilmiştir. Modelin yorumlanabilirliğini artırmak ve tasarımcılara doğrudan eyleme dönük içgörüler sunmak amacıyla, öznitelik önem analizi ve birliktelik kuralı madenciliği (ECLAT algoritması) gerçekleştirilmiştir. Öznitelik önem analizi, her bir ürün kategorisi için satış performansına en çok etki eden yapısal ve stilistik öznitelikleri ortaya koymuştur. Örneğin, dış giyimde fiziksel boyutlar öne çıkarken, tişörtlerde yaka detayları gibi stilistik öğelerin belirleyici olduğu gözlemlenmiştir. Birliktelik kuralı madenciliği ise, yüksek talep potansiyeli gösteren ürünlerde birlikte sıkça rastlanan öznitelik kombinasyonlarını gün yüzüne çıkarmıştır; şortlarda belirli uzunluk ve kalınlık özelliklerinin yüksek satışlarla güçlü korelasyonu gibi. Bu analizler, tasarım ekiplerine yalnızca sezgiye dayalı değil, veri temelli karar şablonları sunarak, yeni koleksiyon tasarımı sürecine doğrudan ve somut katkı sağlamaktadır. Bu tez çalışması, yapılandırılmış ürün niteliklerine dayalı, yorumlanabilir, ölçeklenebilir ve erken aşamalarda uygulanabilir bir karar destek sistemi önermektedir. Görsel veya kullanıcı etkileşimi verisine bağımlı olmaması sayesinde düşük veri erişimi koşullarında dahi uygulanabilirlik sağlar. Geliştirilen bu kapsamlı makine öğrenimi hattı, talep kategorilerini daha iyi ele almak için özel olarak ayarlanmış sıralı kayıp fonksiyonu ile XGBoost kullanımı, daha güvenilir çıktılar için güven tabanlı tahmin filtrelemesi, tasarım keşfini genişletmek için Bayesyen ağlar kullanılarak sentetik ürün üretimi ve eyleme dönük içgörüler için birliktelik kuralı madenciliği yoluyla yorumlanabilir örüntü çıkarımı gibi önemli özelliklere sahiptir. CatBoost ile yapılan karşılaştırmalı değerlendirme, geliştirilen hattın çeşitli ürün kategorilerindeki etkinliğini ve sağlamlığını daha da vurgulamıştır. Genel olarak, sonuçlar öznitelik düzeyindeki meta verilerin erken aşama talep tahmini için etkili bir şekilde kullanılabileceğini açıkça göstermektedir. Bu, dinamik moda perakendeciliği ortamında envanter riskini azaltmak ve tasarım aşaması karar alma süreçlerini önemli ölçüde iyileştirmek için pratik ve değerli bir araç sunmaktadır. Sunulan yaklaşım bazı sınırlamalara sahiptir. Mevcut çerçeve mevsimsellik, genel trend döngüleri veya dönemsel dalgalanmalar gibi zamansal dinamikleri doğrudan içermemektedir. Ayrıca, ürün görselleri veya kullanıcı etkileşimleri gibi zengin veri kaynakları bu versiyonda kullanılmamıştır. Nicel tabanlı bölümlendirmeye rağmen, bazı talep kategorilerinde sınıf dengesizliği hala mevcuttur. Sentetik verilerle yapılan tahminler uzmanlar tarafından incelenmiş olsa da, gerçek perakende ortamında saha testinden geçmemiştir. Gelecekteki çalışmalar bu kısıtlamaları ele alarak, zamansal dinamiklerin entegrasyonu, ileri düzey görsel gömüntülerin dahil edilmesiyle çok modlu modelleme, gelişmiş sınıf dengeleme stratejileri ve sentetik ürün tasarım sürecinin pekiştirmeli öğrenme ile iyileştirilmesi gibi yönlere odaklanabilir. Ayrıca, çizge sinir ağları (GNN'ler) aracılığıyla karmaşık öznitelik ilişkilerinin modellenmesi ve gerçek dünya pilot uygulamaları ile çerçevenin operasyonel etkinliğinin ve ticari değerinin doğrulanması önemli gelecek adımlarıdır. Hibrit topluluk modellemesi (XGBoost, Random Forest ve CatBoost kombinasyonu) de daha doğru ve sağlam tahminler için potansiyel sunmaktadır. Bu çalışma, hızlı tempolu moda endüstrisinde lansman öncesi karar alma süreçlerini önemli ölçüde destekleyebilecek ölçeklenebilir, yorumlanabilir ve üretim odaklı araçların geliştirilmesi için temel bir zemin oluşturmaktadır.

Özet (Çeviri)

Fashion retail is a highly dynamic sector characterized by rapidly shifting trends and extremely short product life cycles. This volatility significantly complicates demand forecasting, particularly for new products that lack historical sales data. In the literature, this is referred to as the“cold-start”problem, which introduces considerable uncertainty into product planning processes. Traditionally, the success of new products in the fashion industry has relied on the intuitive judgments of designers and purchasing teams. However, such decision-making processes are prone to subjectivity, often overlook detailed product attributes, and lack scalability. This study presents a scalable and interpretable machine learning framework developed in collaboration with one of Turkiyes's leading fashion retail companies. The objective is to discover novel, high-potential product combinations before they are produced, using only structured design attributes—such as fabric type, fit, neckline, and sleeve style—without relying on visual, behavioral, or time-series data. This approach provides a systematic method for proactively identifying promising new designs. The dataset includes detailed design features of fashion items along with their per-store sales ratios, from which demand levels were segmented into low, medium, and high. In the modeling phase, we employed XGBoost, CatBoost, and Random Forest algorithms, making several adjustments to better reflect the ordinal nature of the target variable and optimize performance across different evaluation dimensions. Rather than emphasizing a single metric, model performance was assessed using a trade-off between accuracy and coverage to better evaluate generalization capability. Results showed that different models performed better under varying conditions, underscoring the importance of aligning model choice with specific business priorities. The core contribution of this study lies in proposing an integrated, data-driven decision-support framework capable of evaluating new product designs solely based on structured attributes. To address the limitations of observed data, a Bayesian network-based synthetic data generation module was developed. This approach enables the simulation of logically coherent, realistic product configurations without the need for exhaustive historical transaction records. These synthetic items broaden the design space and allow for the exploration of high-potential but previously untested product variants.These synthetic products were then evaluated by the trained model, and only those that were predicted to have high sales potential and surpassed the predefined confidence threshold were retained. Before being passed on as actionable recommendations, these candidates were reviewed by domain experts to ensure contextual and operational coherence. In doing so, the system moves beyond conventional analytics focused solely on existing products and enables the early assessment of market potential for design-stage concepts.In contrast to most prior literature, which relies heavily on visual data (e.g., product images), user behavior (e.g., clickstreams), or time-series-based sales data, this study introduces a distinct attribute-based approach. This approach is viable even at the early stages of product development, as it does not require time-series sales data or user interaction data. As such, it avoids the limitations of data availability and offers a scalable, interpretable, and practical decision support tool for pre-production stages. In conclusion, this research introduces a data-driven framework for guiding pre-production decisions in the fashion industry, enabling firms to evaluate sales potential before launching products. This approach helps mitigate overstock risks while promoting early investment in high-potential designs. Future work may focus on integrating visual data, social media trend analysis, and expert feedback to further enhance the system's predictive capabilities

Benzer Tezler

  1. Müşteri analitiği ve öneri sistemleri uygulaması

    Customer analytics and recommender systems application

    ÖZGE ELMAS

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALP ÜSTÜNDAĞ

  2. Öneri sistemleri ile web sitesi performansının artırılması:Uygulamalar ve yeni bir yaklaşım

    Enhancing website performance with recommender systems: Applications and a new approach

    CAN BİLGİÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UMUT ASAN

  3. Müşteri tarafından algılanan marka değeri ve bankacılık sektöründe bir pilot araştırma

    The brand equity perception from clients and a sample search in Turkish banking sector

    ANIL GÖKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    BankacılıkGalatasaray Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ULUN AKTURAN

  4. Identifying influencer market manipulations and recommending engaging accounts

    Fenomen market manipülasyonlarını açıklama ve ilgi çekici hesaplar önerme

    ÖZGÜN YARGI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Mühendislik ve Doğa Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ONUR VAROL

  5. Online alışverişte tüketicilerin kullanıcı deneyimlerinin satın alma davranışlarına etkisi: Kitap alışverişi üzerine bir araştırma

    The effect of user experiences on consumers purchasing in online shopping behaviour: A research on book shopping

    TANER DOĞUER

    Doktora

    Türkçe

    Türkçe

    2021

    Halkla İlişkilerİstanbul Ticaret Üniversitesi

    Halkla İlişkiler ve Reklamcılık Ana Bilim Dalı

    DOÇ. DR. GÖZDE ÖYMEN