Geri Dön

E-commerce product categorization through text classification

Metin siniflandirmasi yoluyla e-ticaret ürünlerinin kategorizasyonu

  1. Tez No: 875990
  2. Yazar: TUĞÇE KARAGÖL
  3. Danışmanlar: DR. MERVE AYYÜCE KIZRAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 53

Özet

E-ticaret platformlarında ürünlerin doğru şekilde kategorize edilerek sunulması hem müşteri deneyiminin iyileştirilmesi hem de ürün yönetimi ve pazarlama süreçleri açısından önem taşımaktadır. Ürünlerin kategorilere atanma sürecinin manuel yürütülmesi çok fazla zaman ve çaba gerektirir ve hatalı/tutarsız kategori atama riski barındırır. Artan ürün hacmi ve çeşitliliği ile bu durum daha zorlayıcı bir göreve dönüşmektedir. Bu çalışma, ürün bilgilerini kullanarak pazaryeri ürünlerini otomatik olarak kategorize eden bir çözüm önermeyi amaçlamaktadır. Çalışmaya konu olan veri seti Türkiye'de satış yapan bir e-ticaret platformundan elde edilmiştir. Deneyde ürünleri kategorize etmek için Lojistik Regresyon, Destek Vektör Makineleri, eXtreme Gradient Boosting ve Uzun Kısa Vadeli Bellek metin sınıflandırma algoritmaları kullanılmıştır. Modeller, ürün başlıklarının yanı sıra ürün özellikleri (anahtar-değer) ve/veya ürün açıklamalarının da dahil edildiği üç farklı girdi ile eğitilmiştir. Model performansları doğruluk ve F1 skor metrikleri ile ölçülmüştür. Sonuçlar, ürün başlığı ve ürün özelliklerinin birlikte kullanıldığı girdi ile eğitilen SVM sınıflandırıcısının en iyi tahminleme performansına sahip olduğunu göstermiş, %82 F1 skoru elde edilmiştir. Çalışmada aynı zamanda farklı kelime gömme yöntemlerinin sınıflandırma başarısına etkisi araştırılmıştır. Word2vec, FastText ve TF-IDF kelime gömme yöntemlerinden TF-IDF yöntemi kullanılarak vektör temsillerine dönüştürülmüş girdi ile eğitilen sınıflandırma modeli diğerleri üzerinde performans üstünlüğü sağlamıştır. Son olarak, modelin yanlış tahminleme yaptığı başarısız vakalar analiz edilmiş ve sebepleri araştırılmıştır.

Özet (Çeviri)

In e-commerce platforms, accurate categorization of products is crucial for enhancing customer experience as well as for product management and marketing processes. Manually assigning products to categories requires significant time and effort and is prone to erroneous or inconsistent categorization. This task becomes even more challenging with the increasing volume and diversity of products. This study aims to propose a solution that automatically categorizes marketplace products using product information. The dataset used in the study was obtained from an e-commerce platform operating in Türkiye. Logistic Regression, Support Vector Machines, eXtreme Gradient Boosting, and Long Short-Term Memory text classification algorithms were employed to categorize products in the experiment. The models were trained with three different inputs: product titles only, product titles combined with product attributes (key-value pairs), and all three combined with product descriptions. Model performances were evaluated using accuracy and F1 score metrics. The results indicated that the SVM classifier trained with input comprising both product titles and attributes achieved the best prediction performance, with an F1 score of 82%. The study further investigated the impact of different word embedding techniques on classification success. Among Word2vec, FastText, and TF-IDF word embedding methods, the classification model trained with inputs transformed into vector representations using the TF-IDF method demonstrated superior performance over the others. The study lastly analyzed misclassified product cases to understand the reasons behind the errors.

Benzer Tezler

  1. Multi-class categorization of user-generated content in a domain specific medium: inferring product specifications from e-commerce marketplaces

    Kullanici tarafindan üretilen içeriğin sınıflandırılması: e-ticaret pazaryerlerinden ürün spesifikasyonlarını çıkarma

    KEMAL TOPRAK UÇAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA BORAHAN TÜMER

    DR. MUSTAFA KIRAÇ

  2. Categorized storage structure design and skyline indexing for XML-based product catalogs

    XML tabanlı ürün katalogları için kategorize edilmiş depolama yapısı dizaynı ve skyline indeksi

    ÖMER CAN KOLÇAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. TAFLAN İMRE GÜNDEM

  3. E-ticaret sitelerinde çok kanallı kullanılabilirlik ve kullanıcı deneyimi çalışması

    Omni-channel usability and user experience study on e-commerce sites

    ESRA ÖZMEN

    Doktora

    Türkçe

    Türkçe

    2021

    Bilim ve TeknolojiAtatürk Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. ERSİN KARAMAN

  4. Ticaretten e-ticarete Türkiye coğrafyasının değerlendirilmesi

    Evaluation of Turkey's geography from commerce to e-commerce

    ELİF GARAGON

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    DOÇ. DR. EBRU KERİMOĞLU

  5. Fiyat karşılaştırmalı ürün arama motoru geliştirme

    Developing product price comparison search engine

    FURKAN GÖZÜKARA

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ZEKİ YETGİN