E-commerce product categorization through text classification
Metin siniflandirmasi yoluyla e-ticaret ürünlerinin kategorizasyonu
- Tez No: 875990
- Danışmanlar: DR. MERVE AYYÜCE KIZRAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 53
Özet
E-ticaret platformlarında ürünlerin doğru şekilde kategorize edilerek sunulması hem müşteri deneyiminin iyileştirilmesi hem de ürün yönetimi ve pazarlama süreçleri açısından önem taşımaktadır. Ürünlerin kategorilere atanma sürecinin manuel yürütülmesi çok fazla zaman ve çaba gerektirir ve hatalı/tutarsız kategori atama riski barındırır. Artan ürün hacmi ve çeşitliliği ile bu durum daha zorlayıcı bir göreve dönüşmektedir. Bu çalışma, ürün bilgilerini kullanarak pazaryeri ürünlerini otomatik olarak kategorize eden bir çözüm önermeyi amaçlamaktadır. Çalışmaya konu olan veri seti Türkiye'de satış yapan bir e-ticaret platformundan elde edilmiştir. Deneyde ürünleri kategorize etmek için Lojistik Regresyon, Destek Vektör Makineleri, eXtreme Gradient Boosting ve Uzun Kısa Vadeli Bellek metin sınıflandırma algoritmaları kullanılmıştır. Modeller, ürün başlıklarının yanı sıra ürün özellikleri (anahtar-değer) ve/veya ürün açıklamalarının da dahil edildiği üç farklı girdi ile eğitilmiştir. Model performansları doğruluk ve F1 skor metrikleri ile ölçülmüştür. Sonuçlar, ürün başlığı ve ürün özelliklerinin birlikte kullanıldığı girdi ile eğitilen SVM sınıflandırıcısının en iyi tahminleme performansına sahip olduğunu göstermiş, %82 F1 skoru elde edilmiştir. Çalışmada aynı zamanda farklı kelime gömme yöntemlerinin sınıflandırma başarısına etkisi araştırılmıştır. Word2vec, FastText ve TF-IDF kelime gömme yöntemlerinden TF-IDF yöntemi kullanılarak vektör temsillerine dönüştürülmüş girdi ile eğitilen sınıflandırma modeli diğerleri üzerinde performans üstünlüğü sağlamıştır. Son olarak, modelin yanlış tahminleme yaptığı başarısız vakalar analiz edilmiş ve sebepleri araştırılmıştır.
Özet (Çeviri)
In e-commerce platforms, accurate categorization of products is crucial for enhancing customer experience as well as for product management and marketing processes. Manually assigning products to categories requires significant time and effort and is prone to erroneous or inconsistent categorization. This task becomes even more challenging with the increasing volume and diversity of products. This study aims to propose a solution that automatically categorizes marketplace products using product information. The dataset used in the study was obtained from an e-commerce platform operating in Türkiye. Logistic Regression, Support Vector Machines, eXtreme Gradient Boosting, and Long Short-Term Memory text classification algorithms were employed to categorize products in the experiment. The models were trained with three different inputs: product titles only, product titles combined with product attributes (key-value pairs), and all three combined with product descriptions. Model performances were evaluated using accuracy and F1 score metrics. The results indicated that the SVM classifier trained with input comprising both product titles and attributes achieved the best prediction performance, with an F1 score of 82%. The study further investigated the impact of different word embedding techniques on classification success. Among Word2vec, FastText, and TF-IDF word embedding methods, the classification model trained with inputs transformed into vector representations using the TF-IDF method demonstrated superior performance over the others. The study lastly analyzed misclassified product cases to understand the reasons behind the errors.
Benzer Tezler
- Multi-class categorization of user-generated content in a domain specific medium: inferring product specifications from e-commerce marketplaces
Kullanici tarafindan üretilen içeriğin sınıflandırılması: e-ticaret pazaryerlerinden ürün spesifikasyonlarını çıkarma
KEMAL TOPRAK UÇAR
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA BORAHAN TÜMER
DR. MUSTAFA KIRAÇ
- Categorized storage structure design and skyline indexing for XML-based product catalogs
XML tabanlı ürün katalogları için kategorize edilmiş depolama yapısı dizaynı ve skyline indeksi
ÖMER CAN KOLÇAK
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. TAFLAN İMRE GÜNDEM
- E-ticaret sitelerinde çok kanallı kullanılabilirlik ve kullanıcı deneyimi çalışması
Omni-channel usability and user experience study on e-commerce sites
ESRA ÖZMEN
Doktora
Türkçe
2021
Bilim ve TeknolojiAtatürk ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. ERSİN KARAMAN
- Ticaretten e-ticarete Türkiye coğrafyasının değerlendirilmesi
Evaluation of Turkey's geography from commerce to e-commerce
ELİF GARAGON
Yüksek Lisans
Türkçe
2021
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
DOÇ. DR. EBRU KERİMOĞLU
- Fiyat karşılaştırmalı ürün arama motoru geliştirme
Developing product price comparison search engine
FURKAN GÖZÜKARA
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ZEKİ YETGİN