Veri madenciliği teknikleri ile e-ticaret platformu satış verilerinin incelenmesi
Analysis of e-Commerce platform sales data using data mining techniques
- Tez No: 964272
- Danışmanlar: DOÇ. DR. GÜRHAN GÜNDÜZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Pamukkale Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 60
Özet
Bu yüksek lisans tezinde, veri madenciliği teknikleri kullanılarak geniş ölçekli bir e-ticaret platformuna ait satış verilerinin analizi gerçekleştirilmiş ve bu analizler aracılığıyla müşteri davranışlarının çok boyutlu olarak incelenmesi amaçlanmıştır. Çalışma, özellikle Market Basket Analysis (Sepet Analizi) ve ürünler arası birliktelik kurallarının çıkarımı olmak üzere iki temel veri madenciliği yaklaşımına odaklanmaktadır. Araştırma kapsamında, Apriori, FP-Growth ve H-Mine algoritmaları hem tek çekirdekli Python (mlxtend) ortamında hem de yüksek ölçeklenebilirlik sunan Apache Spark altyapısında, farklı düzeylerde paralel işlem gücü kullanılarak uygulanmıştır. Böylelikle, klasik yöntemler ile dağıtık/büyük veri işleme platformlarının performans ve verimlilik bakımından karşılaştırılması sağlanmıştır. Analizler, 100 satırdan 10 milyon satıra kadar değişen farklı veri boyutları üzerinde yürütülmüş; algoritmaların işlem süreleri, kural üretme kapasitesi, ölçeklenebilirlik düzeyleri ve hesaplama kaynaklarının etkin kullanımı bakımından ayrıntılı değerlendirmeleri yapılmıştır. Elde edilen sonuçlar, müşteri satın alma eğilimlerinin istatistiksel olarak anlamlı birliktelik kuralları aracılığıyla ortaya konmasına olanak sağlamıştır. Bu kapsamda, yüksek destek ve güven değerlerine sahip ürün kombinasyonları tespit edilmiş; söz konusu kombinasyonların, kişiselleştirilmiş pazarlama stratejilerinde, çapraz satış uygulamalarında ve öneri sistemlerinin iyileştirilmesinde doğrudan kullanılabilir olduğu belirlenmiştir. Ayrıca, farklı birliktelik kuralı madenciliği algoritmalarının avantaj ve dezavantajları, büyük veri ölçeklerinde işlem maliyeti, bellek kullanımı ve kural kalitesi kriterleri üzerinden karşılaştırmalı olarak analiz edilmiştir. Bu çalışma, veri madenciliği yöntemlerinin e-ticaret alanındaki uygulama potansiyelini yüksek düzeyde ortaya koyan kapsamlı bir örnek niteliğindedir. Akademik açıdan, birliktelik kuralı madenciliği literatürüne hem yöntemsel hem de uygulama boyutunda katkı sunmakta; sektörel açıdan ise, büyük veri işleme, müşteri davranış modelleme ve veri odaklı pazarlama stratejileri konularında işletmelere rekabet avantajı sağlayabilecek nitelikte ölçeklenebilir ve uygulanabilir çözüm önerileri geliştirmektedir.
Özet (Çeviri)
In this master's thesis, sales data from a large-scale e-commerce platform were analyzed using data mining techniques, with the objective of conducting a multidimensional examination of customer behavior. The study specifically focuses on two fundamental data mining approaches: Market Basket Analysis (MBA) and the extraction of association rules between products. Within the scope of the research, the Apriori, FP-Growth, and H-Mine algorithms were implemented both in a single-core Python environment (mlxtend) and on the highly scalable Apache Spark framework, utilizing varying levels of parallel processing power. This dual implementation enabled a comparative evaluation of the performance and efficiency of traditional methods versus distributed/big data processing platforms. Analyses were conducted on datasets ranging in size from 100 rows to 10 million rows, and the algorithms were comprehensively assessed in terms of execution time, rule generation capacity, scalability, and computational resource utilization. The results revealed statistically significant association rules that effectively reflect customer purchasing tendencies. High-support and high-confidence product combinations were identified, which can be directly leveraged in personalized marketing strategies, cross-selling applications, and the enhancement of recommendation systems. Additionally, the advantages and limitations of different association rule mining algorithms were comparatively analyzed based on computational cost, memory consumption, and rule quality in large-scale data environments. This study serves as a comprehensive example that demonstrates the high potential of data mining methodologies in the e-commerce domain. From an academic perspective, it contributes to the literature on association rule mining both methodologically and in terms of applied research. From an industry perspective, it offers scalable and applicable solution strategies capable of providing a competitive advantage for enterprises in big data processing, customer behavior modeling, and data-driven marketing strategies.
Benzer Tezler
- An investigation of the impact of different data cleaning techniques on metric result quality in machine learning
Makine öğrenmesinde, farklı veri temizleme tekniklerlerinin sonuç ölçevleri üzerindeki etkisinin incelenmesi
ISRAA MUSTAFA ABBAS
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. SACİP TOKER
- Product and customer segmentation by purchase behavior in e-commerce platforms using stochastic block model
Stokastik blok model kullanarak e-ticaret platformlarında satın alma davranışına göre ürün ve müşteri segmentasyonu
KENAN KAFKAS
Doktora
İngilizce
2022
Bilim ve TeknolojiKadir Has ÜniversitesiYönetim Bilimleri Ana Bilim Dalı
DOÇ. DR. MEHMET NAFİZ AYDIN
YRD. DOÇ. DR. NAZIM ZİYA PERDAHÇI
- Metin madenciliği teknikleri kullanılarak Türkçe müşteri yorumlarının sınıflandırılması
Classification of customer comments in Turkish using text-mining techniques
VELİ CENGİZ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolİSTANBUL BEYKENT ÜNİVERSİTESİBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TALAT FİRLAR
- TV ve set üstü cihaz arayüz kullanılabilirlik ölçümü
Usability evaluation of TV and set-top box interfaces
AYCAN PEKPAZAR
Doktora
Türkçe
2021
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM ALTIN GÜMÜŞSOY
- A frequency-based weighting mechanism for data embedding methodologies
Veri gömme yöntemleri için sıklık tabanlı ağırlıklandırma mekanizması
NAİL TAŞGETİREN
Doktora
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET SIDDIK AKTAŞ