Sales prediction using data analytics: A machine learning approach
Veri analitiği ile satiş tahmini: Makine öğrenmesi yaklaşimi
- Tez No: 780875
- Danışmanlar: DOÇ. DR. BABEK ERDEBİLLİ
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 96
Özet
Yapay zeka uygulamaları, araştırmacılar tarafından gün geçtikçe artan ilgi görmektedir. Çoğunlukla robotik ve bilişim alanlarında kullanılan bu uygulamalar, endüstride günlük olarak yaşanan sorunları çözebilmektedir. Yapay zekanın bir alt dalı olan makine öğrenmesi (ML), geçmişe dönük verilere dayalı olarak geleceğe yönelik tahminler yapılmasını sağlar. Bu nedenle satış tahminlerini yapmak için makine öğrenmesi yöntemlerini kullanmak mümkündür. İşletmeler tarafından depolanan veri miktarları büyük boyutlara ulaştığından satış tahminlerini geleneksel yöntemlerle yapmak oldukça zor hale gelmiştir. Bu tezde, ofis malzemeleri endüstrisindeki bir işletme için makine öğrenmesi algoritmaları kullanılarak satış tahmini yapılmıştır. İlk olarak, keşifçi veri analizi kullanılarak veri setinden istatistiksel ve görsel çıkarımlar yapılmıştır. Veri seti kategorik değişkenler ve sayısal değişkenler ayrı ayrı ele alınarak incelenmiş, eksik veri ve aykırı değer analizleri yapılmıştır. On iki algoritma (Lineer regresyon, Ridge regresyon, Lasso regresyon, ElasticNet regresyon, K-Nearest Neighbor (KNN), Random Forest (RF), Support Vector Regression (SVR), Classification and Regression Trees (CART), Gradient Boosting Machine (GBM), Light Gradient Boosting Machine (LightGBM), Categorical Boosting Machine (CatBoost) and Extreme Gradient Boosting Machine (XGBoost)) uygulanmış; ortalama hata karesi, ortalama mutlak hata ve R^2 fonksiyonları kullanılarak sonuçlar değerlendirilmiştir. Model ayarlaması, her algoritma için farklı parametreler kullanılarak gerçekleştirilmiştir. Sonuçlar, en başarılı algoritmanın 11.7643 RMSE değeri ile XGBoost olduğunu göstermiştir. XGBoost algoritması ile geliştirilen model kullanılarak tahmin yapılmıştır.
Özet (Çeviri)
Artificial intelligence applications are attracting increasing amounts of attention from researchers. These applications, which are mostly used in the fields of robotics and informatics, are able to solve problems experienced on a daily basis in industry. Machine learning (ML), a sub-branch of artificial intelligence, enables predictions to be made about the future based on historical data, and it is therefore possible to use ML methods to make sales forecasts. Since the amounts of data stored by companies are now very large, sales forecast operations are now fairly difficult with traditional methods. In this thesis, a sales forecast is made for a company in the office supply industry using ML algorithms. First, statistical and visual inferences were made from the dataset using exploratory data analysis. The dataset was examined by considering categorical variables and numerical variables separately, and missing data and outlier analyses were carried out. Twelve algorithms (Linear regression, Ridge regression, Lasso regression, ElasticNet regression, K-Nearest Neighbor (KNN), Random Forest (RF), Support Vector Regression (SVR), Classification and Regression Trees (CART), Gradient Boosting Machine (GBM), Light Gradient Boosting Machine (LightGBM), Categorical Boosting Machine (CatBoost) and Extreme Gradient Boosting Machine (XGBoost)) were applied, and the error functions were evaluated using the Root Mean Squared Error (RMSE), Mean Absolute Error (MAE) and coefficient of determination (R^2). Model tuning was performed using different parameters for each algorithm. The results showed that the most successful algorithm was XGBoost, with a value for RMSE of 11.7643. A prediction was made based on this tuned score using XGBoost algorithm model.
Benzer Tezler
- Deniz ticaret endekslerini zaman serisi modelleri kullanarak tahminleme
Forecasting maritime trade indexes by using the time series models
KAAN KOYUNCU
Doktora
Türkçe
2022
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. LEYLA TAVACIOĞLU
- Bir e-ticaret firması için rfm analizi ve kümeleme algoritmaları kullanılarak müşteri segmentasyonu ve analizi
Customer segmentation using rfm analysis and customer segmentation and analysis with using clustering algorithms
HAVVA GÜLSÜM ERARSLAN
Yüksek Lisans
Türkçe
2023
İstatistikİstanbul Medeniyet ÜniversitesiUygulamalı Matematik ve Hesaplamalı Bilimler Ana Bilim Dalı
DOÇ. DR. RÜYA ŞEN
- Yapay sinir ağları ve makine öğrenmesi ile otomobil satış tahmininin yapılması ve zaman serileri analizi ile karşılaştırılması
Forecasting automobile sales using artificial neural networks and machine learning and comparison with time series analysis
BEYZA KURTGERİ
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. MERVE CENGİZ TOKLU
- Temel ve teknik analize dayalı makine öğrenmesi ile hisse senedi fiyat tahmini: Rastgele orman sınıflandırması yaklaşımı
Stock price prediction with machine learning based on fundamental and technical analysis: Random forest classification approach
DENİZ KAVUK SALIŞ
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiGebze Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMED BURAK PAÇ
- Satış adedini etkileyen değişkenlerin keşfi ve duyarlılık analizi uygulaması: E-ticaret örneği
Discovery of variables affecting the number of sales and application of sensitivity analysis: E-commerce example
RABİA AYDIN
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. FETHİ ÇALIŞIR