Büyük veri analizinde etkin istatistiksel yöntemler
Effective statistical methods in big data
- Tez No: 810547
- Danışmanlar: PROF. DR. OLÇAY ARSLAN
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 93
Özet
Bu tez çalışmasında, büyük veri kullanarak hedonik regresyon modeli ile bir ürünün fiyatını etkileyen faktörleri tespit edip her bir özelliğin fiyata olan katkısını ölçmek amaçlanmıştır. Büyük veri kaynağından elde edilen dizüstü bilgisayar ürün grubuna ait fiyat ve özellik bilgilerinden yararlanarak yapılan analizler çerçevesinde En Küçük Kareler (EKK) ve robust (Huber M ve MM tahmin edici) tahmin yöntemleri karşılaştırılmış ve en etkin tahmin edici ön plana çıkarılmıştır. Verilerde gözlenebilecek aykırı değerlerin etkisini en aza indiren robust yöntemler kullanılarak verilerdeki aykırı değerlerin analiz sonucunu en az şekilde etkilemesi hedeflenmiştir. Çalışmada kullanılan veri seti çerçevesinde; dizüstü bilgisayarın fiyatını ve özelliklerinin fiyata olan katkısını en etkin şekilde tahmin eden modelin Tam Logaritmik robust hedonik regresyon modeli olduğu gözlenmiştir.
Özet (Çeviri)
This thesis aims to use big data in order to determine the features affecting the price of a product with the hedonic regression model and to estimate the contribution of each feature to the price by using robust regression estimation methods. For the analysis, the price and features of the laptop product groups were obtained from the big data source by using the web scraping method. Four different alternatives of the hedonic regression model are used to determine the features affecting the price of the laptops. The contribution of each feature to the laptop price is estimated by using the robust estimation methods (M and MM) and the Ordinary Least Squares (OLS) estimation method, and the resulting estimates are compared for both methods. By using robust methods that minimize the effect of outliers that can be observed in the data, it is aimed that the outliers in the data will have the least effect on the analysis result. In the framework of the data set used in the study, it is observed that the effective model is the Logarithmic Robust Hedonic Regression Model.
Benzer Tezler
- Sağlık harcamaları belirleyicilerinin veri madenciliği yöntemleri ile modellenmesi
The modeling of determinants of health expenditures using data mining methods
MELİHA MELİŞ GÜNALTAY
Doktora
Türkçe
2024
Sağlık YönetimiAnkara ÜniversitesiSağlık Yönetimi Ana Bilim Dalı
PROF. DR. GÜLBİYE YAŞAR
- Efficient estimation of Shrinkage parameters in fuzzy Ridge and fuzzy Liu regression models using α-cut-based methods under multicollinearity
Çoklu bağıntı durumunda bulanık Ridge ve bulanık Liu regresyon modellerinde α-kesim tabanlı yöntemler kullanılarak Shrinkage parametrelerinin etkin tahmini
AMMAR HOMAIDA
- Visualization based analysis of gene networks using high dimensional model representation
Yüksek boyutlu model gösterilim kullanılarak gen ağlarının görselleştirme tabanlı analizi
PINAR GÜLER
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SÜHA TUNA
- From data to action: Transforming pressure testing in manufacturing with machine learning for enhancing energy efficiency
Veriden aksiyona: Üretimdeki basınç testini makine öğrenimiyle dönüştürmek ve enerji verimliliğini artırmak
ERHAN YILDIZ
Yüksek Lisans
İngilizce
2024
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN
- Gestion de performance avec DEA en utilisant les extensions de controle des poids, d'efficacite croisee et d'analyse de fenetre
Ağırlık kısıtlamaları, çapraz etkinlik ve pencere analizi yöntemleri kullanılarak veri zarflama analizi ile performans yönetimi
FİRÜZAN İŞCAN
Yüksek Lisans
Fransızca
1999
Endüstri ve Endüstri MühendisliğiGalatasaray ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. E. ERTUĞRUL KARSAK