Büyük veri analizinde etkin istatistiksel yöntemler
Effective statistical methods in big data
- Tez No: 810547
- Danışmanlar: PROF. DR. OLÇAY ARSLAN
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 93
Özet
Bu tez çalışmasında, büyük veri kullanarak hedonik regresyon modeli ile bir ürünün fiyatını etkileyen faktörleri tespit edip her bir özelliğin fiyata olan katkısını ölçmek amaçlanmıştır. Büyük veri kaynağından elde edilen dizüstü bilgisayar ürün grubuna ait fiyat ve özellik bilgilerinden yararlanarak yapılan analizler çerçevesinde En Küçük Kareler (EKK) ve robust (Huber M ve MM tahmin edici) tahmin yöntemleri karşılaştırılmış ve en etkin tahmin edici ön plana çıkarılmıştır. Verilerde gözlenebilecek aykırı değerlerin etkisini en aza indiren robust yöntemler kullanılarak verilerdeki aykırı değerlerin analiz sonucunu en az şekilde etkilemesi hedeflenmiştir. Çalışmada kullanılan veri seti çerçevesinde; dizüstü bilgisayarın fiyatını ve özelliklerinin fiyata olan katkısını en etkin şekilde tahmin eden modelin Tam Logaritmik robust hedonik regresyon modeli olduğu gözlenmiştir.
Özet (Çeviri)
This thesis aims to use big data in order to determine the features affecting the price of a product with the hedonic regression model and to estimate the contribution of each feature to the price by using robust regression estimation methods. For the analysis, the price and features of the laptop product groups were obtained from the big data source by using the web scraping method. Four different alternatives of the hedonic regression model are used to determine the features affecting the price of the laptops. The contribution of each feature to the laptop price is estimated by using the robust estimation methods (M and MM) and the Ordinary Least Squares (OLS) estimation method, and the resulting estimates are compared for both methods. By using robust methods that minimize the effect of outliers that can be observed in the data, it is aimed that the outliers in the data will have the least effect on the analysis result. In the framework of the data set used in the study, it is observed that the effective model is the Logarithmic Robust Hedonic Regression Model.
Benzer Tezler
- Visualization based analysis of gene networks using high dimensional model representation
Yüksek boyutlu model gösterilim kullanılarak gen ağlarının görselleştirme tabanlı analizi
PINAR GÜLER
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SÜHA TUNA
- From data to action: Transforming pressure testing in manufacturing with machine learning for enhancing energy efficiency
Veriden aksiyona: Üretimdeki basınç testini makine öğrenimiyle dönüştürmek ve enerji verimliliğini artırmak
ERHAN YILDIZ
Yüksek Lisans
İngilizce
2024
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN
- Gestion de performance avec DEA en utilisant les extensions de controle des poids, d'efficacite croisee et d'analyse de fenetre
Ağırlık kısıtlamaları, çapraz etkinlik ve pencere analizi yöntemleri kullanılarak veri zarflama analizi ile performans yönetimi
FİRÜZAN İŞCAN
Yüksek Lisans
Fransızca
1999
Endüstri ve Endüstri MühendisliğiGalatasaray ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. E. ERTUĞRUL KARSAK
- An investigation on coastal sea level changes of Blacksea using tide-gauge and satellite altimetry data
Karadeniz'de mareograf istasyonu ve uydu altimetre verileri ile kıyı deniz seviyesi değişimlerinin araştırılması üzerine bir inceleme
MOHSEN FEIZABADI
Yüksek Lisans
İngilizce
2016
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. BİHTER EROL
- Anomaly detection scenarios in cyber-physical systems
Siber-fiziksel sistemlerde anomali tespit senaryoları
AYŞE SAYIN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. MEHMET TAHİR SANDIKKAYA