Geri Dön

Büyük veri analizinde etkin istatistiksel yöntemler

Effective statistical methods in big data

  1. Tez No: 810547
  2. Yazar: SERDAR CİHAT GÖREN
  3. Danışmanlar: PROF. DR. OLÇAY ARSLAN
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 93

Özet

Bu tez çalışmasında, büyük veri kullanarak hedonik regresyon modeli ile bir ürünün fiyatını etkileyen faktörleri tespit edip her bir özelliğin fiyata olan katkısını ölçmek amaçlanmıştır. Büyük veri kaynağından elde edilen dizüstü bilgisayar ürün grubuna ait fiyat ve özellik bilgilerinden yararlanarak yapılan analizler çerçevesinde En Küçük Kareler (EKK) ve robust (Huber M ve MM tahmin edici) tahmin yöntemleri karşılaştırılmış ve en etkin tahmin edici ön plana çıkarılmıştır. Verilerde gözlenebilecek aykırı değerlerin etkisini en aza indiren robust yöntemler kullanılarak verilerdeki aykırı değerlerin analiz sonucunu en az şekilde etkilemesi hedeflenmiştir. Çalışmada kullanılan veri seti çerçevesinde; dizüstü bilgisayarın fiyatını ve özelliklerinin fiyata olan katkısını en etkin şekilde tahmin eden modelin Tam Logaritmik robust hedonik regresyon modeli olduğu gözlenmiştir.

Özet (Çeviri)

This thesis aims to use big data in order to determine the features affecting the price of a product with the hedonic regression model and to estimate the contribution of each feature to the price by using robust regression estimation methods. For the analysis, the price and features of the laptop product groups were obtained from the big data source by using the web scraping method. Four different alternatives of the hedonic regression model are used to determine the features affecting the price of the laptops. The contribution of each feature to the laptop price is estimated by using the robust estimation methods (M and MM) and the Ordinary Least Squares (OLS) estimation method, and the resulting estimates are compared for both methods. By using robust methods that minimize the effect of outliers that can be observed in the data, it is aimed that the outliers in the data will have the least effect on the analysis result. In the framework of the data set used in the study, it is observed that the effective model is the Logarithmic Robust Hedonic Regression Model.

Benzer Tezler

  1. Visualization based analysis of gene networks using high dimensional model representation

    Yüksek boyutlu model gösterilim kullanılarak gen ağlarının görselleştirme tabanlı analizi

    PINAR GÜLER

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SÜHA TUNA

  2. From data to action: Transforming pressure testing in manufacturing with machine learning for enhancing energy efficiency

    Veriden aksiyona: Üretimdeki basınç testini makine öğrenimiyle dönüştürmek ve enerji verimliliğini artırmak

    ERHAN YILDIZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Enerjiİstanbul Teknik Üniversitesi

    Enerji Bilim ve Teknoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN

  3. Gestion de performance avec DEA en utilisant les extensions de controle des poids, d'efficacite croisee et d'analyse de fenetre

    Ağırlık kısıtlamaları, çapraz etkinlik ve pencere analizi yöntemleri kullanılarak veri zarflama analizi ile performans yönetimi

    FİRÜZAN İŞCAN

    Yüksek Lisans

    Fransızca

    Fransızca

    1999

    Endüstri ve Endüstri MühendisliğiGalatasaray Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. E. ERTUĞRUL KARSAK

  4. An investigation on coastal sea level changes of Blacksea using tide-gauge and satellite altimetry data

    Karadeniz'de mareograf istasyonu ve uydu altimetre verileri ile kıyı deniz seviyesi değişimlerinin araştırılması üzerine bir inceleme

    MOHSEN FEIZABADI

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BİHTER EROL

  5. Anomaly detection scenarios in cyber-physical systems

    Siber-fiziksel sistemlerde anomali tespit senaryoları

    AYŞE SAYIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. MEHMET TAHİR SANDIKKAYA