Geri Dön

Bayes toplamsal regresyon ağaçlarının otomobil fiyatları üzerine bir uygulaması

An application of Bayesian additive regression trees on automobile prices

  1. Tez No: 854762
  2. Yazar: ALEYNA ALTUNTAŞ ARABOĞLU
  3. Danışmanlar: PROF. DR. GÜLHAYAT GÖLBAŞI ŞİMŞEK
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 104

Özet

Ağaç topluluğu algoritmaları, çok çeşitli regresyon ve sınıflandırma problemleri için yüksek tahmin doğruluğu üretme yeteneklerinden dolayı makine öğreniminin ön saflarında ortaya çıkmıştır. Rastgele ormanlar gibi sınıflandırmaya dayalı algoritmalar, verilere uyum sağlamak için algoritmik prosedürlere dayanır. Buna karşılık, Bayes Toplamsal Regresyon Ağaçları (Bayesian Additive Regression Trees (BART)) gibi daha yeni algoritmalar, uyumları oluşturmak için temel bir Bayesci olasılık modeline odaklanır. Bu tezin amacı BART modeli ile otomobillerin birtakım özelliklerinin fiyat üzerindeki etkisinin tahmin edilmesidir. Çalışmanın ilk bölümünde, Bayesci yaklaşım ayrıntılı olarak ele alınmaktadır. Önsel dağılım ve türleri tanıtılıp sonsal dağılımdan ve yöntemlerinden bahsedilmektedir. Bayesci yaklaşımlara vurgu yapılarak BART algoritmaları için metodolojik gelişmelere odaklanılmaktadır. Çalışmanın ikinci bölümünde, sınıflandırmaya dayalı regresyon ağaçlarından Sınıflama ve Regresyon Ağaçları (Classification and Regression Trees (CART)) modeline odaklanılmaktadır. Bu iki model hakkında bilgi verildikten sonra otomobil verisi üzerinde regresyon ağacı (regression tree), rastgele orman (random forest) ve BART algoritmaları uygulanarak otomobillerin fiyatlarının belirlenmesinde hangi özelliklerin etkili olduğu tahmin edilmektedir. Bu üç algoritmanın performans ölçüm sonuçlarına göre ikinci el otomobil fiyatı üzerinde önemli etkiye sahip değişkenleri belirlemede en iyi performansı BART algoritması göstermektedir. Otomobillerin marka kilometre, yaş, genişlik, ağırlık, yükseklik, uzunluk, hızlanma, azami hız, ortalama yakıt tüketimi, bagaj kapasitesi, tork, vites, renk, kasa tipi, motor hacmi özelliklerinin yanı sıra iç-dış ve teknik donanımlarından park sensörü, sis farı, startstop, usb bağlantısı, mesafe takip sistemi, Bluetooth, gündüz sürüş farları, hıza duyarlı direksiyon, adaptif far, elektrikli sürücü koltuğu ve yokuş kalkış desteği değişkenlerinin de fiyat üzerinde etkisi olduğu sonucuna varılmaktadır.

Özet (Çeviri)

Tree ensemble algorithms have emerged at the forefront of machine learning due to their ability to generate high prediction accuracy for a wide range of regression and classification problems. Classification-based algorithms such as Random Forests rely on algorithmic procedures to fit the data. In contrast, newer algorithms like Bayesian Additive Regression Trees (BART) focus on a foundational Bayesian probability model to build fits. The aim of this thesis is to predict the impact of various features of automobiles on their prices using the BART model. The first section of the study extensively discusses the Bayesian approach, introducing prior distributions and their types, and delving into posterior distributions and methods, with an emphasis on Bayesian approaches and methodological developments for BART algorithms. The second section of the study focuses on the Classification and Regression Trees (CART) model, a regression tree based on classification. After providing information about these two models, regression tree, random forest, and BART algorithms are applied to automobile data to predict which features are influential in determining the prices of cars. According to the performance measurement results of these three algorithms, the BART algorithm demonstrates the best performance in determining variables that have a significant impact on the price of used cars. Variables such as brand, mileage, age, width, weight, height, length, acceleration, maximum speed, average fuel consumption, trunk capacity, torque, transmission, color, body type, and engine volume of cars, as well as interior-exterior and technical features such as parking sensors, fog lights, startstop, USB connection, distance tracking system, Bluetooth, daytime running lights, speed-sensitive steering, adaptive headlights, electric driver's seat, and hill start assist, are found to have an impact on prices.

Benzer Tezler

  1. Fonksiyonel veri analizinin karar ağaçlarında kullanımı

    Utilization of functional data analysis in decision trees

    BURCU KOCARIK GACAR

    Doktora

    Türkçe

    Türkçe

    2023

    EkonometriDokuz Eylül Üniversitesi

    Ekonometri Ana Bilim Dalı

    DOÇ. DR. İSTEM KESER

  2. Öğretmen yabancılaşması ve okul yöneticilerinin kullandığı güç stilleri arasındaki ilişkisinin incelenmesi

    Research of the relationship between teachers' alienation and power styles used by school principals

    HAYRİYE KUTLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Eğitim ve ÖğretimKarabük Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAMAZAN CANSOY

  3. Land cover classification using cloud-based machine learning techniques: A case study from Istanbul Metropolitan City

    Bulut tabanlı makine öğrenmesi teknikleri kullanılarak arazi örtüsü sınıflandırması: İstanbul Metropol örneği

    ŞEVVAL DURMAZBİLEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. ELİF SERTEL

  4. Sahte internet sitelerinin URL özellikleri temelinde tespit edilmesi amacıyla özellik seçme metotlarının ve öğrenme algoritmalarının analizi

    Analysis of feature selection methods and learning algorithms for phishing websites detection based on URL

    MUSTAFA AYDIN

    Doktora

    Türkçe

    Türkçe

    2022

    Bankacılıkİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    PROF. DR. SEVİNÇ GÜLSEÇEN

    PROF. DR. KUTLUK KAĞAN SÜMER

  5. Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini

    Forecasting the spread of covid-19 using deep learning and big data analytics methods

    CYLAS KIGANDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL