Bayes toplamsal regresyon ağaçlarının otomobil fiyatları üzerine bir uygulaması
An application of Bayesian additive regression trees on automobile prices
- Tez No: 854762
- Danışmanlar: PROF. DR. GÜLHAYAT GÖLBAŞI ŞİMŞEK
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 104
Özet
Ağaç topluluğu algoritmaları, çok çeşitli regresyon ve sınıflandırma problemleri için yüksek tahmin doğruluğu üretme yeteneklerinden dolayı makine öğreniminin ön saflarında ortaya çıkmıştır. Rastgele ormanlar gibi sınıflandırmaya dayalı algoritmalar, verilere uyum sağlamak için algoritmik prosedürlere dayanır. Buna karşılık, Bayes Toplamsal Regresyon Ağaçları (Bayesian Additive Regression Trees (BART)) gibi daha yeni algoritmalar, uyumları oluşturmak için temel bir Bayesci olasılık modeline odaklanır. Bu tezin amacı BART modeli ile otomobillerin birtakım özelliklerinin fiyat üzerindeki etkisinin tahmin edilmesidir. Çalışmanın ilk bölümünde, Bayesci yaklaşım ayrıntılı olarak ele alınmaktadır. Önsel dağılım ve türleri tanıtılıp sonsal dağılımdan ve yöntemlerinden bahsedilmektedir. Bayesci yaklaşımlara vurgu yapılarak BART algoritmaları için metodolojik gelişmelere odaklanılmaktadır. Çalışmanın ikinci bölümünde, sınıflandırmaya dayalı regresyon ağaçlarından Sınıflama ve Regresyon Ağaçları (Classification and Regression Trees (CART)) modeline odaklanılmaktadır. Bu iki model hakkında bilgi verildikten sonra otomobil verisi üzerinde regresyon ağacı (regression tree), rastgele orman (random forest) ve BART algoritmaları uygulanarak otomobillerin fiyatlarının belirlenmesinde hangi özelliklerin etkili olduğu tahmin edilmektedir. Bu üç algoritmanın performans ölçüm sonuçlarına göre ikinci el otomobil fiyatı üzerinde önemli etkiye sahip değişkenleri belirlemede en iyi performansı BART algoritması göstermektedir. Otomobillerin marka kilometre, yaş, genişlik, ağırlık, yükseklik, uzunluk, hızlanma, azami hız, ortalama yakıt tüketimi, bagaj kapasitesi, tork, vites, renk, kasa tipi, motor hacmi özelliklerinin yanı sıra iç-dış ve teknik donanımlarından park sensörü, sis farı, startstop, usb bağlantısı, mesafe takip sistemi, Bluetooth, gündüz sürüş farları, hıza duyarlı direksiyon, adaptif far, elektrikli sürücü koltuğu ve yokuş kalkış desteği değişkenlerinin de fiyat üzerinde etkisi olduğu sonucuna varılmaktadır.
Özet (Çeviri)
Tree ensemble algorithms have emerged at the forefront of machine learning due to their ability to generate high prediction accuracy for a wide range of regression and classification problems. Classification-based algorithms such as Random Forests rely on algorithmic procedures to fit the data. In contrast, newer algorithms like Bayesian Additive Regression Trees (BART) focus on a foundational Bayesian probability model to build fits. The aim of this thesis is to predict the impact of various features of automobiles on their prices using the BART model. The first section of the study extensively discusses the Bayesian approach, introducing prior distributions and their types, and delving into posterior distributions and methods, with an emphasis on Bayesian approaches and methodological developments for BART algorithms. The second section of the study focuses on the Classification and Regression Trees (CART) model, a regression tree based on classification. After providing information about these two models, regression tree, random forest, and BART algorithms are applied to automobile data to predict which features are influential in determining the prices of cars. According to the performance measurement results of these three algorithms, the BART algorithm demonstrates the best performance in determining variables that have a significant impact on the price of used cars. Variables such as brand, mileage, age, width, weight, height, length, acceleration, maximum speed, average fuel consumption, trunk capacity, torque, transmission, color, body type, and engine volume of cars, as well as interior-exterior and technical features such as parking sensors, fog lights, startstop, USB connection, distance tracking system, Bluetooth, daytime running lights, speed-sensitive steering, adaptive headlights, electric driver's seat, and hill start assist, are found to have an impact on prices.
Benzer Tezler
- Fonksiyonel veri analizinin karar ağaçlarında kullanımı
Utilization of functional data analysis in decision trees
BURCU KOCARIK GACAR
- Öğretmen yabancılaşması ve okul yöneticilerinin kullandığı güç stilleri arasındaki ilişkisinin incelenmesi
Research of the relationship between teachers' alienation and power styles used by school principals
HAYRİYE KUTLU
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimKarabük ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RAMAZAN CANSOY
- Land cover classification using cloud-based machine learning techniques: A case study from Istanbul Metropolitan City
Bulut tabanlı makine öğrenmesi teknikleri kullanılarak arazi örtüsü sınıflandırması: İstanbul Metropol örneği
ŞEVVAL DURMAZBİLEK
Yüksek Lisans
İngilizce
2021
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. ELİF SERTEL
- Sahte internet sitelerinin URL özellikleri temelinde tespit edilmesi amacıyla özellik seçme metotlarının ve öğrenme algoritmalarının analizi
Analysis of feature selection methods and learning algorithms for phishing websites detection based on URL
MUSTAFA AYDIN
Doktora
Türkçe
2022
Bankacılıkİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
PROF. DR. SEVİNÇ GÜLSEÇEN
PROF. DR. KUTLUK KAĞAN SÜMER
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL