Geri Dön

Makine öğrenmesi yöntemleri kullanılarak gayrimenkul değer tahmininde coğrafi referanslı verinin katkısı

Contribution of geo-referenced data in real estate value prediction using machine learning methods

  1. Tez No: 917649
  2. Yazar: MUSTAFA DENİZ AYAR
  3. Danışmanlar: DOÇ. DR. ALPER ŞEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Jeodezi ve Fotogrametri, Geodesy and Photogrammetry
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Harita Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

Gayrimenkul değerlemesi, mülkiyetin doğru bir şekilde değerlendirilmesi ve tahmini piyasa değerinin belirlenmesi sürecidir. Fakat doğru bir gayrimenkul değerlemesi, insan uzman bilgisi gerektirir ve geleneksel gayrimenkul değerleme süreçleri zaman alıcıdır. Geleneksel yöntemler genellikle manuel değerlendirme tekniklerini içerirken, makine öğrenmesi teknikleri gayrimenkul değerlemesi alanında zaman, maliyet, iş gücü ve objektiflik konularında büyük bir potansiyel sunmaktadır. Son yıllarda emlak piyasasındaki gayrimenkullerin fiyatlarını tahmin etmek için makine öğrenmesi teknikleri ve algoritmalarının kullanımı artmıştır. Gayrimenkul değerlemesi için makine öğrenmesi yöntemleri, mülkün değerini etkileyen faktörleri analiz ederek ve tahmin modelleri oluşturarak çalışır. Bu faktörler arasında konum, yapısal özellikler, emlak piyasası verileri, sosyal ve ekonomik faktörler yer alabilir. Çok sayıda faktör bulunduğundan geleneksel yöntemlerde, çok sayıda değişken ve karmaşık ilişkiler göz ardı edilebilir. Bu gibi sebeplerden ötürü son yıllarda makine öğrenmesi yöntemleri ile gayrimenkul fiyat tahmini konusu üzerine birçok çalışma yapılmıştır. Bu çalışmada, gayrimenkul değerlemesinde makine öğrenmesi yöntemlerinin karşılaştırmalı kullanımı incelenmiş ve coğrafi referanslı verilerin tahmin doğruluğuna katkısı araştırılmıştır. Çalışmada 2023 yılı Mayıs ve Haziran aylarına ait İstanbul ili Bayrampaşa ilçesinde ki satılık 1267 adet konut ilanı veri seti için kullanılmıştır. Veri setinde konutlara ait yapısal ve mülki (m2 (Brüt), m2 (Net), oda sayısı, bina yaşı, toplam kat sayısı, bulunduğu kat, ısıtma türü, banyo sayısı, balkon bilgisi, eşya bilgisi, kullanım durumu bilgisi, site bilgisi, kredi durumu, aidat miktarı, tapu türü, fiyat) ek coğrafi referanslı (enlem, boylam) bilgileri de bulunmaktadır. Bu veri setine ağaç temelli makine öğrenmesi yöntemlerinden Rastgele Orman, Adaptive Boosting (AdaBoost), Extreme Gradient Boosting (XGBoost), CatBoost ile Çoklu Doğrusal Regresyon ve Coğrafi Ağırlıklı Regresyon yöntemleri uygulanarak veri eğitilmiş, test verileri tahmin edilmiştir. Makine öğrenmesi modelleri Belirleme Katsayısı (R2), Ortalama Mutlak Hata (MAE), Ortalama Mutlak Yüzde Hata (MAPE), Ortalama Kök Karesel Hata (RMSE) ölçütleri ile karşılaştırılmıştır. Karşılaştırma sonucunda Coğrafi Ağırlıklı Regresyon ile yapılan tahmin modeli 0,87 R2 skoru ile en başarılı model olmuştur. Coğrafi Ağırlıklı Regresyonu, 0,86 R2 skoru ile CatBoost ve Rastgele Orman, 0,85 R2 skoru ile XGBoost, 0,76 ve 0,74 R2 skoru ile Çoklu Doğrusal Regresyon ve AdaBoost yöntemleri takip etmiştir. Coğrafi Ağırlıklı Regresyon modelinin en başarılı sonucu verdiği görülmüştür. CatBoost, XGBoost ve Rastgele Orman algoritmalarının da başarılı tahmin sonuçları verdiği görüldükten sonra veri setinden coğrafi referanslı veriler (enlem, boylam) çıkarılarak mevcut modeller ile tahminler yapılmış, coğrafi referanslı özelliklerin model başarılarına etkisi gözlemlenmiştir. Coğrafi referanslı veriler olmadan hazırlanan bu yeni modeller ile sırasıyla CatBoost 0,82 R2, Rastgele Orman 0,81 R2, XGBoost 0,78 R2, Çoklu Doğrusal Regresyon 0,75 R2 ve AdaBoost 0,73 R2 skoru elde edilmiştir. Böylece çalışma sonunda Coğrafi Ağırlıklı Regresyon, CatBoost, XGBoost ve Rastgele Orman yöntemlerinin gayrimenkul değer tahminlerinde kullanılabileceği gözlemlenmiş, coğrafi referanslı verilerin değer tahminlerinin doğruluğunu arttırdığı anlaşılmıştır.

Özet (Çeviri)

Real estate valuation is the process of accurately assessing property and determining its estimated market value. However, accurate real estate valuation requires human expertise, and traditional valuation processes are time-consuming. While traditional methods often involve manual evaluation techniques, machine learning techniques offer great potential in the field of real estate valuation in terms of time, cost, labor and objectivity. In recent years, the use of machine learning techniques and algorithms to predict the prices of properties in the real estate market has increased. Machine learning methods for real estate valuation analyze factors influencing property values and build predictive models. These factors include location, structural attributes, real estate market data, and social and economic conditions. Due to the large number of factors, traditional methods may ignore the large number of variables and complex relationships. For these reasons, there have been many studies on real estate price prediction with machine learning methods in recent years. In this study, the comparative use of machine learning methods in real estate valuation is examined and the contribution of geo-referenced data to prediction accuracy is investigated. In the study, 1267 housing advertisements for sale in Bayrampaşa district of Istanbul province for the months of May and June 2023 are used for the data set. The dataset includes structural and property details (gross area, net area, number of rooms, building age, total number of floors, floor level, heating type, number of bathrooms, balcony presence, furniture status, usage status, site details, credit eligibility, dues amount, deed type, and price) as well as geo-referenced details (latitude, longitude). Random Forest, Adaptive Boosting (AdaBoost), Extreme Gradient Boosting (XGBoost), CatBoost, Multiple Linear Regression and Geographically Weighted Regression methods were applied to this dataset. Machine learning models were compared with Coefficient of Determination (R2), Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), Root Mean Squared Error (RMSE). As a result of the comparison, the prediction model with Geographically Weighted Regression was the most successful model with an R2 Score of 0,87. Geographically Weighted Regression was followed by CatBoost and Random Forest with an R2 Score of 0,86, XGBoost with an R2 Score of 0,85, Multiple Linear Regression and AdaBoost with R2 Scores of 0,76 and 0,74. The Geographically Weighted Regression model was found to be the most successful. After it was observed that CatBoost, XGBoost and Random Forest algorithms also gave successful prediction results, geo-referenced features (latitude, longitude) were removed from the dataset and predictions were made with the existing models and the effect of geo-referenced features on model success was observed. With these new models prepared without geo-referenced data, CatBoost 0,82 R2, Random Forest 0,81 R2, XGBoost 0,78 R2, Multiple Linear Regression 0,75 R2 and AdaBoost 0,73 R2 scores were obtained respectively. Thus, at the end of the study, it was observed that Geographically Weighted Regression, CatBoost, XGBoost and Random Forest methods can be used in real estate value estimations, and it was understood that geo-referenced data increases the accuracy of value estimations.

Benzer Tezler

  1. Elektrikli araçların kullanıcı tercihlerine göre sınıflandırılması: hibrit bir yaklaşım

    Classification of electric vehicles based on user preference: a hybrid approach

    MEHMET DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UMUT ASAN

  2. Elektronik sözleşmelerde sözleşmenin kuruluşu ve şekil

    The Conclusion of contract in electronic contracts and form

    ULVİ ALTINIŞIK

    Yüksek Lisans

    Türkçe

    Türkçe

    2001

    HukukAnkara Üniversitesi

    Medeni Hukuk Ana Bilim Dalı

    YRD. DOÇ. DR. HASAN SEÇKİN OZANOĞLU

  3. Makine öğrenmesi yöntemleri kullanılarak gayrimenkul fiyat tahmini

    Real Estate Prediction Using Machine LearningMethods

    NEBİYE GEDİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Matematik Ana Bilim Dalı

    PROF. DR. ÖZGÜR YILDIRIM

  4. Gayrimenkul değerlemesinde makine öğrenmesi tekniklerinin kıyaslanması

    Comparison of machine learning techniques in real estate valuation

    FATMA ER

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri MühendisliğiYıldız Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. SELÇUK ÇEBİ

  5. Predicting house prices in Ankara using machine learning

    Makine öğrenimi kullanarak Ankara'da ev fiyatlarini tahmin etme

    CİHAN ERSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgi ve Belge YönetimiÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERDAR ARSLAN