Makine öğrenmesi yöntemleri kullanılarak gayrimenkul değer tahmininde coğrafi referanslı verinin katkısı
Contribution of geo-referenced data in real estate value prediction using machine learning methods
- Tez No: 917649
- Danışmanlar: DOÇ. DR. ALPER ŞEN
- Tez Türü: Yüksek Lisans
- Konular: Jeodezi ve Fotogrametri, Geodesy and Photogrammetry
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Harita Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Bilim Dalı
- Sayfa Sayısı: 78
Özet
Gayrimenkul değerlemesi, mülkiyetin doğru bir şekilde değerlendirilmesi ve tahmini piyasa değerinin belirlenmesi sürecidir. Fakat doğru bir gayrimenkul değerlemesi, insan uzman bilgisi gerektirir ve geleneksel gayrimenkul değerleme süreçleri zaman alıcıdır. Geleneksel yöntemler genellikle manuel değerlendirme tekniklerini içerirken, makine öğrenmesi teknikleri gayrimenkul değerlemesi alanında zaman, maliyet, iş gücü ve objektiflik konularında büyük bir potansiyel sunmaktadır. Son yıllarda emlak piyasasındaki gayrimenkullerin fiyatlarını tahmin etmek için makine öğrenmesi teknikleri ve algoritmalarının kullanımı artmıştır. Gayrimenkul değerlemesi için makine öğrenmesi yöntemleri, mülkün değerini etkileyen faktörleri analiz ederek ve tahmin modelleri oluşturarak çalışır. Bu faktörler arasında konum, yapısal özellikler, emlak piyasası verileri, sosyal ve ekonomik faktörler yer alabilir. Çok sayıda faktör bulunduğundan geleneksel yöntemlerde, çok sayıda değişken ve karmaşık ilişkiler göz ardı edilebilir. Bu gibi sebeplerden ötürü son yıllarda makine öğrenmesi yöntemleri ile gayrimenkul fiyat tahmini konusu üzerine birçok çalışma yapılmıştır. Bu çalışmada, gayrimenkul değerlemesinde makine öğrenmesi yöntemlerinin karşılaştırmalı kullanımı incelenmiş ve coğrafi referanslı verilerin tahmin doğruluğuna katkısı araştırılmıştır. Çalışmada 2023 yılı Mayıs ve Haziran aylarına ait İstanbul ili Bayrampaşa ilçesinde ki satılık 1267 adet konut ilanı veri seti için kullanılmıştır. Veri setinde konutlara ait yapısal ve mülki (m2 (Brüt), m2 (Net), oda sayısı, bina yaşı, toplam kat sayısı, bulunduğu kat, ısıtma türü, banyo sayısı, balkon bilgisi, eşya bilgisi, kullanım durumu bilgisi, site bilgisi, kredi durumu, aidat miktarı, tapu türü, fiyat) ek coğrafi referanslı (enlem, boylam) bilgileri de bulunmaktadır. Bu veri setine ağaç temelli makine öğrenmesi yöntemlerinden Rastgele Orman, Adaptive Boosting (AdaBoost), Extreme Gradient Boosting (XGBoost), CatBoost ile Çoklu Doğrusal Regresyon ve Coğrafi Ağırlıklı Regresyon yöntemleri uygulanarak veri eğitilmiş, test verileri tahmin edilmiştir. Makine öğrenmesi modelleri Belirleme Katsayısı (R2), Ortalama Mutlak Hata (MAE), Ortalama Mutlak Yüzde Hata (MAPE), Ortalama Kök Karesel Hata (RMSE) ölçütleri ile karşılaştırılmıştır. Karşılaştırma sonucunda Coğrafi Ağırlıklı Regresyon ile yapılan tahmin modeli 0,87 R2 skoru ile en başarılı model olmuştur. Coğrafi Ağırlıklı Regresyonu, 0,86 R2 skoru ile CatBoost ve Rastgele Orman, 0,85 R2 skoru ile XGBoost, 0,76 ve 0,74 R2 skoru ile Çoklu Doğrusal Regresyon ve AdaBoost yöntemleri takip etmiştir. Coğrafi Ağırlıklı Regresyon modelinin en başarılı sonucu verdiği görülmüştür. CatBoost, XGBoost ve Rastgele Orman algoritmalarının da başarılı tahmin sonuçları verdiği görüldükten sonra veri setinden coğrafi referanslı veriler (enlem, boylam) çıkarılarak mevcut modeller ile tahminler yapılmış, coğrafi referanslı özelliklerin model başarılarına etkisi gözlemlenmiştir. Coğrafi referanslı veriler olmadan hazırlanan bu yeni modeller ile sırasıyla CatBoost 0,82 R2, Rastgele Orman 0,81 R2, XGBoost 0,78 R2, Çoklu Doğrusal Regresyon 0,75 R2 ve AdaBoost 0,73 R2 skoru elde edilmiştir. Böylece çalışma sonunda Coğrafi Ağırlıklı Regresyon, CatBoost, XGBoost ve Rastgele Orman yöntemlerinin gayrimenkul değer tahminlerinde kullanılabileceği gözlemlenmiş, coğrafi referanslı verilerin değer tahminlerinin doğruluğunu arttırdığı anlaşılmıştır.
Özet (Çeviri)
Real estate valuation is the process of accurately assessing property and determining its estimated market value. However, accurate real estate valuation requires human expertise, and traditional valuation processes are time-consuming. While traditional methods often involve manual evaluation techniques, machine learning techniques offer great potential in the field of real estate valuation in terms of time, cost, labor and objectivity. In recent years, the use of machine learning techniques and algorithms to predict the prices of properties in the real estate market has increased. Machine learning methods for real estate valuation analyze factors influencing property values and build predictive models. These factors include location, structural attributes, real estate market data, and social and economic conditions. Due to the large number of factors, traditional methods may ignore the large number of variables and complex relationships. For these reasons, there have been many studies on real estate price prediction with machine learning methods in recent years. In this study, the comparative use of machine learning methods in real estate valuation is examined and the contribution of geo-referenced data to prediction accuracy is investigated. In the study, 1267 housing advertisements for sale in Bayrampaşa district of Istanbul province for the months of May and June 2023 are used for the data set. The dataset includes structural and property details (gross area, net area, number of rooms, building age, total number of floors, floor level, heating type, number of bathrooms, balcony presence, furniture status, usage status, site details, credit eligibility, dues amount, deed type, and price) as well as geo-referenced details (latitude, longitude). Random Forest, Adaptive Boosting (AdaBoost), Extreme Gradient Boosting (XGBoost), CatBoost, Multiple Linear Regression and Geographically Weighted Regression methods were applied to this dataset. Machine learning models were compared with Coefficient of Determination (R2), Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), Root Mean Squared Error (RMSE). As a result of the comparison, the prediction model with Geographically Weighted Regression was the most successful model with an R2 Score of 0,87. Geographically Weighted Regression was followed by CatBoost and Random Forest with an R2 Score of 0,86, XGBoost with an R2 Score of 0,85, Multiple Linear Regression and AdaBoost with R2 Scores of 0,76 and 0,74. The Geographically Weighted Regression model was found to be the most successful. After it was observed that CatBoost, XGBoost and Random Forest algorithms also gave successful prediction results, geo-referenced features (latitude, longitude) were removed from the dataset and predictions were made with the existing models and the effect of geo-referenced features on model success was observed. With these new models prepared without geo-referenced data, CatBoost 0,82 R2, Random Forest 0,81 R2, XGBoost 0,78 R2, Multiple Linear Regression 0,75 R2 and AdaBoost 0,73 R2 scores were obtained respectively. Thus, at the end of the study, it was observed that Geographically Weighted Regression, CatBoost, XGBoost and Random Forest methods can be used in real estate value estimations, and it was understood that geo-referenced data increases the accuracy of value estimations.
Benzer Tezler
- Elektrikli araçların kullanıcı tercihlerine göre sınıflandırılması: hibrit bir yaklaşım
Classification of electric vehicles based on user preference: a hybrid approach
MEHMET DEMİR
Yüksek Lisans
Türkçe
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. UMUT ASAN
- Elektronik sözleşmelerde sözleşmenin kuruluşu ve şekil
The Conclusion of contract in electronic contracts and form
ULVİ ALTINIŞIK
Yüksek Lisans
Türkçe
2001
HukukAnkara ÜniversitesiMedeni Hukuk Ana Bilim Dalı
YRD. DOÇ. DR. HASAN SEÇKİN OZANOĞLU
- Makine öğrenmesi yöntemleri kullanılarak gayrimenkul fiyat tahmini
Real Estate Prediction Using Machine LearningMethods
NEBİYE GEDİK
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiMatematik Ana Bilim Dalı
PROF. DR. ÖZGÜR YILDIRIM
- Gayrimenkul değerlemesinde makine öğrenmesi tekniklerinin kıyaslanması
Comparison of machine learning techniques in real estate valuation
FATMA ER
Yüksek Lisans
Türkçe
2020
Endüstri ve Endüstri MühendisliğiYıldız Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SELÇUK ÇEBİ
- Predicting house prices in Ankara using machine learning
Makine öğrenimi kullanarak Ankara'da ev fiyatlarini tahmin etme
CİHAN ERSOY
Yüksek Lisans
İngilizce
2022
Bilgi ve Belge YönetimiÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERDAR ARSLAN