Derin öğrenme ve makine öğrenmesi yöntemleriyle Türkiye emlak piyasasında fiyat tahmini
Price prediction in the Turkish real estate market using deep learning and machine learning methods
- Tez No: 943093
- Danışmanlar: PROF. DR. BANU DİRİ, DR. AHMET ELBİR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 85
Özet
Türkiye'deki emlak piyasası, ekonomik büyümenin ve bireylerin yaşam kalitesinin önemli bir belirleyicisidir ve hem yatırımcılar hem de alıcılar için kritik bir rol oynamaktadır. Bu çalışma, Ocak 2025'te Türkiye'deki konut mülkleri için yayınlanan 128.670 emlak ilanından elde edilen verileri kullanarak emlak değerleme ve tavsiye sistemleri geliştirmektedir. Veri ön işleme aşamasında, yanlış kategorideki ilanlar, Kuzey Kıbrıs'tan ilanlar, eksik demografik ve fiyat bilgileri, inşaat halindeki mülkler için ilanlar ve koordinat verileri eksik olanlar gibi hatalı girişler kaldırılmıştır. Ek olarak, metinsel veriler sayısal değerlere dönüştürülmüş ve veri seti fiyat, brüt m² ve oda sayısı sınırlamaları uygulanarak 93.350 ilana indirgenmiş ve 207 farklı özellik elde edilmiştir. Özellikler arasında korelasyon analizi yapılarak fiyatla korelasyonu düşük olanlar çıkarılmıştır. Kategorik verilerKi-Kare testi ve One-Hot Encoding kullanılarak işlenmiştir. RFE, özellik seçiminden etkili yöntem olup, 50 ilgili özelliğin belirlenmesini sağlamıştır. Çeşitli makine öğrenimi modelleri arasında en iyi sonuçlar, 384 farklı parametre kombinasyonu üzerinden optimizasyon ile XGBRegressor kullanılarak elde edilmiştir. Modelin performansı yaklaşık %11'lik bir ortalama mutlak yüzde hata vermektedir ki bu da Türkiye'nin emlak piyasasındaki ortalama pazarlık oranının %9 olduğu düşünüldüğünde oldukça başarılı sayılmaktadır. ANN, CNN, CNN-LSTM, LSTM ve KAN dahil olmak üzere derin ögrenme modelleri de test edilmiştir, ancak hiçbiri XGBRegressor' dan daha iyi performans göstermemiştir. Özellikle, ANN modeli tanh aktivasyon fonksiyonu ve düşük bırakma oranları uygulandığında daha iyi sonuçlar göstermektedir. Genel olarak, XGBRegressor en düşük hata oranlarını vermektedir. Bu çalışma, modern veri işleme tekniklerinden yararlanarak emlak piyasasının analizine yönelik sağlam bir zemin oluşturmakta ve emlak fiyatlarının tahmini için etkili bir model ortaya koymaktadır.
Özet (Çeviri)
The real estate market in Turkey is a key determinant of economic growth and individuals' quality of life, playing a critical role for both investors and buyers. This study develops property valuation and recommendation systems using data from 128,670 property listings published in January 2025 for residential properties in Turkey. During the data preprocessing phase, erroneous entries, such as listings in the wrong category, those from Northern Cyprus, missing demographic and price information, listings for properties under construction, and those lacking coordinate data, are removed. Additionally, textual data is converted into numerical values, and the dataset is reduced to 93,350 listings by applying limitations on price, gross m², and number of rooms, resulting in 207 distinct features. Correlation analysis is performed among the features, leading to the removal of those with low correlation to the price. Categorical data are processed using the Chi-Square test and One-Hot Encoding. RFE proves most effective in feature selection, leading to the identification of 50 relevant features. Among various machine learning models, the best results are achieved using XGBRegressor, with optimization through 384 different parameter combinations. The model's performance yields a mean absolute percentage error of approximately 11%, which is considered highly successful, given that the average bargaining rate in Turkey's real estate market is 9%. Deep learning models, including ANN, CNN, CNN-LSTM, LSTM, and KAN, are also tested, but none outperform XGBRegressor. Notably, the ANN model shows better results when the tanh activation function and low dropout rates are applied. Overall, XGBRegressor delivers the lowest error rates. This study provides a solid basis for the analysis of the real estate market by utilizing modern data processing techniques and presents an effective model for the prediction of real estate prices.
Benzer Tezler
- Makine öğrenmesi yöntemleriyle enflasyona etki eden faktörlerin incelenmesi: Türkiye örneği
Using machine learning methods to examine factors affecting inflation: The example of Türkiye
HASAN ŞEN
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri MühendisliğiBursa Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖMER FARUK EFE
- Türk sinemasında aktör-film işbirliği ağının analizi ve makine öğrenmesi ile hasılat tahmini
Analyzing the Turkish actor-film collaboration network with complex network analysis methods
ELANUR GÜL
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SAİT DEMİR
- Türkiye'deki havayolu firmalarıyla ilgili sosyal medya yorumlarının makine öğrenmesi yöntemleriyle sınıflandırılması
Classification of social media comments about airline companies in Turkey by machine learning methods
HATİCE ELİF EKİM
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALPASLAN BURAK İNNER
- InSAR ve makine öğrenmesi yöntemleri kullanılarak yüzey hareketlerinin zaman serileri ile modellenmesi: İstanbul Havalimanı örneği
Time series modeling of surface movements using InSAR and machine learning methods: The case study of Istanbul Airport
NUR YAĞMUR
Doktora
Türkçe
2023
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. NEBİYE MUSAOĞLU
PROF. DR. ERDAL ŞAFAK
- Türkçe metinlerde duruş tespiti
Stance detection in Turkish texts
KAAN KEMAL POLAT
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NİLGÜN GÜLER BAYAZIT