Mekânsal ağırlıklandırılmış K-ortalamalar yaklaşımı ile enerji tüketim verilerinin kümelenmesi
Clustering energy consumption data with a spatially weighted K-means approach
- Tez No: 930402
- Danışmanlar: DR. ÖĞR. ÜYESİ ELİF ÖZGE ÖZDAMAR
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 91
Özet
Kümeleme analizi, istatistikte yaygın olarak kullanılan gözetimsiz (unsupervised) bir yöntemdir. Birbirine benzer özelliklere sahip olan gözlemleri gruplamak amacıyla oluşturulmuş yöntemler topluluğudur. Çeşitli veriler üzerinde uygulanabilen bu yöntemler, mekânsal verilerde de yaygın olarak kullanılmaktadır. Teknolojinin gelişmesi ve veriye ulaşmanın kolaylaşması sebebiyle mekânsal kümelemeye yönelik ilgi de artmıştır. Bu ilgi ekonomi, coğrafya, çevre, enerji ve sağlık gibi birçok alanda katlanarak büyümektedir. Artan ilgi ve mekânsal verilerle çalışırken klasik yöntemlerin yetersiz kalması sebebiyle mekânsal kümeleme kavramı ortaya çıkmıştır. Mekânsal kümeleme yöntemleri, verilerin mekânsal özelliklerini dikkate alarak daha başarılı sonuçlar vermeyi amaçlamaktadır. Bu doğrultuda yöntemlerde kullanılan yaklaşımlar farklılık göstermektedir. Bu çalışmada gözlemler ve değişkenlerin mekânsal önemini dikkate alan yeni iki yaklaşım önerilmiştir. Gözlemlerin ağırlıklandırılmasında, optimal komşuluk uzaklığına dayanan Lokal Getis-Ord Gi istatistiği kullanılmıştır. Değişken ağırlıklandırılmasında ise Temel Bileşenler Analizi (TBA) ve Markov Zinciri'ne (MZ) dayalı yeni yaklaşımlar kullanılmıştır. Bu yaklaşımlarda, TBA ve MZ'den elde edilen mekânsal ağırlık değerleri ile veride bulunan değişkenlerden bir Artırılmış Regresyon Ağacı (ARA) modeli kurulur. ARA'dan elde edilen önem düzeyleri değişkenlerin mekânsal ağırlığı olarak tanımlanır. Hem gözlem hem değişken ağırlıkları kullanılarak K-Ortalamalar yöntemi uygulanır. Önerilen yaklaşımlar hem sentetik hem de gerçek veri üzerinde uygulanıp klasik kümeleme yöntemlerle karşılaştırılmıştır. Gerçek veri olarak 2022 yılına ait Türkiye'deki illerin kişi başına düşen enerji ve su tüketim değerleri kullanılmıştır. Sonuçlar hem görsel hem de küme başarı indeksleri ile karşılaştırılmış ve sonuçlar tartışılmıştır.
Özet (Çeviri)
Cluster analysis is an unsupervised method commonly used in statistics. It is a collection of techniques that were developed to organize observations that share similar characteristics. These methods, which may be applied to a variety of data types, are also commonly utilized with spatial data. The interest in spatial clustering has risen due to the accessibility of data access and technological advancements. This interest is rapidly expanding across various domains, including economics, geography, ecology, energy, and health. Spatial clustering methods aim to achieve more successful results by taking into account the spatial characteristics of the data, while the approaches used in spatial clustering differ. In this study, we propose novel approaches that consider the spatial importance of observations and variables: The Local Getis-Ord Gi statistic, utilizing optimal neighborhood distance, has been employed for the weighting of observations. Moreover, novel methodologies utilizing Principal Component Analysis (PCA) and Markov Chain (MC) have been employed for variable weighting. The Local Getis-Ord Gi statistic based on the optimal neighborhood distance is used to weight the observations. Novel approaches based on Principle Component Analysis (PCA) and Markov Chains (MC) were used for variable weighting. A Boosted Regression Tree (BRT) model is constructed with the spatial weight values derived from PCA and MC, in conjunction with the data variables. The relevance levels derived from the BRT are characterized as the spatial weight of the variables, and K-Means clustering is utilized on both observation and variable weights. The proposed methodologies were implemented on both synthetic and actual datasets and evaluated against traditional clustering techniques. The per capita energy and water usage figures for Turkish provinces in 2022 were utilized as actual statistics. The data were analyzed using visual and cluster validity indexes, and the findings were examined.
Benzer Tezler
- Muğla yöresinde meydana gelen orman yangınlarının konumsal istatistik analizi ve risk haritalarının oluşturulması
Spatial statistical analysis forest fire in Muğla region and creating risk maps
BERKAY GAYIR
Yüksek Lisans
Türkçe
2019
Jeodezi ve FotogrametriKocaeli ÜniversitesiJeodezi ve Jeoinformasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. OZAN ARSLAN
- Sayısal toprak kütüphanesi destekli vıs-nır teknolojisi ve mekânsal analiz yöntemleri ile yönetim bölgelerinin ve değişken oranlı gübreleme haritalarının oluşturulması
Determination of management zones and generating variable rate fertilization maps with digital soil library supported vis-nir technology and spatial analysis methods
NİHAL SALI
Yüksek Lisans
Türkçe
2025
ZiraatBursa Uludağ ÜniversitesiTarımsal Makine Sistemleri Ana Bilim Dalı
PROF. DR. SELÇUK ARSLAN
- A data-driven approach to identifying and selecting temporary disaster debris management sites: The case of Istanbul
Geçici afet moloz yönetim alanlarının belirlenmesi ve seçimi için veri odaklı bir yaklaşım: İstanbul örneği
BURAK KABAKLI
Yüksek Lisans
İngilizce
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ŞEYDA SERDAR ASAN
- Mekansal ağırlıklandırılmış otoregresif konut fiyat indeks modeli
Spatially weighted autoregressive house price index model
KEREM YAVUZ ARSLANLI
Doktora
Türkçe
2012
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. VEDİA DÖKMECİ
- Van gölü'ne dökülen derelerin taşkın risk analizi
Flood risk analysis of streams flowing into van lake
ERDİ TANIŞ
Yüksek Lisans
Türkçe
2025
İnşaat MühendisliğiDicle Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. RECEP ÇELİK