Geri Dön

Mekânsal ağırlıklandırılmış K-ortalamalar yaklaşımı ile enerji tüketim verilerinin kümelenmesi

Clustering energy consumption data with a spatially weighted K-means approach

  1. Tez No: 930402
  2. Yazar: TURGUT ÖZALTINDİŞ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ELİF ÖZGE ÖZDAMAR
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 91

Özet

Kümeleme analizi, istatistikte yaygın olarak kullanılan gözetimsiz (unsupervised) bir yöntemdir. Birbirine benzer özelliklere sahip olan gözlemleri gruplamak amacıyla oluşturulmuş yöntemler topluluğudur. Çeşitli veriler üzerinde uygulanabilen bu yöntemler, mekânsal verilerde de yaygın olarak kullanılmaktadır. Teknolojinin gelişmesi ve veriye ulaşmanın kolaylaşması sebebiyle mekânsal kümelemeye yönelik ilgi de artmıştır. Bu ilgi ekonomi, coğrafya, çevre, enerji ve sağlık gibi birçok alanda katlanarak büyümektedir. Artan ilgi ve mekânsal verilerle çalışırken klasik yöntemlerin yetersiz kalması sebebiyle mekânsal kümeleme kavramı ortaya çıkmıştır. Mekânsal kümeleme yöntemleri, verilerin mekânsal özelliklerini dikkate alarak daha başarılı sonuçlar vermeyi amaçlamaktadır. Bu doğrultuda yöntemlerde kullanılan yaklaşımlar farklılık göstermektedir. Bu çalışmada gözlemler ve değişkenlerin mekânsal önemini dikkate alan yeni iki yaklaşım önerilmiştir. Gözlemlerin ağırlıklandırılmasında, optimal komşuluk uzaklığına dayanan Lokal Getis-Ord Gi istatistiği kullanılmıştır. Değişken ağırlıklandırılmasında ise Temel Bileşenler Analizi (TBA) ve Markov Zinciri'ne (MZ) dayalı yeni yaklaşımlar kullanılmıştır. Bu yaklaşımlarda, TBA ve MZ'den elde edilen mekânsal ağırlık değerleri ile veride bulunan değişkenlerden bir Artırılmış Regresyon Ağacı (ARA) modeli kurulur. ARA'dan elde edilen önem düzeyleri değişkenlerin mekânsal ağırlığı olarak tanımlanır. Hem gözlem hem değişken ağırlıkları kullanılarak K-Ortalamalar yöntemi uygulanır. Önerilen yaklaşımlar hem sentetik hem de gerçek veri üzerinde uygulanıp klasik kümeleme yöntemlerle karşılaştırılmıştır. Gerçek veri olarak 2022 yılına ait Türkiye'deki illerin kişi başına düşen enerji ve su tüketim değerleri kullanılmıştır. Sonuçlar hem görsel hem de küme başarı indeksleri ile karşılaştırılmış ve sonuçlar tartışılmıştır.

Özet (Çeviri)

Cluster analysis is an unsupervised method commonly used in statistics. It is a collection of techniques that were developed to organize observations that share similar characteristics. These methods, which may be applied to a variety of data types, are also commonly utilized with spatial data. The interest in spatial clustering has risen due to the accessibility of data access and technological advancements. This interest is rapidly expanding across various domains, including economics, geography, ecology, energy, and health. Spatial clustering methods aim to achieve more successful results by taking into account the spatial characteristics of the data, while the approaches used in spatial clustering differ. In this study, we propose novel approaches that consider the spatial importance of observations and variables: The Local Getis-Ord Gi statistic, utilizing optimal neighborhood distance, has been employed for the weighting of observations. Moreover, novel methodologies utilizing Principal Component Analysis (PCA) and Markov Chain (MC) have been employed for variable weighting. The Local Getis-Ord Gi statistic based on the optimal neighborhood distance is used to weight the observations. Novel approaches based on Principle Component Analysis (PCA) and Markov Chains (MC) were used for variable weighting. A Boosted Regression Tree (BRT) model is constructed with the spatial weight values derived from PCA and MC, in conjunction with the data variables. The relevance levels derived from the BRT are characterized as the spatial weight of the variables, and K-Means clustering is utilized on both observation and variable weights. The proposed methodologies were implemented on both synthetic and actual datasets and evaluated against traditional clustering techniques. The per capita energy and water usage figures for Turkish provinces in 2022 were utilized as actual statistics. The data were analyzed using visual and cluster validity indexes, and the findings were examined.

Benzer Tezler

  1. Muğla yöresinde meydana gelen orman yangınlarının konumsal istatistik analizi ve risk haritalarının oluşturulması

    Spatial statistical analysis forest fire in Muğla region and creating risk maps

    BERKAY GAYIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Jeodezi ve FotogrametriKocaeli Üniversitesi

    Jeodezi ve Jeoinformasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. OZAN ARSLAN

  2. Sayısal toprak kütüphanesi destekli vıs-nır teknolojisi ve mekânsal analiz yöntemleri ile yönetim bölgelerinin ve değişken oranlı gübreleme haritalarının oluşturulması

    Determination of management zones and generating variable rate fertilization maps with digital soil library supported vis-nir technology and spatial analysis methods

    NİHAL SALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    ZiraatBursa Uludağ Üniversitesi

    Tarımsal Makine Sistemleri Ana Bilim Dalı

    PROF. DR. SELÇUK ARSLAN

  3. A data-driven approach to identifying and selecting temporary disaster debris management sites: The case of Istanbul

    Geçici afet moloz yönetim alanlarının belirlenmesi ve seçimi için veri odaklı bir yaklaşım: İstanbul örneği

    BURAK KABAKLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ŞEYDA SERDAR ASAN

  4. Mekansal ağırlıklandırılmış otoregresif konut fiyat indeks modeli

    Spatially weighted autoregressive house price index model

    KEREM YAVUZ ARSLANLI

    Doktora

    Türkçe

    Türkçe

    2012

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    PROF. DR. VEDİA DÖKMECİ

  5. Van gölü'ne dökülen derelerin taşkın risk analizi

    Flood risk analysis of streams flowing into van lake

    ERDİ TANIŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    İnşaat MühendisliğiDicle Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. RECEP ÇELİK