Geri Dön

Mekânsal büyük veri analizi

Spatial big data analysis

  1. Tez No: 750928
  2. Yazar: MERAL ÖNDER
  3. Danışmanlar: PROF. DR. FATMA ZEREN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Ekonometri, Econometrics
  6. Anahtar Kelimeler: Ağırlık Matrisi, Büyük Veri, Mekânsal Bağımlılık, Mekânsal Büyük Veri, Suç, Weight Matrix, Big Data, Spatial Dependency, Spatial Big Data, Crime
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: İnönü Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Mekânsal olarak düzenlenmiş verilerin birbirine olan bağımlılığı, bağımsızlık varsayımının ihlal edilmesine neden olmaktadır. Bu nedenle mekânsal istatistiksel analiz, diğer istatistiksel analizlerden ayrılmaktadır. Mekânsal bağlılığa neden olan komşuluk ilişkileri mekânsal ağırlık matrisleri ile tanımlanır. Mekânsal bağımlılığın yapısına göre kurulan regresyon modelleri de farklılaşmaktadır. Bu modellerden en sık kullanılan mekânsal regresyon modelleri, mekânsal hata modelleri (SEM) ve mekânsal gecikme modelleri (SLM) şeklindedir. Mekânsal modellerde içsellik problemi nedeniyle en küçük kareler (EKK) yöntemi kullanılamaz, bunun yerine genellikle maksimum olabilirlik yöntemi uygulanır ve mekânsal modellere ait logaritmik olabilirlik fonksiyonu maksimize edilir. Maksimizasyon işlemi yapılırken logaritmik determinantın hesaplanması örneklem büyüklüğüne bağlıdır ve mekânsal bağımlılık parametresinin her bir değeri için ayrı ayrı determinant hesaplanır. Büyük boyutlu verilerde ise yüksek boyutlu matrislerin determinantının hesaplanması oldukça zordur. Çünkü bu matrislerin içerisinde yüksek oranda sıfır olması öz değerlerin bulunmasında hatalı sonuçlara neden olmaktadır. Bu problemi ortadan kaldırmak için mekânsal büyük veri modellerinde geçerli yöntemler mevcuttur. Bunlar, Üstel Mekânsal Matris Tanımı (MESS), Tek Taraflı Yaklaşıklık Yöntemi ve Kompozit Olabilirlik Yaklaşımıdır. MESS, hem mekânsal hata modelleri hem de mekânsal gecikme modelleri için hesaplamada kolaylık sağlamaktadır. Bu yaklaşıma alternatif olarak kovaryans matrislerinin tersine çevrilmesindeki hesaplama zorluklarını ortadan kaldırmak için tek taraflı yaklaşıklık yöntemi kullanılmaktadır. Bu yöntemin dışında mekânsal hata terimlerindeki ilişkileri modellemek için kompozit olabilirlik yaklaşımı, içsellik problemini gidermek için Genelleştirilmiş İki Aşamalı En Küçük Kareler yöntemleri uygulanmaktadır. Yapılan bu tez çalışmasında öncelikle mekânsal büyük veri modellerinin tahmin yöntemlerinde kullanılan bu yaklaşımlar açıklanmıştır. Daha sonra bu yaklaşımlardan MESS yöntemi kullanılarak ABD'nin 1990-2000 yılı on yıllık ilçe düzeyindeki veriler kullanılarak cinayet oranlarını etkileyen faktörlerin etkisi araştırılmıştır. Bu çalışmada kullanılan veri setinin büyük boyutlu olması nedeni ile MESS modeli ile tahmin gerçekleştirilmiştir. MESS tahmin sonuçlarına göre cinayet oranları üzerinde etkili olan değişkenler tespit edilmiştir.

Özet (Çeviri)

The interdependence of spatially organized data leads to a violation of the independence assumption. For this reason, spatial statistical analysis differs from other statistical analyses. Neighborhood relations that cause spatial commitment are defined by spatial weight matrices. Regression models established according to the structure of spatial dependence also differ. The most frequently used spatial regression models among these models are spatial error models (SEM) and spatial delay models (SLM). The least squares (LCS) method cannot be used in spatial models due to the interiority problem, instead, the maximum likelihood method is generally applied and the logarithmic likelihood function of the spatial models is maximized. The calculation of the logarithmic determinant while performing the maximization process depends on the sample size and the determinant is calculated separately for each value of the spatial dependence parameter. In large dimensional data, it is very difficult to calculate the determinant of high dimensional matrices. Because the high percentage of zeros in these matrices causes erroneous results in finding the eigenvalues. There are valid methods in spatial big data models to eliminate this problem. These are Exponential Spatial Matrix Definition (MESS), One Sided Approximation Method and Composite Likelihood Approach. MESS provides ease of computation for both spatial error models and spatial delay models. As an alternative to this approach, one-sided approximation method is used to eliminate computational difficulties in inverting covariance matrices. Apart from this method, composite likelihood approach is applied to model the relationships in spatial error terms, and Generalized Two-Stage Least Squares methods are applied to solve the internality problem. In this thesis, first of all, these approaches used in the estimation methods of spatial big data models are explained. Then, using the MESS method, one of these approaches, the effects of the factors affecting the homicide rates were investigated by using the ten-year district level data of the USA for the years 1990-2000. Due to the large size of the data set used in this study, estimation was made with the MESS model. According to the MESS estimation results, the variables affecting the murder rates were determined.

Benzer Tezler

  1. Mekansal büyük veri kümeleme

    Spatial big data clustering

    YAĞMUR KILIÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. GALİP AYDIN

  2. Exploring the possibilities of geospatial big data manipulation using NoSQL

    NoSQL kullanarak mekansal büyük veri işleme olanaklarının araştırılması

    EZGİ ERGİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DOÇ. DR. AHMET ÖZGÜR DOĞRU

  3. Açık veri ekosisteminde mekansal veri altyapıları

    Spatial data infrastructures in open data ecosystem

    MİKAİL GÜNEYDAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CANER GÜNEY

  4. Yükseköğretim kurumlarında iç mekan kalitesine ilişkin verilerin mikrodenetleyici kullanılarak toplanması ve büyük veri ortamında analizi

    Collection of data on indoor quality in higher education institutions using microcontroller and analysis in big data environment

    CEYHAN MOLLA

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgi ve Belge YönetimiDokuz Eylül Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. CAN AYDIN

  5. The use of local data in architectural design through augmented reality

    Mimari tasarımda artırılmış gerçeklik aracılığıyla yerel veri kullanımı

    FARUK CAN ÜNAL

    Doktora

    İngilizce

    İngilizce

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DOÇ. DR. YÜKSEL DEMİR