Geri Dön

Parallel clustering algorithms with application to climatology

İklim biliminde uygulamasıyla paralel kümeleme algoritmaları

  1. Tez No: 371551
  2. Yazar: HALİL BİŞGİN
  3. Danışmanlar: PROF. DR. HASAN NÜZHET DALFES
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Bilişim Enstitüsü
  11. Ana Bilim Dalı: Enformatik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

Ekolojik sınırların nasıl belirleneceği, iklim sınırlandırmalarının nasıl yapılacağıuzun zamandır süregelen bir takım tartışmalara konu olmuştur. Tartışmanınçıkış noktası başvurulan yöntemin ne derece tarafsız olduğuna dair görüşayrılıklarıdır. İşte bir takım yanlı olabilecek yaklaşımlardansa, böylesimüdahalelerin önlenebildiği formulasyonlar kullanılması gerekmektedir. Verimadenciliğinin önde gelen yaklaşımlarından olan, hiyerarşik ve hiyerarşik olmayan teknikleri de içeren kümeleme yöntemi bu açıdan bakıldığında bize objektif bir çözüm sunmaktadır. Yanlı kararlara neden olabilecek kişisel beceri veya yorumlara dayanmak yerine, kümeleme analizi metodunu kullanmak, elimizdeki çok değişkenli bir veri kümesi için matematiksel bir yaklaşım olacaktır.Bu çalışmada, daha doğru ve kolay iklim bölgeleri edinmek için bazı istatistikselenstrümanlarla beraber kümeleme yöntemi iklim verileri üzerinde uygulanmıştır.İlk olarak geçerli bir ayırma işlemi için algoritma üzerinde bir geçerlilik kriterigöz önüne alınmıştır. Değişken sayısının her bir deneyde 96 ile 109 arasındadeğiştiği hali ve Temel Bileşen Analizi (TBA) yoluyla indirgenmiş boyutlar içingeçerlilik kriterinin onayladığı sayılarda iklim bölgeleri saptanmıştır. Değişkensayılarındaki bu değişim, ele aldığımız 30-50 K 3-60 D bölgesinde farklısayılarda iklim bölgeleri önerirken, Türkiye'nin tamamına yakınını kapladığı34-43 K 23-47 D bölgesinde devamlı olarak 4 iklim bölgesi saptamaktadır.Bu süreç ele alınırken, seri bir algoritmanın yanında paralelleştirilmiş k-ortalamauygulaması kullanılarak performansı gözlenmiştir. Uygulama neticesinde serikodun TBA ile elde edilmiş veri kümesiyle çalışması daha kolayken, paralelprosedürün yüksek boyutlu küme ile daha iyi sonuçlar verdiğini görülmüştür.Sonuç olarak k-ortalama algoritması 30-50 K 3- 60 D ve 34-43 K23-47 D bölgelerinin iklim sınırlandırmalarına yeni bir anlayış getirmiş, dahaönce yapılmış olan bölgelendirmelerden farklı olarak Türkiye coğrafyasını 4 sınıfaayırmıştır. Her iki çerçeveye ait deneylerde Türkiye üzerindeki sınırlar geneldeaynı seviyede kendini göstermiştir.

Özet (Çeviri)

How to determine the ecoregions or climate zones has been acontroversial issue. Discussion appears from the debate if theselected method is objective or not. In order to prevent fromsubjective approaches, one has to utilize some formulationswhich are independent from such interferences. Clusteranalysis, which is one of the famous pattern recognition toolsand has hierarchical and non-hierarchical methods, contributesto the objectivity in this sense. Instead of relying on anyexpertise or personal interpretations, clustering methodsprovide a mathematical approach with the multivariate data set.The aim of this work is to implement cluster analysis tools toclimatology data in order to obtain climate zones with someother statistical techniques that will make the study moreprecise. In order to clarify, first we determine how manyclusters or regions do we need for valid regionalizationby posing a validation criterion on the algorithm.While acquiring such a number of clusters, we have done experiments with both the high dimensional set where there are from 96 to 109 number of variables and the reduced dimensional data space which was obtained via Principal Component Analysis (PCA). Under the criterion we posed, in the region 30-50 N 3-60 E varying number of clusters obtained as the different variable combinations are used. Nevertheless, in 34-43 N by 23-47 E where Turkey covers almost all the frame, we consistently acquired 4 climate zones. During the cluster analysis (CA), besides the serial k-means algorithm we have also utilized parallel version. According to the time measurements, it is seen that whereas serial code performs better with the reduced dimensions, parallel version is good at dealing with high dimensional sets.Consequently, the k-means algorithm suggests another point of view for the climate zones of both regions where it is possible to observe some climatic blocks that are generally stable. More precisely, 4 climate zones appear in all cases concerning the second frame which represents some differences from the preceding climate zone definitions which are based on conventional and hierarchical ideas.

Benzer Tezler

  1. Kümeleme algoritmaları ve paralelleştirilmeleri

    Clustering algorithms and their parallelization

    CAN ATILGAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. BURAK ORDİN

  2. Metin madenciliğinde kullanılan yöntemlerin karşılaştırılması: Siyasi parti liderlerinin grup genel toplantı konuşmaları ile bir uygulama

    Comparison of techniques and methodologies used in text mining: An application with group meeting speeches of Turkish political part leaders

    KEZİBAN SEÇKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Siyasal BilimlerSakarya Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. ERMAN COŞKUN

  3. Standart dışı verilerin paralel programlama ile analizi ve modellenmesi

    Parallel programming with non-standard data analysis and modelling

    HÜSEYİN YAŞAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET ALBAYRAK

  4. Donanım hızlandırmalı veri demetleme

    Hardware accelerated data clustering

    NAZİRE MERVE ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    ÖĞR. GÖR. MURAT HACIÖMEROĞLU

  5. Uydu görüntü verisinin yapay sinir ağları ile sınıflandırılması

    Classification of satellite imagery data with artificial neural networks

    COŞKUN ÖZKAN

    Doktora

    Türkçe

    Türkçe

    2001

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Jeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı

    DOÇ.DR. FİLİZ SUNAR ERBEK