Geri Dön

Pyramid self organizing maps (psom): a new approach to analyze large data sets

Piramit öz-örgutlemeli haritaları (PSOM): geniş veri setleri analiz etmede yeni bir yaklaşım

  1. Tez No: 480202
  2. Yazar: DRİLON JAHİRİ
  3. Danışmanlar: DOÇ. DR. MUSTAFA ORAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Veri Analizi, Öz-Örgütlemeli Haritaları, Geniş Veri Setleri, Piramit Öz- Örgütlemeli Haritaları, Paralelize Toplu Piramit Öz- Örgütlemeli Haritaları, Data Analysis, Self-Organizing Maps, Large Data Sets, Pyramid Self Organizing Maps, Parallelized Batch Pyramid Self Organizing Maps
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 106

Özet

Bu çalışmanın amacı, geniş veri setlerini daha az zamanda işleyebilen ve analiz edebilen yeni bir metot geliştirmek ve dahası analizi yapılmış veri setlerinin nitelikleri arasındaki korelasyonu görselleştirebilen ekstra vasıfları içinde bulundurmaktır. Çalışmanın yerine getirmeyi amaçladığı bir diğer hedefi ise veri analizi ve veri görselleştirme teknikleri konusunda yeni vasıflar sunan bir yazılım paketi tasarımlamak ve geliştirmektir ki bu da veri özellikleri arasındaki korelasyonunu etkileşimli bir şekilde analiz etme ve görselleştirme asıl amacını gütmektedir. Veri analizi, instenilen bilgiyi elde etmek amacıyla veriyi okuma, temizleme, düzeltme, dönüştürme ve biçimlendirme sürecidir. Büyük veriyi analiz etme, veri analiz tekniklerinin asıl zorlayıcı kısmıdır. Öz-Örgütlemeli Haritaları (SOM), veri setlerini başarılı bir şekilde işleyen ve veri özellikleri arasındaki korelasyonu görselleştiren bir ANN algoritmasıdır. Ancak, çok miktarda veriyi işlerken oldukça yavaştır. Bu çalışmada, Öz-Örgütlemeli Haritaları algoritması temel alınmış bir Piramit Öz- Örgütlemeli Haritası (PSOM) ileri sürülmektedir. Öne sürülen metot, zaman sarfiyatı ve sonuçların niteliği açısından SOM algoritmasına üstünlük gösterir. PSOM, farklı seviyelerde (farklı harita-ölçüleri) haritaların oluşturulduğu ve işletildiği bir hiyerarçi-temelli bir yaklaşımdır. Öne sürülen algoritmanın performansını daha fazla arttırmak için, çok-çekirdekli ortamlarda işlem görebilmesi amacıyla PSOM`in yığıtlı (Batch) versiyonu paralelleştirilir ve uyarlanır. Paralelleştirilmiş Yığıtlı-PSOM (PB-PSOM) versiyonu, uygulama süresi ve nitelik açısından gözle görülür şekilde hem PSOM hem de SOM algoritmalarına üstünlük gösterir. SOM ve PSOM algoritmalarını uygulayan ve veri setlerini analiz etmek amacıyla ekstra kullanıcı-interaktif özelliklerini içinde barındıran bir yazılım paketi, bu çalışmanın bir diğer katkısıdır. Öne sürülen algoritmalar, farklı ölçülerde girdi verisi (küçük, orta ve büyük) kullanan klasik SOM algoritması sonuçları ile test edildi ve kıyaslandi ve sonuçların değerlendirmesi, topoloji koruma (topology preserving), veri seti haritalandırması (data set mapping) ve uygulama süresi dikkate alınarak yapılır. Sonuçlar göstermektedir ki PSOM, geniş veri setlerinin işlenmesi için gerek duyulan süreyi kısaltır ve aynı zamanda elde edilen sonuçları geliştirir. Diger taraftan, PB-PSOM, hem PSOM hem de SOM'dan daha iyi performans gösterir.

Özet (Çeviri)

The aim of this study is to develop a new method capable of processing and analyzing large data sets, by less time consumption and furthermore, to include extra features with the ability of visualizing the correlation between attributes of the analyzed data sets. Another additional goal that the study aims to fulfill is, designing and developing a software package that provides new features of data analysis and data visualization techniques, with the main purpose of interactively analyzing and visualizing the correlation between data attributes. Data analysis is the process of reading, cleaning, correcting, transforming and modeling data with the purpose of subtracting important information. Analyzing big data is an actual challenge of data analysis techniques. Self-Organizing Maps is an ANN algorithm that successfully processes data sets and visualizes the correlation between attributes. However, it is very slow when processing huge amount of data. In this study, a Pyramid Self-Organizing Maps (PSOM), based on Self-Organizing Maps algorithm, is proposed. The suggested method successfully overcomes SOM, in terms of time consumption and quality of results. PSOM is a hierarchy-based approach, where within a training process it constructs and trains several maps of several levels (several map-sizes). To further improve the performance of proposed algorithm, Batch version of PSOM is parallelized and adapted to work in multi-core environments. Parallelized Batch - PSOM (PB-PSOM) version significantly overcomes both, PSOM and SOM, in terms of execution time and in terms of quality. A software package, which implements SOM, PSOM and PB-PSOM, and includes extra user-interactive features to analyze data sets, is another contribution of this study. Suggested algorithms are tested and compared with results of classical SOM using different sizes of input data (100, 500, 1000, 5000, 10000, 50000 and 100000 input patterns) and evaluation of results is done in terms of topology preservation, data set mapping and execution time. Results have shown that PSOM decreases the amount of time required to process large data sets and in the same time, it improves the produced results. In the other hand, PB-PSOM significantly outperforms both, PSOM and SOM.

Benzer Tezler

  1. Süreksiz bir düşünsel zemin olarak heterarşik kartografiler ve kamusal işgal arzuları

    Heterarchic cartographies and desires for public occupation as a transient intellectual ground

    SERİM AYGEN KİŞTİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. NİZAM ONUR SÖNMEZ

  2. Liderlik etkinliğinin ölçümü için bir model önerisi

    Başlık çevirisi yok

    ZEYNEP DİDEM DEMİRÖZLÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN VEHBİ KOÇ

  3. Keeping memories on social media

    Sosyal medyada anıları saklamak

    ÇAĞRI GİZEM VARLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Endüstri Ürünleri Tasarımıİstanbul Teknik Üniversitesi

    Endüstri Ürünleri Tasarımı Ana Bilim Dalı

    DOÇ. DR. GÜLNAME TURAN

  4. Arkaik ve Klasik Dönem eski Yunan toplumunda ölüm kavramı

    The concept of death Archaic and Classical Period in ancient Greek society

    TUVAN KUTLUDUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    TarihManisa Celal Bayar Üniversitesi

    Tarih Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERAP ÖZKAN KILIÇ

  5. Dynamic stability analysis of modular, self-reconfigurable robotic systems

    Modüler, kendiliğinden şekil değiştirebilen robotik sistemlerin dinamik denge analizi

    TEVFİK ALİ BÖKE

    Yüksek Lisans

    İngilizce

    İngilizce

    2005

    Makine MühendisliğiOrta Doğu Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. REŞİT SOYLU