Pyramid self organizing maps (psom): a new approach to analyze large data sets
Piramit öz-örgutlemeli haritaları (PSOM): geniş veri setleri analiz etmede yeni bir yaklaşım
- Tez No: 480202
- Danışmanlar: DOÇ. DR. MUSTAFA ORAL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Veri Analizi, Öz-Örgütlemeli Haritaları, Geniş Veri Setleri, Piramit Öz- Örgütlemeli Haritaları, Paralelize Toplu Piramit Öz- Örgütlemeli Haritaları, Data Analysis, Self-Organizing Maps, Large Data Sets, Pyramid Self Organizing Maps, Parallelized Batch Pyramid Self Organizing Maps
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 106
Özet
Bu çalışmanın amacı, geniş veri setlerini daha az zamanda işleyebilen ve analiz edebilen yeni bir metot geliştirmek ve dahası analizi yapılmış veri setlerinin nitelikleri arasındaki korelasyonu görselleştirebilen ekstra vasıfları içinde bulundurmaktır. Çalışmanın yerine getirmeyi amaçladığı bir diğer hedefi ise veri analizi ve veri görselleştirme teknikleri konusunda yeni vasıflar sunan bir yazılım paketi tasarımlamak ve geliştirmektir ki bu da veri özellikleri arasındaki korelasyonunu etkileşimli bir şekilde analiz etme ve görselleştirme asıl amacını gütmektedir. Veri analizi, instenilen bilgiyi elde etmek amacıyla veriyi okuma, temizleme, düzeltme, dönüştürme ve biçimlendirme sürecidir. Büyük veriyi analiz etme, veri analiz tekniklerinin asıl zorlayıcı kısmıdır. Öz-Örgütlemeli Haritaları (SOM), veri setlerini başarılı bir şekilde işleyen ve veri özellikleri arasındaki korelasyonu görselleştiren bir ANN algoritmasıdır. Ancak, çok miktarda veriyi işlerken oldukça yavaştır. Bu çalışmada, Öz-Örgütlemeli Haritaları algoritması temel alınmış bir Piramit Öz- Örgütlemeli Haritası (PSOM) ileri sürülmektedir. Öne sürülen metot, zaman sarfiyatı ve sonuçların niteliği açısından SOM algoritmasına üstünlük gösterir. PSOM, farklı seviyelerde (farklı harita-ölçüleri) haritaların oluşturulduğu ve işletildiği bir hiyerarçi-temelli bir yaklaşımdır. Öne sürülen algoritmanın performansını daha fazla arttırmak için, çok-çekirdekli ortamlarda işlem görebilmesi amacıyla PSOM`in yığıtlı (Batch) versiyonu paralelleştirilir ve uyarlanır. Paralelleştirilmiş Yığıtlı-PSOM (PB-PSOM) versiyonu, uygulama süresi ve nitelik açısından gözle görülür şekilde hem PSOM hem de SOM algoritmalarına üstünlük gösterir. SOM ve PSOM algoritmalarını uygulayan ve veri setlerini analiz etmek amacıyla ekstra kullanıcı-interaktif özelliklerini içinde barındıran bir yazılım paketi, bu çalışmanın bir diğer katkısıdır. Öne sürülen algoritmalar, farklı ölçülerde girdi verisi (küçük, orta ve büyük) kullanan klasik SOM algoritması sonuçları ile test edildi ve kıyaslandi ve sonuçların değerlendirmesi, topoloji koruma (topology preserving), veri seti haritalandırması (data set mapping) ve uygulama süresi dikkate alınarak yapılır. Sonuçlar göstermektedir ki PSOM, geniş veri setlerinin işlenmesi için gerek duyulan süreyi kısaltır ve aynı zamanda elde edilen sonuçları geliştirir. Diger taraftan, PB-PSOM, hem PSOM hem de SOM'dan daha iyi performans gösterir.
Özet (Çeviri)
The aim of this study is to develop a new method capable of processing and analyzing large data sets, by less time consumption and furthermore, to include extra features with the ability of visualizing the correlation between attributes of the analyzed data sets. Another additional goal that the study aims to fulfill is, designing and developing a software package that provides new features of data analysis and data visualization techniques, with the main purpose of interactively analyzing and visualizing the correlation between data attributes. Data analysis is the process of reading, cleaning, correcting, transforming and modeling data with the purpose of subtracting important information. Analyzing big data is an actual challenge of data analysis techniques. Self-Organizing Maps is an ANN algorithm that successfully processes data sets and visualizes the correlation between attributes. However, it is very slow when processing huge amount of data. In this study, a Pyramid Self-Organizing Maps (PSOM), based on Self-Organizing Maps algorithm, is proposed. The suggested method successfully overcomes SOM, in terms of time consumption and quality of results. PSOM is a hierarchy-based approach, where within a training process it constructs and trains several maps of several levels (several map-sizes). To further improve the performance of proposed algorithm, Batch version of PSOM is parallelized and adapted to work in multi-core environments. Parallelized Batch - PSOM (PB-PSOM) version significantly overcomes both, PSOM and SOM, in terms of execution time and in terms of quality. A software package, which implements SOM, PSOM and PB-PSOM, and includes extra user-interactive features to analyze data sets, is another contribution of this study. Suggested algorithms are tested and compared with results of classical SOM using different sizes of input data (100, 500, 1000, 5000, 10000, 50000 and 100000 input patterns) and evaluation of results is done in terms of topology preservation, data set mapping and execution time. Results have shown that PSOM decreases the amount of time required to process large data sets and in the same time, it improves the produced results. In the other hand, PB-PSOM significantly outperforms both, PSOM and SOM.
Benzer Tezler
- Süreksiz bir düşünsel zemin olarak heterarşik kartografiler ve kamusal işgal arzuları
Heterarchic cartographies and desires for public occupation as a transient intellectual ground
SERİM AYGEN KİŞTİN
Yüksek Lisans
Türkçe
2023
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. NİZAM ONUR SÖNMEZ
- Liderlik etkinliğinin ölçümü için bir model önerisi
Başlık çevirisi yok
ZEYNEP DİDEM DEMİRÖZLÜ
Yüksek Lisans
Türkçe
1998
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN VEHBİ KOÇ
- Keeping memories on social media
Sosyal medyada anıları saklamak
ÇAĞRI GİZEM VARLI
Yüksek Lisans
İngilizce
2017
Endüstri Ürünleri Tasarımıİstanbul Teknik ÜniversitesiEndüstri Ürünleri Tasarımı Ana Bilim Dalı
DOÇ. DR. GÜLNAME TURAN
- Arkaik ve Klasik Dönem eski Yunan toplumunda ölüm kavramı
The concept of death Archaic and Classical Period in ancient Greek society
TUVAN KUTLUDUR
Yüksek Lisans
Türkçe
2019
TarihManisa Celal Bayar ÜniversitesiTarih Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERAP ÖZKAN KILIÇ
- Dynamic stability analysis of modular, self-reconfigurable robotic systems
Modüler, kendiliğinden şekil değiştirebilen robotik sistemlerin dinamik denge analizi
TEVFİK ALİ BÖKE
Yüksek Lisans
İngilizce
2005
Makine MühendisliğiOrta Doğu Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. REŞİT SOYLU