Geri Dön

Capturing the data similarity among organizations of same nature

Başlık çevirisi mevcut değil.

  1. Tez No: 671261
  2. Yazar: WAQAR ISHAQ
  3. Danışmanlar: DOÇ. DR. HABİB ŞENOL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Collaborative clustering, Collaboration, Vertical collaborative clustering, Cluster combination, Purity measurement, Similarity measurement
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Kadir Has Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Dikey i¸sbirlik¸ci k¨umeleme, farklı siteler arasındaki gizli veri yapısını (benzerli˘gi) ortaya ¸cıkarmayı amaclayarak, veri sahiplerinin ger¸cek verileri payla¸smadan akıllıca bir karar vermelerine yardımcı olacaktır. Orne˘gin, farklı b¨olgelerde bulunan ¸ce¸sitli ¨ hastaneler, ger¸cek verileri di˘ger hastanelerle payla¸smadan gizli nedenleri belirlemek i¸cin farklı pop¨ulasyonlardan insanlar arasındaki ortak hastalık yapısını ara¸stırmak ister. Benzer ¸sekilde, bir b¨olgesel e˘gitim kurumları zinciri, ¨o˘grencilerinin farklı b¨olgelere ait performanslarını ortak ¨ort¨uk yapılara g¨ore de˘gerlendirmek ister. Gizli yapıları bulmak i¸cin kullanılan mevcut y¨ontemler karma¸sıktır ve birden ¸cok site arasındaki benzerli˘gi ¨ol¸cmede i¸sbirli˘gi yapmak i¸cin ¨onyargılıdır. Bu tezde, yazar iki dikey i¸sbirlik¸ci k¨umeleme yakla¸sımı ¨onerdi, yani (1) Dikey ˙I¸sbirlik¸ci K¨umeleme Modeli (2) Bit D¨uzlemi Dilimlemeye dayalı Dikey ˙I¸sbirli˘gine Dayalı K¨umeleme, son teknoloji yakla¸sımlarına g¨ore ¨ust¨un do˘grulukla. Dikey ˙I¸sbirlik¸ci K¨umeleme Modeli (VCCM), Kendi Kendini D¨uzenleyen Harita (SOM) kullanarak birden ¸cok veri sitesi arasındaki i¸sbirli˘gini y¨onetir. ˙I¸sbirli˘gi yoluyla k¨umelemenin ¨o˘grenme s¨urecini artırmak i¸cin, belirli orantılı olarak de˘gi¸s toku¸s edilen bilginin standart prosed¨ur¨u ve ayarlanmasını i¸cerir. Dahası, VCCM gizli bilgileri veri gizlili˘ginden ¨od¨un vermeden ¸c¨ozer. Modelin amacı, birden ¸cok site arasında i¸sbirli˘gi s¨ureci i¸cin ideal bir ortam olu¸sturmaktır. VCCM, d¨ort veri seti (Iris, Geyser, Cancer ve Waveform) kullanılarak saflık ¨ol¸c¨um¨uyle de˘gerlendirilir. Bu ¸calı¸smanın bulguları, i¸sbirlik¸ci sonu¸cları saflık ¨ol¸c¨um¨un¨u kullanarak yerel sonu¸clarla kar¸sıla¸stırarak VCCM'nin ¨onemini g¨ostermektedir. VCCM, ili¸skili ve ilgisiz modellere dayalı olarak i¸sbirli˘ginin etkisini belirleyen olası nedenleri ortaya ¸cıkarır. Sonu¸clar, ¨onerilen VCCM, nin i¸sbirli˘gi yoluyla yerel ¨o˘grenmeyi geli¸stirdi˘gini ve ayrıca veri sahibinin k¨umeleme konusunda daha iyi kararlar almasına yardımcı oldu˘gunu g¨ostermektedir. Ek olarak, elde edilen sonu¸clar mevcut yakla¸sımlardan daha iyi do˘grulu˘ga sahiptir. Bit D¨uzlemi Dilimlemeye (VCC-BPS) dayalı ¨onerilen Dikey ˙I¸sbirli˘gine Dayalı K¨umeleme, geli¸smi¸s do˘grulukla basit ve benzersiz bir yakla¸sımdır ve ¸ce¸sitli veri siteleri arasındaki i¸sbirli˘gini y¨onetir. VCC-BPS, verileri giri¸s alanından kod alanına d¨on¨u¸st¨urerek, belirli bir bit d¨uzleminde yerel olarak ve i¸sbirli˘gi i¸cinde maksimum benzerli˘gi yakalar. Bu ¸calı¸smanın bulguları, modele uyan belirli bitlerin, sınıf etiketlerini yerel olarak ve i¸sbirli˘gi i¸cinde do˘gru bir ¸sekilde sınıflandırmadaki ¨onemini vurgulamaktadır. Bundan sonra, veri sahibi daha iyi bir karara varmak i¸cin yerel ve i¸sbirli˘gine dayalı sonu¸cları de˘gerlendirir. VCC-BPS, Gayzer, Skin ve Iris veri k¨umeleri tarafından do˘grulanır ve sonu¸cları bile¸sik veri k¨umesiyle kar¸sıla¸stırılır. VCC-BPS'nin, farklı veri siteleri arasındaki i¸sbirli˘gini y¨onetmek i¸cin saflık ve Davies-Bouldin indeksi a¸cısından iyile¸stirilmi¸s do˘grulukla mevcut ¸c¨oz¨umlerden daha iyi performans g¨osterdi˘gi bulunmu¸stur. Ayrıca, ¸cok sayıda g¨ozlemi az sayıda veri sembol¨u ile temsil ederek veri sıkı¸stırması ger¸cekle¸stirir. Anahtar S¨ozc¨ukler: ˙I¸sbirlik¸ci k¨umeleme, ˙I¸sbirli˘gi, Dikey i¸sbirlik¸ci k¨umeleme, K¨ume kombinasyonu, Saflık ¨ol¸c¨um¨u, Benzerlik ¨ol¸c¨um¨u

Özet (Çeviri)

The vertical collaborative clustering aims to unravel the hidden structure of data (similarity) among different sites, which will help data owners to make a smart decision without sharing actual data. For example, various hospitals located in different regions want to investigate the structure of common disease among people of different populations to identify latent causes without sharing actual data with other hospitals. Similarly, a chain of regional educational institutions wants to evaluate their students' performance belonging to different regions based on common latent constructs. The available methods used for finding hidden structures are complicated and biased to perform collaboration in measuring similarity among multiple sites. In this dissertation, the author proposed two approaches of vertical collaborative clustering, namely (1) Vertical Collaborative Clustering Model (2) Vertical Collaborative Clustering based on Bit-Plane Slicing, with superior accuracy over the state of the art approaches. The Vertical Collaborative Clustering Model (V CCM) manages the collaboration among multiple data sites using Self-Organizing Map (SOM). It includes standard procedure and tuning of the exchanged information in specific proportionality to augment the learning process of the clustering via collaboration. Moreover, the VCCM unravels hidden information without compromising the data confidentiality. The aim of the model is to set an ideal environment for the collaboration process among multiple sites. The VCCM is evaluated by purity measurement, using four datasets (Iris, Geyser, Cancer and Waveform). The findings of this study show the significance of the VCCM by comparing the collaborative results with the local results using purity measurement. The VCCM unlocks possible reasons determining impact of collaboration based on related and unrelated patterns. The results demonstrate that the proposed VCCM improves local learning by collaboration and also helps the data owner to make better decisions on the clustering. Additionally, the results obtained have better accuracy than the existing approaches. The proposed Vertical Collaborative Clustering based on Bit-Plane Slicing (VCCBPS) is simple and unique approach with improved accuracy, manages collaboration among various data sites. The VCC-BPS transforms data from input space to code space, capturing maximum similarity locally and collaboratively at a particular bit plane. The findings of this study highlight the significance of those particular bits which fit the model in correctly classifying clusters locally and collaboratively. Thenceforth, the data owner appraises local and collaborative results to reach a better decision. The VCC-BPS is validated by Geyser, Skin and Iris datasets and its results are compared with the composite dataset. It is found that the VCCBPS outperforms existing solutions with improved accuracy in term of purity and Davies-Bouldin index to manage collaboration among different data sites. It also performs data compression by representing a large number of observations with a small number of data symbols.

Benzer Tezler

  1. Community event prediction in evolving social networks

    Dinamik sosyal ağlarda topluluk olay öngörüsü

    NAGEHAN İLHAN

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ŞULE ÖĞÜDÜCÜ

  2. Gemilerde kullanılan seçici katalitik indirgeme sistemlerinde tortu oluşumunun ve azot oksit indirgeme performanslarının deneysel ve sayısal olarak incelenmesi

    Experimental and numerical investigation of urea-deposit formation and nitrogen oxide reduction performances in selective catalytic reduction systems used on marine vessels

    TALAT GÖKÇER CANYURT

    Doktora

    Türkçe

    Türkçe

    2023

    Gemi Mühendisliğiİstanbul Teknik Üniversitesi

    Gemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı

    PROF. DR. SELMA ERGİN

  3. Yüksek çözünürlükteki bölgesel iklim modeli simülasyonu ile ekstrem iklim indekslerinin belirlenmesi

    Defining extreme indices by using high resolution regional climate model simulation

    FULDEN BATIBENİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Meteorolojiİstanbul Teknik Üniversitesi

    Meteoroloji Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BARIŞ ÖNOL

  4. Türkiye'nin Kuzeydoğu Anadolu bölgesinde Aedes dorsalis Meigen, 1830 (Diptera:Culicidae)'in doğal populasyonlarının morfometrik analizi

    Morphometric analysis of natural populations of Aedes vexans Meigen from the North-East Part of Turkey

    ÖMER AĞDAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    BiyolojiKafkas Üniversitesi

    Biyoloji Ana Bilim Dalı

    YRD. DOÇ. DR. ADNAN ALDEMİR

  5. Türkiye'nin Kuzeydoğu Anadolu bölgesinden Aedes vexans Meigen, 1830 (Diptera: Culicidae)'in doğal populasyonlarının morfometrik analizi

    Morphometric analysis of natural populations of Aedes vexans Meigen,1830 (Diptera:Culicidae) from the North-East Part of Turkey

    ÖZGE KUÇLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    ZoolojiKafkas Üniversitesi

    Biyoloji Ana Bilim Dalı

    YRD. DOÇ. DR. ADNAN ALDEMİR