Geri Dön

Bayesian approaches for privacy preserving data sharing

Mahremiyeti koruyan veri paylaşımında bayesçi yöntemler

  1. Tez No: 632553
  2. Yazar: BEYZA ERMİŞ
  3. Danışmanlar: PROF. DR. ALİ TAYLAN CEMGİL
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 180

Özet

Bu tezde, farklı kaynaklardan toplanan matrisler ve yüksek mertebeli tensörler şeklinde depolanan heterojen verilerin birlikte analiz edilmesi ve veri füzyon problemine yoğunlaşıyoruz. Problemin çözümünde ise bağlaşımlı matris ve tensör ayışımı modelleri kullanmaktayız. Bu yöntem, paylaşılan modlardan ortak gizli faktörleri çıkararak matrislerin ve tensörlerin aynı anda bileşenlerine ayrılmasını sağlar. Biz de burada eksik bağlantı tahmini problemi için bağlaşımlı tensör modelleri geliştirerek, çeşitli model topolojileri ve çeşitli ıraksaylar kullanarak başarılı deneysel sonuçları rapor etmekteyiz. Çoğu zaman, veri matrisleri ve tensörler değişik taraflar arasında dağıtılır. Bu taraflar arasında bilgi paylaşımı gizlilik ve mahremiyeti koruma gereksinimini getirir, bu nedenle ele aldığımız ikinci sorun dağıtılmış ve heterojen veri kümelerinin mahremiyetini korumaktır. Dağıtık bir ortamda bireylerin gizliliğini sağlayan pratik bir mekanizma geliştirecek ve bu mekanizmayi çesitli gerçek veriler kullanarak değerlendirecegiz. Bu mekanizma için Bayesçi cıkarım ve diferansiyel mahremiyet arasındaki bağlantıdan faydalanarak etkili bir bağlaşımlı tensör ayrışım yöntemi geliştireceğiz. Yöntemlerimizin mahremiyet garantisi sağlarken sentetik ve gerçek veri kümelerinde iyi tahmin doğruluğu sağlayabildiğini deneysel olarak göstereceğiz. Son olarak, tensör ayrışımı ve yapay sinir ağları arasındaki bağlantıyı göstererek, yapay sinir ağlarının kullandığı verilerinin gizliliğini korumak için bir yaklaşım önereceğiz.

Özet (Çeviri)

In this thesis, we focus on the data fusion problem where we have heterogeneous data which is collected from different sources and stored in the form of matrices and higher-order tensors and propose coupled matrix and tensor factorization models to be able to jointly analyze these relational datasets. This method performs simultaneous factorization of matrices and tensors by extracting the common latent factors from the shared modes. We develop coupled models using various tensor models and cost functions for the missing link prediction problem and report the successful empirical results. Most of the time, the data matrices and tensors are distributed between several parties. Sharing information across those parties brings the privacy protection requirement, therefore the second problem we handle is protecting the privacy of distributed and heterogeneous datasets. We develop and evaluate a practical mechanism that ensures the privacy of individuals in a distributed setting, in which N data sites jointly estimate the parameters of a statistical model conditioned on all the data without sharing their input datasets. We exploit the connection between differential privacy and sampling from a Bayesian posterior to derive an efficient coupled tensor factorization algorithm. We empirically show that our methods are able to provide good prediction accuracy on synthetic and real datasets while providing provable privacy guarantee. Finally, we propose an approach to preserve the privacy of the neural network's training data due to the connection between tensor factorization and neural networks. We introduce a dropout technique that provides an elegant Bayesian interpretation to dropout, and show that the intrinsic noise added can be exploited to obtain a degree of differential privacy.

Benzer Tezler

  1. Privacy-preserving data collection and sharing in modern mobile internet systems

    Modern mobil internet sistemlerinde gizlilik korumalı veri toplama ve paylaşma

    MEHMET EMRE GÜRSOY

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGeorgia Institute of Technology

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. LİNG LİU

  2. Graf bazlı sorgu seti yöntemi ile diferensiyel mahremiyetin sağlanması

    Differential privacy with graph based query set

    EMİR ESMERDAĞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DOÇ. DR. MUHAMMED OĞUZHAN KÜLEKCİ

  3. Privacy-preserving naïve bayesian classifier-based collaborative filtering

    Basit bayes sınıflandırıcı tabanlı gizliliği koruyan işbirlikçi filtreleme

    CİHAN KALELİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    YRD. DOÇ. DR. HÜSEYİN POLAT

  4. Shilling attack design and detection on masked binary data

    Gizlenmiş ikili veriler üzerinde şilin atak tasarımı ve tespiti

    ZEYNEP BATMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN POLAT

  5. Bayesian methods for tackling complex inferential problems in data science

    Veri biliminde karmaşık çıkarım problemleriyle uğraşmak için Bayes yöntemleri

    SONER AYDIN

    Doktora

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri MühendisliğiSabancı Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SİNAN YILDIRIM