Geri Dön

Monte Carlo methods for data privacy applications

Monte Carlo metodlarıyla veri mahremiyeti uygulamaları

  1. Tez No: 821154
  2. Yazar: BARIŞ ALPARSLAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SİNAN YILDIRIM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, İstatistik, Computer Engineering and Computer Science and Control, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Bu tez, iki ana veri mahremiyeti problemine Bayesci çıkarım yöntemlerini kullanarak odaklanmaktadır. Bayesci çıkarım yöntemleri arasından özellikle Markov chain Monte Carlo (MCMC) ve bu metodu temel alan yaklaşımlar incelenmektedir. Bahsedilen problemlerden ilki, veri mahremiyeti uygulamalarında kullanıcıya sunulacak olan gizli verinin seçilmesi ile ilgilidir ve bunun için Fisher information yöntemi önerilmektedir. Bu noktada bilgilendiricilik ile çıkarım metodlarının başarısının yakından ilişkili olduğunu gösterilmiştir. Ardından, veri mahremiyetini gözeten doğrusal regresyon için bilinen yöntemlerden daha başarılı olan yeni bir üretici model önerilmiştir. Bu çalışmada, MCMC algoritmaları, çeşitli veri mahremiyeti senaryoları için özel olarak geliştirilmiştir. Bazı senaryolar basit ve verimli Metropolis-Hastings (MH) ile çalışmayı mümkün kılarken, diğerleri Pseudo-Marginal Metropolis-Hastings (PMMH), Metropolis-Hastings with Averaged Acceptance Ratios (MHAAR) veya Gibbs örnekleme gibi daha gelişmiş örnekleme yöntemleri gerektirmektedir. Daha ayrıntılı olarak, istatistik seçimi için MH, PMMH, MHAAR gibi algoritmalar uygulanırken, doğrusal regresyon problemi için Gibbs örnekleme ve türevlerinin kullanılması tercih edilmiştir. Sonunda, farklı durumları kapsayan sayısal deneyler gerçekleştirilmiştir. İstatistik seçimi bölümünde, her bir senaryo üzerinde titizlikle durulmuş ve Fisher information yönteminin hemen hemen tüm olası problem tanımlarında diferansiyel mahremiyet uygulamaları için faydalı bir araç olduğu gösterilmiştir. Doğrusal regresyon için hem simüle edilmiş hem de gerçek veri kümeleri kullanılmış ve önerilen yöntemlerin verimlilik ve etkinlik açısından mevcut algoritmaları geride bıraktığı gözlemlenmiştir.

Özet (Çeviri)

This thesis focuses on data privacy applications with Bayesian inference, particularly Markov chain Monte Carlo (MCMC) methods for two main data privacy problems. Firstly, we focus on statistic selection with a Fisher information, and we show that informativeness and efficiency are closely related in the differential privacy setting. Then, we propose a novel generative model for the private linear regression that outshines state-of-art methods. In this work, MCMC algorithms are specifically developed for several data privacy settings. While some of the settings enable to work with simple and efficient Metropolis-Hastings (MH), others require more advanced sampling methods such as Pseudo-Marginal Metropolis-Hastings (PMMH), Metropolis-Hastings with Averaged Acceptance Ratios (MHAAR) or MH-within-Gibbs sampling. In detail, we prefer using versions of MH, PMMH, MHAAR for the statistic selection, and derivatives of the MH-within-Gibbs for the linear regression problem. At the end, we conduct several numerical experiments for evaluation purposes. In the statistic selection part, we rigorously deal with each problem setting and we obtain that Fisher information is actually a useful tool for the differential privacy applications for almost all possible problem definitions. For the linear regression, both simulated and real datasets are tested, and we observe that proposed methods beat existing algorithms in terms of efficiency and effectiveness.

Benzer Tezler

  1. Applications of Bayesian inference for the origin destination matrix problem

    Kökenli varış noktası problemlerine yönelik Bayesci çıkarım uygulamaları

    ALARA GÜLER

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Endüstri ve Endüstri MühendisliğiSabancı Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SİNAN YILDIRIM

    PROF. ŞEVKET İLKER BİRBİL

  2. Genetik algoritma ve monte carlo simülasyonu ile bir inşaat projesinde alt yüklenici seçimine ilişkin süre maliyet kalite optimizasyonu ve risk değerlendirmesi

    Time cost quality optimization and risk evaluation about selecting subcontractors in a construction project by using genetic algorithm and monte carlo simulation

    BARIŞ KAPLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜL POLAT TATAR

  3. Bayesci tahmin için ardışık Monte Carlo örnekleme yöntemleri

    Sequential Monte Carlo sampling methods for Bayesian estimation

    GÜLER KOÇBERBER

    Doktora

    Türkçe

    Türkçe

    2004

    İstatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF.DR. HÜLYA ÇINGI

  4. Kuantum monte carlo yaklaşımında parite izdüşümlü seviye yoğunluğu hesaplamaları

    Parity-projected level density calculations in the quantum monte carlo approach

    ENES AKYÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Fizik ve Fizik Mühendisliğiİstanbul Üniversitesi

    Fizik Ana Bilim Dalı

    DOÇ. DR. YEŞİM ÖKTEM

    YRD. DOÇ. DR. CEM ÖZEN

  5. Aykırı değerlerin tespiti için kullanılan dayanıklı uzaklık yöntemlerinin karşılaştırılması

    The comparison of robust distance methods for outliers detection

    TUBA ÇELEBİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. PELİN KASAP