Geri Dön

Privacy preserving and robust watermarking on sequential genome data using belief propagation and local differential privacy

Dizisel genetik veriler ̇için ̇inanç yayımı ve lokal diferansiyel gizlilik kullanılarak oluşturulan güçlü ve gizlilik koruyucu filigran teknikleri

  1. Tez No: 642156
  2. Yazar: ABDULLAH ÇAĞLAR ÖKSÜZ
  3. Danışmanlar: PROF. DR. UĞUR GÜDÜKBAY, YRD. DOÇ. DR. ERMAN AYDAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 69

Özet

Genetik veriler 1990 yılında başlayan İnsan Genetik Verisi Projesi'nden beri hem biyolojinin hem de bilgisayar bilimlerinin çalışma alanlarından biri olmuştur. O zamandan bu yana genetik veri dizilimi, hem sağlık sektörü için hem de sosyal kullanım için gittikçe daha ulaşılabilir ve karşılanabilir hale gelmiştir. Üzerlerinde araştırma yapılabilmesi adına bu genetik veriler hem halka açık internet sitelerinde hem de servis sağlayıcıları aracılığıyla paylaşılabilmektedir. Ancak, bu paylaşımlar kısmi yapıldığı durumlarda bile paylaşımcıların veri gizliliklerini (mahremiyetlerini) tehlikeye atmaktadır. Bu çalışmamızda, verilerin izinsiz paylaşım durumundaki sorumlu tutulabilme ilkesini odaklanılmıştır. Sorumlu tutulabilmeyi yüksek olasılıklarla garanti edebilmek için kullanılan yöntemlerden biri de filigran tekniğidir. Paylaşımcıların izni olmaksızın, verileri ifşa olmadan paylaşabilmek isteyen servis sağlayıcılarına karşı, inanç yayımı tekniği aracılığıyla genetik verinin üzerine uygulanabilecek yeni bir filigran metodu öneriyoruz. Yeni yöntemimizde, sağlanması hedeflenen üç kriter belirlenmiştir. Birincisi, kötü niyetli servis sağlayıcılarının silme ve değiştirme yapma ihtimaline karşın dayanıklı, onları yüksek olasılıklarla tespit edebilecek filigranlar üretmektir. İkincisi, herhangi bir servis sağlayıcısıyla paylaşım yapmak için oluşturulan bütün filigranların epsilon-lokal diferansiyel gizliliği sağlamasıdır. Üçüncü kriter ise filigranların oluşturulması sırasında filigran uzunluğunu -veriden sağlanan faydayı yüksek tutmak adına- olabildiğince kısa ve etkili tutmak, ve bu filigranların gerçek genetik veriden ayırt edilememesini sağlamaktır. Oluşturulan filigranların servis sağlayıcıları tarafından“tek servis sağlayıcı saldırısı”ve“iş birliği saldırısı”kullanılarak bozulmasını engellemek için genetik verilerle ilgili halka açık istatistiki değerler kullanılmaktadır. Bu değerler çekinik gen frekansı, bağlayış denksizliği, fenotip özellikleri ve aile bireylerinin genetik dizilimleri olabilir. Ayrıca servis sağlayıcılarının filigran oluşturma yöntemimizi ayrıntılarıyla bildiklerini varsayarak, olasılıksal bir inandırıcı yadsınabilirlik garantileyen ve okunan verinin kesinliğini azaltan lokal diferansiyel gizlilik yöntemi sistemimizde yer almaktadır. İstatistiki bilgilere göre verinin içine rastgele gürültü ekleyen, geleneksel diferansiyel gizlilik yöntemlerinden farklı olarak sistemimiz gürültüyü lokal olasılıklara bağlı kalarak eklemektedir.

Özet (Çeviri)

Genome data is a subject of study for both biology and computer science since the start of Human Genome Project in 1990. Since then, genome sequencing for medical and social purposes becomes more and more available and affordable. For research, these genome data can be shared on public websites or with service providers. However, this sharing process compromises the privacy of donors even under partial sharing conditions. In this work, we mainly focus on the liability aspect ensued by unauthorized sharing of these genome data. One of the techniques to address the liability issues in data sharing is watermarking mechanism. In order to detect malicious correspondents and service providers (SPs) -whose aim is to share genome data without individuals' consent and undetected-, we propose a novel watermarking method on sequential genome data using belief propagation algorithm. In our method, we have three criteria to satisfy. (i) Embedding robust watermarks so that the malicious adversaries can not temper the watermark by modification and are identified with high probability (ii) Achieving -local differential privacy in all data sharings with SPs and (iii) Preserving the utility by keeping the watermark length short and the watermarks non-conflicting. For the preservation of system robustness against single SP and collusion attacks, we consider publicly available genomic information like Minor Allele Frequency, Linkage Disequilibrium, Phenotype Information and Familial Information. Also, considering the fact that the attackers may know our optimality strategy in watermarking, we incorporate local differential privacy as plausible deniability factor that induces malicious inference strength. As opposed to traditional differential privacy-based data sharing schemes in which the noise is added based on summary statistic of the population data, noise is added in local setting based on local probabilities.

Benzer Tezler

  1. Privacy-preserving computation and robust watermarking techniques for healthcare data

    Sağlık verileri için gizliliği koruyan hesaplama ve güçlü filigran teknikleri

    SİNEM SAV

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERMAN AYDAY

  2. Proba:Privacy-preserving, robust and accessible blockchain-powered Helios

    Proba:Mahremiyeti koruyan, sağlam ve erişilebilir blokzincir destekli Helios

    SERMİN KOCAMAN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilim ve TeknolojiOrta Doğu Teknik Üniversitesi

    Kriptografi Ana Bilim Dalı

    DOÇ. DR. ALİ DOĞANAKSOY

    DOÇ. DR. FATİH SULAK

  3. A privacy-preserving solution for storage and processing of personal health records against brute-force attacks

    Kişisel sağlık verilerinin kaba güç saldırılarına karşı güvenli saklanması ve işlenmesi

    SAHARNAZ ESMAEILZADEH DILMAGHANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ERMAN AYDAY

  4. Privacy-preserving mechanisms for face verification systems

    Yüz doğrulama sistemleri için gizliliği koruyucu mekanizmalar

    MARAM H. W. ALAGHBAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. TÜLAY YILDIRIM

  5. On the robustness of privacy-preserving collaborative filtering schemes

    Gizlilik-tabanlı ortak filtreleme metotlarının gürbüzlüğü üzerine

    İHSAN GÜNEŞ

    Doktora

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN POLAT