Privacy preserving and robust watermarking on sequential genome data using belief propagation and local differential privacy
Dizisel genetik veriler ̇için ̇inanç yayımı ve lokal diferansiyel gizlilik kullanılarak oluşturulan güçlü ve gizlilik koruyucu filigran teknikleri
- Tez No: 642156
- Danışmanlar: PROF. DR. UĞUR GÜDÜKBAY, YRD. DOÇ. DR. ERMAN AYDAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Genetik veriler 1990 yılında başlayan İnsan Genetik Verisi Projesi'nden beri hem biyolojinin hem de bilgisayar bilimlerinin çalışma alanlarından biri olmuştur. O zamandan bu yana genetik veri dizilimi, hem sağlık sektörü için hem de sosyal kullanım için gittikçe daha ulaşılabilir ve karşılanabilir hale gelmiştir. Üzerlerinde araştırma yapılabilmesi adına bu genetik veriler hem halka açık internet sitelerinde hem de servis sağlayıcıları aracılığıyla paylaşılabilmektedir. Ancak, bu paylaşımlar kısmi yapıldığı durumlarda bile paylaşımcıların veri gizliliklerini (mahremiyetlerini) tehlikeye atmaktadır. Bu çalışmamızda, verilerin izinsiz paylaşım durumundaki sorumlu tutulabilme ilkesini odaklanılmıştır. Sorumlu tutulabilmeyi yüksek olasılıklarla garanti edebilmek için kullanılan yöntemlerden biri de filigran tekniğidir. Paylaşımcıların izni olmaksızın, verileri ifşa olmadan paylaşabilmek isteyen servis sağlayıcılarına karşı, inanç yayımı tekniği aracılığıyla genetik verinin üzerine uygulanabilecek yeni bir filigran metodu öneriyoruz. Yeni yöntemimizde, sağlanması hedeflenen üç kriter belirlenmiştir. Birincisi, kötü niyetli servis sağlayıcılarının silme ve değiştirme yapma ihtimaline karşın dayanıklı, onları yüksek olasılıklarla tespit edebilecek filigranlar üretmektir. İkincisi, herhangi bir servis sağlayıcısıyla paylaşım yapmak için oluşturulan bütün filigranların epsilon-lokal diferansiyel gizliliği sağlamasıdır. Üçüncü kriter ise filigranların oluşturulması sırasında filigran uzunluğunu -veriden sağlanan faydayı yüksek tutmak adına- olabildiğince kısa ve etkili tutmak, ve bu filigranların gerçek genetik veriden ayırt edilememesini sağlamaktır. Oluşturulan filigranların servis sağlayıcıları tarafından“tek servis sağlayıcı saldırısı”ve“iş birliği saldırısı”kullanılarak bozulmasını engellemek için genetik verilerle ilgili halka açık istatistiki değerler kullanılmaktadır. Bu değerler çekinik gen frekansı, bağlayış denksizliği, fenotip özellikleri ve aile bireylerinin genetik dizilimleri olabilir. Ayrıca servis sağlayıcılarının filigran oluşturma yöntemimizi ayrıntılarıyla bildiklerini varsayarak, olasılıksal bir inandırıcı yadsınabilirlik garantileyen ve okunan verinin kesinliğini azaltan lokal diferansiyel gizlilik yöntemi sistemimizde yer almaktadır. İstatistiki bilgilere göre verinin içine rastgele gürültü ekleyen, geleneksel diferansiyel gizlilik yöntemlerinden farklı olarak sistemimiz gürültüyü lokal olasılıklara bağlı kalarak eklemektedir.
Özet (Çeviri)
Genome data is a subject of study for both biology and computer science since the start of Human Genome Project in 1990. Since then, genome sequencing for medical and social purposes becomes more and more available and affordable. For research, these genome data can be shared on public websites or with service providers. However, this sharing process compromises the privacy of donors even under partial sharing conditions. In this work, we mainly focus on the liability aspect ensued by unauthorized sharing of these genome data. One of the techniques to address the liability issues in data sharing is watermarking mechanism. In order to detect malicious correspondents and service providers (SPs) -whose aim is to share genome data without individuals' consent and undetected-, we propose a novel watermarking method on sequential genome data using belief propagation algorithm. In our method, we have three criteria to satisfy. (i) Embedding robust watermarks so that the malicious adversaries can not temper the watermark by modification and are identified with high probability (ii) Achieving -local differential privacy in all data sharings with SPs and (iii) Preserving the utility by keeping the watermark length short and the watermarks non-conflicting. For the preservation of system robustness against single SP and collusion attacks, we consider publicly available genomic information like Minor Allele Frequency, Linkage Disequilibrium, Phenotype Information and Familial Information. Also, considering the fact that the attackers may know our optimality strategy in watermarking, we incorporate local differential privacy as plausible deniability factor that induces malicious inference strength. As opposed to traditional differential privacy-based data sharing schemes in which the noise is added based on summary statistic of the population data, noise is added in local setting based on local probabilities.
Benzer Tezler
- Privacy-preserving computation and robust watermarking techniques for healthcare data
Sağlık verileri için gizliliği koruyan hesaplama ve güçlü filigran teknikleri
SİNEM SAV
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERMAN AYDAY
- Proba:Privacy-preserving, robust and accessible blockchain-powered Helios
Proba:Mahremiyeti koruyan, sağlam ve erişilebilir blokzincir destekli Helios
SERMİN KOCAMAN
Doktora
İngilizce
2024
Bilim ve TeknolojiOrta Doğu Teknik ÜniversitesiKriptografi Ana Bilim Dalı
DOÇ. DR. ALİ DOĞANAKSOY
DOÇ. DR. FATİH SULAK
- A privacy-preserving solution for storage and processing of personal health records against brute-force attacks
Kişisel sağlık verilerinin kaba güç saldırılarına karşı güvenli saklanması ve işlenmesi
SAHARNAZ ESMAEILZADEH DILMAGHANI
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ERMAN AYDAY
- Privacy-preserving mechanisms for face verification systems
Yüz doğrulama sistemleri için gizliliği koruyucu mekanizmalar
MARAM H. W. ALAGHBAR
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik MühendisliğiYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TÜLAY YILDIRIM
- On the robustness of privacy-preserving collaborative filtering schemes
Gizlilik-tabanlı ortak filtreleme metotlarının gürbüzlüğü üzerine
İHSAN GÜNEŞ
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN POLAT