Geri Dön

Quantifying and protecting genomic privacy

Genomik gizliliği ölçmek ve korumak

  1. Tez No: 520244
  2. Yazar: MOHAMMAD MOBAYENJARIHANI
  3. Danışmanlar: Assist. Prof. ERMAN AYDAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 86

Özet

Günümüzde, genom dizilimi her zamankinden daha erişilebilir ve hesaplıdır. Ayrıca bireylerin genom verilerini servis sağlayıcıları veya kamuya açık web sitelerinde paylaşmaları da mümkündür. Genomik verilerin tıbbi araştırmalarda önemli bir etkisi ve yaygın kullanımı olmasına rağmen, genetik verilerini anonim veya kısmen paylaşsalar bile bireylerin gizliliğini tehlikeye atmaktadır. Bu çalışmada, ilk olarak, gözlemlenebilir Markov modeli, haplotipler, akrabalık ilişkileri ve fenotipik özellikler arasındaki rekombinasyon modeli kullanılarak genomik gizlilik çıkarsama saldırısı üzerinde mevcut çalışmalarını geliştiriyoruz. Daha sonra bu gizlilik konusunu ele almak için, mahremiyetlerini korurken bireylerin genomik verilerini paylaşmaya yönelik farklı bir gizlilik temelli çerçeve sunuyoruz. Genomik veriler için var olan farklı gizlilik temelli çözümlerden farklı olarak (özet istatistiklerinin gizliliğin korunmasını da göz önünde bulundurarak), gerçek genomik verilerin gizliliğini koruyan paylaşımına odaklanıyoruz. Kendi genomunda (örneğin, mutasyonlar veya tek nükleotid polimorfizmleri - bireyle ilgili hassas bilgileri açığa çıkaran SNP'ler) bazı hassas kısımları olan bir bireyi varsayıyoruz. Bireyin amaçları (i) hassas verilerinin gizliliğini korumak, (ii) birbirine bağlı verilerin gizliliğini korumak (kendi verileriyle ilişkili olan diğer bireylere ait veriler) ve (iii) çok fazla veri paylaşmak Veri paylaşımını en üst düzeye çıkarmak için mümkün olduğu kadar. Geleneksel farklı gizlilik temelli veri paylaşım şemalarının aksine, önerilen plan, verilere kasıtlı olarak gürültü eklemez; veri noktalarının seçici bir şekilde paylaşılmasına dayanır. Önceki çalışmalar, diğerlerini paylaşırken hassas SNP'leri gizlemenin, bireyin (ya da diğer birbirine bağlı halkların) gizliliğini korumadığını göstermektedir. Yardımcı bilgilerden yararlanarak, bir saldırgan etkili çıkarım saldırıları yürütebilir ve bireylerin hassas SNP'lerini çıkartabilir. Bu çalışmada, öncelikle gizlilik temelli veri paylaşımı çerçevemizde, ayrıntılı olarak tartıştığımız bu çıkarım saldırılarını ve farklı gizlilik garantileri sağlayan bireyler için bir SNP paylaşım platformu önermekteyiz. Önerilen çerçevenin, yüksek bir veri paylaşım programı sağlarken saldırganı hassas bilgiler sağlamadığını gösteriyoruz. Gerçek veriler üzerinde yapılan deneyler sayesinde, fayda ile mahremiyeti etkileyen çeşitli parametreler arasındaki ilişkiyi kapsamlı bir şekilde inceliyoruz. Ayrıca, önerilen tekniği daha öncekilerle karşılaştırıyoruz ve hem gizlilik hem de veri paylaşımı yararı açısından avantajımız olduğunu gösteriyoruz.

Özet (Çeviri)

Today, genome sequencing is more accessible and affordable than ever. It is also possible for individuals to share their genomic data with service providers or on public websites. Although genomic data has significant impact and widespread usage on medical research, it puts individuals' privacy in danger, even if they anonymously or partially share their genomic data. In this work, first, we improve the existing work on inference attack on genomic privacy using observable Markov model, recombination model between the haplotypes, kinship relations, and phenotypic traits. Then to address this privacy concern, we present a differential privacy-based framework for sharing individuals' genomic data while preserving their privacy. Different from existing differential privacy-based solutions for genomic data (which consider privacy-preserving release of summary statistics), we focus on privacy-preserving sharing of actual genomic data. We assume an individual with some sensitive portion on his genome (e.g., mutations or single nucleotide polymorphisms - SNPs that reveal sensitive information about the individual). The goals of the individual are to (i) preserve the privacy of his sensitive data, (ii) preserve the privacy of interdependent data (data that belongs to other individuals that is correlated with his data), and (iii) share as much data as possible to maximize utility of data sharing. As opposed to traditional differential privacy-based data sharing schemes, the proposed scheme does not intentionally add noise to data; it is based on selective sharing of data points. Previous studies show that hiding the sensitive SNPs while sharing the others does not preserve individual's (or other interdependent peoples') privacy. By exploiting auxiliary information, an attacker can run efficient inference attacks and infer the sensitive SNPs of individuals. In this work, we also utilize such inference attacks, which we discuss in details first, in our differential privacy-based data sharing framework and propose a SNP sharing platform for individuals that provides differential privacy guarantees. We show that the proposed framework does not provide sensitive information to the attacker while it provides a high data sharing utility. Through experiments on real data, we extensively study the relationship between utility and several parameters that effect privacy. We also compare the proposed technique with the previous ones and show our advantage both in terms of privacy and data sharing utility.

Benzer Tezler

  1. Dijitalleşme ve hibrit çalışmanın karbon ayak izi etkisine yönelik bir model önerisi

    Digitalisation and the impact of hybrid work on carbon footprint: A model proposal

    MÜGE YALÇIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. FATMA PINAR ÇAKMAK

  2. Turizm işletmelerinde halkla ilişkiler faaliyetlerinin itibar yönetimine etkileri: Örnek bir uygulama

    The effects of public relations activities to the reputation management in tourism companies: A sample application

    ERKAN AKGÖZ

    Doktora

    Türkçe

    Türkçe

    2009

    Halkla İlişkilerSelçuk Üniversitesi

    Halkla İlişkiler ve Tanıtım Ana Bilim Dalı

    DOÇ. DR. BAŞAK SOLMAZ

  3. Türkiye'de kamu ulaştırma yatırımlarının verimliliğini etkileyen faktörlerin analizi

    Factors affecting the profitability of public transportation investments in Turkey

    NAZLI ECE BACAKSIZ

    Doktora

    Türkçe

    Türkçe

    2019

    İşletmeMuğla Sıtkı Koçman Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ERKAN POYRAZ

  4. Assessing the water quality of the Sazlıdere reservoir in İstanbul with ikonos satellite imagery

    Ikonos uydu verisiyle Sazlıdere rezarvuarının su kalitesinin değerlendirilmesi

    AYSEL SHAMIS

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    CoğrafyaFatih Üniversitesi

    Coğrafya Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET KARABURUN

  5. Ceza Muhakemesinde hukuka aykırı delillerin ispat değeri

    Probative value of illegally obtained evidence in Criminal Procedure

    YEŞİM YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    HukukGalatasaray Üniversitesi

    Kamu Hukuku Ana Bilim Dalı

    DOÇ. DR. ÜMİT KOCASAKAL