Geri Dön

Towards differentially private data publishing for effective privacy research

Akıllı sayaç verilerinde etkıi mahremiyet araştırmaları için diferansiyel gizli gürültü ekleme

  1. Tez No: 855430
  2. Yazar: MOHAMED MEDHAT MOHAMED ALI ZEINA
  3. Danışmanlar: PROF. DR. ALBERT LEVİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Akıllı sayaçlar, elektrik, gaz veya su gibi hizmetlerin tüketimini ölçer. Hizmet sağlayıcıları, veri üzerinde analiz yaparak araştırma ve inovasyona katkıda bulunmak amacıyla akıllı sayaç verilerini yayınlamaktadırlar. Veri sahipleri, akıllı sayaç verilerini yayınlarken, bireylerin yeniden tanımlanmasına olanak tanıyan bağlantı saldırılarına karşı hassas olan anonimleştirme gibi, sınırlı mahremiyet tekniklerinden yararlanmaktadır. Sonuç olarak akıllı sayaç verilerinin kamuya açık hale getirilmesi mahremiyet endişelerini artırmaktadır. Akıllı sayaç verileri, hane halkının günlük rutinleri, faaliyetleri ve mahrem özellikleri hakkındaki kişisel bilgileri ortaya çıkarmak için kötüye kullanılabilir. Diferansiyel mahremiyet, verinin kullanışlılığı ile bireysel mahremiyetin çatışan hedeflerini dengeleyen bir çerçevedir. Bu tezde, diferansiyel mahremiyetin, etkin veri kullanımı ve bilgi çıkarımı sağlanırken, ev halkının mahremiyetini ne derece etkili bir şekilde dengeleyebileceğinin gösterimini amaçlanmaktadır. Bu amaçla ev elektriği tüketim verileri kullanılmıştır. Veri seti dengesiz olduğundan Sentetik Azınlık Örneklem Artırma Tekniği (SMOTE) kullanılarak dengeleme yapıldı. Öte yandan, veri seti küçük olduğundan, gerçek verilere dayalı sentetik veriler üretmek için Üretken Rekabetçi Ağ (GAN) tekniği kullanıldı. IBM'nin diffprivlib kütüphanesi kullanılarak veriye gürültü eklemek için çeşitli deneyler yapıldı ve gürültülü veri üzerinde makine öğrenimine dayalı sınıflandırma gerçekleştirildi. Orijinal verilere benzer sınıflandırma performansı sağlayan en uygun olanı belirlemek için çeşitli gürültü seviyelerinin değerlendirilmesi yapılmıştır. Diferansiyel mahremiyete sahip Gaussian Naive Bayes modelinin, diferansiyel mahremiyete sahip Lojistik Regresyon modeline göre daha iyi bir diferansiyel mahremiyet düzeyi (daha küçük $\varepsilon$) sağladığı belirlendi. Ayrıca, Gaussian gürültü ekleme mekanizmasının, diferansiyel mahremiyet elde etmek için diğer mekanizmalar arasında en iyisi olduğu gösterilmiştir.

Özet (Çeviri)

Smart meters measure utility consumption, like electricity, gas, or water. Utility providers publish smart meter data to contribute to research and innovation by performing analysis on the data. Data owners utilize limited privacy techniques when publishing smart meter data, such as anonymization, which is susceptible to linkage attacks that allow for the re-identification of individuals. As a result, making smart meter data publicly available raises privacy concerns. Smart meter data could be misused to reveal personal information about daily routines, activities, and private characteristics of households. Differential privacy is a framework that balances the conflicting goals of data utilization and individual privacy. In this thesis, we aim to show to what extent differential privacy can effectively balance household privacy while providing efficient data utilization and information extraction. For this purpose, we use household electricity consumption data. The data set was unbalanced, so Synthetic Minority Oversampling Technique (SMOTE) was used to balance it. Moreover, since the data set was small, Generative Adversarial Network (GAN) technique was used to generate synthetic data based on the real data. Using IBM's diffprivlib library, conducted various experiments for adding noise to the data and performed machine-learning-based classification over noisy data. We evaluated various noise levels to determine the optimal one that gives a similar classification performance as the original data. It has been determined that the Gaussian Naive Bayes model with differential privacy provides a better differential privacy level (smaller $\varepsilon$) than the Logistic Regression model with differential privacy. Furthermore, it has been shown that the Gaussian noise addition mechanism is the best among the other mechanisms for achieving differential privacy.

Benzer Tezler

  1. The effect of project-based learning on 7th grade students' knowledge acquisition in, attitude towards and active learning strategies in and learning value of geometry with differing cognitive style

    Proje tabanlı öğrenmenin farklı bilişsel stillere sahip 7. sınıf öğrencilerin geometri bilgi seviyesi, tutum ve aktif öğrenme stratejileri ve öğrenmenin değerine etkisi

    YURDAGÜL AYDINYER

    Doktora

    İngilizce

    İngilizce

    2010

    Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesi

    Ortaöğretim Fen ve Matematik Alanları Eğitimi Ana Bilim Dalı

    DOÇ. DR. BEHİYE UBUZ

  2. The relationship between paternalistic leadership, perceived employment discrimination and nepotism

    Paternalistik liderlik ile iş ayrımcılığı algısı ve kayırmacılık (Nepotizm) arasındaki ilişki

    PINAR SÜNNELİ ERDEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    İşletmeYeditepe Üniversitesi

    İşletme Ana Bilim Dalı

    YRD. DOÇ. DR. A. BEGÜM ÖTKEN

  3. Perakende piyasalarında dayanıksız tüketim ürünleri ile ilgili gelişmeler -bireysel markalı ürünlerde satın alma davranışı

    Developments regarding fast moving consumer goods at retail markets-buying behavior at the private label products

    K. SELÇUK TUZCUOĞLU

    Doktora

    Türkçe

    Türkçe

    1999

    İşletmeİstanbul Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. SELİME SEZGİN

  4. Genel hastanelerde yenileme ve büyümeye bağlı değişmelerin bina programına etkileri

    The Effects of growth and changes on the formulation of programme of requirements in general hospital

    NİLÜFER (TEZEL) AKINCITÜRK

    Doktora

    Türkçe

    Türkçe

    1985

    Hastanelerİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF.DR. NECATİ İNCEOĞLU