Towards differentially private data publishing for effective privacy research
Akıllı sayaç verilerinde etkıi mahremiyet araştırmaları için diferansiyel gizli gürültü ekleme
- Tez No: 855430
- Danışmanlar: PROF. DR. ALBERT LEVİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Sabancı Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Akıllı sayaçlar, elektrik, gaz veya su gibi hizmetlerin tüketimini ölçer. Hizmet sağlayıcıları, veri üzerinde analiz yaparak araştırma ve inovasyona katkıda bulunmak amacıyla akıllı sayaç verilerini yayınlamaktadırlar. Veri sahipleri, akıllı sayaç verilerini yayınlarken, bireylerin yeniden tanımlanmasına olanak tanıyan bağlantı saldırılarına karşı hassas olan anonimleştirme gibi, sınırlı mahremiyet tekniklerinden yararlanmaktadır. Sonuç olarak akıllı sayaç verilerinin kamuya açık hale getirilmesi mahremiyet endişelerini artırmaktadır. Akıllı sayaç verileri, hane halkının günlük rutinleri, faaliyetleri ve mahrem özellikleri hakkındaki kişisel bilgileri ortaya çıkarmak için kötüye kullanılabilir. Diferansiyel mahremiyet, verinin kullanışlılığı ile bireysel mahremiyetin çatışan hedeflerini dengeleyen bir çerçevedir. Bu tezde, diferansiyel mahremiyetin, etkin veri kullanımı ve bilgi çıkarımı sağlanırken, ev halkının mahremiyetini ne derece etkili bir şekilde dengeleyebileceğinin gösterimini amaçlanmaktadır. Bu amaçla ev elektriği tüketim verileri kullanılmıştır. Veri seti dengesiz olduğundan Sentetik Azınlık Örneklem Artırma Tekniği (SMOTE) kullanılarak dengeleme yapıldı. Öte yandan, veri seti küçük olduğundan, gerçek verilere dayalı sentetik veriler üretmek için Üretken Rekabetçi Ağ (GAN) tekniği kullanıldı. IBM'nin diffprivlib kütüphanesi kullanılarak veriye gürültü eklemek için çeşitli deneyler yapıldı ve gürültülü veri üzerinde makine öğrenimine dayalı sınıflandırma gerçekleştirildi. Orijinal verilere benzer sınıflandırma performansı sağlayan en uygun olanı belirlemek için çeşitli gürültü seviyelerinin değerlendirilmesi yapılmıştır. Diferansiyel mahremiyete sahip Gaussian Naive Bayes modelinin, diferansiyel mahremiyete sahip Lojistik Regresyon modeline göre daha iyi bir diferansiyel mahremiyet düzeyi (daha küçük $\varepsilon$) sağladığı belirlendi. Ayrıca, Gaussian gürültü ekleme mekanizmasının, diferansiyel mahremiyet elde etmek için diğer mekanizmalar arasında en iyisi olduğu gösterilmiştir.
Özet (Çeviri)
Smart meters measure utility consumption, like electricity, gas, or water. Utility providers publish smart meter data to contribute to research and innovation by performing analysis on the data. Data owners utilize limited privacy techniques when publishing smart meter data, such as anonymization, which is susceptible to linkage attacks that allow for the re-identification of individuals. As a result, making smart meter data publicly available raises privacy concerns. Smart meter data could be misused to reveal personal information about daily routines, activities, and private characteristics of households. Differential privacy is a framework that balances the conflicting goals of data utilization and individual privacy. In this thesis, we aim to show to what extent differential privacy can effectively balance household privacy while providing efficient data utilization and information extraction. For this purpose, we use household electricity consumption data. The data set was unbalanced, so Synthetic Minority Oversampling Technique (SMOTE) was used to balance it. Moreover, since the data set was small, Generative Adversarial Network (GAN) technique was used to generate synthetic data based on the real data. Using IBM's diffprivlib library, conducted various experiments for adding noise to the data and performed machine-learning-based classification over noisy data. We evaluated various noise levels to determine the optimal one that gives a similar classification performance as the original data. It has been determined that the Gaussian Naive Bayes model with differential privacy provides a better differential privacy level (smaller $\varepsilon$) than the Logistic Regression model with differential privacy. Furthermore, it has been shown that the Gaussian noise addition mechanism is the best among the other mechanisms for achieving differential privacy.
Benzer Tezler
- The effect of project-based learning on 7th grade students' knowledge acquisition in, attitude towards and active learning strategies in and learning value of geometry with differing cognitive style
Proje tabanlı öğrenmenin farklı bilişsel stillere sahip 7. sınıf öğrencilerin geometri bilgi seviyesi, tutum ve aktif öğrenme stratejileri ve öğrenmenin değerine etkisi
YURDAGÜL AYDINYER
Doktora
İngilizce
2010
Eğitim ve ÖğretimOrta Doğu Teknik ÜniversitesiOrtaöğretim Fen ve Matematik Alanları Eğitimi Ana Bilim Dalı
DOÇ. DR. BEHİYE UBUZ
- The relationship between paternalistic leadership, perceived employment discrimination and nepotism
Paternalistik liderlik ile iş ayrımcılığı algısı ve kayırmacılık (Nepotizm) arasındaki ilişki
PINAR SÜNNELİ ERDEN
Yüksek Lisans
İngilizce
2014
İşletmeYeditepe Üniversitesiİşletme Ana Bilim Dalı
YRD. DOÇ. DR. A. BEGÜM ÖTKEN
- Perakende piyasalarında dayanıksız tüketim ürünleri ile ilgili gelişmeler -bireysel markalı ürünlerde satın alma davranışı
Developments regarding fast moving consumer goods at retail markets-buying behavior at the private label products
K. SELÇUK TUZCUOĞLU
- Sürdürülebilir bölgesel kalkınma amacında turizm eylemlerinin etkisi: Türkiye üzerine karşılaştırmalı bir araştırma
Başlık çevirisi yok
FERHAN GEZİCİ
Doktora
Türkçe
1998
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. GÜNDÜZ ATALIK
- Genel hastanelerde yenileme ve büyümeye bağlı değişmelerin bina programına etkileri
The Effects of growth and changes on the formulation of programme of requirements in general hospital
NİLÜFER (TEZEL) AKINCITÜRK
Doktora
Türkçe
1985
Hastanelerİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF.DR. NECATİ İNCEOĞLU