Privacy preserving data publishing with multiple sensitive attributes
Privacy preserving data publishing with multiple sensitive attributes
- Tez No: 348723
- Danışmanlar: DOÇ. DR. YÜCEL SAYGIN, YRD. DOÇ. DR. MEHMET ERCAN NERGİZ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: İngilizce
- Üniversite: Sabancı Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 100
Özet
Veri madenciliği tahmin edilebilir gizli bilgiyi büyük very tabanlarından çıkarma işlemidir. Devletlere, araştırmacılara ve şirketlere veri ambarlarındaki en önemli bilgilere odaklanmaları konusunda yardım etmek gibi büyük bir potansiyele sahiptir. Veri madenciliğinin yüksek bir etki sağlayabilmesi için yüksek kaliteli veriye ve etkin veri yayıncılığına ihtiyaç duyulur. Buna karşın, yayınlanan veri için kişisel mahremiyetin korunması da açık bir ihtiyaçtır.
Özet (Çeviri)
Data mining is the process of extracting hidden predictive information from large databases, it has a great potential to help governments, researchers and companies focus on the most significant information in their data warehouses. High quality data and effective data publishing are needed to gain a high impact from data mining process. However there is a clear need to preserve individual privacy in the released data. Privacy-preserving data publishing is a research topic of eliminating privacy threats. At the same time it provides useful information in the released data. Normally datasets include many sensitive attributes; it may contain static data or dynamic data. Datasets may need to publish multiple updated releases with different time stamps. As a concrete example, public opinions include highly sensitive information about an individual and may reflect a person's perspective, understanding, particular feelings, way of life, and desires. On one hand, public opinion is often collected through a central server which keeps a user profile for each participant and needs to publish this data for researchers to deeply analyze. On the other hand, new privacy concerns arise and user?s privacy can be at risk. The user?s opinion is sensitive information and it must be protected before and after data publishing. Opinions are about a few issues, while the total number of issues is huge. In this case we will deal with multiple sensitive attributes in order to develop an efficient model. Furthermore, opinions are gathered andpublished periodically, correlations between sensitive attributes in different releases may occur. Thus the anonymization technique must care about previous releases as well as the dependencies between released issues. This dissertation identifies a new privacy problem of public opinions. In addition it presents two probabilistic anonymization algorithms based on the concepts of k-anonymity [1, 2] and `-diversity [3, 4]diversity to solve the problem of both publishing datasets with multiple sensitive attributes and publishing dynamic datasets. Proposed algorithms provide a heuristic solution for multidimensional quasi-identifier and multidimensional sensitive attributes using probabilistic `-diverse definition. Experimental results show that these algorithms clearly outperform the existing algorithms in term of anonymization accuracy.
Benzer Tezler
- Mülkiyet bilgilerinin paylaşılmasında kişisel verilerin mahremiyetinin korunması
Privacy preserving personal information in the sharing of land register data
BARIŞ ANKAY
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTürk Hava Kurumu ÜniversitesiElektrik ve Bilgisayar Ana Bilim Dalı
YRD. DOÇ. DR. MELTEM YILDIRIM İMAMOĞLU
- Gizlilik korumalı veri yayınlama için algoritma tasarımı ve gerçeklemesi
Algorithm design and implementation for privacy-preserving data publishing
BURAK CEM KARA
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. CAN EYÜPOĞLU
- Sağlık hizmetlerinde anonimlik: Dağıtık yapılar için ideal bir veri paylaşım modeli
Anonymity in healthcare systems: An ideal data sharing model for distributed structures
PELİN CANBAY
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
- p-kazanım: Mahremiyet korumalı fayda temelli veri yayınlama modeli
p-gain: Privacy preserving utility-based data publishing model
YILMAZ VURAL
Doktora
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MURAT AYDOS
- Preserving privacy in hierarchical data publishing
Başlık çevirisi yok
MEHMET EMRE GÜRSOY
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversity of California Los AngelesBilgisayar Bilimleri Ana Bilim Dalı
PROF. PETER REIHER