Geri Dön

Privacy preserving data publishing with multiple sensitive attributes

Privacy preserving data publishing with multiple sensitive attributes

  1. Tez No: 348723
  2. Yazar: AHMED ABDALAL
  3. Danışmanlar: DOÇ. DR. YÜCEL SAYGIN, YRD. DOÇ. DR. MEHMET ERCAN NERGİZ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 100

Özet

Veri madenciliği tahmin edilebilir gizli bilgiyi büyük very tabanlarından çıkarma işlemidir. Devletlere, araştırmacılara ve şirketlere veri ambarlarındaki en önemli bilgilere odaklanmaları konusunda yardım etmek gibi büyük bir potansiyele sahiptir. Veri madenciliğinin yüksek bir etki sağlayabilmesi için yüksek kaliteli veriye ve etkin veri yayıncılığına ihtiyaç duyulur. Buna karşın, yayınlanan veri için kişisel mahremiyetin korunması da açık bir ihtiyaçtır.

Özet (Çeviri)

Data mining is the process of extracting hidden predictive information from large databases, it has a great potential to help governments, researchers and companies focus on the most significant information in their data warehouses. High quality data and effective data publishing are needed to gain a high impact from data mining process. However there is a clear need to preserve individual privacy in the released data. Privacy-preserving data publishing is a research topic of eliminating privacy threats. At the same time it provides useful information in the released data. Normally datasets include many sensitive attributes; it may contain static data or dynamic data. Datasets may need to publish multiple updated releases with different time stamps. As a concrete example, public opinions include highly sensitive information about an individual and may reflect a person's perspective, understanding, particular feelings, way of life, and desires. On one hand, public opinion is often collected through a central server which keeps a user profile for each participant and needs to publish this data for researchers to deeply analyze. On the other hand, new privacy concerns arise and user?s privacy can be at risk. The user?s opinion is sensitive information and it must be protected before and after data publishing. Opinions are about a few issues, while the total number of issues is huge. In this case we will deal with multiple sensitive attributes in order to develop an efficient model. Furthermore, opinions are gathered andpublished periodically, correlations between sensitive attributes in different releases may occur. Thus the anonymization technique must care about previous releases as well as the dependencies between released issues. This dissertation identifies a new privacy problem of public opinions. In addition it presents two probabilistic anonymization algorithms based on the concepts of k-anonymity [1, 2] and `-diversity [3, 4]diversity to solve the problem of both publishing datasets with multiple sensitive attributes and publishing dynamic datasets. Proposed algorithms provide a heuristic solution for multidimensional quasi-identifier and multidimensional sensitive attributes using probabilistic `-diverse definition. Experimental results show that these algorithms clearly outperform the existing algorithms in term of anonymization accuracy.

Benzer Tezler

  1. Mülkiyet bilgilerinin paylaşılmasında kişisel verilerin mahremiyetinin korunması

    Privacy preserving personal information in the sharing of land register data

    BARIŞ ANKAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTürk Hava Kurumu Üniversitesi

    Elektrik ve Bilgisayar Ana Bilim Dalı

    YRD. DOÇ. DR. MELTEM YILDIRIM İMAMOĞLU

  2. Gizlilik korumalı veri yayınlama için algoritma tasarımı ve gerçeklemesi

    Algorithm design and implementation for privacy-preserving data publishing

    BURAK CEM KARA

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CAN EYÜPOĞLU

  3. Sağlık hizmetlerinde anonimlik: Dağıtık yapılar için ideal bir veri paylaşım modeli

    Anonymity in healthcare systems: An ideal data sharing model for distributed structures

    PELİN CANBAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

  4. p-kazanım: Mahremiyet korumalı fayda temelli veri yayınlama modeli

    p-gain: Privacy preserving utility-based data publishing model

    YILMAZ VURAL

    Doktora

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MURAT AYDOS

  5. Preserving privacy in hierarchical data publishing

    Başlık çevirisi yok

    MEHMET EMRE GÜRSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversity of California Los Angeles

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. PETER REIHER