Kişisel verilerin anonimleştirilmesinin iyileştirilmesine yönelik bir model geliştirilmesi ve e-devlet alanında uygulanması
Development of a model for improving personal data anonymization and case study in e-government
- Tez No: 589918
- Danışmanlar: PROF. DR. ALİ ZİYA ALKAR
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 381
Özet
Günümüzde, e-Devlet hizmetleri sayesinde ortaya çıkan verinin istatistik, araştırma-geliştirme, yapay zekâ öğrenimi, hizmet iyileştirme, projeksiyon geliştirme başta olmak üzere pek çok alanda değerli bir kaynak olduğunun fark edilmesi, bu veriyi işlemek üzere elde etme ihtiyacını arttırmıştır. Ancak e-Devlet hizmetlerinden doğan bu büyük hacimli verinin önemli bir bölümü kişisel verilerden oluşmaktadır ve mahremiyetin korunmasına yönelik olarak gerek Avrupa Birliği gibi uluslararası kuruluşlarda Genel Veri Koruma Tüzüğü (GDPR) ile gerekse ülkemizde 6698 sayılı Kişisel Verilerin Korunması Kanunu gibi mevzuat altyapısı ile korunmakta ve verinin paylaşımı için anonimleştirme şart koşulmaktadır. Verinin belli kısımlarının kapatılması veya genelleştirilmesi gibi yöntemlerle gerçekleştirilen anonimleştirme ile söz konusu veri, bir gerçek kişi ile ilişkilendirilemeyecek hale getirilmektedir. Bu konudaki mahremiyet standartlarının en bilineni olan k-anonimlik (kişileri aynı yarı tanımlayıcı değere sahip en az k tane kayıt grupları şeklinde tutarak mahremiyeti sağlar), l -çeşitlilik (her bir denklik sınıfının her hassas özellik için en az l adet değere sahip olmasını gerektirir) ve t-yakınlık (herhangi bir denklik sınıfında hassas özniteliğin dağılımının, özniteliğin veri setindeki dağılımına yakın olmasını, yani bu iki dağılım arasındaki mesafenin t eşik değerinden fazla olmamasını gerektirir) uygulamasında, veri üzerinde yapılan genelleştirme işlemleri sebebiyle, belirli seviyede veri kaybı oluşmakta ve bu durum, sonuç veri kümesinden elde edilmesi beklenen faydayı azaltmaktadır. Bu doktora çalışmasında, veri niteliğini dikkate alarak ve kayda özelleşmiş grupları adaptif şekilde oluşturarak veri fayda kaybını en aza indirgeyen ve tam baskılanan kayıtların sayısında yüksek oranda iyileştirmeler sağlayan, hedef odaklı, e-Devlet verisi dahil olmak üzere her türlü veri setine uygulanabilen, yenilikçi bir adaptif ve dinamik anonimleştirme modeli (ADAM) ortaya konulmuştur. e-Devlet veri kümeleri büyük hacimlerden oluştuğu için, ortaya konulan modelin, yüksek veri hacimlerinde de beklenen iyileştirmeyi sağlaması gerekmektedir. Bu sebeple, bu buluşsal yöntemin sağlayacağı iyileştirme seviyesini ölçebilmek için, e-Devletin önemli uygulama alanlarından birisi olan sağlık alanında sentetik veri üreten bir uygulama geliştirilmiş ve 1.000 kişilik veri setlerinden başlayarak kademeli olarak 100.000 kişilik sentetik veri setleri oluşturularak ADAM algoritması uygulanmış, mevcut anonimleştirme yöntemlerine kıyasla önerilen modelin önemli ölçüde iyileştirmeler sağlayabildiği gösterilmiştir.
Özet (Çeviri)
Nowadays, the realization that the data emerged through e-Government services is a valuable resource in many fields such as statistics, research and development, artificial intelligence training, service improvement and projection development has increased the need to obtain this data for processing. However, an important part of this large volume of data arising from e-Government services consists of personal data. Privacy is protected by the legislation infrastructure, both in international organizations such as the European Union, with the General Data Protection Regulation (GDPR) and in our country the Law on Protection of Personal Data No. 6698, and anonymization is required for sharing personal data. By means of anonymization with methods such as generalizing or masking certain parts of the data, said data cannot be associated with a single person. K-anonymity, the most well-known of the privacy standards in this regard (provides privacy by keeping individuals in at least k groups of records of the same quasi-identifier value), l -diversity (requires that each equivalence class has at least l well-represented values for each sensitive attribute) and t-closeness (requires that the distribution of a sensitive attribute in any equivalence class is close to the distribution of the attribute in the overall table, so the distance between the two distributions should be no more than a threshold t), resulting in a certain level of data loss due to generalization on the data, which reduces the expected benefit from the resulting data set. In this doctoral study, an innovative, aim oriented, applicable to any kind of data set including e-Government data, adaptive and dynamic anonymization model (ADAM) was introduced by minimizing data benefit loss and providing high improvements in the number of fully suppressed records, taking into account the content of data and adaptively creating records specific to groups. Since e-Government data sets are composed of large volumes, the model introduced should provide the expected improvement in high data volumes. Therefore, in order to measure the level of improvement provided by this heuristic method, an application has been developed which produces synthetic data in the field of health which is one of the important application fields of e-Government and ADAM algorithm has been applied gradually by creating synthetic data sets of starting from 1.000 data sets up to 100.000 people and it has been shown that the proposed model can provide significant improvements compared to existing anonymization methods.
Benzer Tezler
- Kurumlar arasında web servis aracılığı ile sunulan kişisel verilerin yazılım geliştiricilere karşı korunması
Protection personal data submitted by web services between government agancies against software developers
MAHMUT ÇELİK
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgi Güvenliği Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA ALKAN
- Kişisel Verilerin Korunması Kanunu kapsamında çerezler
Cookies within the scope of the Personal Data Protection Law
MUHAMMED HARUN KILIÇ
- Kişisel Verilerin Korunması Hukukunda ticari elektronik ileti
Commercial electronic message in Data Protection Law
RAMAZAN FURKAN KAYA
- Bilgi Edinme Hakkı kapsamında Kişisel Verilerin Korunması
Protection of Personal Data within the Right to Information
MUSTAFA CİHAT ALTAN
Yüksek Lisans
Türkçe
2022
Siyasal BilimlerErciyes ÜniversitesiSiyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı
DOÇ. DR. MÜZEYYEN EROĞLU DURKAL