Geri Dön

Application of privacy-preserving clustering methods using homomorphic encryption algorithms

Homomorfik şifreleme algoritmaları kullanılarak mahremiyet korumalı gruplandırma yöntemlerinin uygulanması

  1. Tez No: 527522
  2. Yazar: İSMAİL AYDIN
  3. Danışmanlar: PROF. DR. ENSAR GÜL, DR. FERHAT ÖZGÜR ÇATAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: İstanbul Şehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgi Güvenliği Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Güvenliği Bilim Dalı
  13. Sayfa Sayısı: 89

Özet

Günümüzde finans, sağlık, askeri sistemler veya sosyal platformlarda elde edilmiş ve mahremiyeti korunması gereken büyük veri topluluklarının işlenmesi/anlamlandırılması ihtiyacı mevcuttur. Mahremiyet koruma amacıyla klasik şifreleme yöntemlerinin kullanımı, verinin kullanılacağı sistemde şifreleme, şifre çözme veya verinin anlamlandırılması işlemlerinin en az ikisinin aynı yerde yapılmasını gerektirir. Veri büyüklüğünün artması ile beraber bu işlemlerin aynı yerde yapılması durumunda büyük miktarlarda bir işlem gücü ihtiyacı doğacaktır. Klasik anlamda kriptolama yöntemlerinin çok sayıda bağlantı içeren büyük veri sistemlerinde kullanımı durumunda, işlem yüküne ek olarak çok sayıda kullanıcının her birinde uygun anahtar dağıtım mekanizmalarının da çalışması gerekecektir. Çok sayıda kullanıcının bir araya gelmiş olduğu bir büyük veri sisteminde gerek anahtar dağıtım mekanizmalarının koşmasının, gerekse de büyük veri üzerinde yapılacak yüksek işlem gücü gerektiren işlemlerin ortak bir platform üzerinde yapılmasına imkan vermesi sebebiyle bu çalışmada homomorfik şifreleme yöntemlerinin kullanımı önerilmektedir. Homomorfik şifreleme yöntemleri ile beraber şifreli veri üzerinde uygun makine öğrenme yöntemleri kullanılması sayesinde büyük verilerin paydaşlara dağıtımının ve veri işlemenin mahremiyete aykırı bir durum oluşturmadan yapılabilmesi mümkün hale gelmektedir. Bu sayede sistem paydaşlarının yüksek işlem kapasitesine sahip olmasına gerek kalmadan büyük veri işleme mekanizmalarına dahil olup, işlem yapabilme imkanına sahip olması sağlanacaktır. Tasarlanan sistemin çalışmasına uygun olması sebebiyle asimetrik bir şifreleme algoritması olan ve homomorfik özellik göstermesi sebebiyle mahremiyet koruma amacıyla Paillier kriptolama sistemi kullanılmıştır. Makine öğrenme yöntemlerinin uygulamas ı amacıyla tasarlanan sistem üzerinde farklı veri uzunlukları, farklı anahtar uzunluklar ı kullanılarak mahremiyeti sağlanan sistemde 4 ayrı makine öğrenme yöntemi koşturulmu ştur. Her algoritmanın farklı anahtar ve veri uzunluğu için göstermiş olduğu performans, aynı verinin açık ve kapalı halleri üzerinde koşturulan makine öğrenme algoritmalarının 6 farklı ölçüt üzerinden değerlendirmeye tutulması ile tespit edilmiştir.

Özet (Çeviri)

The need of protection and processing of the sensitive data in large scale data systems (for example data derived from financial systems, militaristic systems or social media platforms) is a common problem. Usage of traditional cryptographic methods for data protection mainly needs at least two of the ciphering, deciphering and data processing works to be done on the same side. Because of this, with increase of the data size there will be a need for higher processing power to work on the data. Using traditional encryption algorithms for protection of the sensitive data on large scale systems, also brings the need of exchanging the needed keys for protection and processing the data. Homomorphic encryption schemes have enough flexibility that, they should be used on data systems that contains data from multiple parts, because of its feature of allowing to process the encrypted data like its non-encrypted form. With the usage of homomorphic encryption schemes and proper data learning systems on encrypted data, distribution of sensitive data to different parties can be done without violating its privacy. In this thesis, we propose a method to run mathematical computations which needs high processing power on a common platform which offers high processing power of data but not on parties that the sensitive data will be distributed. As a result the partners of this systems will not need to have high processing power to function on the data because the high processing demanding tasks would be done on the common platform. In this research Paillier Cryptographic system was used to protect data privacy. Paillier Cryptographic algorithm's most prominent features are its asymmetrical and partially homomorphic behavior. We proposed a system that uses privacy preserving distance matrix calculation as input for several clustering algorithms which are commonly used in machine learning systems. Our system is evaluated considering different data lengths and different key lengths. Four different data clustering methods have been tested. By applying clustering algorithms on both encrypted and plain forms of the same data for different key and data lengths, we obtained performance results by using six different metrics.

Benzer Tezler

  1. Gizliliği koruyan bulanık veri madenciliği yöntemlerinin geliştirilmesi

    Development of privacy preserving fuzzy data mining methods

    TOLGA BERBEROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET KAYA

  2. Improving performance of privacy-preserving collaborative filtering schemes

    Gizlilik temelli ortak süzgeçleme yöntemlerinin başarımının iyileştirilmesi

    ALPER BİLGE

    Doktora

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN POLAT

  3. Privacy preserving data collection framework for user centric network applications

    Günümüz kullanıcı eksenli ağ uygulamaları için kişisel gizliliği sağlayan bilgi toplama anaçatısı

    HAYRETDİN BAHŞİ

    Doktora

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALBERT LEVİ

  4. A toolbox for privacy preserving distributed data mining

    Mahremiyet koruyucu veri madenciliği için bir kütüphane gerçeklemesi

    SELİM VOLKAN KAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Elektronik Mühendisliği ve Bilgisayar Bilimi Ana Bilim Dalı

    DOÇ. DR. ERKAY SAVAŞ

    YRD. DOÇ. DR. YÜCEL SAYGIN

  5. Proxy-secure computation model: Application to k-means clustering implementation, analysis and improvements

    Vekil güvenlikli hesaplama modeli: K-means gruplama uygulaması uygulama, analiz ve geliştirmeleri

    ERMAN PATTUK

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERKAY SAVAŞ