Application of privacy-preserving clustering methods using homomorphic encryption algorithms
Homomorfik şifreleme algoritmaları kullanılarak mahremiyet korumalı gruplandırma yöntemlerinin uygulanması
- Tez No: 527522
- Danışmanlar: PROF. DR. ENSAR GÜL, DR. FERHAT ÖZGÜR ÇATAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: İstanbul Şehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgi Güvenliği Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgi Güvenliği Bilim Dalı
- Sayfa Sayısı: 89
Özet
Günümüzde finans, sağlık, askeri sistemler veya sosyal platformlarda elde edilmiş ve mahremiyeti korunması gereken büyük veri topluluklarının işlenmesi/anlamlandırılması ihtiyacı mevcuttur. Mahremiyet koruma amacıyla klasik şifreleme yöntemlerinin kullanımı, verinin kullanılacağı sistemde şifreleme, şifre çözme veya verinin anlamlandırılması işlemlerinin en az ikisinin aynı yerde yapılmasını gerektirir. Veri büyüklüğünün artması ile beraber bu işlemlerin aynı yerde yapılması durumunda büyük miktarlarda bir işlem gücü ihtiyacı doğacaktır. Klasik anlamda kriptolama yöntemlerinin çok sayıda bağlantı içeren büyük veri sistemlerinde kullanımı durumunda, işlem yüküne ek olarak çok sayıda kullanıcının her birinde uygun anahtar dağıtım mekanizmalarının da çalışması gerekecektir. Çok sayıda kullanıcının bir araya gelmiş olduğu bir büyük veri sisteminde gerek anahtar dağıtım mekanizmalarının koşmasının, gerekse de büyük veri üzerinde yapılacak yüksek işlem gücü gerektiren işlemlerin ortak bir platform üzerinde yapılmasına imkan vermesi sebebiyle bu çalışmada homomorfik şifreleme yöntemlerinin kullanımı önerilmektedir. Homomorfik şifreleme yöntemleri ile beraber şifreli veri üzerinde uygun makine öğrenme yöntemleri kullanılması sayesinde büyük verilerin paydaşlara dağıtımının ve veri işlemenin mahremiyete aykırı bir durum oluşturmadan yapılabilmesi mümkün hale gelmektedir. Bu sayede sistem paydaşlarının yüksek işlem kapasitesine sahip olmasına gerek kalmadan büyük veri işleme mekanizmalarına dahil olup, işlem yapabilme imkanına sahip olması sağlanacaktır. Tasarlanan sistemin çalışmasına uygun olması sebebiyle asimetrik bir şifreleme algoritması olan ve homomorfik özellik göstermesi sebebiyle mahremiyet koruma amacıyla Paillier kriptolama sistemi kullanılmıştır. Makine öğrenme yöntemlerinin uygulamas ı amacıyla tasarlanan sistem üzerinde farklı veri uzunlukları, farklı anahtar uzunluklar ı kullanılarak mahremiyeti sağlanan sistemde 4 ayrı makine öğrenme yöntemi koşturulmu ştur. Her algoritmanın farklı anahtar ve veri uzunluğu için göstermiş olduğu performans, aynı verinin açık ve kapalı halleri üzerinde koşturulan makine öğrenme algoritmalarının 6 farklı ölçüt üzerinden değerlendirmeye tutulması ile tespit edilmiştir.
Özet (Çeviri)
The need of protection and processing of the sensitive data in large scale data systems (for example data derived from financial systems, militaristic systems or social media platforms) is a common problem. Usage of traditional cryptographic methods for data protection mainly needs at least two of the ciphering, deciphering and data processing works to be done on the same side. Because of this, with increase of the data size there will be a need for higher processing power to work on the data. Using traditional encryption algorithms for protection of the sensitive data on large scale systems, also brings the need of exchanging the needed keys for protection and processing the data. Homomorphic encryption schemes have enough flexibility that, they should be used on data systems that contains data from multiple parts, because of its feature of allowing to process the encrypted data like its non-encrypted form. With the usage of homomorphic encryption schemes and proper data learning systems on encrypted data, distribution of sensitive data to different parties can be done without violating its privacy. In this thesis, we propose a method to run mathematical computations which needs high processing power on a common platform which offers high processing power of data but not on parties that the sensitive data will be distributed. As a result the partners of this systems will not need to have high processing power to function on the data because the high processing demanding tasks would be done on the common platform. In this research Paillier Cryptographic system was used to protect data privacy. Paillier Cryptographic algorithm's most prominent features are its asymmetrical and partially homomorphic behavior. We proposed a system that uses privacy preserving distance matrix calculation as input for several clustering algorithms which are commonly used in machine learning systems. Our system is evaluated considering different data lengths and different key lengths. Four different data clustering methods have been tested. By applying clustering algorithms on both encrypted and plain forms of the same data for different key and data lengths, we obtained performance results by using six different metrics.
Benzer Tezler
- Gizliliği koruyan bulanık veri madenciliği yöntemlerinin geliştirilmesi
Development of privacy preserving fuzzy data mining methods
TOLGA BERBEROĞLU
Yüksek Lisans
Türkçe
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MEHMET KAYA
- Improving performance of privacy-preserving collaborative filtering schemes
Gizlilik temelli ortak süzgeçleme yöntemlerinin başarımının iyileştirilmesi
ALPER BİLGE
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. HÜSEYİN POLAT
- Privacy preserving data collection framework for user centric network applications
Günümüz kullanıcı eksenli ağ uygulamaları için kişisel gizliliği sağlayan bilgi toplama anaçatısı
HAYRETDİN BAHŞİ
Doktora
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALBERT LEVİ
- A toolbox for privacy preserving distributed data mining
Mahremiyet koruyucu veri madenciliği için bir kütüphane gerçeklemesi
SELİM VOLKAN KAYA
Yüksek Lisans
İngilizce
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiElektronik Mühendisliği ve Bilgisayar Bilimi Ana Bilim Dalı
DOÇ. DR. ERKAY SAVAŞ
YRD. DOÇ. DR. YÜCEL SAYGIN
- Proxy-secure computation model: Application to k-means clustering implementation, analysis and improvements
Vekil güvenlikli hesaplama modeli: K-means gruplama uygulaması uygulama, analiz ve geliştirmeleri
ERMAN PATTUK
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERKAY SAVAŞ