Modified k-nearest neighbor classifiers for dealing with secure encrypted data
Kriptolanmış veriler ile güvenli işlem için k-en yakın komşu sınıflandırıcıları değişikliği
- Tez No: 482509
- Danışmanlar: DOÇ. DR. SHADI AL-SHEHABI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Veri Madenciliği, Sınıflandırma, Kriptolama, Homomorfik, k-En Yakın Komşu (k-EYK), Data Mining, Classification, Encryption, Homomorphic, k-Nearest Neighbors
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Türk Hava Kurumu Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilişim Teknolojileri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Son zamanlarda veri depolama ve veri yönetme amaçlı olarak ortaya çıkan paylaşımlı serverların kullanımı, özellikle bu veriler kişisel ve hassas bilgiler içermekteyse, veri sahipleri için çok sayıda güvenlik açığı ortaya koymaktadır. Bu sorunların üstesinden gelmek amacıyla veriler yalnızca kripto şifresine sahip yetkili kişilerin erişimine izin vermek amacıyla kriptolanmaktadır. Veri kriptolama işlemi bu verilere geleneksel veri madenciliğinin uygulanmasını imkânsız hale getirmektedir, çünkü bu tekniklerin bu verilerdeki değerlere ve içerikteki her özelliğin veri türüne erişiminin olması gerekmektedir. Veri madenciliği her şirket için verilerinden en yüksek verimi alabilmek amacıyla çok önemlidir. En önemli veri madenciliği uygulamalarınsan biri sınıfı henüz belli olmayan bir veri grubunun (tuple) sınıfının mevcut sınıflandırılmış verilere dayanarak tahmin edilmesini mümkün kılan Veri Sınıflandırmasıdır. Bu bağlamda, kriptolama şifresini veri yönetim serverına göstermeden veya depolanmış herhangi bir veriyi bu veriyle ilgisi olmayan başka bir yetkili kullanıcının görmesine gerek kalmayacak şekilde kriptolanmış verilerin sınıflandırılması elzem hale gelmiştir. Verilerin sınıflandırılmasında yaygın olarak k-En Yakın Komşu sınıflandırma sistemi kullanılmaktadır. Verilere erişim olmaksızın bir verisetinin sınıflandırılması için homomorfik kripto sistemleri kullanarak uygulanan güvenli birçok k-EYK sınıflandırıcıları önerilmektedir. Homomorfik kripto sistemlerinde kriptolanmış veriler üzerinde uygulanan bir matematiksel işlemin kriptolanmış sonucu bu veriler deşifre edilmeksizin hesaplanabilmektedir. Mevcut güvenli k-EYK sınıflandırıcıları, verilerde depolanmış olan kriptolanmış değerlere bağlı olan veri grupları (tuples) arasındaki mesafeleri bulmak amacıyla homomorfik hesaplamalara dayanmaktadır. Bu araştırmada veri grupları arasındaki mesafelerin hesaplanması için verilerin kriptolanmış değerine ve asıl sınıflandırmadaki katkısına göre her özelliğin ağırlığına dayanan ve homomorfik metotları kullanan güvenli-modifiye k-EYK sınıflandırıcıları önerilmektedir. Bu araştırmada iki ağırlıklandırma metodu test edilmektedir; Bilgi Entropisi ve Gini Çeşitlililik Endeksi. Her metot iki değişik şekilde test edilmiştir, lokal ve global. Global ağırlıklandırma her özellik için bir ağırlık hesaplamaktadır; diğer yandan, lokal ağırlıklandırma her özellik için her sınıfın ağırlığını hesaplamaktadır. Deneysel sonuçlar sınıflandırma sonuçlarında Temel Sınıflandırma Sistemine göre önemli düzeyde gelişme göstermektedir.
Özet (Çeviri)
The recent trend of using shared servers for data storage and management poses many challenges to the data owners to protect the information being outsourced, especially if these data contain personal or sensitive information. To overcome these problems, the data are encrypted so that only authorized clients, who have the encryption key, are able to decrypt the contents of these data. Data encryption makes it impossible to apply traditional data mining techniques to these data, as these techniques must access the values stored in the data and the data type of each attribute. Data mining is very important for any corporation to make the best use of their data. One of the most important data mining tasks is the data classification, which enables predicting a class for a new unclassified tuple depending on the existing classified data. Thus, it has become mandatory to classify encrypted data without the need to reveal the encryption key to the data management server or expose any stored data to any other authorized client who is unrelated to those data. k-Nearest Neighbors classifier is widely used to classify data. Thus, many Secure k-NN classifiers are proposed to enable classifying a dataset without having access to these data using homomorphic cryptosystems, which are cryptosystems where an encrypted result of a mathematical operation on encrypted data may be calculated without decrypting these data. The existing Secure k-NN classifiers rely on homomorphic calculations to find the distances among tuples depending on the encrypted values stored in the data. In this study, modified Secure k-NN classifiers are proposed that use homomorphic calculations to compute distances among tuples depending on the encrypted values of the data and the weight of each attribute, according to its contribution to the actual classification. Two weighting methods are tested in this study, which are information entropy and Gini diversity index. Each method is tested in two different schemes that are global and local. Global weighting calculates one weight per attributes while local weighting calculates a weight per each class for each attribute. The experimental results show significant improvement in classification results, compared to the basic classifier.
Benzer Tezler
- Fall detection and classification using wearable motion sensors
Giyilebilir hareket algılayıcılarıyla düşme sezimi ve sınıflandırması
MUSTAFA ŞAHİN TURAN
Yüksek Lisans
İngilizce
2017
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. BİLLUR BARSHAN ÖZAKTAŞ
- Sentetik açıklıklı radar görüntülerinde otomatik hedef tanıma
Automatic target recognition in synthetic aperture radar images
MAHMUT ESAT DEMİRHAN
Yüksek Lisans
Türkçe
2016
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖZGÜL SALOR DURNA
- Multilabel classification with neural network
Yapay sinir ağları ile çok etiketli sınıflandırma
SEZİN EKŞİOĞLU
Yüksek Lisans
İngilizce
2022
Bilim ve TeknolojiÖzyeğin ÜniversitesiVeri Bilimi Ana Bilim Dalı
DOÇ. DR. OKAN ÖRSAN ÖZENER
- Elektrokardiyogram verilerinin iyileştirilmiş yapay arı kolonisi (MABC) algoritması ile analizi
Analysis of electrocardiogram data by using modified artificial bee colony (MABC) algorithm
SELİM DİLMAÇ
Doktora
Türkçe
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TAMER ÖLMEZ
- Audio visual attention for robots from a developmental perspective
Gelişimsel perspektiften robotlar için görsel ve işitsel diıkkat
NADA AL AZZAWI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖKHAN İNCE