The information theoretical privacy and the impact of communication channel on information theoretic privacy
Bilgi kuramsal mahremiyet ve haberleşme kanalının bilgi kuramsal mahremiyete etkisi
- Tez No: 455369
- Danışmanlar: DOÇ. DR. GÜNEŞ ZEYNEP KARABULUT KURT
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Telekomünikasyon Mühendisliği Bilim Dalı
- Sayfa Sayısı: 131
Özet
Bilgi teknolojilerinin günden güne hızlı gelişimi düşünüldüğünde, bireylere ait bilginin toplanması ve iletimi de şeylerin interneti (IoT) tanımına uygun olacak şekilde aynı hızla artmaktadır. Bu tanım altında yer alan makineden makineye (M2M) haberleşme sistemleri de bireyler hakkında toplanan bilgilerin çoğunun kaynağıdır. Bu bilgilerin toplanmasındaki temel amaç, cihazların çalışma verimliliğini artırarak bireylere daha yüksek konfor sağlamaktır. Toplanan bilgi iteratif yöntemler kullanılarak makine öğrenme algoritmaları tarafından işlenir ve algoritma çıkışları güncel tutularak kararlar iyileştirir. Bireyler hakkındaki bilgilerin toplanması ve işlenmesi aşamalarında ise önemli bir konu henüz telsiz haberleşme sistemleri için yeteri kadar incelenmemiştir. Tüm bu bilgi miktarı düşünüldüğünde, aynı zamanda mahrem bilgiler de ayırt edilmeden toplanmakta ve sistemler içerisinde işlenmektedir, ve bu tüm bireyler için kabul edilemez bir durumdur. Bu tez kapsamında telsiz haberleşme sistemlerindeki mahremiyet konusu ele alınmış ve özellikle telsiz haberleşme kanallarının bozucu etkilerinin mahremiyete olan etkisi incelenmiştir. Mahremiyet kelimesinin tanımı öncelikle sosyal bilimler alanında tartışılmış, ve mahremiyet tanımı olarak farklı öneriler getirilmiştir. Günümüzde de buna ek olarak bilgi teknojilerinin gelişimiyle beraber, mahremiyet tanımı bu alan için de bir araştırma konusu olmuştur. Sosyal bilimciler tarafından yayımlanan çalışmalarda yer alan mahremiyet tanımları geniş kapsamlı, birbirinden oldukça farklı ve çoğu zaman bilgi teknolojilerine aktarılması oldukça zordur. Bu sebeple mahremiyetin bilgi teknolojileri çerçevesinde ayrıca tanımları yapılmıştır. Bu tanımlardan biri olan $k$-anonimlik bu tez kapsamında detaylıca incelenmiş olup, tez içerisinde düşünülen 3 uygulama senaryosundan biri baz alınarak değendirilmiştir. Ancak $k$-anonimliğin de dahil olduğu bu tanımlar da oldukça farklı olup, çoğunun kullanım alanı belli uygulamalarla sınırlıdır. Ayrıca çoğu çalışma sadece mahremiyeti sağlamakla ilgilenmiş ve mahremiyeti sağlarken verinin içerisindeki faydayı büyük ölçüde göz ardı etmiştir. Burada fayda ve mahremiyet kavramlarının arasındaki ilişki incelenmiş ve aralarında bir ödünleşim ortaya çıkarılmıştır. Bu ödünleşim de farklı kaynak tipleri için modellenmiş ve tez kapsamındaki diğer 2 senaryo da fayda mahremiyet ödünleşimi temelinde incelenmiştir. $k$-anonimlik tanımına göre, yarı tanımlıyıcı olarak adlandırılan nitelik grubunun anonim veride en az $k$ defa bulunması gerekmetedir. Yarı tanımlayıcı niteliklerin özellikleri, mahremiyet saldırganlarının farklı bilgi kaynaklarından bu tip nitekleri karşılaştırarak, bireyleri tanımlayabilmesi imkanı vermesidir. Örnekle açıklamak gerekirse, açık kaynaklarda bulunan bir özgeçmişdeki yaş ve adres bilgileri, anonim bir şekilde yayınlanmış tıp verisindeki aynı bilgilerle karşılaştırılırsa, özgeçmişin sahibi bireyin hassas tıp bilgilerine ulaşılabilir. Bu durumda adres ve yaş tipi bilgiler yarı tanımlayıcı olarak sınıflandırılabilir. $k$-anonimlik tanımının çalışıldığı uygulama senaryosundan da bahsetmek gerekir. Bu senaryo temelde bir akıllı şehir senaryosuna göre uyarlanmıştır. Bu tip bir akıllı şehirde, trafik ışıkları veya tabelalarında yer alan Bluetooth alıcılar ile trafik ihlallerini saptamak, trafik yoğunluğunun gerçek zamanlı olarak kullanıcılara iletilmesi ve trafik ışıklarının bu yoğunluğa göre zamanlanması gibi kullanım alanları belirlenmiştir. Bu tez içerisindeki senaryoda Bluetooth tabanlı bu sistemin çalışması için araçlar içerisinde de Bluetooth etiketler bulunmalıdır. Saldırgan bir Bluetooth alıcı ile bu araçlardaki Bluetooth etiketleri anlık olarak takip edebilir. Düşünülen saldırılara göre evden işe gitmekte olan bireylerin araçlarında Bluetooth etiketler yol boyunca izlenmiştir. Bu saldırı sonucunda, isim bilgisi olmadan şirket çalışanlarının ev adresi ve ev-iş arası yol güzergahı öğrenilmiştir. Sonraki saldırı da, saldırgan açık kaynaklar yardımıyla şirket çalışanlarının isimlerini öğrenebilmektedir. Bu açık kaynaklara örnek olarak büyük bir enstitütünün internet sitesi gösterilebilir. En son saldırı da ise, öğrenilen bu isimlerin adresleri ve telefon numaraları telefon rehberi gibi açık kaynaklar yardımıyla öğrenilebilir. Tüm bu ataklar sonucunda kişilerin, adresleri, işyeri adresleri ve yol güzergahı gibi bilgilerin tamamı öğrenilir. Bu ataklara karşı olarak $k$-anonimlik hem Bluetooth numaraları hem de posta kodları kapsamında ayrı ayrı kullanılmış ve mahremiyeti korumada başarılı olduğu gözlenmiştir. Ancak doğal olarak sebep olduğu faydalı bilginin kaybına dikkat edilmelidir. Bu sebeple tezin ileri kısımlarında fayda mahremiyet ödünleşim tanımı haberleşme sistemleri için incelenmiştir. Fayda mahremiyet ödünleşimin detaylarını açıklamadan önce bilgi kaynağı modelini belirtmekte yarar var. Bu modele göre, bireylerle ilgili bilgiler toplandıktan sonra temelde ikiye ayrılabilirler; biri bireyler hakkındaki mahrem nitelik (isim, vergi numarası, konum) diğeri de bireyler hakkındaki aleni nitelik (servis sağlayacı için gerekli fatura bilgileri, araç hızı). Bu sınıflandırmaya göre, mahrem niteliğin olabilidiğince gizli kalması istenirken, aleni niteliğin de fayda fonksiyonu için en iyi şekilde iletilmesi ve işlenmesi beklenir. Buradaki aleni nitelikler, sistemin tasarımına ve çalışma şekline göre kullanıcı ya da sistem sağlayıcı tarafından önem arz eder. Yine bilgi kaynağı modeline göre bu iki tip nitelik birbiriyle bağlantılı olabilir. Örneğin, konum ile hız ya da evdeki cihazların çalışma durumu ile evde birinin olup olmaması gibi. Bu niteliklerin birbiriyle bağlantılı olma durumu da bir mahremiyet riskini ortaya çıkarır, çünkü aleni niteliği bilen bir kişi ya da sistem aynı zamanda belli bir ilişkilendirme modeline göre bireyin mahrem niteliği hakkında da büyük oranda fikir sahibi olur. Açıklanan kaynak modeline göre, fayda mahremiyet tanımı daha rahat yapılabilir. Temelde fayda ölçütü aleni niteliği temel alarak ölçerken, mahremiyet ölçütü de mahrem niteliğin miktarını baz alır. Bu iki ölçüt ise var olan ilişki fonsiyonundan dolayı birbirine zıt biçimde gözlenir. Faydanın en yüksek olduğu durum aleni bilginin tam anlamıyla açığa vurulması sonucunda ortaya çıkarken bu durumda mahremiyet minimumdadır. Tam tersi durumda ise aleni bilgi meydana çıkarılmaz ve mahrem bilgiye erişim olanağı kalmaz, bu sayede de mahremiyet en üst, fayda ise en alt düzeydedir. Haberleşme sistemleri özelinde bu iki mahrem ve aleni niteliğin iletimi ve sistem içerisinde bozulma miktarları, fayda mahremiyet ödünleşimi ile açıklanabilir. Tez kapsamında düşünülen telsiz haberleşme sisteminde, mahrem nitelik kaynak tarafından dışa çıkarılmaz ve sistem üzerinde iletilmez. Aleni nitelik ise önce kodlanır, ardından oluşan kod sözcükleri telsiz haberleşme kanalını kullanarak alıcıya ulaşır. Alıcıda kod çözme işlemi yapıldıktan sonra aleni niteliğin özellikleri incelenebilir. Tez kapsamında incelenen mahremiyet ölçütü, sistem çıkışındaki aleni niteliğe bakılarak mahrem nitelik hakkında ne kadar bilgi edinildiği fikrine göre tanımlanmıştır. Fayda ölçütü ise sistem çıkışındaki aleni niteliğin, kaynak tarafından sistemin girişine yollanan aleni niteliğe ne kadar yakın olmasıyla belirlenir. Fayda mahremiyet ödünleşimi hakkında haberleşme sistemlerinde yapılan çalışmalar incelendiğinde, var olan çalışmaların farklı kaynak biçimleri için bu ödünleşimi analiz ettikleri görülmüştür. Bu yayınlarda, fayda ve mahremiyet bilgi kuramı temelli araçlarla ölçülürken, var olan ödünleşim de bilgi kuramını temel alan hız bozunum teorisi ile açıklanmıştır. Ele alınan kaynak biçimleri arasında ikili değer alabilen kaynaklar ve normal dağılıma sahip kaynaklar başlıca incelenmiştir. Ancak bu çalışmaların içerisinde ödünleşim üzerindeki telsiz haberleşme kanalının bozucu etkileri incelenmemiştir. Bu tez kapsamında, fayda mahremiyet ödünleşimi ikili değerler alabilen ve normal dağılıma sahip kaynaklar kullanılarak telsiz kanalların bozucu etkileri göz önüne alınarak incelenmiştir. Başlıca katkılar açıklanacak olursa, en temelde fayda ve mahremiyet ödünleşim fonksiyonlarının kaynak dağılımı ve kodlama kaynaklı bozunumlara ek olarak telsiz haberleşme kanalının bozucu etkilerine de bağlı bir fonksiyon olduğu önerilmiştir. Bu önerim sonrasında, güncellenen fonksiyon tanımı ikili değer alabilen ve normal dağılımlı nitelikler için matematiksel olarak ayrı ayrı türetilmiştir. Elde edilen fonskiyon ifadelerin doğruluğu sonrasında da simulasyonlar ile onaylanmıştır. Öncelikle ikili değerler alabilen kaynaklar, uygulama senaryolarının ikincisi altında değerlendirilmiştir. Bu senaryoya göre akıllı ev veya ofisler içerisindeki cihazlar, mevcut çalışma durumlarını M2M sistemler çerçevesinde kullanıcılara ya da servis sağlayıcılara iletirler. Çalışma durumları olarak ikili durumlar (açık/kapalı gibi) seçilmiş o sebeple ikili değer alabilien sistemler için uygun bir senaryo olduğu düşünülmüştür. Bu senaryo kapsamında, cihazın çalışma durumu kullanıcı veya servis sağlayıcı için faydayı belirtir. Cihazın çalışma durumuyla ilişkili o ortamda birinin olup olmaması ise mahremiyet kapsamında değerlendirilir. Öngörülebileceği gibi cihazın (havalandırma sistemi, güvenlik sistemi) çalışma durumu ile ortamda birinin olup olmaması biribiriyle açıkça ilişkilidir. İkili değerler alabilen nitelikler kapsamında, fayda mahremiyet ödünleşim tanımı matematiksel olarak güncellenmiştir ve simulasyonlarla güncel fonksiyon ifadesinin doğruluğu onaylanmıştır. Bu fayda mahremiyet ödünleşim fonksiyonlarına göre, telsiz haberleşme kanalının bozucu etkileri kodlama bozunumuna ek olarak ayrı bir bozunum yapar. Dolayısıyla bu bozunum aleni nitelik için faydayı düşürürken, mahrem nitelik için mahremiyeti arttırır. Normal dağılımlı nitelikler de fayda mahremiyet ödünleşimi başlığı altında incelenmiştir. Bu esnada ikili değerler alabilen niteliklerde olduğu gibi bir uygulama senaryosu düşünülmüştür. İncelenen bu üçüncü ve son senaryoda, akıllı tıbbi sistemler senaryo başlığı olarak belirlenmiştir. Bu tip sistemlerde hastaların anlık sağlık durumları telsiz haberleşme sistemleri ve sensör ağları kullanılarak hastanın doktoruna iletilmektedir ve ciddi bir mahremiyet koruması içermelidir. Tez içerisindeki senaryoya göre, hastaların anlık tıbbi durumu (kan basıncı, kalp ritmi gibi) doktorlara iletilmelidir ve bu fayda ölçütünün kriteridir. Ancak bu tıbbi bilgiler, hastanın yaşıyla, cinsiyetiyle, boyu ve kilosuyla da aynı zamanda ilişkilidir. Dolayısıyla saldırgan, elde ettiği bu tıbbi bilgileri ve bu bilgilerin hasta özellikleriyle alakalı ilişki modeli kullanarak, kurumlar tarafından anonim hasta adıyla yayınlanan sağlık verilerine ulaşabilir. Bu verilerden hastaya ait daha detaylı bilgilere ulaşarak hasta mahremiyetini ihlal edebilir. Bu senaryo kapsamında, kan basıncı ve yaş gibi değerlerin normal dağılımı ile modellenebileceği öngörülmüştür. Bu şekilde yapılan ödünleşim çalışmalarında, normal dağılıma uygun biçimde fayda mahremiyet ödünleşim fonksiyonları telsiz haberleşme kanalının bozucu etkilerini de kapsayacak şekilde güncellenmiştir. Ardından bu güncel fonksiyonlar, simulasyonlar ile test edilmiş ve doğruluğu belirlenmiştir. Çıkan sonuçlara göre kanal gürültüsünün gücü arttıkça sistemdeki bozunum artıyor, ve akabinde mahremiyet artarken fayda düşünüyor. Telsiz haberleşme sistemleri için mahremiyet konusunun işlendiği bu tez kapsamında, öncelikle çeşitli mahremiyet tanımları incelenmiş ve ilk olarak sisteme aktarılması uygun olan $k$-anonimlik tanımı gerçeklenmiştir. Yapılan gerçekleme sonucunda, $k$-anonimliğin mahremiyeti sağlamak için uygun olduğu ancak bir diğer önemli ifade olan faydayı da önemli biçimde düşürdüğü ortaya çıkmıştır. Dolayısıyla fayda mahremiyet ödünleşimi de önem kazanmış ve tez kapsamında farklı tipte nitelikler için araştırılmıştır. Bu esnada telsiz haberleşme kanalının bozucu etkileri de var olan ödünleşim fonksiyonlarına eklenmiştir. Ortaya çıkan fonksiyonların doğruluğu simulasyonlar ile onaylanmıştır. Sonuçlara göre telsiz haberleşme kanalının bozucu etkileri sistemdeki bozunumu artırarak mahremiyeti arttırıcı ve faydayı azaltırıcı bir etken olarak gözlenmiştir. Bu konu hakkında yapılabilecek ileriki çalışmalarda fayda mahremiyet ödünleşimi telsiz haberleşme konuları kapsamında daha geniş bir biçimde incelenebilir. Olası çalışma alanlarından biri, kanalın sönümleme etkisinin bu ödünleşime olan etkisini incelemektir. Muhtemel sonuçlar düşünüldüğünde, artan bir sönümlemenin mahremiyeti arttıracağı ve faydayı düşüreceği tahmin edilebilir. Yine de bu kapsamda bir çalışma yapılması durumunda, sönümlemenin teorik etkilerinin literatüre kazandırılması büyük önem taşır. Fayda mahremiyet ödünleşimi hakkında bir diğer olası çalışma konusu da yan bilginin telsiz haberleşme sistem parametreleri düşünülerek, fayda mahremiyet ödünleşimine etkisinin incelenmesidir. Yan bilginin telsiz haberleşme sistemleri kapsamındaki olası etkisi de mahremiyeti düşürmek ve faydayı arttırmak olabilir. Düşünülebilecek bir diğer ihtimal ise, fayda mahremiyet ödünleşim incelemesinin anonimite ile beraber göz önüne alınmasıdır. Var olabilecek tüm senaryolar ayrıca mevcut ve geliştirilecek sistemler için gerçeklenmelidir ve bu da geniş bir inceleme alanıdır.
Özet (Çeviri)
With the deployment of the machine to machine (M2M) systems based on Internet of things (IoT) concept, the amount of the information and its transmission will be increased dramatically since the new concepts such as smart houses, hospitals or transportation are integrating to the daily life day by day. In addition to the information collection and transmission, complex machine learning algorithms, which are fed with this collected information, will run to guarantee a robust system performance. These algorithms will run each piece of the information and serve to the end user of the communication system. But they do not have sufficient information about an important constraint, which is private information and privacy of individuals. The collected data also includes private information and it should be not processed using machine learning algorithms directly. However, this task is not easy to address because of various definitions of privacy. As a social term, description of privacy is diverse and can be changed with different perspectives. When information technologies are considered, different definitions of privacy are already introduced. In this thesis, privacy is investigated using information theoretic tools because it is well defined to measure information quantity. As a first step, $k$-anonymity, which is one of the first privacy definitions in information technologies, is chosen as a countermeasure to preserve privacy in one specific smart city application. This applications is based on localization privacy in smart cities. The attacks are introduced to violate privacy and $k$-anonymity is measured. The results show that $k$-anonymity satisfies privacy, but it leads decreased data utility during anonymization. An important issue, which is called the utility privacy trade-off, should be investigated in wireless communication systems. This trade-off is based on preserving private attributes about individuals secretly, while utility about the public attributes, which should be revealed as much as possible, should be satisfied. It should be noted that both type of these attributes are correlated, as a result privacy leakages of hidden attributes are possible if public attribute is known. In order to measure utility and privacy, information theoretic tools are used, while the utility privacy trade-off is already modeled based on rate distortion theory. The utility privacy trade-off is already introduced in communication systems and studied for binary and Gaussian distributed sources. With respect to previous studies, both utility and privacy are measured based on the distortion level, which results from coding. However, the impacts of the wireless communication channel are not studied yet. In this thesis, the utility privacy trade-off functions are investigated based on the effects of wireless channel in two different application scenarios; smart home and smart medical scenarios. The first contribution of thesis, the utility privacy trade-off functions are updated with respect to wireless channel errors in addition to coding distortion with the help of rate distortion theory and information theory in general. Then, the exact updated trade-off functions are derived for the binary valued based on smart home scenario under the effects of binary symmetric channel and the normally distributed attributes based on smart medical applications with additional Gaussian noise respectively. Finally, the derived trade-off functions are justified with numerical simulations. This thesis firstly indicates how the anonymization measure can be used in the communication systems to satisfy privacy for individuals by considering $k$-anonymity definition. Due to decreased data utility during anonymization, the utility privacy trade-off is studied in wireless communication systems. This trade-off is already studied in communication systems, but the effects of the wireless communication channel is not deeply investigated yet. For that reason, the impacts of the imperfect wireless channels are studied and the existing utility privacy trade-off functions are updated. Then the simulations with respect to updated functions are completed to justify these functions. Both theoretical analysis and results of simulations show that distorting effects of wireless channel cause more privacy and less utility. Since the wireless channel effects are inherently part of a communication systems as well as coding, the results of these distorting effect on privacy should be carefully inspected. As future works, further analysis can be done with respect to the utility privacy trade-off in wireless communications channel. One of the possible research topic is quantifying the impact of the wireless channel fading on utility privacy trade-off. It should be expected that the increased fading distortion will lead to more privacy and less utility, but the theoretical framework and bounds of this future study is quite promising. Other possible study topic is the effects of the side information on utility privacy trade-off in case of transmission over erroneous wireless channel. The side information will possibly cause less privacy for private data and more utility for the end user. The combination of the anonymization and utility privacy trade-off investigation can also be considered interesting research subject. The number of corresponding possible future studies can be increased and also the real life application scenarios and implementations can be investigated.
Benzer Tezler
- Dijitalleşme bağlamında yeni medya ve seçmen davranışı ilişkisi: 23 Haziran 2019 yerel seçimleri Küçükçekmece ve Bağcılar örnekleri
New media and voter behavior relationship in the context of digitalization: 23 June 2019 local elections examples of Küçükçekmece and Bağcılar districts
NECMETTİN MUTLU
Doktora
Türkçe
2020
Siyasal Bilimlerİstanbul Gelişim ÜniversitesiSiyaset Bilimi ve Uluslararası İlişkiler Ana Bilim Dalı
PROF. DR. NAİL ÖZTAŞ
- A new approach to corporate social responsibility: Corporate digital responsibility, analysis of Turkish banking and e-commerce sectors
Kurumsal sosyal sorumluluğa yeni bir yaklaşım: Kurumsal dijital sorumluluk, Türk bankacılık ve e-ticaret sektörlerinin analizi
CEYDA CİHAN AYDOĞDU
Doktora
İngilizce
2024
BankacılıkGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
PROF. DR. BANU MÜJDE BASKAN KARSAK
- The impact of mobile marketing on young consumer attitudes and permission marketing effect
Mobil pazarlamanın tüketici tutumu ve satınalma niyeti üzerindeki etkisi ve izinli pazarlama
DİREN TOPTAŞ
Yüksek Lisans
İngilizce
2016
İşletmeMarmara Üniversitesiİşletme (İngilizce) Ana Bilim Dalı
DOÇ. DR. AZİZE MÜGE YALÇIN
- The brand reputation of facebook: A case study of Cambridge Analytica crisis on facebook
Facebook'un marka itibarı: Facebook'taki Cambridge Analytica krizine ilişkin örnek olay incelemesi
SARA ZIAD TARIQ TARIQ
Yüksek Lisans
İngilizce
2019
İletişim Bilimleriİstanbul Aydın Üniversitesiİşletme Yönetimi Ana Bilim Dalı
Prof. Dr. AKIN MARŞAP
- Siyasal bir denetim aracı olarak panoptikon
Panopticon as a political control tool
ÖYKÜ ULUSOY
Yüksek Lisans
Türkçe
2024
SosyolojiSivas Cumhuriyet ÜniversitesiSosyoloji Ana Bilim Dalı
DOÇ. DR. AHMET MAZLUM