Identification of anonymous users in twitter
Twitter'daki anonim hesapların ortaya çıkartılması
- Tez No: 348700
- Danışmanlar: DOÇ. DR. YÜCEL SAYGIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: İngilizce
- Üniversite: Sabancı Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
- Sayfa Sayısı: 62
Özet
Kullanıcılar internet ağı üzerinden yorum, blog ve tweet yazarken birden fazla profile sahip olabilirler. Bu kullanıcıların bir kısmı gerçek kimliklerini ortaya çıkarırken, diğer kısmı profillerini anonim olarak takma isimle oluştururlar. Bu durum özellikle eylemcilerin tweet ya da Facebook mesajlarını anonim olarak yazdığı baskıcı hükümetlerin bulunduğu ülkelerde çok gereklidir. Bu ülkelerde, eylemcilerin arasında bulunan kişilerin ciddi sorunlarla karşılaşabileceği, hapis cezasına çarptırılabilecekleri ve hatta hayatlarının riske atılmış olabileceği gerçeği hükümet yetkilileri tarafından ortaya konulmuştur. Her ne kadar takma isimli bir hesaba sahip olmak belli olaranda gizlilik sağlasa da yazarların yazım şablonu, anonim hesapları ve gerçek hesapları ilişkilendirmek için ipuçları verebilir. Daha belirgin olarak, birileri yazarı bilinen bir yazının özelliklerine bakarak bu özelliklerden bir model oluşturabilir ve bu oluşturduğu modeli verilen başka bir anonim yazının bu yazara ait olup olmadığını tahmin etmek için kullanabilir. Bu çalışmada ilk olarak, verilen bir kişinin tweet'lerine bakarak bu kişinin belirli bir grubun parçası olarak tanımlanabileceğini kanıtlayacağız. Biz bu çalışma için çok popüler bir platform olan Twitter'ı kullanmış olsak da bu problemin sadece Twitter ile kısıtlı olmadığını belirtmek isteriz. Gösterdiğimiz diğer bir nokta, bir aleyhtar gerçek isimli kullanıcıların tweet'lerini kullanarak, bu gerçek hesapları anonim hesaplarla eşleştirebilmek için bir sınıflandırıcı yaratabilir. Biz bu çalışmada dökümanları temsil eden kelimelerin tf-idf ağırlıklarından oluşan bir vektor uzayı, Naive-Bayes sınıflandırıcı ve cosinüs benzerliği ölçüsü kullanmaktayız. Ayrıca problemimizi tanımlayan bir formalizm oluşturarak, tweet yazarken anonim kalmaya davam etmek isteyen bireyler için oluşturduğumuz formalizm üzerinden gizliliği korumaya yönelik bazı çözümler de ortaya koymaktayız.
Özet (Çeviri)
Users may have multiple profiles when writing comments, blogs, and tweets on the web. While some of these profiles reveal true identity, the others are created under pseudonyms. This is essential especially in the countries with oppressive governments where activists are writing pseudonymous tweets or Facebook messages. In these countries, government officials discovering the fact that a person is among the activists may have serious consequences, the activist being imprisoned, or even his or her life being jeopardized. Pseudonyms may provide a sense of anonymity, however the writing patterns of an author can provide clues that can be used to link the pseudonymous account to the public account. More specifically, one can look at some features within the text whose author is known, and build a model by using these features to predict whether a given (supposedly) anonymous text belongs to that author or not. In this work, we first demonstrate that a person can be identified as being part of a group by using his/her tweets. We used twitter since it is a popular platform, but the problem is not specific to twitter. We show that through tweets, an adversary can build a classifier from public tweets of known users to match them with pseudonymous twitter accounts. We use a simple vector-space model with tf-idf weights to represent documents and a Naive-Bayes classifer with cosine similarity measure. We show that the problem of matching public and pseudonymous accounts exists in twitter through experiments with real data. We also provide a formalism to describe the problem and based on the formalism we provide a solution to protect the privacy of individuals who would like to stay anonymous when writing tweets.
Benzer Tezler
- Biometric cryptosystems: authentication, encryption and signaturefor biometric identities
Biyometrik şifreleme sistemleri: Biyometrik kimlik denetimi, şifrelemesi ve imzası
NEYYİRE DENİZ SARIER
Doktora
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolRheinische Friedrich-Wilhelms-Universität BonnBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. JOACHIM VON ZUR GATHEN
PROF. DR. PREDA MIHAILESCU
- Enerji performans sözleşmelerindeki risk kriterlerinin best-worst yöntemi ile değerlendirilmesi
Evaluation of risk criteria in energy performance contracts by best-worst method
ECEM ÖNCÜ
Yüksek Lisans
Türkçe
2023
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
PROF. DR. SERMİN ONAYGİL
- Security, privacy and trust in wireless mesh networks
Çokgen bağlantılı kablosuz ağlarda güvenlik, mahremiyet, ve güven
AHMET ONUR DURAHİM
Doktora
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERKAY SAVAŞ
- Idemix based anonymization for home automation systems
Ev otomasyon sistemleri için idemix tabanlı anonimleştirme
SİMGE DEMİR
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. ALBERT LEVİ
- Hadoop ile büyük veride kimliksizleştirme
Anonymization model with hadoop
İREM CİVELEK
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUHAMMED ALİ AYDIN