Cluster-based scoring for malicious model detection in federated learning
Federe öğrenmede zararlı modellerin tespiti için kümeleme tabanlı skorlama
- Tez No: 807217
- Danışmanlar: PROF. DR. ARDA YURDAKUL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
Federe öğrenme, küresel bir model elde etmek için her istemci modelini bir sunucuda toplayan dağıtılmış bir makine öğrenimi tekniğidir. Ancak, bazı istemciler modellerini veya verilerini zehirleyerek küresel modeli istenenden alakasız hale getirebilir ve sisteme zarar verebilir. Bu tez, sunucu için koordinat tabanlı istatistiksel karşılaştırma yoluyla zehirli modelleri tespit etmesi ve bunları birleştirme öncesinde sistemden uzaklaştırması için bir yaklaşım sunmaktadır. Koruma mekanizmasından kaçınmak için zararlı istemcilerin modelin daha az bir kısmını zehirlediği saldırı türü olan Katman Zehirlemesi de tanıtılmıştır. Farklı saldırı türlerine ve ağlara karşı koruma mekanizmasının sağlamlığını teyit etmek için uyarlanabilir eşik değeri uygulanmıştır. Önerilen yöntemin başarımını ölçmek için dağınık bir test ortamı tasarlanmıştır. Bazı istemciler, diğerlerinden daha yavaş öğrense veya enerji sınırlamaları nedeniyle nicelenmiş model parametreleri gönderse bile kötü niyetli cihazları başarılı bir şekilde belirleyebildiğini göstermek için farklı küme boyutlarına sahip, rastgele örneklenmiş bağlantılı veri kümelerini kullanan deneyler yapılmıştır. Ayrıca, koruma sisteminin detaylı analizi için farklı kötü niyetli cihaz sayıları, model türleri ve veri kümeleri ile denenmiştir. Sonuç olarak, sunulan korumanın, zararlı cihazların tüm istemcilere oranı %45'e kadar olduğunda zararlı modelleri tespit edebildiği ve sistemden uzaklaştırabilmeyi başarabildiği görülmüştür. Sunulan çözümün, literatürden alınmış diğer koruma mekanizmalarıyla kıyaslaması yapılmış; bu sistemler ile aynı veya daha fazla koruma sağladığı gözlemlenmiştir.
Özet (Çeviri)
Federated learning is a distributed machine learning technique aggregating every client model on a server to obtain a global model. However, some clients may harm the system by poisoning their model or data to make the global model irrelevant to its objective. This thesis introduces an approach for the server to detect adversarial models by coordinate-based statistical comparison and eliminate them from the system prior to aggregation. A new attack type, layer poisoning, where the malicious nodes prefer poisoning selected small size layers of the model to deceive the detection system, is also introduced. Adaptive thresholding is adopted for preserving the robustness of the detection mechanism for various network against different attack types. A simulation framework is developed to benchmark and realize tests as a distributed system. Experiments that use random sampling of independent and identically distributed (iid) datasets with different batch sizes have been carried out to show that the proposed method can identify the malicious nodes successfully even if some of the clients learn slower than others or send quantized model weights due to energy limitations. The proposed approach is extensively tested with malicious-benign client ratios, model types, and datasets to present its versatility. The results show that the proposed system successfully eliminates the malicious models when their generating clients constitute at most 45% of the network. Comparison with the approaches from the literature shows that the proposed method performs the same as or better than the state of art solutions.
Benzer Tezler
- Music retrieval systems: Robust performance under the effect of uncertainty
Başlık çevirisi yok
ERDEM ÜNAL
Doktora
İngilizce
2008
Elektrik ve Elektronik MühendisliğiUniversity of Southern CaliforniaDR. SHRIKANTH NARAYANAN
- Multiscale computational investigation of the kynurenine 3-monooxygenase catalyzed hydroxylation reaction
Kinürenin 3-monooksijenaz katalizli hidroksilasyon tepkimesinin çok boyutlu hesaplamalı kimya yöntemleriyle incelenmesi
YILMAZ ÖZKILIÇ
- Predicting novel small inhibitors of SARS-CoV-2: Targeting SARS-CoV-2 spike protein, human ACE2 protein and SARS-CoV-2 NsP16 via molecular docking
SARS-CoV-2 için yeni küçük inhibitör moleküllerin tahmini: Moleküler yanaştırma yöntemiyle SARS-CoV-2 spike proteini, insan ACE2 proteini ve SARS-CoV-2 NsP16 hedeflenmesi
ONUR ÖZER
Yüksek Lisans
İngilizce
2022
Biyolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
DOÇ. DR. MERT GÜR
DR. ÖĞR. ÜYESİ SEFER BADAY
- İlköğretim okullarındaki bitişik eğik yazı uygulamalarının değerlendirilmesi
An evalutaion of cursive italic handwriting applications in primary schools
HATİCE COŞKUN
Yüksek Lisans
Türkçe
2011
Eğitim ve ÖğretimMustafa Kemal ÜniversitesiTürkçe Eğitimi Ana Bilim Dalı
DOÇ. DR. EYYUP COŞKUN
- Dağıtık mimari tasarımı ve yönetim sistemi geliştirilmesi
Distributed architecture design and management system development
MUSTAFA HALUK AKGÜNDÜZ
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI