Geri Dön

On federated learning over wireless channels with over-the-air aggregation

Kablosuz kanallar üzerinden havada birleştirme ile federe öğrenme

  1. Tez No: 748203
  2. Yazar: OZAN AYGÜN
  3. Danışmanlar: PROF. TOLGA METE DUMAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Haberleşme Bilim Dalı
  13. Sayfa Sayısı: 115

Özet

Federe öğrenme (FL) adı verilen merkezi olmayan makine öğrenimi (ML) yaklaşımı, kullanıcıların verilerini güvence altına aldığı ve iletişim maliyetlerini azalttığı için son zamanlarda ilgi odağı olmuştur. FL'de, global modelin kaydını tutan bir parametre sunucusu (PS), bir dizi mobil kullanıcı (MU) arasında yerel eğitimi ve global model toplamasını düzenler. Kablosuz kanallar üzerinden FL ile ilgili çalışmalar mevcut olmakla birlikte, pratik kablosuz iletişim senaryolarındaki performansı çok iyi araştırılmamıştır. Bu motivasyonla, bu tez, gerçekçi kanal modelleri kullanan ve farklı kablosuz kanal etkilerinin etkisini analiz eden kablosuz FL şemalarını ele almaktadır. Tezin ilk bölümünde, sunucu tarafını MU'lara daha yakın hale getirmek için ara sunucuların (IS'ler) kullanıldığı hiyerarşik federe öğrenmeyi (HFL) inceliyoruz. Kümeleme yaklaşımı, küresel toplamadan önce çoklu küme toplamaları gerçekleştirmek için MU'ların IS'lere atandığı durumlarda kullanılır. İlk olarak, MU'ların gradyanlarını havadan (OTA) toplama kullanarak yol kaybı ve sönümlemeli bir kanal üzerinden gönderdiği kısmen kablosuz bir yaklaşımın performansını analiz ediyoruz. Kümeler arası girişim olmadığını ve IS'lerden PS'ye olan gradyanların hatasız gönderildiğini varsayıyoruz. Önerilen algoritmamızın OTA toplamalı standart FL'ye kıyasla daha hızlı yakınsama ve daha düşük güç tüketimi sunduğunu sayısal ve deneysel analizlerle gösteriyoruz. Bir uzantı olarak, hem MU'ların hem de IS'lerin gradyanlarını kümeler arası girişimin etkisini dikkate alarak OTA toplama yoluyla gönderdiği tamamen kablosuz bir HFL kurulumunu da inceliyoruz. Sayısal ve deneysel sonuçlarımız, IS'lerin kullanılmasının, daha az iletim gücü kullanırken herhangi bir IS'siz OTA FL'den daha hızlı bir yakınsama ve daha iyi bir performans ile sonuçlandığını ortaya koymaktadır. Ayrıca, küme kümelemelerinin en iyi seçiminin, MU'lar ve kümeler arasındaki veri dağılımına bağlı olduğu da gösterilmiştir. Tezin ikinci bölümünde, stokastik enerji gelişleri ile enerji hasadı MU'ları ile FL'yi inceliyoruz. Her global yinelemede, pillerinde yeterli enerjiye sahip MU'lar yerel SGD yinelemelerini gerçekleştirir ve gradyanlarını OTA toplamasını kullanarak iletir. Gradyanları PS'ye göndermeden önce, daha az sıklıkta yerel güncellemeler gönderen MU'ların önemini artırmak için gradyanlar, bir bekleme süresi çarpanı aracılığıyla her bir MU'nun boşta kalma süresi ve veri kardinalitesine göre ölçeklendirilir. Önerilen kurulumun yakınsama analizini sağlarız ve sonuçlarımızı farklı enerji varış profilleri altında sayısal ve sinir ağı simülasyonları ile doğrularız. Sonuçlar, enerji toplama cihazlarına sahip OTA FL'nin herhangi bir enerji kısıtlaması olmaksızın OTA FL'den biraz daha kötü performans gösterdiğini ve fazla enerjiyi daha fazla yerel SGD yinelemeleri için kullanmanın, yalnızca iletim gücünü artırmaktan daha iyi bir yakınsama oranı sağladığını göstermektedir.

Özet (Çeviri)

A decentralized machine learning (ML) approach called federated learning (FL) has recently been at the center of attention since it secures edge users' data and decreases communication costs. In FL, a parameter server (PS), which keeps track of the global model orchestrates local training and global model aggregation across a set of mobile users (MUs). While there exist studies on FL over wireless channels, its performance on practical wireless communication scenarios has not been investigated very well. With this motivation, this thesis considers wireless FL schemes that use realistic channel models, and analyze the impact of different wireless channel effects. In the first part of the thesis, we study hierarchical federated learning (HFL) where intermediate servers (ISs) are utilized to make the server-side closer to the MUs. Clustering approach is used where MUs are assigned to ISs to perform multiple cluster aggregations before the global aggregation. We first analyze the performance of a partially wireless approach where the MUs send their gradients through a channel with path-loss and fading using over-the-air (OTA) aggregation. We assume that there is no inter-cluster interference and the gradients from the ISs to the PS are sent error-free. We show through numerical and experimental analysis that our proposed algorithm offers a faster convergence and lower power consumption compared to the standard FL with OTA aggregation. As an extension, we also examine a fully-wireless HFL setup where both the MUs and ISs send their gradients through OTA aggregation, taking into account the effect of inter-cluster interference. Our numerical and experimental results reveal that utilizing ISs results in a faster convergence and a better performance than the OTA FL without any IS while using less transmit power. It is also shown that the best choice of cluster aggregations depends on the data distribution among the MUs and the clusters. In the second part of the thesis, we study FL with energy harvesting MUs with stochastic energy arrivals. In every global iteration, the MUs with enough energy in their batteries perform local SGD iterations, and transmit their gradients using OTA aggregation. Before sending the gradients to the PS, the gradients are scaled with respect to the idle time and data cardinality of each MU, through a cooldown multiplier, to amplify the importance of the MUs that send less frequent local updates. We provide a convergence analysis of the proposed setup, and validate our results with numerical and neural network simulations under different energy arrival profiles. The results show that the OTA FL with energy harvesting devices performs slightly worse than the OTA FL without any energy restrictions, and that utilizing the excess energy for more local SGD iterations gives a better convergence rate than simply increasing the transmit power.

Benzer Tezler

  1. Federated learning and distributed inference over wireless channels

    Kablosuz kanallar üzerinde federe öğrenme ve dağıtık çıkarım

    BÜŞRA TEGİN

    Doktora

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. TOLGA METE DUMAN

  2. Simultaneous transmission based communication techniques

    Eş zamanlı ̇iletime dayalı haberleşme sistemleri ̇

    UFUK ALTUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. GÜNEŞ ZEYNEP KARABULUT KURT

    DOÇ. DR. ENVER ÖZDEMİR

  3. Distributed caching and learning over wireless channels

    Kablosuz kanallar üzerinde dağıtık önbelleğe alma ve makine öğrenmesi

    BÜŞRA TEGİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. TOLGA METE DUMAN

  4. Unveiling the wireless network limitations in federated learning

    Kablosuz internet ağlarındaki kısıtların federe öğrenmeye olan etkilerinin ortaya çıkarılması

    MÜMTAZ CEM ERİŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SEMA FATMA OKTUĞ

    DOÇ. DR. BURAK KANTARCI

  5. Age of information and unbiased federated learning in energy harvesting error-prone channels

    Hataya açık kanallar üzerinde enerji hasadı ile tarafsız federe öğrenme ve bilgi yaşı

    ZEYNEP ÇAKIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF TUĞÇE CERAN ARSLAN