Geri Dön

Davranış fonksiyonu tabanlı derin pekiştirmeli öğrenme algoritmaları eğitiminde dağıtık mimari kullanımı

Utilization of distributed architecture in training policy-based deep reinforcement learning algorithms

  1. Tez No: 818330
  2. Yazar: CİHAN ÇALIŞIR
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SEMİH YUMUŞAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: KTO Karatay Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Ana Bilim Dalı
  12. Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 58

Özet

Pekiştirmeli öğrenmede eğitimler genellikle zaman açısından maliyetli olup, bu durum karmaşık ortamlarda sorun teşkil edebilir. Bu nedenle dağıtık mimari kullanımı, karmaşık ortamlarda hızlı eğitim için etkili bir alternatif sunar. Veri veya model paralelleştirme yapılarak, pekiştirmeli öğrenme eğitimlerinde dağıtık mimarinin avantajlarından faydalanmak mümkündür. Bu tez çalışmasında, pekiştirmeli öğrenme (reinforcement learning) yöntemlerinde ajanların karmaşık görevlerde uzun eğitim süreleri ile karşılaşma sorunu ele alınmıştır. Önerilen yaklaşım, davranış fonksiyonu tabanlı pekiştirmeli öğrenme metotlarında ortam ile etkileşim kurularak biriktirilmesi gereken tecrübeleri, dağıtık işleme yöntemleri ile çoğaltılmış ortam kopyalarından eş zamanlı ve daha hızlı sağlamaktır. Dağıtık işleme yöntemi için python tabanlı DASK dağıtık hesaplama kütüphanesi kullanılmıştır. Geliştirilen yöntem, mevcut iki farklı yöntemle karşılaştırılmıştır. Alınan sonuçlar, önerilen yöntemin pekiştirmeli öğrenme modellerinin eğitimini hızlandırdığını göstermektedir.

Özet (Çeviri)

In reinforcement learning, trainings are often time-consuming. costly, which can be a problem in complex environments. Therefore, the use of distributed architecture offers an effective alternative for fast training in complex environments. It is possible to benefit from the advantages of distributed architecture in reinforcement learning training by parallelising data or models. In this thesis, the problem of agents facing long training times in complex tasks in reinforcement learning methods is addressed. The proposed approach is to provide the experiences that need to be accumulated by interacting with the environment in policy-based reinforcement learning methods, simultaneously and faster from replicated environment copies with distributed processing methods. DASK which is python-based distributed computing library is used for the distributed processing method. The proposed method is compared with two existing methods. The results show that the proposed method accelerates the training of reinforcement learning models.

Benzer Tezler

  1. Deep reinforcement learning for partially observable markov decision processes

    Kısmi gözlemlenebilir markov karar süreçleri için derin pekiştirmeli öğrenme

    MEHMET HAKLIDIR

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN TEMELTAŞ

  2. Equity portfolio optimization using reinforcement learning: An emerging market case

    Pekiştirmeli öğrenme ile hisse senedi portföyü optimizasyonu: Gelişmekte olan piyasa örneği

    MERT CANDAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALP ÜSTÜNDAĞ

  3. Video analysis based fish detecton and tail beat frequency estimation in fishways

    Video analizi ile balık geçitlerinde balık tanıma ve kuyruk sallama frekansı tahmini

    YASİN YILDIRIM

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. BEHÇET UĞUR TÖREYİN

    PROF. DR. SERHAT KÜÇÜKALİ

  4. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  5. Transforming feedback control systems on whiteboard into Matlab via a deep learning based intelligent system

    Derin öğrenme tabanlı akıllı bir sistem ile beyaz tahtadaki geribeslemeli kontrol sistemlerinin Matlab ortamına aktarılması

    DORUKHAN ERDEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN KUMBASAR