Davranış fonksiyonu tabanlı derin pekiştirmeli öğrenme algoritmaları eğitiminde dağıtık mimari kullanımı
Utilization of distributed architecture in training policy-based deep reinforcement learning algorithms
- Tez No: 818330
- Danışmanlar: DR. ÖĞR. ÜYESİ SEMİH YUMUŞAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: KTO Karatay Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Ana Bilim Dalı
- Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 58
Özet
Pekiştirmeli öğrenmede eğitimler genellikle zaman açısından maliyetli olup, bu durum karmaşık ortamlarda sorun teşkil edebilir. Bu nedenle dağıtık mimari kullanımı, karmaşık ortamlarda hızlı eğitim için etkili bir alternatif sunar. Veri veya model paralelleştirme yapılarak, pekiştirmeli öğrenme eğitimlerinde dağıtık mimarinin avantajlarından faydalanmak mümkündür. Bu tez çalışmasında, pekiştirmeli öğrenme (reinforcement learning) yöntemlerinde ajanların karmaşık görevlerde uzun eğitim süreleri ile karşılaşma sorunu ele alınmıştır. Önerilen yaklaşım, davranış fonksiyonu tabanlı pekiştirmeli öğrenme metotlarında ortam ile etkileşim kurularak biriktirilmesi gereken tecrübeleri, dağıtık işleme yöntemleri ile çoğaltılmış ortam kopyalarından eş zamanlı ve daha hızlı sağlamaktır. Dağıtık işleme yöntemi için python tabanlı DASK dağıtık hesaplama kütüphanesi kullanılmıştır. Geliştirilen yöntem, mevcut iki farklı yöntemle karşılaştırılmıştır. Alınan sonuçlar, önerilen yöntemin pekiştirmeli öğrenme modellerinin eğitimini hızlandırdığını göstermektedir.
Özet (Çeviri)
In reinforcement learning, trainings are often time-consuming. costly, which can be a problem in complex environments. Therefore, the use of distributed architecture offers an effective alternative for fast training in complex environments. It is possible to benefit from the advantages of distributed architecture in reinforcement learning training by parallelising data or models. In this thesis, the problem of agents facing long training times in complex tasks in reinforcement learning methods is addressed. The proposed approach is to provide the experiences that need to be accumulated by interacting with the environment in policy-based reinforcement learning methods, simultaneously and faster from replicated environment copies with distributed processing methods. DASK which is python-based distributed computing library is used for the distributed processing method. The proposed method is compared with two existing methods. The results show that the proposed method accelerates the training of reinforcement learning models.
Benzer Tezler
- Deep reinforcement learning for partially observable markov decision processes
Kısmi gözlemlenebilir markov karar süreçleri için derin pekiştirmeli öğrenme
MEHMET HAKLIDIR
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN TEMELTAŞ
- Equity portfolio optimization using reinforcement learning: An emerging market case
Pekiştirmeli öğrenme ile hisse senedi portföyü optimizasyonu: Gelişmekte olan piyasa örneği
MERT CANDAR
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Video analysis based fish detecton and tail beat frequency estimation in fishways
Video analizi ile balık geçitlerinde balık tanıma ve kuyruk sallama frekansı tahmini
YASİN YILDIRIM
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. BEHÇET UĞUR TÖREYİN
PROF. DR. SERHAT KÜÇÜKALİ
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Transforming feedback control systems on whiteboard into Matlab via a deep learning based intelligent system
Derin öğrenme tabanlı akıllı bir sistem ile beyaz tahtadaki geribeslemeli kontrol sistemlerinin Matlab ortamına aktarılması
DORUKHAN ERDEM
Yüksek Lisans
İngilizce
2020
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN KUMBASAR