Ayrıklaştırılmış durum uzayı ile öğrenme tabanlı görev atama yaklaşımı
Learning-based task allocation approach with discretized state space
- Tez No: 360832
- Danışmanlar: PROF. DR. OSMAN PARLAKTUNA
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: Türkçe
- Üniversite: Eskişehir Osmangazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Kontrol ve Kumanda Bilim Dalı
- Sayfa Sayısı: 125
Özet
Bu çalışmada, çok robotlu sistemlerde görev atama problemlerinin çözümünde sistem performansının artırılması amacıyla öğrenme tabanlı görev atama yaklaşımı önerilmiştir. Bu amaçla Q-öğrenme yöntemi kullanılmıştır. Teorik olarak tek erkinli yapılar üzerinde tanımlanmış olan Q-öğrenme yönteminin çok robotlu sistemlerde uygulanması araştırılmıştır. Çok erkinli sistemlerde Q-öğrenme yönteminin uygulanmasına dair mevcut yaklaşımlar olan dağıtık ve merkezi öğrenme yaklaşımları ele alınmıştır. Bu iki temel yaklaşımın avantajlarını birleştirmek üzere Strateji Planlamalı Dağıtık Öğrenme yaklaşımı önerilmiştir. Q-öğrenme yönteminin çok robotlu sistemlerde uygulanmasında ortaya çıkan önemli bir problem ayrık ve sonlu durum ve hareket uzayları belirlenmesidir. Uygulamada kullanılan sistemde sürekli nitelikte olan durum uzayının temsili için Sabit Aralıklı Ayrık Durum Uzayı (SAADU), Dağılım Fonksiyonlu Sürekli Durum Uzayı (DFSDU) ve Değişken Aralıklı Ayrık Durum Uzayı (DAADU) yöntemleri önerilmiştir. Ayrık durum uzayı kullanımı yaklaşımı olan SAADU yöntemi sürekli durum uzayını sabit temsil hassasiyeti kullanarak ayrıklaştırırken, DAADU yönteminde durum uzayı ayrıklaştırma işlemi ardışıl kümeleme tabanlı bir yaklaşım ile adaptif olarak gerçekleştirilmektedir. DFSDU yönteminde ise durum uzayı sürekli bir yapıda temsil edilmektedir. Önerilen yaklaşımların etkinliği gerçekleştirilen uygulamalarda gösterilmiştir.
Özet (Çeviri)
In this study, a learning-based task allocation approach is proposed in order to increase the overall system performance. For this purpose, Q-learning algorithm is preferred. Theoretically, Q-learning algorithm is defined on single-agent frame. The difficulties of scaling up the multi-agent Q-learning to multi-robot systems are investigated. Two major approaches of multi-agent Q-learning in literature, distributed learning and centralized learning, are examined. To combine the advantages of these approaches, Strategy-Planned Distributed Learning approach is proposed. An important problem that appears in the application of Q-learning algorithm in multi-robot domain is to define discrete and finite state and action spaces. To represent the continuous state space, three methods, Fixed-Interval Discrete State Space (FIDSS), Continuous State Space with Distribution Function (DFCSS) and Variable-Interval Discrete State Space (VIDSS), are proposed. The continuous state space is discretized by using a fixed resolution value in FIDSS, whereas the discretization process is realized by a sequential clustering-based approach in an adaptive manner in VIDSS. DFCSS method represents the continuous state space by distribution functions in continuous way. The effectiveness of proposed approaches on system performance are demonstrated by applications.
Benzer Tezler
- Deep learning based speed up of fluid dynamics solvers
Akışkanlar dinamiği çözücülerinin derin öğrenmeye dayalı hızlandırılması
DENİZ ALPER ACAR
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiHavacılık ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. OĞUZ UZOL
- A parallel unstructured finite volume method with an efficient edge based data structure for compressible flows
Verimli bir kenar tabanlı veri yapısı üzerine kurgulanmış yapısal olmayan sonlu hacimler yöntemiyle çalışan paralel bir sıkıştırılabilir akış çözücüsü
SEMİH AKKURT
Yüksek Lisans
İngilizce
2018
Uçak Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ŞAHİN
- Implementations of novel cellular nonlinear and cellular logic networks and their applications
Yeni hücresel doğrusal olmayan ve hücresel lojik ağların gerçeklemeleri ve uygulamaları
RAMAZAN YENİÇERİ
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MÜŞTAK ERHAN YALÇIN
- Direct and inverse electromagnetic scattering problems in spherically layered media
Küresel tabakalı cisimlere ilişkin düz ve ters saçılma problemleri
EGEMEN BİLGİN
Doktora
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ YAPAR
- An integral equation method with hermite surfaces for particle sedimentation problems
Parçacık sedimantasyon problemi için hermite yüzeyleri ile integral denklem yöntemi
REŞİT KAYHAN ATA
Yüksek Lisans
İngilizce
2014
Uçak Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ŞAHİN