Geri Dön

Ayrıklaştırılmış durum uzayı ile öğrenme tabanlı görev atama yaklaşımı

Learning-based task allocation approach with discretized state space

  1. Tez No: 360832
  2. Yazar: HATİCE HİLAL EZERCAN KAYIR
  3. Danışmanlar: PROF. DR. OSMAN PARLAKTUNA
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Osmangazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Kontrol ve Kumanda Bilim Dalı
  13. Sayfa Sayısı: 125

Özet

Bu çalışmada, çok robotlu sistemlerde görev atama problemlerinin çözümünde sistem performansının artırılması amacıyla öğrenme tabanlı görev atama yaklaşımı önerilmiştir. Bu amaçla Q-öğrenme yöntemi kullanılmıştır. Teorik olarak tek erkinli yapılar üzerinde tanımlanmış olan Q-öğrenme yönteminin çok robotlu sistemlerde uygulanması araştırılmıştır. Çok erkinli sistemlerde Q-öğrenme yönteminin uygulanmasına dair mevcut yaklaşımlar olan dağıtık ve merkezi öğrenme yaklaşımları ele alınmıştır. Bu iki temel yaklaşımın avantajlarını birleştirmek üzere Strateji Planlamalı Dağıtık Öğrenme yaklaşımı önerilmiştir. Q-öğrenme yönteminin çok robotlu sistemlerde uygulanmasında ortaya çıkan önemli bir problem ayrık ve sonlu durum ve hareket uzayları belirlenmesidir. Uygulamada kullanılan sistemde sürekli nitelikte olan durum uzayının temsili için Sabit Aralıklı Ayrık Durum Uzayı (SAADU), Dağılım Fonksiyonlu Sürekli Durum Uzayı (DFSDU) ve Değişken Aralıklı Ayrık Durum Uzayı (DAADU) yöntemleri önerilmiştir. Ayrık durum uzayı kullanımı yaklaşımı olan SAADU yöntemi sürekli durum uzayını sabit temsil hassasiyeti kullanarak ayrıklaştırırken, DAADU yönteminde durum uzayı ayrıklaştırma işlemi ardışıl kümeleme tabanlı bir yaklaşım ile adaptif olarak gerçekleştirilmektedir. DFSDU yönteminde ise durum uzayı sürekli bir yapıda temsil edilmektedir. Önerilen yaklaşımların etkinliği gerçekleştirilen uygulamalarda gösterilmiştir.

Özet (Çeviri)

In this study, a learning-based task allocation approach is proposed in order to increase the overall system performance. For this purpose, Q-learning algorithm is preferred. Theoretically, Q-learning algorithm is defined on single-agent frame. The difficulties of scaling up the multi-agent Q-learning to multi-robot systems are investigated. Two major approaches of multi-agent Q-learning in literature, distributed learning and centralized learning, are examined. To combine the advantages of these approaches, Strategy-Planned Distributed Learning approach is proposed. An important problem that appears in the application of Q-learning algorithm in multi-robot domain is to define discrete and finite state and action spaces. To represent the continuous state space, three methods, Fixed-Interval Discrete State Space (FIDSS), Continuous State Space with Distribution Function (DFCSS) and Variable-Interval Discrete State Space (VIDSS), are proposed. The continuous state space is discretized by using a fixed resolution value in FIDSS, whereas the discretization process is realized by a sequential clustering-based approach in an adaptive manner in VIDSS. DFCSS method represents the continuous state space by distribution functions in continuous way. The effectiveness of proposed approaches on system performance are demonstrated by applications.

Benzer Tezler

  1. Deep learning based speed up of fluid dynamics solvers

    Akışkanlar dinamiği çözücülerinin derin öğrenmeye dayalı hızlandırılması

    DENİZ ALPER ACAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Havacılık ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. OĞUZ UZOL

  2. A parallel unstructured finite volume method with an efficient edge based data structure for compressible flows

    Verimli bir kenar tabanlı veri yapısı üzerine kurgulanmış yapısal olmayan sonlu hacimler yöntemiyle çalışan paralel bir sıkıştırılabilir akış çözücüsü

    SEMİH AKKURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ŞAHİN

  3. Implementations of novel cellular nonlinear and cellular logic networks and their applications

    Yeni hücresel doğrusal olmayan ve hücresel lojik ağların gerçeklemeleri ve uygulamaları

    RAMAZAN YENİÇERİ

    Doktora

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜŞTAK ERHAN YALÇIN

  4. Direct and inverse electromagnetic scattering problems in spherically layered media

    Küresel tabakalı cisimlere ilişkin düz ve ters saçılma problemleri

    EGEMEN BİLGİN

    Doktora

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ YAPAR

  5. An integral equation method with hermite surfaces for particle sedimentation problems

    Parçacık sedimantasyon problemi için hermite yüzeyleri ile integral denklem yöntemi

    REŞİT KAYHAN ATA

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ŞAHİN