Geri Dön

Pekiştirmeli öğrenme yöntemiyle farklı görevlerin robotlara öğretilmesi

Teaching different tasks to robots with reinforcement learning

  1. Tez No: 449376
  2. Yazar: RÜSTEM ÖZAKAR
  3. Danışmanlar: YRD. DOÇ. DR. BARIŞ ÖZYER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: Atatürk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 84

Özet

Pekiştirmeli Öğrenme, bilgisayar bilimleri dalı başta olmak üzere, birçok bilim dalında kullanılan, son yıllarda oldukça yoğun ilgi gösterilen bir makine öğrenmesi metodudur. Pekiştirmeli öğrenmede, ajan istenen bir davranışı deneme-yanılma yöntemiyle öğrenir. Önceden hazırlanmış bir veriseti ile eğitim görmez. Öğrenme ödül sistemiyle gerçekleşir. Bu tezde, üç farklı kontrol problemine, üç farklı pekiştirmeli öğrenme algoritması farklı parametreler kullanılarak uygulanmıştır. Bu problemlerden ilki, literatürde sıklıkla çalışılan ters sarkacın (inverted pendulum) dengede tutulması problemidir. Diğer iki problem, top düşürmeme ve top fırlatma, bu tezde oluştur-duğumuz yeni problemlerdir. top düşürmeme, iki robotik link üzerine bırakılan topun linklerin hareketiyle düşmeden tutulmasını öğretmeyi amaçlamaktadır. Top fırlatma, sabit açısal hızla dönen bir linkin ucuna bağlı bir topu en uzağa fırlatabilmek için topun fırlatılacağı anı öğretmeyi amaçlamaktadır. Bu problemlere, Q-öğrenmesi, SARSA ve Adaptif Sezgisel Kritik (Adaptive Heuristic Critic) algoritmaları, Box2d simülatöründe robotik manipülatörler oluşturularak gerçeklenmiştir. Bu manipülatörler için, bir pekiştirmeli öğrenme durum-uzay oluşturma biçimi olan, yeni Boxes algoritmaları geliştirilmiştir. Simülasyonlarda elde edilen sonuçlar detaylı bir şekilde analiz edilmiştir.

Özet (Çeviri)

Reinforcement learning is a commonly researched machine learning method which is researched in several disciplines especially in computer science in recent years. In reinforcement learning, an agent learns the desired behavior by trial and error. There isn't a pre-defined training dataset in reinforcement learning. Learning is actualized through a reward system. In this thesis, three different reinforcement learning algorithms are applied to three different control problems using different parameters. First one of these problems is balancing the inverted pendulum which is commonly researched in literature. Other two problems, ball-cradling and ball-throwing are newly created problems in this thesis. Ball-cradling aims for teaching the balancing of a ball which falls onto two robotic links by the movement of the links. Ball-throwing aims for teaching the moment to throw a ball to furthest distance, which is tied to a rotating link with a constant linear velocity. Q-learning, SARSA and Adaptive Heuristic Critic algorithms are applied to these problems using the robotic manipulators created in Box2d simulator. For each of these manipulators, new Boxes algorithms, a way of defining reinforcement learning state-spaces, were created. The results of simulations are analyzed particularly.

Benzer Tezler

  1. Dual-arm safe robot manipulation with second arm assistance

    Çift kollu robotlarda ikinci kol destekli güvenli robot etkileşimi

    ASEL MENEKŞE

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SANEM SARIEL UZER

  2. Robot skill acquisition via representation sharing and reward conditioning

    Robotların temsil paylaşımı ve ödül koşullanması yoluyla beceri kazanmaları

    METE TULUHAN AKBULUT

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. EMRE UĞUR

  3. Quadcopter trajectory tracking control using reinforcement learning

    Pekiştirmeli öğrenme ile quadcopter yörünge takibi kontrolü

    MUSTAFA ERDEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERDİNÇ ALTUĞ

  4. Optimizing rotary-wing UAV trajectory tracking: A comparative study of optimization methods

    Döner kanatlı İHA yörünge takibinin optimize edilmesi: Optimizasyon yöntemlerinin karşılaştırmalı bir çalışması

    AHMET SABAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Havacılık ve Uzay Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL BAYEZİT

  5. Continual learning with sparse progressive neural networks

    Seyrek ilerlemeli sinir ağları ile sürekli öğrenme

    ESRA ERGÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. BEHÇET UĞUR TÖREYİN