Pekiştirmeli öğrenme yöntemiyle farklı görevlerin robotlara öğretilmesi
Teaching different tasks to robots with reinforcement learning
- Tez No: 449376
- Danışmanlar: YRD. DOÇ. DR. BARIŞ ÖZYER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 84
Özet
Pekiştirmeli Öğrenme, bilgisayar bilimleri dalı başta olmak üzere, birçok bilim dalında kullanılan, son yıllarda oldukça yoğun ilgi gösterilen bir makine öğrenmesi metodudur. Pekiştirmeli öğrenmede, ajan istenen bir davranışı deneme-yanılma yöntemiyle öğrenir. Önceden hazırlanmış bir veriseti ile eğitim görmez. Öğrenme ödül sistemiyle gerçekleşir. Bu tezde, üç farklı kontrol problemine, üç farklı pekiştirmeli öğrenme algoritması farklı parametreler kullanılarak uygulanmıştır. Bu problemlerden ilki, literatürde sıklıkla çalışılan ters sarkacın (inverted pendulum) dengede tutulması problemidir. Diğer iki problem, top düşürmeme ve top fırlatma, bu tezde oluştur-duğumuz yeni problemlerdir. top düşürmeme, iki robotik link üzerine bırakılan topun linklerin hareketiyle düşmeden tutulmasını öğretmeyi amaçlamaktadır. Top fırlatma, sabit açısal hızla dönen bir linkin ucuna bağlı bir topu en uzağa fırlatabilmek için topun fırlatılacağı anı öğretmeyi amaçlamaktadır. Bu problemlere, Q-öğrenmesi, SARSA ve Adaptif Sezgisel Kritik (Adaptive Heuristic Critic) algoritmaları, Box2d simülatöründe robotik manipülatörler oluşturularak gerçeklenmiştir. Bu manipülatörler için, bir pekiştirmeli öğrenme durum-uzay oluşturma biçimi olan, yeni Boxes algoritmaları geliştirilmiştir. Simülasyonlarda elde edilen sonuçlar detaylı bir şekilde analiz edilmiştir.
Özet (Çeviri)
Reinforcement learning is a commonly researched machine learning method which is researched in several disciplines especially in computer science in recent years. In reinforcement learning, an agent learns the desired behavior by trial and error. There isn't a pre-defined training dataset in reinforcement learning. Learning is actualized through a reward system. In this thesis, three different reinforcement learning algorithms are applied to three different control problems using different parameters. First one of these problems is balancing the inverted pendulum which is commonly researched in literature. Other two problems, ball-cradling and ball-throwing are newly created problems in this thesis. Ball-cradling aims for teaching the balancing of a ball which falls onto two robotic links by the movement of the links. Ball-throwing aims for teaching the moment to throw a ball to furthest distance, which is tied to a rotating link with a constant linear velocity. Q-learning, SARSA and Adaptive Heuristic Critic algorithms are applied to these problems using the robotic manipulators created in Box2d simulator. For each of these manipulators, new Boxes algorithms, a way of defining reinforcement learning state-spaces, were created. The results of simulations are analyzed particularly.
Benzer Tezler
- Dual-arm safe robot manipulation with second arm assistance
Çift kollu robotlarda ikinci kol destekli güvenli robot etkileşimi
ASEL MENEKŞE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SANEM SARIEL UZER
- Robot skill acquisition via representation sharing and reward conditioning
Robotların temsil paylaşımı ve ödül koşullanması yoluyla beceri kazanmaları
METE TULUHAN AKBULUT
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EMRE UĞUR
- Quadcopter trajectory tracking control using reinforcement learning
Pekiştirmeli öğrenme ile quadcopter yörünge takibi kontrolü
MUSTAFA ERDEM
Yüksek Lisans
İngilizce
2019
Mekatronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERDİNÇ ALTUĞ
- Optimizing rotary-wing UAV trajectory tracking: A comparative study of optimization methods
Döner kanatlı İHA yörünge takibinin optimize edilmesi: Optimizasyon yöntemlerinin karşılaştırmalı bir çalışması
AHMET SABAH
Yüksek Lisans
İngilizce
2024
Havacılık ve Uzay Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL BAYEZİT
- Continual learning with sparse progressive neural networks
Seyrek ilerlemeli sinir ağları ile sürekli öğrenme
ESRA ERGÜN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. BEHÇET UĞUR TÖREYİN