Learning to control an inverted pendulum using neural networks
Bir ters sarkan kontrolünün yapay sinir ağlarıyla öğrenilmesi
- Tez No: 47341
- Danışmanlar: PROF.DR. EROL KOCAOĞLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Takviyeli Öğrenme, Geçici Farkla Öğrenme, Değer Biçici Ağ, Eylem Ağı. iv, Reinforcement Learning, Temporal Difference Learning, Evaluation Network, Action Network 111
- Yıl: 1995
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 77
Özet
oz YAPAY SİNİR A?LARI KULLANILARAK BİR TERS SARKACIN DENETLENMESİNİN Ö?RENİLMESİ ÖZTÜRK, İbrahim Yüksek Lisans Tezi, Elektrik ve Elektronik Mühendisliği Bölümü Tez Yöneticisi: Prof. Dr. Erol Kocaoğlan Eylül 1995, 77 sayfa Bu tez takviyeli öğrenme ve geçici farkla öğrenme metodları kullanılarak yapay sinir ağlarıyla denetim üzerinedir. Denetlenecek sistemin dinamiği hakkında bir ön bilgi yoktur. Denetim öğrenilmesinde benzer yapıda iki yapay sinir ağı beraber kullanıldı. Bunlardan biri öğrenme prosedürü geçici farkla öğrenme olan değer biçici ağ, diğeri öğrenme prosedürü takviyeli öğrenme olan eylem ağıdır. Geçici farkla öğrenme ve takviyeli öğrenme teorileri tek tabakalı ve çok tabakalı ağlar için incelendi ve yeni bir, çok tabakalı ağ formülasyonu verildi. Bu yapay sinir ağlarının uygulamaları ters sarkaç, eğik düzlem üzerindeki ters sarkaç, çift ters sarkaç ve çubuk ve top örnekleri için başarıyla denendi. Üçtaş örneği üzerine bir uygulama gerçeklendi ve tartışıldı.
Özet (Çeviri)
ABSTRACT LEARNING TO CONTROL AN INVERTED PENDULUM USING NEURAL NETWORKS ÖZTÜRK, Ibrahim M.Sc, Department of Electrical and Electronics Engineering Supervisor: Prof. Dr. Erol Kocaoğlan September 1995, 77 pages This thesis covers the study on learning to control via neural networks using reinforcement learning and temporal difference learning methods. There is no priory knowledge of the dynamics of the system to be controlled. In learning to control two similar structured neural networks are used together. Of these networks one is the evaluation network (or adaptive critic element) whose learning procedure is temporal difference learning and the other is the action network (or associate search element) whose learning procedure is reinforcement learning. Theories of temporal difference and reinforcement learning are discussed for both single layer and multi layer neural networks and a multi layer neural network formulation is given. Applications of these neural networks are made to inverted pendulum, inverted pendulum on inclined plane, double inverted pendulum and ball and beam examples successfully. Also an application to tic- tac-toe is realized and discussed.
Benzer Tezler
- Control of rotary inverted pendulum system with learning feedback linearization based stable robust adaptive controller
Öğrenen geri beslemeli doğrusallaştırma tabanlı kararlı gürbüz uyarlanır denetleyici ile dönel ters sarkaç sisteminin kontrolü
MEHMET UĞUR SOYDEMİR
Yüksek Lisans
İngilizce
2020
Elektrik ve Elektronik Mühendisliğiİzmir Katip Çelebi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SAVAŞ ŞAHİN
- Etkileşimli öğrenme araçları tasarımı yoluyla otomatik kontrol eğitiminin geliştirilmesi
Development of interactive learning tools to improve automatic control education
MEHMET KORKUNÇ
Yüksek Lisans
Türkçe
2018
Makine MühendisliğiOndokuz Mayıs ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN ÖZCAN
- İç içe geçmiş kayan kipli kontrol yöntemi kullanarak döner ters sarkaç sisteminin kontrolü
Control of rotary inverted pendulum system by using coupled sliding mode control method
VASIF EMRE KÖTAN
Yüksek Lisans
Türkçe
2021
Makine MühendisliğiOndokuz Mayıs ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN ÖZCAN
- Pekiştirmeli öğrenme yöntemiyle farklı görevlerin robotlara öğretilmesi
Teaching different tasks to robots with reinforcement learning
RÜSTEM ÖZAKAR
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BARIŞ ÖZYER
- İki ayaklı yürüyen robot tasarımı ve prototip imalatı
Design and contruction of 12 dof biped robot
ALPER GERÇEK
Yüksek Lisans
Türkçe
2012
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Ana Bilim Dalı
PROF. DR. HİKMET KOCABAŞ
YRD. DOÇ. DR. ZEKİ YAĞIZ BAYRAKTAROĞLU