Learning to control an inverted pendulum using neural networks

Bir ters sarkan kontrolünün yapay sinir ağlarıyla öğrenilmesi

Tez No: 47341
Yazar: İBRAHİM ÖZTÜRK
Danışmanlar: PROF.DR. EROL KOCAOĞLAN
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Takviyeli Öğrenme, Geçici Farkla Öğrenme, Değer Biçici Ağ, Eylem Ağı. iv, Reinforcement Learning, Temporal Difference Learning, Evaluation Network, Action Network 111
Yıl: 1995
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Belirtilmemiş.
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 77

Özet

oz YAPAY SİNİR A?LARI KULLANILARAK BİR TERS SARKACIN DENETLENMESİNİN Ö?RENİLMESİ ÖZTÜRK, İbrahim Yüksek Lisans Tezi, Elektrik ve Elektronik Mühendisliği Bölümü Tez Yöneticisi: Prof. Dr. Erol Kocaoğlan Eylül 1995, 77 sayfa Bu tez takviyeli öğrenme ve geçici farkla öğrenme metodları kullanılarak yapay sinir ağlarıyla denetim üzerinedir. Denetlenecek sistemin dinamiği hakkında bir ön bilgi yoktur. Denetim öğrenilmesinde benzer yapıda iki yapay sinir ağı beraber kullanıldı. Bunlardan biri öğrenme prosedürü geçici farkla öğrenme olan değer biçici ağ, diğeri öğrenme prosedürü takviyeli öğrenme olan eylem ağıdır. Geçici farkla öğrenme ve takviyeli öğrenme teorileri tek tabakalı ve çok tabakalı ağlar için incelendi ve yeni bir, çok tabakalı ağ formülasyonu verildi. Bu yapay sinir ağlarının uygulamaları ters sarkaç, eğik düzlem üzerindeki ters sarkaç, çift ters sarkaç ve çubuk ve top örnekleri için başarıyla denendi. Üçtaş örneği üzerine bir uygulama gerçeklendi ve tartışıldı.

Özet (Çeviri)

ABSTRACT LEARNING TO CONTROL AN INVERTED PENDULUM USING NEURAL NETWORKS ÖZTÜRK, Ibrahim M.Sc, Department of Electrical and Electronics Engineering Supervisor: Prof. Dr. Erol Kocaoğlan September 1995, 77 pages This thesis covers the study on learning to control via neural networks using reinforcement learning and temporal difference learning methods. There is no priory knowledge of the dynamics of the system to be controlled. In learning to control two similar structured neural networks are used together. Of these networks one is the evaluation network (or adaptive critic element) whose learning procedure is temporal difference learning and the other is the action network (or associate search element) whose learning procedure is reinforcement learning. Theories of temporal difference and reinforcement learning are discussed for both single layer and multi layer neural networks and a multi layer neural network formulation is given. Applications of these neural networks are made to inverted pendulum, inverted pendulum on inclined plane, double inverted pendulum and ball and beam examples successfully. Also an application to tic- tac-toe is realized and discussed.

Benzer Tezler

Tez No
611832
Control of rotary inverted pendulum system with learning feedback linearization based stable robust adaptive controller
Öğrenen geri beslemeli doğrusallaştırma tabanlı kararlı gürbüz uyarlanır denetleyici ile dönel ters sarkaç sisteminin kontrolü
MEHMET UĞUR SOYDEMİR
Yüksek Lisans
İngilizce
2020
Elektrik ve Elektronik Mühendisliği İzmir Katip Çelebi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SAVAŞ ŞAHİN
Tez No
511640
Etkileşimli öğrenme araçları tasarımı yoluyla otomatik kontrol eğitiminin geliştirilmesi
Development of interactive learning tools to improve automatic control education
MEHMET KORKUNÇ
Yüksek Lisans
Türkçe
2018
Makine Mühendisliği Ondokuz Mayıs Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN ÖZCAN
Tez No
673884
İç içe geçmiş kayan kipli kontrol yöntemi kullanarak döner ters sarkaç sisteminin kontrolü
Control of rotary inverted pendulum system by using coupled sliding mode control method
VASIF EMRE KÖTAN
Yüksek Lisans
Türkçe
2021
Makine Mühendisliği Ondokuz Mayıs Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN ÖZCAN
Tez No
449376
Pekiştirmeli öğrenme yöntemiyle farklı görevlerin robotlara öğretilmesi
Teaching different tasks to robots with reinforcement learning
RÜSTEM ÖZAKAR
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Atatürk Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BARIŞ ÖZYER
Tez No
323978
İki ayaklı yürüyen robot tasarımı ve prototip imalatı
Design and contruction of 12 dof biped robot
ALPER GERÇEK
Yüksek Lisans
Türkçe
2012
Makine Mühendisliği İstanbul Teknik Üniversitesi
Makine Ana Bilim Dalı
PROF. DR. HİKMET KOCABAŞ
YRD. DOÇ. DR. ZEKİ YAĞIZ BAYRAKTAROĞLU

Geri Dön