Pekiştirmeli öğrenme için bir helikopter ortamı geliştirilmesi
Developing a helicopter environment for reinforcement learning
- Tez No: 744742
- Danışmanlar: PROF. DR. YAŞAR BECERİKLİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Havacılık ve Uzay Mühendisliği, Computer Engineering and Computer Science and Control, Aeronautical Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Yapay zeka, insanoğlunun problem çözümlemede kullandığı yaklaşımlardan biridir. Son zamanlarda gelişen yöntemleri ile birçok problem çözümü keşfedilmeye başlanmıştır. Çözülmeye çalışılan problemlerden biri de helikopter kontrolüdür. Helikopter kontrolü karmaşık ve doğrusal olmayan bir problemdir. Pekiştirmeli öğrenme algoritmaları bu tarz problemlerin çözüm yaklaşımlarından biridir. Pekiştirmeli öğrenme algoritmalarının helikopterler üzerinde geliştirilebilmesi hem yüksek riski hem de maliyeti sebebiyle kolay değildir. Bu nedenle, çalışmaların dijital ortamda gerçekleştirilmesi gerekmektedir. Bu çalışmada, pekiştirmeli öğrenme çalışmaları için C++ ve Python programlama dilleri kullanılarak DynaG-Heli adlı yeni bir helikopter ortamı geliştirilmiştir. Ortamın kullanılabilirliği ve öğretilebilirliğinin test edilebilmesi için hover manevra görevi tanımlanmıştır. Tanımlanan hover manevra görevi, model-bağımsız algoritmalardan biri olan Soft Actor-Critic (SAC) kullanılarak ajana öğretilmiştir. Elde edilen sonuçlar, tek başına SAC algoritması ile geliştirilen ajanın başarısını ve ortamın kullanılabilirliğini göstermektedir. Bu ortamın, helikopter kontrol problemlerinin çözümü için geliştirilecek olan bir çok yeni yaklaşıma ev sahipliği yapması hedeflenmektedir.
Özet (Çeviri)
Artificial intelligence is one of the approaches that human beings use in problem solving. Recently, solutions of many problem have started to be discovered with the developed methods. One of the problems to be solved is helicopter control. Helicopter control is a complex and nonlinear problem. Reinforcement learning algorithms are one of the solution approaches to these problems. Developing reinforcement learning algorithms on helicopters is not easy due to both high risk and cost. For this reason, studies need to be carried out in a digital environment. In this study, a new helicopter environment named DynaG-Heli was developed by using C++ and Python programming languages for reinforcement learning studies. The hover maneuver task is defined in order to test the usability and teachability of the environment. The defined hover maneuver task was taught to the agent using Soft Actor-Critic (SAC), one of the model-free algorithms. The results obtained show the success of the agent developed with the SAC algorithm alone and the usability of the environment. It is aimed that this environment will host many new approaches to be developed for solving helicopter control problems.
Benzer Tezler
- Quadcopter trajectory tracking control using reinforcement learning
Pekiştirmeli öğrenme ile quadcopter yörünge takibi kontrolü
MUSTAFA ERDEM
Yüksek Lisans
İngilizce
2019
Mekatronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERDİNÇ ALTUĞ
- Makine öğrenme ve pekiştirmeli öğrenme algoritmaları ile denizaltı savunma harbinin modellenmesi
Modeling anti-submarine warfare with machine learning and reinforcement learning algorithms
HAKAN AKYOL
Yüksek Lisans
Türkçe
2023
Savunma ve Savunma TeknolojileriÇankaya ÜniversitesiVeri Analitiği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
- Engaging human-robot interaction with batch reinforcement learning
Kayıtlı veriden pekiştirmeli öğrenme yoluyla insan robot etkileşiminde kullanıcı ilgisinin eniyilenmesi
NUSRAH HUSSAIN
Doktora
İngilizce
2020
Elektrik ve Elektronik MühendisliğiKoç ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ENGİN ERZİN
PROF. DR. YÜCEL YEMEZ
- Normalizing flows as HMM emissions for learning from demonstration
Gösterimlerden öğrenme için normalleştiren akış emisyonlu saklı markov modelleri
FARZIN NEGAHBANI
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BARIŞ AKGÜN
- Transfer learning for continuous control
Sürekli kontrol için öğrenme aktarımı
SUZAN ECE ADA
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. HÜSEYİN LEVENT AKIN