Geri Dön

Pekiştirmeli öğrenme için bir helikopter ortamı geliştirilmesi

Developing a helicopter environment for reinforcement learning

  1. Tez No: 744742
  2. Yazar: MEHMET GÖKÇAY KABATAŞ
  3. Danışmanlar: PROF. DR. YAŞAR BECERİKLİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Havacılık ve Uzay Mühendisliği, Computer Engineering and Computer Science and Control, Aeronautical Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

Yapay zeka, insanoğlunun problem çözümlemede kullandığı yaklaşımlardan biridir. Son zamanlarda gelişen yöntemleri ile birçok problem çözümü keşfedilmeye başlanmıştır. Çözülmeye çalışılan problemlerden biri de helikopter kontrolüdür. Helikopter kontrolü karmaşık ve doğrusal olmayan bir problemdir. Pekiştirmeli öğrenme algoritmaları bu tarz problemlerin çözüm yaklaşımlarından biridir. Pekiştirmeli öğrenme algoritmalarının helikopterler üzerinde geliştirilebilmesi hem yüksek riski hem de maliyeti sebebiyle kolay değildir. Bu nedenle, çalışmaların dijital ortamda gerçekleştirilmesi gerekmektedir. Bu çalışmada, pekiştirmeli öğrenme çalışmaları için C++ ve Python programlama dilleri kullanılarak DynaG-Heli adlı yeni bir helikopter ortamı geliştirilmiştir. Ortamın kullanılabilirliği ve öğretilebilirliğinin test edilebilmesi için hover manevra görevi tanımlanmıştır. Tanımlanan hover manevra görevi, model-bağımsız algoritmalardan biri olan Soft Actor-Critic (SAC) kullanılarak ajana öğretilmiştir. Elde edilen sonuçlar, tek başına SAC algoritması ile geliştirilen ajanın başarısını ve ortamın kullanılabilirliğini göstermektedir. Bu ortamın, helikopter kontrol problemlerinin çözümü için geliştirilecek olan bir çok yeni yaklaşıma ev sahipliği yapması hedeflenmektedir.

Özet (Çeviri)

Artificial intelligence is one of the approaches that human beings use in problem solving. Recently, solutions of many problem have started to be discovered with the developed methods. One of the problems to be solved is helicopter control. Helicopter control is a complex and nonlinear problem. Reinforcement learning algorithms are one of the solution approaches to these problems. Developing reinforcement learning algorithms on helicopters is not easy due to both high risk and cost. For this reason, studies need to be carried out in a digital environment. In this study, a new helicopter environment named DynaG-Heli was developed by using C++ and Python programming languages for reinforcement learning studies. The hover maneuver task is defined in order to test the usability and teachability of the environment. The defined hover maneuver task was taught to the agent using Soft Actor-Critic (SAC), one of the model-free algorithms. The results obtained show the success of the agent developed with the SAC algorithm alone and the usability of the environment. It is aimed that this environment will host many new approaches to be developed for solving helicopter control problems.

Benzer Tezler

  1. Quadcopter trajectory tracking control using reinforcement learning

    Pekiştirmeli öğrenme ile quadcopter yörünge takibi kontrolü

    MUSTAFA ERDEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERDİNÇ ALTUĞ

  2. Makine öğrenme ve pekiştirmeli öğrenme algoritmaları ile denizaltı savunma harbinin modellenmesi

    Modeling anti-submarine warfare with machine learning and reinforcement learning algorithms

    HAKAN AKYOL

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Savunma ve Savunma TeknolojileriÇankaya Üniversitesi

    Veri Analitiği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

  3. Engaging human-robot interaction with batch reinforcement learning

    Kayıtlı veriden pekiştirmeli öğrenme yoluyla insan robot etkileşiminde kullanıcı ilgisinin eniyilenmesi

    NUSRAH HUSSAIN

    Doktora

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ENGİN ERZİN

    PROF. DR. YÜCEL YEMEZ

  4. Normalizing flows as HMM emissions for learning from demonstration

    Gösterimlerden öğrenme için normalleştiren akış emisyonlu saklı markov modelleri

    FARZIN NEGAHBANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BARIŞ AKGÜN

  5. Transfer learning for continuous control

    Sürekli kontrol için öğrenme aktarımı

    SUZAN ECE ADA

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. HÜSEYİN LEVENT AKIN