Geri Dön

Taktik çevre simülasyon programlarında sanal varlıkların pekiştirmeli öğrenme ile eğitilmesi

Training virtual entities with reinforcement learning in tactical environment simulation programs

  1. Tez No: 691511
  2. Yazar: FATİHA NUR BÜYÜKOFLAZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ HÜSEYİN OKTAY ALTUN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: KTO Karatay Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Günümüzde uçuş eğitimlerinin büyük bir kısmı güvenlik gerekçeleri, gerçek araçların bakım, onarım ve kullanım maliyetleri, eğitim için gerekli olan savaş koşullarının gerçek dünyada zor oluşturulması gibi sebeplerden ötürü uçuş simülatörleri üzerinden gerçekleştirilmektedir. Bu uçuş simülatörleri genellikle taktik çevre yazılımları ile entegre çalışırlar ve pilotun kontrol ettiği yüksek gerçeklik sadakat derecesine sahip varlıklarla birlikte senaryoyu oluşturan diğer düşük gerçeklik sadakat derecesine sahip varlıklar bu taktik çevre simülasyon programları ile yönetilirler. Mevcut taktik çevre simülasyon programlarında ortamdaki varlıkların kontrolleri geleneksel kontrol dallanmaları ile uzman ekipler tarafından programlanmak suretiyle gerçekleştirilmektedir. Bu şekilde tasarlanan simülasyonlarda karşılaşabilecek bütün durum olasılıklarını düşünmek zaman almaktadır ve yazılımsal anlamda oldukça güçtür. Ayrıca simülasyonda kullanılan sanal varlıkların statik olarak tasarlanması oldukça sınırlı ve kendini tekrarlayan senaryolara olduğu gibi katı davranış modellerine de sebep olmaktadır. Bu ve benzeri problemler için taktik çevre sümülasyonlarındaki sanal varlıkların eğitilmesi ihtiyacı ortaya çıkmıştır. Bu varlıkların eğitilmesi için pekiştirmeli öğrenme algoritmalarından olan proksimal politika optimizasyonu tercih edilmiştir. Çalışmalar ticari bir taktik çevre simülasyon programı üzerinde gerçekleştirilmiştir. Sonuç olarak proje kapsamında kullanılan algoritmaların sanal varlıkları eğitmek için uygunluğu gösterilmiştir. Buna ek olarak birden çok sanal varlığın bulunduğu senaryolarda tüm varlıkların akıllandırılması suretiyle bir ekip olarak çalışabileceği ispatlanmıştır.

Özet (Çeviri)

Today, most of the flight trainings are carried out on flight simulations due to maintenance, repair and usage costs of real vehicles, security reasons and the fact that the war conditions required for training can be difficult in the real world. Flight simulators are usually integrated with tactical environment simulators. Along with the high fidelity model of an airplane controlled via a pilot, the rest of the low fidelity entities are controlled by this tactical environment simulators. In the existing simulation softwares, controlling agents in the environment where the pilots are trained are performed by traditional computer coding techniques with many branches in order to account for many possibilities. It takes substantial time and effort to consider all the possibilities that may be encountered in simulation environments and it is a quite challening task to program these entities. In addition, the static design of virtual entities used in simulation causes limited and repetitive scenarios and rigid behavioral models. For this problem and related problems, the need for intelligent virtual entities has emerged. Proximal policy optimization, which is a branch of reinforcement learning algorithm was preferred to train this agent. The studies were carried out on a highly sophisticated commercial simulation software. As a result, the algorithms used within the scope of the project have been proven to be suitable for smarting static virtual entities. In addition, it has been shown that virtual entitys can work as a team with the proposed approach.

Benzer Tezler

  1. Hava saldırı senaryoları için merkezi olmayan işbirlikçi çok ajanlı pekiştirmeli öğrenme

    Decentralized collaborative multi-agent reinforcement learning for air attack scenarios

    BERİRE GÜNDÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET DİKMEN

  2. High-speed trajectory tracking controller design

    Yüksek hızlı iz takip kontrolörü tasarımı

    OMAR SHADEED

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Havacılık ve Uzay Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    Assoc. Prof. Dr. EMRE KOYUNCU

  3. Maneuvering of high speed displacement vessels in regular waves

    Yüksek hızlı deplasman gemilerinin düzenli dalgalarda manevraları

    DENİZ ÖZTÜRK SARIGÜL

    Doktora

    İngilizce

    İngilizce

    2023

    Gemi Mühendisliğiİstanbul Teknik Üniversitesi

    Gemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖMER KEMAL KINACI

  4. Automated lane change decision making for autonomous vehicles using machine learning techniques

    Makine öğrenmesi teknikleri ile otonom araçlarda şerit değişimine karar verme

    MEHDI NASIRI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. GÜLAY ÖKE GÜNEL

  5. Dynamic model integration and 3D graphical interface for a virtual ship

    Sanal bir gemi için dinamik model birleştirilmesi ve üç boyutlu grafik arayüzü

    CANKU ALP ÇALARGÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HALİT OĞUZTÜZÜN

    DOÇ. DR. VEYSİ İŞLER