Taktik çevre simülasyon programlarında sanal varlıkların pekiştirmeli öğrenme ile eğitilmesi
Training virtual entities with reinforcement learning in tactical environment simulation programs
- Tez No: 691511
- Danışmanlar: DR. ÖĞR. ÜYESİ HÜSEYİN OKTAY ALTUN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: KTO Karatay Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 77
Özet
Günümüzde uçuş eğitimlerinin büyük bir kısmı güvenlik gerekçeleri, gerçek araçların bakım, onarım ve kullanım maliyetleri, eğitim için gerekli olan savaş koşullarının gerçek dünyada zor oluşturulması gibi sebeplerden ötürü uçuş simülatörleri üzerinden gerçekleştirilmektedir. Bu uçuş simülatörleri genellikle taktik çevre yazılımları ile entegre çalışırlar ve pilotun kontrol ettiği yüksek gerçeklik sadakat derecesine sahip varlıklarla birlikte senaryoyu oluşturan diğer düşük gerçeklik sadakat derecesine sahip varlıklar bu taktik çevre simülasyon programları ile yönetilirler. Mevcut taktik çevre simülasyon programlarında ortamdaki varlıkların kontrolleri geleneksel kontrol dallanmaları ile uzman ekipler tarafından programlanmak suretiyle gerçekleştirilmektedir. Bu şekilde tasarlanan simülasyonlarda karşılaşabilecek bütün durum olasılıklarını düşünmek zaman almaktadır ve yazılımsal anlamda oldukça güçtür. Ayrıca simülasyonda kullanılan sanal varlıkların statik olarak tasarlanması oldukça sınırlı ve kendini tekrarlayan senaryolara olduğu gibi katı davranış modellerine de sebep olmaktadır. Bu ve benzeri problemler için taktik çevre sümülasyonlarındaki sanal varlıkların eğitilmesi ihtiyacı ortaya çıkmıştır. Bu varlıkların eğitilmesi için pekiştirmeli öğrenme algoritmalarından olan proksimal politika optimizasyonu tercih edilmiştir. Çalışmalar ticari bir taktik çevre simülasyon programı üzerinde gerçekleştirilmiştir. Sonuç olarak proje kapsamında kullanılan algoritmaların sanal varlıkları eğitmek için uygunluğu gösterilmiştir. Buna ek olarak birden çok sanal varlığın bulunduğu senaryolarda tüm varlıkların akıllandırılması suretiyle bir ekip olarak çalışabileceği ispatlanmıştır.
Özet (Çeviri)
Today, most of the flight trainings are carried out on flight simulations due to maintenance, repair and usage costs of real vehicles, security reasons and the fact that the war conditions required for training can be difficult in the real world. Flight simulators are usually integrated with tactical environment simulators. Along with the high fidelity model of an airplane controlled via a pilot, the rest of the low fidelity entities are controlled by this tactical environment simulators. In the existing simulation softwares, controlling agents in the environment where the pilots are trained are performed by traditional computer coding techniques with many branches in order to account for many possibilities. It takes substantial time and effort to consider all the possibilities that may be encountered in simulation environments and it is a quite challening task to program these entities. In addition, the static design of virtual entities used in simulation causes limited and repetitive scenarios and rigid behavioral models. For this problem and related problems, the need for intelligent virtual entities has emerged. Proximal policy optimization, which is a branch of reinforcement learning algorithm was preferred to train this agent. The studies were carried out on a highly sophisticated commercial simulation software. As a result, the algorithms used within the scope of the project have been proven to be suitable for smarting static virtual entities. In addition, it has been shown that virtual entitys can work as a team with the proposed approach.
Benzer Tezler
- Hava saldırı senaryoları için merkezi olmayan işbirlikçi çok ajanlı pekiştirmeli öğrenme
Decentralized collaborative multi-agent reinforcement learning for air attack scenarios
BERİRE GÜNDÜZ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET DİKMEN
- High-speed trajectory tracking controller design
Yüksek hızlı iz takip kontrolörü tasarımı
OMAR SHADEED
Yüksek Lisans
İngilizce
2024
Havacılık ve Uzay Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. EMRE KOYUNCU
- Maneuvering of high speed displacement vessels in regular waves
Yüksek hızlı deplasman gemilerinin düzenli dalgalarda manevraları
DENİZ ÖZTÜRK SARIGÜL
Doktora
İngilizce
2023
Gemi Mühendisliğiİstanbul Teknik ÜniversitesiGemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı
PROF. DR. ÖMER KEMAL KINACI
- Automated lane change decision making for autonomous vehicles using machine learning techniques
Makine öğrenmesi teknikleri ile otonom araçlarda şerit değişimine karar verme
MEHDI NASIRI
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. GÜLAY ÖKE GÜNEL
- Dynamic model integration and 3D graphical interface for a virtual ship
Sanal bir gemi için dinamik model birleştirilmesi ve üç boyutlu grafik arayüzü
CANKU ALP ÇALARGÜN
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HALİT OĞUZTÜZÜN
DOÇ. DR. VEYSİ İŞLER