Geri Dön

Learning to coordinate for target selection

Hedef seçimi için koordinasyon ögrenme

  1. Tez No: 143406
  2. Yazar: MEHMET TAN
  3. Danışmanlar: PROF. DR. FARUK POLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Çoklu etmen sistemleri, takviye öğrenme, hedef seçimi, Multi-agent systems, reinforcement learning, target selection
  7. Yıl: 2003
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 50

Özet

Takviye öğrenme, çoklu etmen sistemlerinde koordinasyon öğrenmek için sağlam bir yöntemdir. Bu tezde, bir veya birden fazla etmenin düşman unsurlarca korunan bir bölgeye saldırdığı bir hedef paylaşımı problemine çeşitli takviye öğrenme metodları uygulanmıştır. Etmenler hayatta kalmak ve düşman un surları yok etmek için koordinasyon sağlamak zorundadırlar. Takviye öğrenme metodları, etmenlerin birbirlerinden haberdar olup olmadıklarına ve aralarında haberleşme olup olmadığına göre üç farklı şekilde gerçekleştirilmiştir. Daha sonra, öğrenme algoritmalarının performansları birbirleri ile ve insan tarafından üretilen bazı çözümlerle karşılaştırılmıştır.

Özet (Çeviri)

Reinforment Learning is a robust learning method that can be used to learn coordination in multiagent systems. In this thesis we apply different kinds of reinforcement learning algorithms to a target selection problem, in which a num ber of agents are attacking a territory defended by a number of enemy units. Agents have to coordinate to survive and eliminate the enemy units. Rein forcement learning algorithms are implemented in three different ways that are distinguished by whether agents are aware of each other and whether they have communication in between. We then compare the performance of learning algo rithms with each other and with some human generated policies.

Benzer Tezler

  1. Sayısal haritaların coğrafi bilgi sistemlerinde kullanılması ve kordinat transformasyonu

    The usage of digital maps in geographical information systems and coordinate transformation

    HÜSEYİN KURŞUN

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Jeodezi ve Fotogrametri Ana Bilim Dalı

    DOÇ. DR. YUNUS KALKAN

  2. Secure and coordinated beamforming in 5G and beyond systems using deep neural networks

    5G ve ötesi sistemlerde derin sinir ağları kullanarak güvenli ve koordineli hüzmeleme

    UTKU ÖZMAT

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET AKİF YAZICI

    DR. ÖĞR. ÜYESİ MEHMET FATİH DEMİRKOL

  3. Cisim tanıma problemine yapay sinir ağlarının uygulanması

    Application of artificial neural networks to object recognition

    ATİLLA ÜSTÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. A. TALHA DİNİBÜTÜN

  4. Crowd localization and counting via deep flow maps

    Derin öğrenme ile çıkarılan hareket haritaları kullanılarak nesne kalabalıklarının tespiti ve sayımı

    PEDRAM YOUSEFI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL

  5. Bütünleşik nehir havzası yönetiminde paydaş katılımı: Modeller ve süreç

    Stakeholder participation in integrated watershed management: Models and process

    ÇİĞDEM KANBER

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Çevre Mühendisliğiİstanbul Teknik Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    PROF. AYŞE GÜL TANIK