Geri Dön

Coordination and control of autonomous multi-robot systems

Otonom çoklu robot sistemlerinin koordinasyonu ve kontrolü

  1. Tez No: 926072
  2. Yazar: MUHAMMED ALİ ÇALMAZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ NESLİHAN AVCU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 65

Özet

Bu tezde, Webots simülasyon ortamında oluşturulan E-puck robotlarının, sinir ağı algoritmalarına dayalı Yakınsal Politika Optimizasyonu (PPO) pekiştirmeli öğrenme (RL) yöntemi kullanılarak, robotun hareketleri optimize edilirken, mümkün olan en kısa yoldan belirli bir hedefe ulaşmaları amaçlanmıştır. Engel sayılarının ve boyutlarının değiştiği farklı boyutlardaki ortamlarda robotların istenilen hedeflere ulaşma eğitimini değerlendirmek için farklı senaryolar analiz edilmiştir. PPO algoritması, karmaşık görevleri öğrenmek için güçlü bir yöntem olarak ortaya çıkmaktadır. Yapay sinir ağlarına dayalı bir Actor-Critic yapısı içeren PPO algoritmasının, robotların çevresel değişikliklere hızla uyum sağlamasını ve hedeflerine en kısa yoldan ulaşmasını sağladığı görülmektedir. Webots, fiziksel dünyayı yüksek doğrulukla simüle etme yeteneği ile öne çıkan bir simülasyon platformudur. Bu platform çeşitli senaryoların gerçek zamanlı simülasyonlarını gerçekleştirmek için kullanılmaktadır. Webots simülasyon ortamında, değişik konumlarda bulunan robotlar için farklı kontrol yapıları geliştirilerek kendi konumlarına bağlı bireysel öğrenme süreçleri incelenmiştir. Yapılan simülasyonlarda, robotların eğitim sürelerinin bulundukları konumlara göre değişiklik gösterdiği ve ortamın karmaşıklığıyla orantılı olarak arttığı gözlemlenmiştir. Bu çalışmada, PPO algoritmasının uygulanması ve robotların belirlenen hedefi bulması için optimizasyon süreçleri tek ve çok robotlu sistemler için incelenmiştir. Sonuç olarak, robotların bir eğitim aşamasından geçtikten sonra belirlenen hedefe en kısa yoldan ulaşmayı öğrendikleri gösterilmiştir. Bu sonuçlar, geliştirilen pekiştirmeli öğrenme tabanlı kontrol algoritmalarının çok robotlu sistemlerde robotların istenilen hedefi bulma sorununa bir çözüm sağlayabileceğini göstermektedir.

Özet (Çeviri)

In this thesis, it is aimed to ensure that E-puck robots, created in the Webots simulation environment, reach a specified target in the shortest path possible by using Proximal Policy Optimization (PPO) reinforcement learning (RL) method based on neural network algorithms, while optimizing the robot's movements. Different scenarios have been analyzed to assess the training of robots in reaching desired targets within environments of different dimensions, where obstacle numbers and sizes vary. The PPO algorithm emerges as a powerful method for learning complex tasks. It is observed that the PPO algorithm, which includes an Actor-Critic structure based on artificial neural networks, enables robots to quickly adapt to environmental changes and reach their targets via the shortest path. Webots is used to perform real-time simulations of various scenarios, as it stands out for its ability to simulate the physical world with high accuracy. In the Webots simulation environment, it is examined that robots achieved individual learning based on their positions through the development of different control structures. In the simulations conducted, it is observed that the training durations of the robots varied depending on their location within the same environment, and the training duration increased proportionally with the complexity of the environment. In this study, the application of the PPO algorithm and the optimization processes for the robots to find the specified target are studied for single and multi-robots systems. Ultimately, it is shown that the robots learned to reach the specified target via the shortest path after undergoing a training phase. These results demonstrate that the developed reinforcement learning-based control algorithms can provide a solution to the problem of robots finding the desired target in multi-robot systems.

Benzer Tezler

  1. An integrated planning, scheduling and execution framework for multi-robot cooperation and coordination

    Çoklu-robotların ortak calışması ve koordinasyonu için tümleşik bir planlama, görev atama ve yürütme mimarisi

    SANEM SARIEL

    Doktora

    İngilizce

    İngilizce

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ.DR. TUCKER BALCH

    PROF.DR. NADİA ERDOĞAN

  2. Çoklu algılayıcı füzyonunun çoklu robot sistemlerinde eş zamanlı konum belirleme ve haritalama problemine uygulanması

    The implementation of multi-sensor fusion to simultaneous localization and mapping problem in multi-robot systems

    GÜRKAN TUNA

    Doktora

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. KAYHAN GÜLEZ

    YRD. DOÇ. DR. VEHBİ ÇAĞRI GÜNGÖR

  3. Relative localization and coordination for air-ground robot teams

    Hava-yer robot ekipleri için bağıl lokalizasyon ve koordinasyon

    İSA EMRE YILDIRIM

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SAMET GÜLER

  4. Çoklu robot sistemleri için blokzincir tabanlı dağıtık görev paylaşım sistem mimarisinin geliştirilmesi

    Development of blockchain oriented distributed task sharing system architecture for multi robot systems

    MEHMED OĞUZ ŞEN

    Doktora

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİnönü Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ADNAN FATİH KOCAMAZ

  5. Distributed team formation for robot soccer

    Robot futbolu için dağıtılmış takım formasyonu

    ONURALP ULUSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SANEM SARIEL-TALAY