Comparison of MPC based motion control algorithms on mujoco hybrid platform
Mujoco hibrit platformunda MPC tabanlı hareket kontrol algoritmalarının karşılaştırılması
- Tez No: 946026
- Danışmanlar: PROF. DR. HAKAN TEMELTAŞ
- Tez Türü: Yüksek Lisans
- Konular: Mekatronik Mühendisliği, Mechatronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Mekatronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Mekatronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 95
Özet
Dört ayaklı robotlar, son yıllarda özellikle zorlu ve düzensiz arazilerdeki yüksek hareket kabiliyetleri sayesinde robotik alanında giderek artan bir ilgiyle karşılaşmakta ve öncü araştırma konularından biri haline gelmektedir. Bu tür sistemler, yapıları gereği yalnızca düz yüzeylerde değil, aynı zamanda kaygan, eğimli, engebeli veya çukur gibi karmaşık arazi koşullarında da dengeyi koruyarak ilerleyebilme kapasitesine sahiptir. Geleneksel tekerlekli ya da paletli hareket sistemleriyle karşılaştırıldığında, dört ayaklı robotlar çok daha yüksek çeviklik, esneklik ve adaptasyon yetenekleri sunmakta; bu da onları arama-kurtarma operasyonları, keşif görevleri, askeri uygulamalar, tarımsal otomasyon sistemleri ve afet sonrası incelemeler gibi çevresel belirsizliğin yüksek olduğu görevler için ideal hale getirmektedir. Ayrıca bu sistemler, biyolojik canlıların yürüyüş ve denge stratejilerinden esinlenerek tasarlandıkları için, karmaşık çoklu temas senaryolarını yüksek verimlilikle yönetebilme potansiyeline sahiptir. Ancak bu sistemlerin gerçek dünya uygulamalarında güvenilir ve verimli biçimde çalışabilmesi, yalnızca gelişmiş mekanik yapı, dayanıklı gövde tasarımı ve hassas sensörlerle değil; aynı zamanda çevresel değişimlere hızlı adapte olabilen, hesaplama açısından etkin ve yüksek kararlılığa sahip kontrol algoritmalarıyla mümkündür. Dört ayaklı robotların yürüyüş planlaması, dengesizlik durumunda toparlanması veya farklı zemin türlerine anlık tepki verebilmesi gibi işlevleri, klasik kontrol yöntemlerinin sınırlarını zorlamakta; bu nedenle ileri düzey hareket kontrol stratejilerine ihtiyaç duyulmaktadır. Bu bağlamda Model Öngörülü Kontrol (Model Predictive Control - MPC), sistemin mevcut durumunu ve dinamik modelini kullanarak gelecekteki olası davranışları belirli bir zaman ufku içinde tahmin edebilmesi ve kontrol girişlerini bu doğrultuda optimize etmesi sayesinde, dört ayaklı robot kontrolünde dikkat çeken bir yöntem olarak öne çıkmaktadır. MPC, her kontrol adımında bir optimizasyon problemi çözüp, sistemin gelecek durumları üzerinde etkili olacak kontrol girişlerini belirli kısıtlar altında seçer ve yalnızca ilk kontrol adımını uygular. Bu işlem her adımda tekrarlanarak sistemin gerçek zamanlı olarak çevre koşullarına duyarlı, planlı ve güvenli şekilde hareket etmesi sağlanır. MPC'nin bu ileri görüşlü yapısı, özellikle çok eklemli, temasa duyarlı, doğrusal olmayan ve yüksek derecede dinamik davranış sergileyen dört ayaklı robot sistemlerinde; denge koruma, adım geçişi, yön değiştirme ve düşmeden toparlanma gibi görevlerin güvenilir biçimde gerçekleştirilmesine olanak tanır. Bu tez çalışmasında, MPC temelli üç farklı kontrol algoritması İteratif Lineer Kuadratik Gauss (iLQG), Gradyan İnişi (Gradient Descent) ve Öngörülü Örnekleme (Predictive Sampling) karşılaştırmalı olarak incelenmiştir. Söz konusu algoritmalar, Google DeepMind tarafından geliştirilen açık kaynaklı MJPC (Model Predictive Control for MuJoCo) platformu üzerinden, MuJoCo fizik motoru ile entegre bir şekilde Unitree A1 dört ayaklı robot modeli üzerinde uygulanmıştır. MuJoCo (Multi-Joint dynamics with Contact), sürekli temas içeren çok eklemli sistemlerin yüksek hassasiyetle fiziksel simülasyonunu mümkün kılan bir simülasyon altyapısıdır. MJPC ise bu fizik motorunu kullanarak gerçek zamanlı MPC planlayıcılarının uygulanmasına olanak tanır. Tez kapsamında oluşturulan simülasyon ortamı Python diliyle kodlanmış ve Jupyter Notebook platformunda yapılandırılmıştır. Python'un sunduğu esneklik, güçlü veri işleme kütüphaneleri (NumPy, Pandas) ve görselleştirme olanakları (Matplotlib) sayesinde algoritmalar arası karşılaştırmalar sistematik ve tekrarlanabilir biçimde gerçekleştirilmiştir. Simülasyonlarda kullanılan robot modeli olan Unitree A1, 12 serbestlik derecesine (3'er DOF'lu 4 bacak), yüksek torklu fırçasız motorlara ve IMU gibi temel sensör donanımlarına sahiptir. Robotun MJCF (MuJoCo XML) formatında fiziksel özellikleri tanımlanmış ve MJPC çerçevesine entegre edilmiştir. Her algoritma için aynı koşullarda yürütülen simülasyonlarda, farklı yürüyüş senaryoları (yürüme, dörtnala koşma), eğimli yüzeylerde hareket, bozulmuş zeminde ilerleme ve düşme sonrası toparlanma gibi görevler gerçekleştirilmiştir. Her kontrol döngüsünde 2 ms kontrol zaman adımı ve 30 adımlık öngörü ufku kullanılmış; böylece toplam 60 ms ileriye dönük planlama gerçekleştirilmiştir. Simülasyonlar sırasında sistem durumu (pozisyon, hız, eklem torkları, zemin tepkisi vb.) sürekli izlenmiş ve maliyet fonksiyonları her zaman adımında hesaplanarak performans ölçütleri elde edilmiştir. İteratif Lineer Kuadratik Gauss (iLQG) algoritması, sistemin doğrusal ve kuadratik yaklaşımlarına dayanan bir ikinci mertebe optimizasyon yöntemidir. Her iterasyonda sistem dinamiği ve maliyet fonksiyonu lokal olarak doğrusal ve kuadratik hale getirilir; böylece hem ileri besleme (feedforward) hem de geri besleme (feedback) kontrol sinyalleri elde edilir. Bu çift yönlü yaklaşım sayesinde iLQG, yüksek izleme doğruluğu, hızlı yakınsama ve sistemsel kararlılık sağlar. Simülasyon sonuçlarında, iLQG algoritmasının hem yürüme hem de dörtnala senaryolarında en düşük maliyet fonksiyon değerlerine ulaştığı, sistemin düşmeden önce toparlanma kabiliyetinin yüksek olduğu ve temas değişimlerine karşı istikrarlı tepkiler verdiği görülmüştür. Bununla birlikte, ikinci türev bilgisine olan bağımlılığı ve yüksek hesaplama yükü, özellikle donanım sınırlamalarının olduğu uygulamalarda dezavantaj oluşturabilir. Gradyan İnişi yöntemi ise birinci mertebe optimizasyon tekniğidir ve yalnızca maliyet fonksiyonunun gradyan bilgisine ihtiyaç duyar. Bu nedenle iLQG'ye kıyasla daha düşük hesaplama yüküne sahiptir ve uygulaması daha kolaydır. Ancak algoritmanın başarısı, adım büyüklüğü gibi hiperparametrelerin hassas ayarlanmasına bağlıdır. Simülasyonlarda, Gradyan İnişi yönteminin ortalama düzeyde bir performans sergilediği, bazı senaryolarda dengeyi sürdüremediği ve özellikle ani dış etkiler karşısında hassas olduğu gözlemlenmiştir. Geri besleme mekanizması bulunmadığından sistemsel bozulmalar telafi edilememekte, bu da kararlılığı azaltmaktadır. Buna rağmen, sınırlı kaynaklı sistemlerde veya prototip kontrol algoritmalarının geliştirilmesi aşamasında faydalı bir yöntemdir. Öngörülü Örnekleme (Predictive Sampling) algoritması ise, belirli bir dağılımdan rastgele kontrol dizileri örnekleyerek, bu diziler için simülasyonlar yürütür ve en düşük maliyet üreten kontrol dizisini uygular. Bu yöntemin avantajı, türev bilgisine ihtiyaç duymaması ve paralel işlemeye uygun olmasıdır. Ancak örnek sayısının artırılması performansı olumlu etkilerken, aynı zamanda hesaplama maliyetini de yükseltir. Tez kapsamında yapılan deneylerde, Predictive Sampling algoritmasının özellikle basit yürüme senaryolarında kararlı hareketler sergilediği ancak karmaşık ve hızlı adaptasyon gerektiren durumlarda yeterli tepki veremediği gözlemlenmiştir. Ayrıca, geri besleme mekanizmasının olmaması nedeniyle, beklenmedik bozucular karşısında denge kaybı yaşanmıştır. Tüm kontrol algoritmaları, performans karşılaştırmasının adil ve tutarlı bir biçimde yapılabilmesi amacıyla aynı maliyet fonksiyonu tanımı altında test edilmiştir. Bu maliyet fonksiyonu, robotun istenen (referans) yörüngeden sapmalarını ve bu yörüngeyi takip ederken harcadığı kontrol eforunu birlikte değerlendiren bir yapıdadır. Özellikle konum ve hız gibi durum değişkenlerindeki sapmalar ile eklem torklarının büyüklüğü, belirli ağırlık katsayılarıyla dengelemiş ve çok amaçlı bir optimizasyon çerçevesi oluşturulmuştur. Böylece hem sistemin izleme doğruluğu hem de enerji verimliliği göz önünde bulundurulmuş, algoritmaların yalnızca performansı değil aynı zamanda uygulama uygunluğu da dikkate alınmıştır. Simülasyonların sonunda elde edilen çıktılar, zaman serisi verileri üzerinden detaylı şekilde analiz edilmiştir. Bu analizler sırasında robotun üç boyutlu uzaydaki gövde pozisyonu, bacak uçlarının (end-effector) lineer ve açısal hızları, yer ile temas anındaki kuvvet dağılımları ve her bir eklemde üretilen tork değerleri dikkatle incelenmiştir. Bu veriler, Python kullanılarak geliştirilen görselleştirme araçları aracılığıyla grafiksel olarak sunulmuş; algoritmaların performansları, hem sayısal hem de görsel analizlerle desteklenmiştir. Özellikle adım geçiş süreleri, denge merkezinin (Center of Mass - CoM) salınım büyüklüğü, ayak temas süresi ve yönelme (orientation) açılarındaki değişimler, algoritmalar arası farkları ortaya koymak açısından kritik metrikler olarak kullanılmıştır. Ayrıca, gait geçişlerinin performansı, simülasyonlar sırasında robotun adım düzenini koruyabilme yetisi ve geçiş sırasındaki salınımların kontrol edilebilirliği açısından değerlendirilmiştir. Denge koruma analizi kapsamında ise robotun dışsal bozuculara veya eğimli yüzeylere verdiği tepkiler incelenmiş, her bir algoritmanın bozulmaya ne hızda yanıt verdiği, dengenin ne kadar sürede yeniden sağlandığı gibi metrikler karşılaştırılmıştır. Yönelme analizinde ise robotun sapma yaptığı eksen etrafındaki toparlanma davranışı, açısal hız regülasyonu ve gövde stabilizasyonu gibi yönler ele alınmıştır. Bu kapsamlı değerlendirmelere ek olarak, MJPC platformunun sınırlı olan analiz ve senaryo çeşitlendirme kapasitesi, Python diliyle geliştirilen özel modüller sayesinde genişletilmiştir. Kullanıcının manuel olarak tanımlaması gereken senaryolar, otomatikleştirilmiş yapılandırma dosyaları ile betik destekli hale getirilmiş; farklı yürüyüş modları ve zemin profilleri için seri simülasyonlar çalıştırılabilir duruma getirilmiştir. Ayrıca her simülasyon sonunda elde edilen veriler düzenli biçimde kaydedilmekte ve video formatında dışa aktarılmaktadır. Bu süreçlerin otomatize edilmesi sayesinde yalnızca algoritma doğruluğu değil, aynı zamanda tekrarlanabilirlik, simülasyon süresi ve analiz verimliliği gibi pratik uygulama ölçütleri de değerlendirilebilir olmuştur. Sonuç olarak, bu tez çalışması, farklı MPC algoritmalarının dört ayaklı robot hareket kontrolünde sağladığı başarıyı sistematik biçimde karşılaştırmış; algoritmaların hem teorik yapıları hem de uygulama çıktıları yönünden güçlü ve zayıf yönlerini ortaya koymuştur. iLQG algoritması genel performans bakımından en başarılı yöntem olarak öne çıkarken, Gradyan İnişi ve Örnekleme tabanlı algoritmalar belirli görevler ve kaynak kısıtları altında uygulanabilir alternatifler sunmuştur. Çalışmada geliştirilen simülasyon ve değerlendirme altyapısı, gelecekte pekiştirmeli öğrenme (reinforcement learning) tabanlı yöntemlerin de dahil edileceği genişletilmiş araştırmalar için sağlam bir temel teşkil etmektedir. Bu sayede hem akademik literatüre hem de gerçek dünya uygulamalarına katkı sağlanması hedeflenmektedir.
Özet (Çeviri)
Quadruped robots(QRs) have attracted significant attention in recent years compared to wheeled or tracked robots due to their ability to move on rough and sloping terrain. With the advancement of technology, these robots have become extremely prominent in areas such as search and rescue, agricultural activities, exploration in remote areas and logistics operations. With the increasing demand for QRs, the need for high performance motion control strategies has become increasingly evident. Among the existing control techniques, Model Predictive Control (MPC) is a model based approach that predicts the future behavior of the system and continuously optimizes control inputs to maximize robot performance. For this reason, it is considered one of the powerful and preferred methods. This study presents a comparative analysis of three different MPC based motion control methods: Iterative Linear Quadratic Gaussian (iLQG), Gradient Descent and Predictive Sampling. These algorithms were tested on the Unitree A1 model in a simulation environment using the MJPC platform developed by the Google DeepMind team. The integration of MJPC with the MuJoCo physics engine provides a robust infrastructure and computational environment for conducting predictive control experiments. The simulation environment was developed using Python and Jupyter Notebook, allowing user interaction, data collection, visualization, and performance evaluations. The scenarios included various locomotion tasks such as walking, trotting, galloping, hill climbing, progressing on unstable ground, and recovery after falling. Time series data and cost function outputs were recorded to evaluate the consistency, efficiency, and responsiveness of each control method. The results revealed that the iLQG algorithm provided the highest tracking accuracy, fastest convergence, and highest stability under various conditions. This method stood out as a more effective method in terms of maintaining balance and adapting to step transitions. Gradient Descent showed moderate performance but required careful tuning of parameters such as step size and was not robust enough to sudden ground changes. Although Predictive Sampling is an algorithm that does not rely on derivatives, it was considered a suitable alternative that provides stability in simple scenarios due to its lower computational complexity. In addition, this study has addressed some of the shortcomings of the MJPC platform, such as benchmarking tools and visualization capabilities. A special evaluation interface has been developed that allows for more detailed performance analysis and different simulation scenarios. This advanced structure is thought to be a helpful approach for future research to improve the locomotion of QRs with predictive control methods.
Benzer Tezler
- Model based optimal longitudinal vehicle control
Model bazlı optimal doğrusal araç kontrolü
MURAT ÖTKÜR
Doktora
İngilizce
2016
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. İSMAİL MURAT EREKE
DR. ORHAN ATABAY
- Data-driven model discovery and control of lateral-directional fighter aircraft dynamics
Yanal ve yönlü savaş uçağı dinamiklerinin veri tabanlı yöntemler ile model keşfi ve kontrolü
CAN ÖZNURLU
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilimsel Hesaplama Ana Bilim Dalı
PROF. DR. ÖMÜR UĞUR
DOÇ. DR. TAYFUN ÇİMEN
- Modelling and control of vertical landing rockets
Dikey inişlİ roketlerin modellenmesi ve kontrolü
MUHAMMET ENES ÇILDIR
Yüksek Lisans
İngilizce
2024
Havacılık ve Uzay MühendisliğiGaziantep ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET HANİFİ DOĞRU
DR. ÖĞR. ÜYESİ EDİP ÖZTÜRK
- Kendini dengeleyebilen iki tekerlekli aracın tasarımı ve kontrolü
Design and control of self-balancing two wheeled vehicle
ULAŞ ÇELİK
Yüksek Lisans
Türkçe
2014
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AYHAN KURAL
- Kontrollü lagrange yöntemleri ve uygulamaları
Controlled lagrangian methods and applications
HÜSEYİN ALPASLAN YILDIZ
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. AFİFE LEYLA GÖREN