Object, action, and outcome blending latent space exploration with intrinsic motivation to learn manipulation skills
Nesne, eylem ve sonuç bilgisini harmanlayan saklı uzayda manipülasyon becerilerinin içsel motivasyonlu keşif ile öğrenimi
- Tez No: 632745
- Danışmanlar: DR. ÖĞR. ÜYESİ EMRE UĞUR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Yapay ajanları daha özerk ve zeki yapma arayışında, onların, becerileri kendi kendilerine öğrenebilme yeteneğiyle donatılması çok önemli bir rol oynar. Bu tezde, yapay ajanların becerileri verimli bir şekilde kazanmasını sağlamak için içsel motivasyonlu keşfe odaklanmaktayız. Keşif sırasında ajan, keşfe devam edeceği bir sonraki bölgeyi içsel motivasyon sinyalini kullanarak seçer. Bu motivasyon sinyali, ajanı, ajan için ne çok kolay ne de çok zor olan bölgeyi keşfetmeye yönlendirir. İlk çalışmamızda, mevcut bir içsel motivasyon mimarisini daha iyi kullanmak amacıyla, özel öğrenme bölgelerini oluşturmak için, duyumotor uzayını öngörülebilirlik ilkesini kullanarak sürekli olarak bölen bir yöntem önerdik. Bir sonraki çalışmamız, bir dizi becerinin öğrenimi için, içsel motivasyonun yönlendirdiği keşifsel davranışların kendi kendine örgütlenmesini kolaylaştıran saklı bir uzay kullanmayı amaçlamaktadır. Bu uzayın robot ve çevre arasındaki etkileşimin dinamiklerini yansıtmasını sağlamak için, sonuç, eylem ve nesne bilgilerinin harmanlanmasını öneriyoruz. Daha sonra, bu saklı uzay farklı bölgelere ayrılmakta ve her bölge ayrı tahmin modelleri tarafından öğrenilmektedir. Önerilen yaklaşım, masa üstü bir ortamda, parametrik eylemler kullanarak farklı nesnelerle etkileşime giren, simüle edilmiş bir robotla doğrulanmaktadır. Sunduğumuz yaklaşım, robotun kendi müfredatını düzenlemesine olanak tanıyarak, robotun daha kolay olan becerilerden daha karmaşık olanlara geçmesini sağlar. Oluşan müfredatın analizi, itme becerisinden önce kavrama becerisinin ortaya çıktığı sonucuna varmaktadır, bu da bebeklerdeki beceri gelişimi ile benzerlik göstermektedir. Ayrıca, sonuçlar önerilen yöntemin çeşitli koşullar altında, benzerlerinden önemli ölçüde daha az tahmin hatası yaptığını göstermektedir.
Özet (Çeviri)
In quest of making artificial agents more autonomous and intelligent, equipping them with the ability of self-learning of skills plays a crucial role. In this thesis, we focus on intrinsically motivated exploration to enable efficient acquisition of skills for artificial agents. During the exploration, the agent uses the intrinsic motivation signal to self-select the exploration regions to proceed. This motivation signal drives the agent to explore the region that is neither too easy nor too difficult for the agent. First, we proposed a method that continuously partitions the sensorimotor space using the predictability principle to form specialized learning regions to better employ an existing intrinsic motivation framework. Our next study aims to utilize a latent space that facilitates the self-organization of the exploratory behaviors driven by the intrinsic motivation to learn a set of skills. To make this space reflect the dynamics of the interaction between the robot and the environment, we propose blending the outcome, action, and object information. Next, the latent space is clustered into different regions; each is then learned by separate predictors. The proposed approach is validated with a simulated robot that manipulates different objects using parameterized actions in a table-top environment. Our approach allows the robot to organize its own curriculum, enabling it to proceed from easier skills to more complex ones. The analysis of the curriculum deduces that grasp emerges before pushing, which is consistent with the skill emergence in infants. Furthermore, results show that the proposed method makes significantly lesser prediction errors than its counterparts in various settings.
Benzer Tezler
- Yaparak öğrenme ve dijital fabrikasyonun kesişimi: Kendi aracını tasarlamak
The intersection of learning by doing and digital fabrication: Designing your own tool
EKİN ÜNLÜ
Yüksek Lisans
Türkçe
2022
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. SEMA ALAÇAM
- Tüketim toplumunda yeni sanat pratikleri
New art practices in the consumer society
MAHMUT ESAT SEVİLAY
- ABD'nin Meksika uyuşturucu savaşı stratejisinin uygulanabilirliğinin çatışma çözümü açısından analizi
Analysis of the viability of the strategy pursued by the US on Mexico's war on drugs from a conflict resolution perspective
LAURA AMELIA CANTU GARZA
Yüksek Lisans
Türkçe
2016
Uluslararası İlişkilerAkdeniz ÜniversitesiUluslararası İlişkiler Ana Bilim Dalı
YRD. DOÇ. DR. SENEM ATVUR
- Learning mental states from biosignal
Başlık çevirisi yok
MELİH KANDEMİR
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAalto University (Aalto Yliopisto)PROF. SAMUEL KASKI
DR. ARTO KLAMI
- Sanat, iktidar, beden
Art, power, body
GÖKCEN MERYEM KILINÇ
Sanatta Yeterlik
Türkçe
2016
Güzel SanatlarAnadolu ÜniversitesiResim Ana Sanat Dalı
PROF. ZELİHA AKÇAOĞLU