Multi-object graph symbol network: Goal-oriented planning through learned compound object symbols
Çok nesneli çizge sembol ağı: Öğrenilmiş bileşik nesne sembolleri aracılığıyla hedef odaklı planlama
- Tez No: 880237
- Danışmanlar: DOÇ. DR. EMRE UĞUR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Robotikte nesnelerin otonom montajı ve demontajı genellikle politika öğrenme yöntemlerine ve sembolik planlayıcılara dayanır. Ancak bu yaklaşımlar, genellemeyi sınırlayan büyük miktarda veri ve uzman tanımlı sembollere duyulan ihtiyaç gibi önemli zorluklarla karşı karşıyadır. Çevre tarafından sağlanan potansiyel eylemleri ifade eden olanaklar kavramı, aktif keşif açısından robotik alanında yaygın olarak çalışılmış ve gözetim ihtiyacını çözmüştür. Benzer şekilde, üst düzey sembol keşfi, üst düzey görevler için sembolleri öğrenmek ve sembolik planlayıcılara dönüştürmek için kapsamlı bir şekilde çalışılmıştır. Tek veya eşleştirilmiş nesne etkileşimlerine odaklanan önceki çalışmaların aksine, çalışmamız çeşitli boyutlara sahip bileşik nesnelerin olanaklarını ve sembollerini ele almaktadır. Çalışmamız iki yeni model önermektedir: bileşik nesnelerin olanaklarını öğrenmek için Çok Nesneli Çizge Uygunluk Ağı (MOGAN) ve etki tahminleri yoluyla tek ve bileşik nesnelerin sembollerini keşfetmek için Çok Nesneli Çizge Sembol Ağı (MOGSN). Bileşikleri grafikler olarak temsil ederek, uzamsal ilişkileri koruyor ve bilgiyi etkili bir şekilde yayarak karmaşık yapıların olanaklarının ve sembollerinin tahmin edilmesini sağlıyoruz. Bu yapıların ve ilişkilerinin temsillerini öğrenmek için Çizge Sinir Ağları (GNN'ler) kullanılmaktadır. Sonuçlarımız önerilen modellerin etkinliğini göstermektedir. MOGAN ve MOGSN, dışbükey ve içbükey nesneleri içeren görevler üzerinde test edilmiş ve başarılı uygunluk öğrenimi ve sembol keşfi göstermiştir. MOGAN modeli hem simülasyon hem de gerçek dünya ortamlarında başarılı plan üretimi ile doğrulanmıştır. MOGSN modeli, bileşik nesnelerde anlamlı sembollerin ortaya çıktığını ve başarılı sembolik planlamalara yol açtığını göstermiştir.
Özet (Çeviri)
The assembly and disassembly of objects in robotics often relies on policy learning methods and symbolic planners. However, these approaches face significant challenges, such as the need for large amounts of data and expert-defined symbols, which limit their generalizability. The concept of affordances, which refer to the potential actions provided by the environment, widely studied in robotics domain in the aspect of active exploration, solving the need for supervision. Similarly, high-level symbol exploration has been extensively studied for learning and transforming symbols into symbolic planners for high-level tasks. Unlike previous works that focus on single or paired object interactions, our study addresses the affordances and symbols of compound objects with varying shapes and sizes. Our study proposes two novel models: the Multi-Object Graph Affordance Network (MOGAN) for learning affordances of compound objects, and the Multi-Object Graph Symbol Network (MOGSN) for exploring symbols of single and compound objects through effect predictions. By representing the compounds as graphs, we preserve spatial relations and propagate information effectively, enabling the prediction of affordances and symbols of complex structures. Graph Neural Networks (GNNs) are utilized to learn representations of these structures and their relations. MOGAN and MOGSN were tested on tasks involving convex and concave objects, showing successful affordance learning and symbol exploration. The MOGAN model was validated through successful plan generation in both simulation and real-world settings. The MOGSN model demonstrated the emergence of meaningful symbols in compound objects, leading to successful symbolic plannings.
Benzer Tezler
- Multi-object tracking by associations on temporal window
Geçici pencerede çağrışımlara dayalı çoklu nesne takibi
GÜLTEKİN GÜNDÜZ
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TANKUT ACARMAN
- Graph-based hierarchical tracklet merge for multiple object tracking
Çoklu hedef takibi için çizge tabanlı hiyerarşik iz birleştirme
HALİL ÇAĞRI BİLGİ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH AYDIN ALATAN
- A multi-modal discrete-event simulation model for military deployment
Askerî birliklerin intikali için çok-modlu bir kesikli olay simülasyonu
UĞUR ZİYA YILDIRIM
Doktora
İngilizce
2009
Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiEndüstri Mühendisliği Bölümü
PROF. İHSAN SABUNCUOĞLU
- Dense depth map estimation for object segmentation in multi-view video
Çok görüntülü videoda nesne bölütlemesi için sık derinlik haritası kestirimi
CEVAHİR ÇIĞLA
Yüksek Lisans
İngilizce
2007
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. A. AYDIN ALATAN
- Object oriented paradigm for optimization model enhancement
Başlık çevirisi yok
SELÇUK CİMTALAY
Doktora
İngilizce
2000
Makine MühendisliğiGeorgia Institute of TechnologyDR. ROBERT E. FULTON
DR. RUSSEL PEAK