Geri Dön

Multi-object graph symbol network: Goal-oriented planning through learned compound object symbols

Çok nesneli çizge sembol ağı: Öğrenilmiş bileşik nesne sembolleri aracılığıyla hedef odaklı planlama

  1. Tez No: 880237
  2. Yazar: GÜLSÜM TUBA ÇİBUK GİRGİN
  3. Danışmanlar: DOÇ. DR. EMRE UĞUR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 87

Özet

Robotikte nesnelerin otonom montajı ve demontajı genellikle politika öğrenme yöntemlerine ve sembolik planlayıcılara dayanır. Ancak bu yaklaşımlar, genellemeyi sınırlayan büyük miktarda veri ve uzman tanımlı sembollere duyulan ihtiyaç gibi önemli zorluklarla karşı karşıyadır. Çevre tarafından sağlanan potansiyel eylemleri ifade eden olanaklar kavramı, aktif keşif açısından robotik alanında yaygın olarak çalışılmış ve gözetim ihtiyacını çözmüştür. Benzer şekilde, üst düzey sembol keşfi, üst düzey görevler için sembolleri öğrenmek ve sembolik planlayıcılara dönüştürmek için kapsamlı bir şekilde çalışılmıştır. Tek veya eşleştirilmiş nesne etkileşimlerine odaklanan önceki çalışmaların aksine, çalışmamız çeşitli boyutlara sahip bileşik nesnelerin olanaklarını ve sembollerini ele almaktadır. Çalışmamız iki yeni model önermektedir: bileşik nesnelerin olanaklarını öğrenmek için Çok Nesneli Çizge Uygunluk Ağı (MOGAN) ve etki tahminleri yoluyla tek ve bileşik nesnelerin sembollerini keşfetmek için Çok Nesneli Çizge Sembol Ağı (MOGSN). Bileşikleri grafikler olarak temsil ederek, uzamsal ilişkileri koruyor ve bilgiyi etkili bir şekilde yayarak karmaşık yapıların olanaklarının ve sembollerinin tahmin edilmesini sağlıyoruz. Bu yapıların ve ilişkilerinin temsillerini öğrenmek için Çizge Sinir Ağları (GNN'ler) kullanılmaktadır. Sonuçlarımız önerilen modellerin etkinliğini göstermektedir. MOGAN ve MOGSN, dışbükey ve içbükey nesneleri içeren görevler üzerinde test edilmiş ve başarılı uygunluk öğrenimi ve sembol keşfi göstermiştir. MOGAN modeli hem simülasyon hem de gerçek dünya ortamlarında başarılı plan üretimi ile doğrulanmıştır. MOGSN modeli, bileşik nesnelerde anlamlı sembollerin ortaya çıktığını ve başarılı sembolik planlamalara yol açtığını göstermiştir.

Özet (Çeviri)

The assembly and disassembly of objects in robotics often relies on policy learning methods and symbolic planners. However, these approaches face significant challenges, such as the need for large amounts of data and expert-defined symbols, which limit their generalizability. The concept of affordances, which refer to the potential actions provided by the environment, widely studied in robotics domain in the aspect of active exploration, solving the need for supervision. Similarly, high-level symbol exploration has been extensively studied for learning and transforming symbols into symbolic planners for high-level tasks. Unlike previous works that focus on single or paired object interactions, our study addresses the affordances and symbols of compound objects with varying shapes and sizes. Our study proposes two novel models: the Multi-Object Graph Affordance Network (MOGAN) for learning affordances of compound objects, and the Multi-Object Graph Symbol Network (MOGSN) for exploring symbols of single and compound objects through effect predictions. By representing the compounds as graphs, we preserve spatial relations and propagate information effectively, enabling the prediction of affordances and symbols of complex structures. Graph Neural Networks (GNNs) are utilized to learn representations of these structures and their relations. MOGAN and MOGSN were tested on tasks involving convex and concave objects, showing successful affordance learning and symbol exploration. The MOGAN model was validated through successful plan generation in both simulation and real-world settings. The MOGSN model demonstrated the emergence of meaningful symbols in compound objects, leading to successful symbolic plannings.

Benzer Tezler

  1. Multi-object tracking by associations on temporal window

    Geçici pencerede çağrışımlara dayalı çoklu nesne takibi

    GÜLTEKİN GÜNDÜZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TANKUT ACARMAN

  2. Graph-based hierarchical tracklet merge for multiple object tracking

    Çoklu hedef takibi için çizge tabanlı hiyerarşik iz birleştirme

    HALİL ÇAĞRI BİLGİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDULLAH AYDIN ALATAN

  3. A multi-modal discrete-event simulation model for military deployment

    Askerî birliklerin intikali için çok-modlu bir kesikli olay simülasyonu

    UĞUR ZİYA YILDIRIM

    Doktora

    İngilizce

    İngilizce

    2009

    Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Endüstri Mühendisliği Bölümü

    PROF. İHSAN SABUNCUOĞLU

  4. Dense depth map estimation for object segmentation in multi-view video

    Çok görüntülü videoda nesne bölütlemesi için sık derinlik haritası kestirimi

    CEVAHİR ÇIĞLA

    Yüksek Lisans

    İngilizce

    İngilizce

    2007

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. A. AYDIN ALATAN

  5. Object oriented paradigm for optimization model enhancement

    Başlık çevirisi yok

    SELÇUK CİMTALAY

    Doktora

    İngilizce

    İngilizce

    2000

    Makine MühendisliğiGeorgia Institute of Technology

    DR. ROBERT E. FULTON

    DR. RUSSEL PEAK