Geri Dön

Stroke-based sketched symbol generation and segmentation

Çizgi tabanlı elle çizilmiş sembol üretimi ve segmentasyonu

  1. Tez No: 530196
  2. Yazar: KURMANBEK KAIYRBEKOV
  3. Danışmanlar: DOÇ. DR. TEVFİK METİN SEZGİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 51

Özet

Elle çizilmiş nesneler genellikle çok sayıda anlamlı alt kısımdan oluşur. Örneğin bir çöp adam; bir kafa, bir gövde ve bacak ile kol çiftlerinden oluşur. Elle çizilmiş bir sembolü bu alt parçalara bölme işlemine sembol segmentasyonu denir. Diğer yandan, alt parçaları çizerek bir anlamlı sembole dönüştürme sürecine sembol üretimi denir. Bu iki prosedür birbiriyle ilişkili olmasına rağmen, önceki tüm çabalar, ya segmentasyon ya da üretim problemi üzerine odaklanmıştır. Bu tezde, StrokeRNN adlı Değişimsel Oto Kodlayıcı (DOK) mimarisine dayanan çizim üretme modelini öneriyoruz ve bu modeli, çizimdeki anlamlı alt parçaları tanımaya yönelik kullanışlı hale getiriyoruz. Mevcut generatif sistemler elle çizilmiş tam objeleri modellerken, StrokeRNN ise onların bileşen çizgilerini modeller. Bu nedenle, önceki modellerden farklı olarak StrokeRNN, tek bir sınıf ile eğitildiği takdirde bile, birçok değişik kategoriden çizimler üretebilir. Çizimleri alt parçalara bölmek için halihazır tekniklerde kullanılan piksel resim formatı yerine daha az hafızaya ihtiyaç duyan vektör formatını kullanıyoruz. Segmentasyon modelimiz, StrokeRNN tarafından oluşturulan kodlamaya dayanarak çizgileri sınıflandıran basit ama güçlü bir yapay sinir ağıdır. Mevcut veri kümesiyle yapılan deneylerde, bizim segmentasyon modelimizin var olan metodolojiye göre daha iyi bir başarı sergiliyor. Üstelik, alt parçalarını yeni etiketlediğimiz çizim veri setimizde yapılan geniş çaplı değerlendirmeler, yapay sinir ağımızın en iyi referans modele kıyasla daha iyi bir performans sergilediğini gösteriyor. Etikelenmiş veri kümemizi kamuya açıyoruz.

Özet (Çeviri)

Hand-drawn objects usually consist of multiple semantically meaningful parts. For example, a stick figure consists of a head, a torso, and pairs of legs and arms. The process of breaking a hand-drawn symbol into those subparts is called symbol segmentation. On the other hand, the process of drawing subparts and unifying them into a single entity is called symbol generation. Despite the fact that these two procedures are interrelated, all previous endeavors focused on a single task, either segmentation or generation. In this thesis, we propose a StrokeRNN that is a generative model based on a Variational Auto-Encoder (VAE) architecture and we extend it to recognize semantically meaningful components. While existing generative systems model complete hand-drawn objects, the StrokeRNN models their constituent strokes. Hence, in contrast to prior frameworks, the StrokeRNN is capable of drawing multiple symbol categories even when trained on a single class. To segment drawings, we adopt a memory efficient vector representation of symbols instead of the raster image format used by existing techniques. Our segmentation model is simple yet powerful neural network, it classifies stroke-level components based on the encoding generated by the StrokeRNN. Experiments show that our segmentation accuracies surpass exist- ing methodologies on the available state of the art dataset. Furthermore, extensive evaluations on our newly annotated dataset demonstrate that our neural network obtains significantly better scores as compared to the best baseline model. We release our dataset to the community.

Benzer Tezler

  1. El çizimi diyagramların modifiye destek vektör makineleri ve grid tabanlı su havzası ile tanınması

    Recognition of hand drawn diagrams using modified support vector machines and grid based watershed

    ORHAN NOORULDEEN

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ OĞUZ ALTUN

  2. Enhancing scene sketch understanding through a dual-network: Visio-temporal segmentation and context-aware sketch recognition

    Çift ağ ile sahne çizimi anlamayı geliştirme: Görsel-zamansal bölütleme ve bağlam farkındalıklı çizim tanıma

    ALEYNA KÜTÜK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. TEVFİK METİN SEZGİN

  3. A unified framework for stroke fragmentation and sketch recognition

    Çizim vuruşlarının bölütlenmesi ve çizim tanıma için bütünleşik bir yaklaşım

    RECEP SİNAN TÜMEN

    Doktora

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TEVFİK METİN SEZGİN

  4. A depth perception aware pen-based 3D sketching system

    Derinlik algısı vurgusu içeren, grafik tablet tabanlı 3 boyutlu çizim sistemi

    CANSIN YILDIZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. TOLGA ÇAPIN

  5. Vuruş temelli sporlarda kullanılan etkileşimli dayanım sistemi yazılımının geliştirilmesi

    Development of interactive strength system software used in stroke based sports

    OĞUZHAN KİLİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İSMAİL SERKAN ÜNCÜ