Stroke-based sketched symbol generation and segmentation
Çizgi tabanlı elle çizilmiş sembol üretimi ve segmentasyonu
- Tez No: 530196
- Danışmanlar: DOÇ. DR. TEVFİK METİN SEZGİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 51
Özet
Elle çizilmiş nesneler genellikle çok sayıda anlamlı alt kısımdan oluşur. Örneğin bir çöp adam; bir kafa, bir gövde ve bacak ile kol çiftlerinden oluşur. Elle çizilmiş bir sembolü bu alt parçalara bölme işlemine sembol segmentasyonu denir. Diğer yandan, alt parçaları çizerek bir anlamlı sembole dönüştürme sürecine sembol üretimi denir. Bu iki prosedür birbiriyle ilişkili olmasına rağmen, önceki tüm çabalar, ya segmentasyon ya da üretim problemi üzerine odaklanmıştır. Bu tezde, StrokeRNN adlı Değişimsel Oto Kodlayıcı (DOK) mimarisine dayanan çizim üretme modelini öneriyoruz ve bu modeli, çizimdeki anlamlı alt parçaları tanımaya yönelik kullanışlı hale getiriyoruz. Mevcut generatif sistemler elle çizilmiş tam objeleri modellerken, StrokeRNN ise onların bileşen çizgilerini modeller. Bu nedenle, önceki modellerden farklı olarak StrokeRNN, tek bir sınıf ile eğitildiği takdirde bile, birçok değişik kategoriden çizimler üretebilir. Çizimleri alt parçalara bölmek için halihazır tekniklerde kullanılan piksel resim formatı yerine daha az hafızaya ihtiyaç duyan vektör formatını kullanıyoruz. Segmentasyon modelimiz, StrokeRNN tarafından oluşturulan kodlamaya dayanarak çizgileri sınıflandıran basit ama güçlü bir yapay sinir ağıdır. Mevcut veri kümesiyle yapılan deneylerde, bizim segmentasyon modelimizin var olan metodolojiye göre daha iyi bir başarı sergiliyor. Üstelik, alt parçalarını yeni etiketlediğimiz çizim veri setimizde yapılan geniş çaplı değerlendirmeler, yapay sinir ağımızın en iyi referans modele kıyasla daha iyi bir performans sergilediğini gösteriyor. Etikelenmiş veri kümemizi kamuya açıyoruz.
Özet (Çeviri)
Hand-drawn objects usually consist of multiple semantically meaningful parts. For example, a stick figure consists of a head, a torso, and pairs of legs and arms. The process of breaking a hand-drawn symbol into those subparts is called symbol segmentation. On the other hand, the process of drawing subparts and unifying them into a single entity is called symbol generation. Despite the fact that these two procedures are interrelated, all previous endeavors focused on a single task, either segmentation or generation. In this thesis, we propose a StrokeRNN that is a generative model based on a Variational Auto-Encoder (VAE) architecture and we extend it to recognize semantically meaningful components. While existing generative systems model complete hand-drawn objects, the StrokeRNN models their constituent strokes. Hence, in contrast to prior frameworks, the StrokeRNN is capable of drawing multiple symbol categories even when trained on a single class. To segment drawings, we adopt a memory efficient vector representation of symbols instead of the raster image format used by existing techniques. Our segmentation model is simple yet powerful neural network, it classifies stroke-level components based on the encoding generated by the StrokeRNN. Experiments show that our segmentation accuracies surpass exist- ing methodologies on the available state of the art dataset. Furthermore, extensive evaluations on our newly annotated dataset demonstrate that our neural network obtains significantly better scores as compared to the best baseline model. We release our dataset to the community.
Benzer Tezler
- El çizimi diyagramların modifiye destek vektör makineleri ve grid tabanlı su havzası ile tanınması
Recognition of hand drawn diagrams using modified support vector machines and grid based watershed
ORHAN NOORULDEEN
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ OĞUZ ALTUN
- Enhancing scene sketch understanding through a dual-network: Visio-temporal segmentation and context-aware sketch recognition
Çift ağ ile sahne çizimi anlamayı geliştirme: Görsel-zamansal bölütleme ve bağlam farkındalıklı çizim tanıma
ALEYNA KÜTÜK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. TEVFİK METİN SEZGİN
- A unified framework for stroke fragmentation and sketch recognition
Çizim vuruşlarının bölütlenmesi ve çizim tanıma için bütünleşik bir yaklaşım
RECEP SİNAN TÜMEN
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. TEVFİK METİN SEZGİN
- A depth perception aware pen-based 3D sketching system
Derinlik algısı vurgusu içeren, grafik tablet tabanlı 3 boyutlu çizim sistemi
CANSIN YILDIZ
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TOLGA ÇAPIN
- Vuruş temelli sporlarda kullanılan etkileşimli dayanım sistemi yazılımının geliştirilmesi
Development of interactive strength system software used in stroke based sports
OĞUZHAN KİLİM
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSMAİL SERKAN ÜNCÜ