Deep learning custom object detection, segmentation and classification using mask R-CNN for newspapers
Derin öğrenme ile gazeteler için mask R-CNN kullanarak özel nesne tespiti, segmentasyon ve sınıflandırma
- Tez No: 937389
- Danışmanlar: DR. IHAB ELAFF
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Üsküdar Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 48
Özet
Gazete arşivlerinin dijitalleştirilmesi, değerli tarihî bilgilerin korunması ve erişimi açısından büyük önem taşımaktadır. Ancak, gazetelerin karmaşık düzenleri ve çeşitli stilleri, etkili veri çıkarımı konusunda önemli engeller oluşturmaktadır. Geleneksel optik karakter tanıma yöntemleri, genellikle başlıklar, reklamlar ve diğer makale dışı içerikler gibi çevresel unsurlardan bireysel makaleleri doğru bir şekilde ayırt edemez. Bu araştırma, gazete düzenleri için özel nesne tespiti, segmentasyon ve sınıflandırmaya yönelik kapsamlı bir yaklaşımı tanıtmaktadır. Ekip, yüksek kaliteli bir veri seti oluşturmak için gazete görüntülerini metodik olarak topladı ve elle anotasyon yaptı. Daha sonra, çeşitli unsurları tanımak ve segmentlemek için Detectron2 çerçevesi içinde Mask R-CNN algoritmasını kullanarak bir model eğittiler. Bu unsurlar arasında başlıklar, haber makaleleri, reklamlar, karikatürler ve diğer bileşenler bulunmakta olup, bu sayede kesin içerik çıkarımı sağlanmaktadır. Eğitimli model, ayrı bir doğrulama veri seti kullanılarak titizlikle değerlendirildi ve çeşitli gazete unsurlarını tespit etme ve ayırmada yüksek doğruluğu ve güçlü yetenekleri sergiledi. Sonuçlar, geleneksel yöntemlere kıyasla önemli ilerlemeler göstererek, tarihî gazetelerin dijital korunması, aranması ve veri madenciliği için gelişmiş bir yol sunmaktadır. Bu araştırma, karmaşık gazete düzenlerinin otomatik analizi için ölçeklenebilir ve verimli bir çözüm sunarak, tarihî bilgilere daha iyi erişim sağlanması amacıyla gazete dijitalleştirme alanına değerli bir katkı sağlamaktadır
Özet (Çeviri)
digitizing newspaper archives is crucial for preserving and accessing valuable historical information. However, the intricate layouts and varied styles of newspapers present significant obstacles to effective data extraction. Traditional optical character recognition methods frequently fail to accurately distinguish individual articles from surrounding elements such as headers, advertisements, and other non-article content. This research introduces a comprehensive approach to custom object detection, segmentation, and classification for newspaper layouts. The team methodically collected and manually annotated newspaper images to create a high-quality dataset. They then trained a model using the Mask R-CNN algorithm within the Detectron2 framework to recognize and segment various elements, such as headers, news articles, advertisements, caricatures, and other components, enabling precise content extraction. The trained model is rigorously evaluated using a separate validation dataset, showcasing its high accuracy and robust capabilities in detecting and separating various newspaper elements. The results demonstrate substantial advancements over conventional methods, paving the way for enhanced digital preservation, search, and data mining of historical newspapers. This research represents a valuable contribution to the field of newspaper digitization, providing a scalable and efficient solution for the automated analysis of complex newspaper layouts, ultimately enabling better access to historical information.
Benzer Tezler
- Deep learning-based detection and segmentation for 3D perception of the urban world
Kentsel dünyanın 3D algısı için derin öğrenme tabanlı tespit ve segmentasyon
BAHADIR AKIN AKGÜL
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL BURAK PARLAK
- Distal radius fracture detection: a comparison of computer vision algorithms
Distal radius kırığı tespiti: Bilgisayar görüsü algoritmalarının karşılaştırılması
BURCU SELÇUK
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYeditepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TACHA SERIF
- Automated learning rate search using batch-level cross-validation
Yığın seviyesinde çapraz geçerleme kullanarak otomatik öğrenme oranı araması
DUYGU KABAKCI
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRE AKBAŞ
- U-Net ağı kullanılarak kamufle askeri unsurların tespiti
Detection of camouflaged military elements using the U-Net network
MURAT ALTUN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN GÜRÜLER
- Segment anything model for crater detection on the lunar surface
Ay yüzeyinde krater tespiti için segment anythıng modeli
ISSA DAHDOULI
Yüksek Lisans
İngilizce
2025
Astronomi ve Uzay BilimleriBEYKOZ ÜNİVERSİTESİBilgisayar Mühendisliği Ana Bilim Dalı
Dr. ÖZLEM FEYZA ERKAN