Empowering multimodal multimedia information retrieval through semantic deep learning
Semantik derin öğrenme yoluyla multimodal multimedya bilgi erişimini güçlendirme
- Tez No: 859205
- Danışmanlar: PROF. DR. MEHMET HALİT SEYFULLAH OĞUZTÜZÜN, PROF. DR. ADNAN YAZICI
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 104
Özet
Multimedya verileri, ses, görsel ve metin de dahil olmak üzere çeşitli yöntemleri kapsar ve bu yöntemler, multimedya kaynaklarından anlamsal bilgileri çıkarmak ve almak için bu yöntemlerden yararlanabilecek sağlam erişim yöntemlerinin geliştirilmesini gerektirir. Bu çalışma, oldukça ölçeklenebilir ve çok yönlü, uçtan uca çok modlu bir multimedya bilgi erişim çerçevesi sunmaktadır. Bu sistemin temel gücü, derin sinir modellerinin kullanımıyla elde edilen, bireysel yöntemler içindeki ve farklı yöntemler arasındaki anlamsal bağlamları öğrenme kapasitesinde yatmaktadır. Bu modeller, sorgu kombinasyonları ve sorgu günlüklerinden elde edilen ilgili çekimler kullanılarak eğitilir. Bu çerçevenin ayırt edici özelliklerinden biri, daha önce karşılaşılmamış videoları temsil eden çekim şablonları oluşturabilmesidir. Geri alma performansını artırmak amacıyla sistem, bu şablonlara benzer çekimleri almak için kümeleme teknikleri kullanır. Çok modlu konseptlerdeki doğal belirsizliği gidermek için değiştirilmiş kayıp fonksiyonuyla bulanık kümelemenin geliştirilmiş bir çeşidi uygulanır. Yaklaşımımız, gelişmiş yeniden sıralama için Siyam ağlarını dahil ederek basit küme tabanlı sıralamanın ötesine geçiyor ve böylece erişim hassasiyetini artırıyor. Ayrıca OWA operatörünü içeren bir füzyon yöntemi tanıtılmıştır. Bu yöntem, birden fazla erişim sistemi tarafından üretilen sıralanmış listeleri bir araya getirmek için çeşitli önlemler kullanır. Önerilen yaklaşım, çerçevenin uyarlanabilirliğini ve ölçeklenebilirliğini sağlayarak üç farklı yöntemden özellikler çıkarmak için paralel işleme ve aktarım öğreniminden yararlanır. Etkinliğini değerlendirmek için sistem, yaygın olarak tanınan altı çok modlu veri kümesi üzerinde gerçekleştirilen deneyler aracılığıyla titizlikle değerlendirilir. Dikkat çekici bir şekilde, yaklaşımımız literatürde bu veri kümelerinin beşi üzerinde yapılan önceki çalışmalardan daha iyi performans göstermektedir. İstatistiksel testlerle desteklenen deneysel bulgular, önerilen yaklaşımın çok modlu multimedya bilgi erişimi alanında etkinliğini kesin olarak ortaya koymaktadır.
Özet (Çeviri)
Multimedia data encompasses various modalities, including audio, visual, and text, necessitating the development of robust retrieval methods capable of harnessing these modalities to extract and retrieve semantic information from multimedia sources. This study presents a highly scalable and versatile end-to-end multimodal multimedia information retrieval framework. The core strength of this system lies in its capacity to learn semantic contexts within individual modalities and across different modalities, achieved through the utilization of deep neural models. These models are trained using combinations of queries and relevant shots obtained from query logs. One of the distinguishing features of this framework is its ability to create shot templates representing videos that have not been encountered previously. To enhance retrieval performance, the system employs clustering techniques to retrieve shots similar to these templates. An improved variant of fuzzy clustering with a modified loss function is applied to address the inherent uncertainty in multimodal concepts. Our approach goes beyond simple cluster-based ranking by incorporating Siamese networks for improved re-ranking, thereby enhancing retrieval precision. Additionally, a fusion method incorporating an OWA operator is introduced. This method employs various measures to aggregate ranked lists produced by multiple retrieval systems. The proposed approach leverages parallel processing and transfer learning to extract features from three distinct modalities, ensuring the adaptability and scalability of the framework. To assess its effectiveness, the system is rigorously evaluated through experiments conducted on six widely recognized multimodal datasets. Remarkably, our approach outperforms previous studies in the literature on five of these datasets. The experimental findings, substantiated by statistical tests, conclusively establish the effectiveness of the proposed approach in the field of multimodal multimedia information retrieval.
Benzer Tezler
- Afet tedarik zinciri yönetiminde stokastik, çok periyotlu, çok-modlu, çok malzemeli, iki-seviyeli yardım malzemesi dağıtım modeli
A two-stage stochastic, multi-period, multi-modal and multi-commodity model for the disaster-relief supply chain distribution and planning
ÇAĞLAR UTKU GÜLER
Doktora
Türkçe
2016
Endüstri ve Endüstri MühendisliğiHava Harp Okulu KomutanlığıEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MURAT ERMİŞ
- Empowering of Oromieh University female students in related to their sexual and reproductive health by peer education method
Urumiye Üniversitesi?nde kız öğrencileri akran eğitimi yöntemiyle cinsel ve üreme sağlığı konusunda güçlendirme
SOHEİLA RABİEİPOOR
Doktora
İngilizce
2011
HemşirelikHacettepe ÜniversitesiDoğum ve Kadın Hastalıkları Hemşireliği Ana Bilim Dalı
PROF. DR. LALE TAŞKIN
- Türkiye'de merkezden yereli güçlendirme çabası: Yerel Yönetimler Bakanlığı deneyimi
Empowering local governments from the centre in Turkey: The experience of Ministry of Local Governments
DAMLANUR TAT
Yüksek Lisans
Türkçe
2018
Kamu YönetimiHacettepe ÜniversitesiSiyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı
PROF. DR. UĞUR ÖMÜRGÖNÜLŞEN
- Empowering teamwork experience and skills in industrial design studio education through collaborative tools for task management and shared leadership
Görev yönetimi ve paylaşımlı liderlik için işbirliği araçlarıyla endüstriyel tasarım stüdyo eğitiminde ekip çalışması deneyimi ve becerilerini güçlendirmek
ITIR GÜNGÖR BONCUKÇU
Doktora
İngilizce
2022
Endüstri Ürünleri TasarımıOrta Doğu Teknik ÜniversitesiEndüstriyel Tasarım Ana Bilim Dalı
PROF. DR. ÇAĞLA DOĞAN
- Kırsal alanda kız çocuklarının sporla güçlendirilmesi: Eziler köyü örneği
Empowering girls in rural areas with sports: Example of Eziler village
KAYHAN TURAN
Yüksek Lisans
Türkçe
2023
SporPamukkale ÜniversitesiSporda Psiko-Sosyal Alanlar Ana Bilim Dalı
DOÇ. DR. YELİZ İLGAR DOĞAN