Supervised learning for image search result diversification
Görüntü arama sonucu çeşitlendirmesi için denetimli öğrenme
- Tez No: 608984
- Danışmanlar: DOÇ. DR. İSMAİL SENGÖR ALTINGÖVDE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 85
Özet
Kullanıcı sorgularının belirsizliği ve internetteki verilerin boyutu nedeniyle, arama sonuçlarını çeşitlendirme yöntemleri son zamanlarda daha önemli hale geldi. Önceki çalışmalar çoğunlukla metin aramaya odaklanırken, görüntü verileri de insanların akıllı telefonlarıyla Instagram, Snapchat ve Facebook gibi sosyal medya uygulamalarıyla görüntü verilerini işleyip paylaşmaları gibi sebeplerden ötürü çok önemli hale gelmiştir. Bu nedenle, bu tezde, görüntü arama için sonuç çeşitlendirme problemine odaklanılmıştır. Bu amaçla, ilk katkımız olarak, metinsel veriler için önerilen denetimli öğrenme yaklaşımı R-LTR'yi benimsedik ve daha iyi çeşitlendirme için gereken görsel ve metinsel özellikler için ağırlıkların ayrı ayrı ayarlanmasına izin verecek şekilde değiştirdik. İkinci bir katkı olarak, sonucun sağlayabileceği gelecekteki çeşitlilik katkısı için bir üst limiti dikkate alan alternatif bir paradigma uygulayarak R-LTR'yi genişletiyoruz. PyTorch'un sinir ağı çerçevesini kullanarak R-LTR ve türevlerini kullanıyoruz ki bu, orijinal lineer formülasyonun ötesine geçmemizi sağlıyor. Son olarak, imaj çeşitlendirme sorununa en umut verici yaklaşımları bir araya getirmek için kolektif öğrenme metodunu uyguluyoruz. 153 sorgu ve 45K görüntü içeren bir veri seti kullanan deneylerimiz, uygulanan denetimli R-LTR algoritmasının, alt konu hatırlama ölçütü cinsinden çeşitli spesifik çeşitlendirme yaklaşımlarından önemli ölçüde daha iyi performans gösterdiğini ortaya çıkarmıştır. Ayrıca, burada önerilen bazı R-LTR varyantları, orijinal metottan daha üstündür ve %2.2'ye kadar ilave kazançlar sağlayabilmektedir.
Özet (Çeviri)
Due to ambiguity of user queries and growing size of data living on the internet, methods for diversifying search results have gained more importance lately. While earlier works mostly focus on text search, a similar need also exists for image data, which grows rapidly as people produce and share image data via their smartphones and social media applications such as Instagram, Snapchat, and Facebook. Therefore, in this thesis, we focus on the result diversification problem for image search. To this end, as our first contribution, we adopt R-LTR, a supervised learning approach that has been proposed for textual data and modify it to allow tuning the weights of visual and textual features separately, as would be required for better diversification. As a second contribution, we extend R-LTR by applying an alternative paradigm that takes into account an upperbound for the future diversity contribution that can be provided by the result being scored. We implement R-LTR and its variants using PyTorch's neural network framework, which enables us to go beyond the original linear formulation. Finally, we create an ensemble of the most promising approaches for the image diversification problem. Our experiments using a benchmark dataset with 153 queries and 45K images reveal that the adopted supervised algorithm, R-LTR, significantly outperforms various ad hoc diversification approaches in terms of the sub-topic recall metric. Furthermore, certain variants of R-LTR proposed here are superior to the original method and provide additional (relative) gains of up to 2.2%.
Benzer Tezler
- Soft morphological filter optimization using a genetic algorithm for noise elimination
Genetik algoritmalar kullanılarak, resimler üzerindeki gürültüyü azaltma amaçlı bir soft morfolojik filtre optimizasyonu
TÜRKER ERÇAL
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYeditepe ÜniversitesiBilgisayar Mühendisliği Bölümü
YRD. DOÇ. DR. ENDER ÖZCAN
- Deep feature transfer from deep learning models into machine learning algorithms to classify COVID-19 from chest X-ray images
Göğüs röntgeni görüntülerinden COVID-19 sınıflandırması yapmak amacıyla derin öğrenme modellerinden makine öğrenmesi algoritmalarına derin öznitelik aktarımı
OZAN GÜLDALİ
Yüksek Lisans
İngilizce
2021
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜL İNAN
- Uydu görüntü verisinin yapay sinir ağları ile sınıflandırılması
Classification of satellite imagery data with artificial neural networks
COŞKUN ÖZKAN
Doktora
Türkçe
2001
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiJeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı
DOÇ.DR. FİLİZ SUNAR ERBEK
- Localized multiple kernel algorithms for machine learning
Yapay öğrenme için yerel çoklu çekirdek algoritmaları
MEHMET GÖNEN
Doktora
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ETHEM ALPAYDIN
- A fast 3d flow field prediction around bluff bodies using deep learning
Derin öğrenme kullanılarak küt cisimler etrafındaki 3 boyutlu akış alanının tahmini
FARHAD NEMATI TAHER
Yüksek Lisans
İngilizce
2023
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DOÇ. DR. ABDUSSAMET SUBAŞI