Geri Dön

Supervised learning for image search result diversification

Görüntü arama sonucu çeşitlendirmesi için denetimli öğrenme

  1. Tez No: 608984
  2. Yazar: BURAK GÖYNÜK
  3. Danışmanlar: DOÇ. DR. İSMAİL SENGÖR ALTINGÖVDE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Kullanıcı sorgularının belirsizliği ve internetteki verilerin boyutu nedeniyle, arama sonuçlarını çeşitlendirme yöntemleri son zamanlarda daha önemli hale geldi. Önceki çalışmalar çoğunlukla metin aramaya odaklanırken, görüntü verileri de insanların akıllı telefonlarıyla Instagram, Snapchat ve Facebook gibi sosyal medya uygulamalarıyla görüntü verilerini işleyip paylaşmaları gibi sebeplerden ötürü çok önemli hale gelmiştir. Bu nedenle, bu tezde, görüntü arama için sonuç çeşitlendirme problemine odaklanılmıştır. Bu amaçla, ilk katkımız olarak, metinsel veriler için önerilen denetimli öğrenme yaklaşımı R-LTR'yi benimsedik ve daha iyi çeşitlendirme için gereken görsel ve metinsel özellikler için ağırlıkların ayrı ayrı ayarlanmasına izin verecek şekilde değiştirdik. İkinci bir katkı olarak, sonucun sağlayabileceği gelecekteki çeşitlilik katkısı için bir üst limiti dikkate alan alternatif bir paradigma uygulayarak R-LTR'yi genişletiyoruz. PyTorch'un sinir ağı çerçevesini kullanarak R-LTR ve türevlerini kullanıyoruz ki bu, orijinal lineer formülasyonun ötesine geçmemizi sağlıyor. Son olarak, imaj çeşitlendirme sorununa en umut verici yaklaşımları bir araya getirmek için kolektif öğrenme metodunu uyguluyoruz. 153 sorgu ve 45K görüntü içeren bir veri seti kullanan deneylerimiz, uygulanan denetimli R-LTR algoritmasının, alt konu hatırlama ölçütü cinsinden çeşitli spesifik çeşitlendirme yaklaşımlarından önemli ölçüde daha iyi performans gösterdiğini ortaya çıkarmıştır. Ayrıca, burada önerilen bazı R-LTR varyantları, orijinal metottan daha üstündür ve %2.2'ye kadar ilave kazançlar sağlayabilmektedir.

Özet (Çeviri)

Due to ambiguity of user queries and growing size of data living on the internet, methods for diversifying search results have gained more importance lately. While earlier works mostly focus on text search, a similar need also exists for image data, which grows rapidly as people produce and share image data via their smartphones and social media applications such as Instagram, Snapchat, and Facebook. Therefore, in this thesis, we focus on the result diversification problem for image search. To this end, as our first contribution, we adopt R-LTR, a supervised learning approach that has been proposed for textual data and modify it to allow tuning the weights of visual and textual features separately, as would be required for better diversification. As a second contribution, we extend R-LTR by applying an alternative paradigm that takes into account an upperbound for the future diversity contribution that can be provided by the result being scored. We implement R-LTR and its variants using PyTorch's neural network framework, which enables us to go beyond the original linear formulation. Finally, we create an ensemble of the most promising approaches for the image diversification problem. Our experiments using a benchmark dataset with 153 queries and 45K images reveal that the adopted supervised algorithm, R-LTR, significantly outperforms various ad hoc diversification approaches in terms of the sub-topic recall metric. Furthermore, certain variants of R-LTR proposed here are superior to the original method and provide additional (relative) gains of up to 2.2%.

Benzer Tezler

  1. Soft morphological filter optimization using a genetic algorithm for noise elimination

    Genetik algoritmalar kullanılarak, resimler üzerindeki gürültüyü azaltma amaçlı bir soft morfolojik filtre optimizasyonu

    TÜRKER ERÇAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYeditepe Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    YRD. DOÇ. DR. ENDER ÖZCAN

  2. Deep feature transfer from deep learning models into machine learning algorithms to classify COVID-19 from chest X-ray images

    Göğüs röntgeni görüntülerinden COVID-19 sınıflandırması yapmak amacıyla derin öğrenme modellerinden makine öğrenmesi algoritmalarına derin öznitelik aktarımı

    OZAN GÜLDALİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÜL İNAN

  3. Uydu görüntü verisinin yapay sinir ağları ile sınıflandırılması

    Classification of satellite imagery data with artificial neural networks

    COŞKUN ÖZKAN

    Doktora

    Türkçe

    Türkçe

    2001

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Jeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı

    DOÇ.DR. FİLİZ SUNAR ERBEK

  4. Localized multiple kernel algorithms for machine learning

    Yapay öğrenme için yerel çoklu çekirdek algoritmaları

    MEHMET GÖNEN

    Doktora

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ETHEM ALPAYDIN

  5. A fast 3d flow field prediction around bluff bodies using deep learning

    Derin öğrenme kullanılarak küt cisimler etrafındaki 3 boyutlu akış alanının tahmini

    FARHAD NEMATI TAHER

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ABDUSSAMET SUBAŞI