Geri Dön

Görüntü başlıklama yöntemi ile ürün görüntülerine uygun başlıkların üretilmesi

Generating titles for product images with an image captioning technique

  1. Tez No: 667939
  2. Yazar: BİRKAN ATICI
  3. Danışmanlar: DOÇ. DR. SEVİNÇ İLHAN OMURCA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 73

Özet

Teknolojik gelişmelerle birlikte insanların ürettikleri veri miktarında oldukça artış görülmektedir. Artan veri miktarı ve hesaplama teknolojilerindeki gelişmelerin sonucunda ise derin öğrenme çalışmaları son yıllarda hız kazanmıştır. Bazı problemlerde, geleneksel makine öğrenmesi tekniklerinin yetersiz ya da fazla başarı gösterememesi nedeniyle derin öğrenme teknikleri bu alanlarda önem kazanmıştır. Bu alanlardan birisi de görüntü başlıklama çalışmalarıdır. Görüntü başlıklama, görüntü içerisindeki obje, sahne ve olayı anlamlandırıp doğal dile otomatik olarak aktarmayı sağlayan bir çalışma alanıdır. Literatürde bu çalışmalar oldukça zorlu bir problem olarak görülmektedir. Bunun en önemli nedeni ise, görüntü işleme ve doğal dil işleme tekniklerinin bir arada kullanılıyor olmasıdır. Diğer bir nedeni ise bu çalışmalar için kullanılacak veri kümesinin yetersiz kalmasıdır. Görüntü başlıklama çalışmaları, derin öğrenme teknikleri öncesinde geleneksel makine öğrenmesiyle, şablon ve getirme tabanlı olarak yapılmaktaydı. Ancak bu teknikler oldukça kısıtlı ve görüntüyü açıklamakta yetersiz kalmaktaydı. CNN ve LSTM gibi derin öğrenme teknikleri ile yapılan bu çalışmalar model başarısını oldukça arttırmıştır. Bu çalışmada, sahibinden.com sitesindeki ürün ilanların görüntü-başlık ikili verileriyle, ürün resimlerine uygun olacak başlıkların çıkartılması amaçlanmıştır. Derin öğrenme yöntemleri kullanılarak yapılan bu çalışmada, yaklaşık 1,8 milyon görüntü-başlık verisi ile eğitim gerçekleştirilmiştir. BLUE, METEOR ve CIDEr skor başarım ölçütleri ile değerlendirilen çalışmamızda oldukça başarılı sayılabilecek sonuçlar elde edilmiştir.

Özet (Çeviri)

Recently, with evolution of technology, there has been a significant increase in the amount of data produced by people. As a result of the increasing amount of data and developments in computing technologies, deep learning studies have gained momentum in recent years. In some problems, deep learning techniques have gained importance due to the insufficient results of traditional machine learning techniques. One of these areas is image captioning studies. Image captioning studies provide that make sense of the object, scene and action in the image and generate automatically title of the image. These studies are considered challenging problem in the literature. One of the most important reasons why it is seen as challenging is that uses image processing and natural language processing techniques together. Another reason is that the dataset is not sufficient for model training. Before the deep learning techniques, these studies were done with traditional machine learning techniques such as template and retrieval based methods. But these traditional techniques are very limited and insufficient to fully define the image. With the deep learning techniques, the success of these studies has increased. This study aimed to generate titles that will be suitable for the product images with the image - title pair of the product classified ads on sahibinden.com website. The model developed in this study by using deep learning methods, approximately 1.8 million image-title pair were used. The deep learning model, which was evaluated with the BLUE, METEOR and CIDEr score performance metrics, achieved results that could be considered successful.

Benzer Tezler

  1. Çoklu cevap yüzeylerinin optimizasyonu için doğrusal olmayan bir model önerisi ve ekmek üretim sürecine uygulanması

    A non-linear model proposal for multi-response surface optimization and application to bread making process

    ALİ İHSAN BOYACI

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. RAMAZAN EVREN

  2. Bilgisayar ve internet destekli uzaktan eğitim programlarının tasarım, geliştirme ve değerlendirme aşamaları (SUZEP örneği)

    Design, development and evaluating stages of computer and internet supported distance education program (on the model of SUZEP)

    BİROL GÜLNAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Radyo-TelevizyonSelçuk Üniversitesi

    Radyo Televizyon Ana Bilim Dalı

    PROF.DR. AHMET HALUK YÜKSEL

  3. Teknoloji çağının gerekleri çerçevesinde fotoğraf sanatının görsel anlatım ögesi olarak afiş tasarım çalışmalarında kullanılması

    As a part of reguirements of technology age using photography arts as a visual expressing item

    İBRAHİM YALÇIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Güzel SanatlarOndokuz Mayıs Üniversitesi

    Güzel Sanatlar Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. TARIK YAZAR

  4. Sistemli mimari tasarım sürecinde üretken bir yapay yardımcı önerisi

    Proposal for a productive artificial aid in the systematic architectural design process

    BETÜL ŞEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    PROF. DR. YÜKSEL DEMİR

  5. Synthesis and characterization of strontium aluminate based nanophospors

    Nano boyutta stronsiyum aluminat esaslı fosfor sentezi ve karakterizasyonu

    MEHMET DURMUŞ ÇALIŞIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    Nanobilim ve Nanomühendislik Ana Bilim Dalı

    YRD. DOÇ. DR. NURİ SOLAK