Geri Dön

Çok etiketli sınıflandırma problemleri için makine öğrenimi yaklaşımları

Machine learning approaches for multilabel classification problems

  1. Tez No: 944089
  2. Yazar: FATIMA ZEHRA ÜNAL
  3. Danışmanlar: PROF. DR. MEHMET SERDAR GÜZEL
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 103

Özet

Çok etiketli sınıflandırma çalışmalarından biri de film türlerinin otomatik olarak tahmin edilmesidir. Bu tez çalışmasındaki temel amaç çok etiketli sınıflandırma problemlerinin çözümü için görüntü ve metin verilerini kullanarak derin öğrenme modellerinin eğitilmesi, test ve analiz edilerek yüksek doğrulukta sonuç üreten bir modelin elde edilmesidir. Bu kapsamda film özetleri ve posterleri kullanılarak tür tahmini çalışması yapılmıştır. Çalışma için öncelikle görüntü tabanlı sınıflandırma modeli ve metin tabanlı sınıflandırma modeli ayrı ayrı oluşturulup değerlendirilmiştir. Görüntü tabanlı sınıflandırma modeli için VGG16, ResNet, DenseNet, Inception, MobileNet ve ConvNeXt olmak üzere altı adet önceden eğitilmiş modeller başlangıç noktası olarak seçilerek transfer öğrenimi ve ince ayar yöntemleri kullanılarak tür tahmini problemine adapte edilmiştir. Metin tabanlı sınıflandırma modeli için Doğal Dil İşleme uygulamalarında kullanılan yeni nesil DistilBERT ağı kendi problemimize uygun hale getirilmiştir. İki farklı modelden elde edilen özellikleri XGBoost algoritması ile birleştiren özgün çok modlu derin hibrit bir model önerilmiştir. Model performansını artırmak için Grid Search optimizasyon algoritması kullanılmıştır. Model performansları doğruluk, kayıp, Hamming kaybı, F1-skor, kesinlik, duyarlılık ve AUC ROC metriklerine göre değerlendirilmiş ve kaydedilmiştir. Önerilen her 3 model IMDB web sitesi üzerinden elde edilen veri seti üzerinde eğitilip test edilmiştir. Sonuçlar değerlendirildiğinde metin tabanlı modelin, görüntü tabanlı modele göre daha başarılı, hibrit modelin ise her iki modelden de daha başarılı bir performans sergilediği görülmüştür. Deneyler sonucunda, farklı modellerden elde edilen özelliklerin birbirini tamamlayarak sınıflandırma performansını artırdığı görülmüştür. Tez çalışması sonucunda çok etiketli film türü tahmini için bilgisayarlarla görme, doğal dil işleme ve makine öğrenimi alanlarını birleştiren özgün ve başarılı bir araştırma gerçekleştirilmiştir.

Özet (Çeviri)

One of the multilabel classification studies is the automatic prediction of movie genres. The main goal in this thesis is to train, test and analyze deep learning models using image and text data to solve multilabel classification problems and to obtain a model that produces high accuracy results. In this context, a genre prediction study was conducted using movie summaries and posters. First of all, the image based classification model and the text based classification model were created and evaluated separately for the study. For the image based classification model, six state-of-the-art pre-trained models, namely VGG16, ResNet, DenseNet, Inception, MobileNet and ConvNeXt, were selected as the starting point and adapted to the genre prediction problem using transfer learning and fine-tuning methods. For the text-based classification model, the new generation DistilBERT network used in Natural Language Processing applications was adapted to our problem. A novel multi-modal deep hybrid model combining features obtained from two different models with the XGBoost algorithm was proposed. The Grid Search optimization algorithm was used to increase model performance. Model performances were evaluated and recorded according to accuracy, loss, Hamming loss, F1-score, precision, recall and AUC ROC metrics. All 3 proposed models were trained and tested on the dataset obtained from the IMDB website. When the results were evaluated, it was seen that the text based model was more successful than the image based model, and the hybrid model was more successful than both models. As a result of the experiments, it was seen that the features obtained from different models complemented each other and increased the classification performance. As a result of the presrent thesis study, an original and successful study was carried out combining the fields of computer vision, natural language processing and machine learning for multilabel movie genre prediction.

Benzer Tezler

  1. Ensemble based feature selection with hybrid model

    Hibrit modeli ile topluluk temelli öznitelik seçimi

    CEYLAN DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İZZET GÖKSEL

    DOÇ. DR. SÜREYYA AKYÜZ

  2. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  3. Elektrikli araçların kullanıcı tercihlerine göre sınıflandırılması: hibrit bir yaklaşım

    Classification of electric vehicles based on user preference: a hybrid approach

    MEHMET DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UMUT ASAN

  4. Simplifying balance sheet adjustment process in commercial loan applications using machine learning methods

    Ticari kredi başvurularında şirket bilançoları üzerinde gerçekleştirilen aktarma-arındırma işlemlerinin makine öğrenmesi yöntemleri kullanılarak basitleştirilmesi

    İBRAHİM TOZLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE GÜNDÜZ ÖĞÜDÜCÜ

  5. New proposed methods for synthetic minority over-sampling technique

    Sentetik azınlık aşırı örnekleme tekniği için yeni önerilen yöntemler

    HAKAN KORUL

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Veri Mühendisliği ve İş Analitiği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN