Çok etiketli sınıflandırma problemleri için makine öğrenimi yaklaşımları
Machine learning approaches for multilabel classification problems
- Tez No: 944089
- Danışmanlar: PROF. DR. MEHMET SERDAR GÜZEL
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 103
Özet
Çok etiketli sınıflandırma çalışmalarından biri de film türlerinin otomatik olarak tahmin edilmesidir. Bu tez çalışmasındaki temel amaç çok etiketli sınıflandırma problemlerinin çözümü için görüntü ve metin verilerini kullanarak derin öğrenme modellerinin eğitilmesi, test ve analiz edilerek yüksek doğrulukta sonuç üreten bir modelin elde edilmesidir. Bu kapsamda film özetleri ve posterleri kullanılarak tür tahmini çalışması yapılmıştır. Çalışma için öncelikle görüntü tabanlı sınıflandırma modeli ve metin tabanlı sınıflandırma modeli ayrı ayrı oluşturulup değerlendirilmiştir. Görüntü tabanlı sınıflandırma modeli için VGG16, ResNet, DenseNet, Inception, MobileNet ve ConvNeXt olmak üzere altı adet önceden eğitilmiş modeller başlangıç noktası olarak seçilerek transfer öğrenimi ve ince ayar yöntemleri kullanılarak tür tahmini problemine adapte edilmiştir. Metin tabanlı sınıflandırma modeli için Doğal Dil İşleme uygulamalarında kullanılan yeni nesil DistilBERT ağı kendi problemimize uygun hale getirilmiştir. İki farklı modelden elde edilen özellikleri XGBoost algoritması ile birleştiren özgün çok modlu derin hibrit bir model önerilmiştir. Model performansını artırmak için Grid Search optimizasyon algoritması kullanılmıştır. Model performansları doğruluk, kayıp, Hamming kaybı, F1-skor, kesinlik, duyarlılık ve AUC ROC metriklerine göre değerlendirilmiş ve kaydedilmiştir. Önerilen her 3 model IMDB web sitesi üzerinden elde edilen veri seti üzerinde eğitilip test edilmiştir. Sonuçlar değerlendirildiğinde metin tabanlı modelin, görüntü tabanlı modele göre daha başarılı, hibrit modelin ise her iki modelden de daha başarılı bir performans sergilediği görülmüştür. Deneyler sonucunda, farklı modellerden elde edilen özelliklerin birbirini tamamlayarak sınıflandırma performansını artırdığı görülmüştür. Tez çalışması sonucunda çok etiketli film türü tahmini için bilgisayarlarla görme, doğal dil işleme ve makine öğrenimi alanlarını birleştiren özgün ve başarılı bir araştırma gerçekleştirilmiştir.
Özet (Çeviri)
One of the multilabel classification studies is the automatic prediction of movie genres. The main goal in this thesis is to train, test and analyze deep learning models using image and text data to solve multilabel classification problems and to obtain a model that produces high accuracy results. In this context, a genre prediction study was conducted using movie summaries and posters. First of all, the image based classification model and the text based classification model were created and evaluated separately for the study. For the image based classification model, six state-of-the-art pre-trained models, namely VGG16, ResNet, DenseNet, Inception, MobileNet and ConvNeXt, were selected as the starting point and adapted to the genre prediction problem using transfer learning and fine-tuning methods. For the text-based classification model, the new generation DistilBERT network used in Natural Language Processing applications was adapted to our problem. A novel multi-modal deep hybrid model combining features obtained from two different models with the XGBoost algorithm was proposed. The Grid Search optimization algorithm was used to increase model performance. Model performances were evaluated and recorded according to accuracy, loss, Hamming loss, F1-score, precision, recall and AUC ROC metrics. All 3 proposed models were trained and tested on the dataset obtained from the IMDB website. When the results were evaluated, it was seen that the text based model was more successful than the image based model, and the hybrid model was more successful than both models. As a result of the experiments, it was seen that the features obtained from different models complemented each other and increased the classification performance. As a result of the presrent thesis study, an original and successful study was carried out combining the fields of computer vision, natural language processing and machine learning for multilabel movie genre prediction.
Benzer Tezler
- Ensemble based feature selection with hybrid model
Hibrit modeli ile topluluk temelli öznitelik seçimi
CEYLAN DEMİR
Yüksek Lisans
İngilizce
2019
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İZZET GÖKSEL
DOÇ. DR. SÜREYYA AKYÜZ
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Elektrikli araçların kullanıcı tercihlerine göre sınıflandırılması: hibrit bir yaklaşım
Classification of electric vehicles based on user preference: a hybrid approach
MEHMET DEMİR
Yüksek Lisans
Türkçe
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. UMUT ASAN
- Simplifying balance sheet adjustment process in commercial loan applications using machine learning methods
Ticari kredi başvurularında şirket bilançoları üzerinde gerçekleştirilen aktarma-arındırma işlemlerinin makine öğrenmesi yöntemleri kullanılarak basitleştirilmesi
İBRAHİM TOZLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE GÜNDÜZ ÖĞÜDÜCÜ
- New proposed methods for synthetic minority over-sampling technique
Sentetik azınlık aşırı örnekleme tekniği için yeni önerilen yöntemler
HAKAN KORUL
Yüksek Lisans
İngilizce
2024
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiVeri Mühendisliği ve İş Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN