Geri Dön

Movie genre prediction from subtitle using deep learning

Derin öğrenme yöntemiyle alt yazıdan film kategorisi tahmin etme

  1. Tez No: 617164
  2. Yazar: MÜCAHİT BÜYÜKYILMAZ
  3. Danışmanlar: YRD. DOÇ. DR. AHMET ERCAN TOPCU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 53

Özet

Günümüzde, büyük veri çağında, makina öğrenmesi farklı verileri kullanarak doğru tahminler yapmada önemli bir rol oynamaktadır. İnsanların ilgili verileri kullanarak diğer veri kaynakları ile doğru veri ilişkilerini bulması gerekir. Altyazıları kullanarak film türlerini tahmin etme ve kategorilere ayırma bu alanlardan biridir. Diğer film tahmin yaklaşımları sorunu çözmek için farklı veri modelleri kullanır. Bu tez, derin öğrenme yöntemlerini kullanarak altyazı dosyalarından film türünü tahmin etmeyi amaçlamaktadır. Araştırmada kullanılan veri seti IMDb ve OpenSubtitle web sitelerinden elde edilmiştir. Bu veri kümesi, film/dizi ye ait XML biçimindeki altyazı dosyaları ve ilgili film/dizinin kategorilerini içerir. Altyazı dosyaları ön işleme tabi tutularak XML içerisindeki“alt yazılar”ayrıştırılarak basılamayan karakterler temizlendi. Dönüştürülen her bir alt yaz 100.000 boyutlu vektöre dönüştürüldü. İşlenen veri setine dayalı geliştirilen LSTM derin öğrenme modeli, 5 katlı çapraz doğrulama tekniği ile test edilmiş ve sonuçlar Area Under the ROC Curve (AUC) ve Hamming Loss gibi farklı yöntemlerle ölçülmüş ve sunulmuştur. Önerilen model % 93.97 acurracy, 0.2392 Exact Match Score ve 0.0602 Hamming Loss doğruluk oranları ile sonuçlandı. Bu çalışmada kullanılan model, derin öğrenme teknikleri kullanılarak, film türü için yüksek bir tahmin oranının elde edildiğini göstermektedir.

Özet (Çeviri)

Nowadays, in the era of big data, prediction plays an important role in finding correct estimations about related data. People need to find correct data relationships from other data resources by using other related data. The movie genre is one of the areas to predict and categorize movies using subtitles. Other movie prediction approaches use different data models to solve the problem. This thesis aims to predict movie genre from subtitle files by using deep learning methods. The dataset used in the study was obtained from the IMDb and OpenSubtitle websites. This dataset contains subtitle files in XML format for different movie/series and corresponding movie categories. The subtitle files were preprocessed with a conversion technique and each subtitle was converted to 100.000 dimensional vector. The LSTM deep learning model developed in this thesis based on the preprocessed dataset was tested with 5 fold cross-validation technique and the results were measured and presented with different methods such as Area Under the ROC Curve (AUC) and Hamming loss. The suggested model resulted in an accuracy rate of 93.97%, 0.2392 Exact Match Score and 0.0602 Hamming Loss. The model employed in this work shows that a high prediction ratio for the movie genre is obtained by using deep learning techniques.

Benzer Tezler

  1. Emotion prediction in movies using visual features

    Filmlerde görsel özellikler kullanılarak duygu tahmini

    FATİH ASLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAZIM KEMAL EKENEL

  2. IMDB movie rating prediction with feature extraction and machine learning methods

    Özellik çıkarımı ve makine öğrenimi ile IMDB film puanı tahmini

    AHMET FATİH DERELİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri MühendisliğiMarmara Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. SENİYE ÜMİT FIRAT

    YRD. DOÇ. DR. CANAN AĞLAN

  3. Bilim kurgu sinemasında iç mekân tasarımını şekillendiren karakter-mekân bütünlüğünün Star Wars filmleri üzerinden incelenmesi

    Analysis of the character-space integrity that shapes the interior space design in science fiction cinema through Star Wars film

    SELVA BAŞÇI

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    MimarlıkMimar Sinan Güzel Sanatlar Üniversitesi

    İç Mimarlık Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL EMRE KAVUT

  4. Cyberpunk gelecek öngörülerinde film örneklemi üzerinden mekân gösterimleri ve tasarım yaklaşımının incelenmesi

    Investigation of space impression and design approach by film sample in cyberpunk future vision

    SÜPHAN KAAN ÇİFTCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İç Mimari ve DekorasyonKocaeli Üniversitesi

    İç Mimarlık Ana Sanat Dalı

    DOÇ. DR. SİBEL DEMİRARSLAN

  5. Kültürel ve zihinsel yapılanmanın Türk melodram sineması üzerindeki etkileri

    The effects of cultural and intellectual structuring on Turkish melodramatic films

    DİLEK TUNALI

    Doktora

    Türkçe

    Türkçe

    2005

    Sahne ve Görüntü SanatlarıDokuz Eylül Üniversitesi

    Sinema Televizyon Ana Bilim Dalı

    PROF.DR. OĞUZ ADANIR