Movie genre prediction from subtitle using deep learning
Derin öğrenme yöntemiyle alt yazıdan film kategorisi tahmin etme
- Tez No: 617164
- Danışmanlar: YRD. DOÇ. DR. AHMET ERCAN TOPCU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 53
Özet
Günümüzde, büyük veri çağında, makina öğrenmesi farklı verileri kullanarak doğru tahminler yapmada önemli bir rol oynamaktadır. İnsanların ilgili verileri kullanarak diğer veri kaynakları ile doğru veri ilişkilerini bulması gerekir. Altyazıları kullanarak film türlerini tahmin etme ve kategorilere ayırma bu alanlardan biridir. Diğer film tahmin yaklaşımları sorunu çözmek için farklı veri modelleri kullanır. Bu tez, derin öğrenme yöntemlerini kullanarak altyazı dosyalarından film türünü tahmin etmeyi amaçlamaktadır. Araştırmada kullanılan veri seti IMDb ve OpenSubtitle web sitelerinden elde edilmiştir. Bu veri kümesi, film/dizi ye ait XML biçimindeki altyazı dosyaları ve ilgili film/dizinin kategorilerini içerir. Altyazı dosyaları ön işleme tabi tutularak XML içerisindeki“alt yazılar”ayrıştırılarak basılamayan karakterler temizlendi. Dönüştürülen her bir alt yaz 100.000 boyutlu vektöre dönüştürüldü. İşlenen veri setine dayalı geliştirilen LSTM derin öğrenme modeli, 5 katlı çapraz doğrulama tekniği ile test edilmiş ve sonuçlar Area Under the ROC Curve (AUC) ve Hamming Loss gibi farklı yöntemlerle ölçülmüş ve sunulmuştur. Önerilen model % 93.97 acurracy, 0.2392 Exact Match Score ve 0.0602 Hamming Loss doğruluk oranları ile sonuçlandı. Bu çalışmada kullanılan model, derin öğrenme teknikleri kullanılarak, film türü için yüksek bir tahmin oranının elde edildiğini göstermektedir.
Özet (Çeviri)
Nowadays, in the era of big data, prediction plays an important role in finding correct estimations about related data. People need to find correct data relationships from other data resources by using other related data. The movie genre is one of the areas to predict and categorize movies using subtitles. Other movie prediction approaches use different data models to solve the problem. This thesis aims to predict movie genre from subtitle files by using deep learning methods. The dataset used in the study was obtained from the IMDb and OpenSubtitle websites. This dataset contains subtitle files in XML format for different movie/series and corresponding movie categories. The subtitle files were preprocessed with a conversion technique and each subtitle was converted to 100.000 dimensional vector. The LSTM deep learning model developed in this thesis based on the preprocessed dataset was tested with 5 fold cross-validation technique and the results were measured and presented with different methods such as Area Under the ROC Curve (AUC) and Hamming loss. The suggested model resulted in an accuracy rate of 93.97%, 0.2392 Exact Match Score and 0.0602 Hamming Loss. The model employed in this work shows that a high prediction ratio for the movie genre is obtained by using deep learning techniques.
Benzer Tezler
- Emotion prediction in movies using visual features
Filmlerde görsel özellikler kullanılarak duygu tahmini
FATİH ASLAN
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAZIM KEMAL EKENEL
- IMDB movie rating prediction with feature extraction and machine learning methods
Özellik çıkarımı ve makine öğrenimi ile IMDB film puanı tahmini
AHMET FATİH DERELİ
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri MühendisliğiMarmara ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SENİYE ÜMİT FIRAT
YRD. DOÇ. DR. CANAN AĞLAN
- Bilim kurgu sinemasında iç mekân tasarımını şekillendiren karakter-mekân bütünlüğünün Star Wars filmleri üzerinden incelenmesi
Analysis of the character-space integrity that shapes the interior space design in science fiction cinema through Star Wars film
SELVA BAŞÇI
Yüksek Lisans
Türkçe
2020
MimarlıkMimar Sinan Güzel Sanatlar Üniversitesiİç Mimarlık Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL EMRE KAVUT
- Cyberpunk gelecek öngörülerinde film örneklemi üzerinden mekân gösterimleri ve tasarım yaklaşımının incelenmesi
Investigation of space impression and design approach by film sample in cyberpunk future vision
SÜPHAN KAAN ÇİFTCİ
Yüksek Lisans
Türkçe
2023
İç Mimari ve DekorasyonKocaeli Üniversitesiİç Mimarlık Ana Sanat Dalı
DOÇ. DR. SİBEL DEMİRARSLAN
- Kültürel ve zihinsel yapılanmanın Türk melodram sineması üzerindeki etkileri
The effects of cultural and intellectual structuring on Turkish melodramatic films
DİLEK TUNALI
Doktora
Türkçe
2005
Sahne ve Görüntü SanatlarıDokuz Eylül ÜniversitesiSinema Televizyon Ana Bilim Dalı
PROF.DR. OĞUZ ADANIR