Geri Dön

İstatistiksel analiz yöntemleri ve makine öğrenme yöntemleri ile film başarı tahmini

Movie success prediction with statistical analysis techniques and machine learning methods

  1. Tez No: 687013
  2. Yazar: BUGAY SARIKAYA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ DUYGU DEDE ŞENER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, İstatistik, Computer Engineering and Computer Science and Control, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Başkent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 49

Özet

Film endüstrisinde başarılı bir sinema filmi çekmek için büyük yatırımlar yapılmaktadır. Ancak, büyük yatırımlara rağmen, beklenildiği gibi başarılı olamayan bazı film örnekleri mevcuttur. Bu nedenle, bir filmin başarısını büyük ölçekte tahmin etmek, film yapımcıları için film vizyona girmeden önce çok önemlidir. Bu çalışmada, yapımcılara film yatırımı konusunda bir öngörü sağlamak için sınıflandırmaya dayalı bir tahmin modeli geliştirilmesi amaçlanmıştır. Bir filmin başarısını tahmin etmek için önerilen modelde farklı istatistiksel analiz ve makine öğrenmesi yaklaşımları kullanılmıştır. Esas olarak, hangi film özelliğinin filmin başarısı ile yüksek oranda ilişkili olduğunu ve film başarısını tahmin etmede hangi makine öğrenme tekniğinin daha iyi olduğunu tespit etmeye odaklanılmıştır. Bunun için öncelikle ki-kare (chi-square) analizi ve varyans analizi testi kullanılarak istatistiksel bir analiz yapılmıştır. Ardından sınıflandırma yöntemlerinden Rastgele Orman (Random Forest), Destek Vektör Makinesi (Support Vector Machine) ve Yapay Sinir Ağı (Artificial Neural Network), regresyon yöntemlerinden, Çoklu Doğrusal Regresyon (Multi Linear Regression), Destek Vektör Regresyon (Support Vector Regression), Rastgele Orman Regresyon (Random Forest Regression) gibi farklı makine öğrenme teknikleri kullanılarak karşılaştırmalı bir analiz yapılmıştır. Deneysel sonuçlar, bir filmin başarısının en önemli belirleyicilerinin“oyOrtalamasi”,“oySayisi”,“gelir”ve“butce”olduğunu göstermektedir. Bunun yanı sıra Rastgele Orman, diğer makine öğrenme yöntemleri arasında film başarısını tahmin etmede %96 doğruluk (accuracy) oranıyla başarılı olmuştur. Destek Vektör Regresyon, diğer regresyon yöntemleri arasında film başarı tahmin etmede 1.77 Kök Ortalama Kare Hatası (Root Mean Square Error, RMSE) değeri ile başarılı olmuştur.

Özet (Çeviri)

In the movie industry, huge investments have been made to shoot a successful motion picture. However, despite large investments, there are some movie examples that cannot be successful as expected. Therefore, predicting the success of a movie is so important on a large scale for the movie producers before releasing the movie. In this study, a classification-based prediction model is aimed to develop for providing a foresight to the producers about investing on a movie. Different statistical analysis and machine learning approaches were used in the proposed model for predicting success of a movie. We mainly focus on detecting which movie attribute is highly correlated with the success of the movie and which machine learning technique is better at predicting the movie success. To do so, firstly a statistical analysis was conducted by using chi-square analysis and analysis of variance test. Then a comparative analysis was performed by using different machine learning techniques including Random Forest, Support Vector Machine and Artificial Neural Network, and Multiple Linear Regression, Support Vector Regression and Random Forest Regression methods as regression methods. The experimental results indicate that the most important predictors of a movie's success are“voteAverage”,“voteCount”,“revenue”and "budget. In addition to this, Random Forest has become successful by the accuracy of 96% in predicting movie success among other machine learning methods, and Support Vector Regression has become successful by the Root Mean Square Error (RMSE) 1.77 in predicting movie success among other regression methods.

Benzer Tezler

  1. Pre-release forecasting of imdb movie ratings using multi-view data

    Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi

    BEYZA ÇİZMECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

  2. Isı pompalı çamaşır kurutma makinesinin sistem tasarım parametreleri optimizasyon modelinin oluşturulması

    Development of an optimization model of system design parameters of heat pump clothes dryer

    GÖKHAN SIR

    Doktora

    Türkçe

    Türkçe

    2023

    Makine MühendisliğiYıldız Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞEVKET ÖZGÜR ATAYILMAZ

  3. Hata içeren yazılım modüllerinin tespitinde kullanılan makine öğrenme algoritmalarının çok kriterli karar verme yöntemleriyle sıralanması

    Ranking of machine learning algorithms used to detect bug-containing software modules with multi-criteria decision making methods

    MERVE ALPER IŞIK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELMAS BURCU MAMAK EKİNCİ

  4. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  5. Yüksek gerilim doğru akım enerji iletiminde meydana gelen arızaların sayısal koruma yöntemleri ile belirlenmesi

    Determining faults in high voltage direct current transmission by using numerical protection methods

    FATİH ÜNAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    EnerjiFırat Üniversitesi

    Enerji Sistemleri Mühendisliği Ana Bilim Dalı

    PROF. DR. SAMİ EKİCİ