İstatistiksel analiz yöntemleri ve makine öğrenme yöntemleri ile film başarı tahmini
Movie success prediction with statistical analysis techniques and machine learning methods
- Tez No: 687013
- Danışmanlar: DR. ÖĞR. ÜYESİ DUYGU DEDE ŞENER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, İstatistik, Computer Engineering and Computer Science and Control, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Başkent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 49
Özet
Film endüstrisinde başarılı bir sinema filmi çekmek için büyük yatırımlar yapılmaktadır. Ancak, büyük yatırımlara rağmen, beklenildiği gibi başarılı olamayan bazı film örnekleri mevcuttur. Bu nedenle, bir filmin başarısını büyük ölçekte tahmin etmek, film yapımcıları için film vizyona girmeden önce çok önemlidir. Bu çalışmada, yapımcılara film yatırımı konusunda bir öngörü sağlamak için sınıflandırmaya dayalı bir tahmin modeli geliştirilmesi amaçlanmıştır. Bir filmin başarısını tahmin etmek için önerilen modelde farklı istatistiksel analiz ve makine öğrenmesi yaklaşımları kullanılmıştır. Esas olarak, hangi film özelliğinin filmin başarısı ile yüksek oranda ilişkili olduğunu ve film başarısını tahmin etmede hangi makine öğrenme tekniğinin daha iyi olduğunu tespit etmeye odaklanılmıştır. Bunun için öncelikle ki-kare (chi-square) analizi ve varyans analizi testi kullanılarak istatistiksel bir analiz yapılmıştır. Ardından sınıflandırma yöntemlerinden Rastgele Orman (Random Forest), Destek Vektör Makinesi (Support Vector Machine) ve Yapay Sinir Ağı (Artificial Neural Network), regresyon yöntemlerinden, Çoklu Doğrusal Regresyon (Multi Linear Regression), Destek Vektör Regresyon (Support Vector Regression), Rastgele Orman Regresyon (Random Forest Regression) gibi farklı makine öğrenme teknikleri kullanılarak karşılaştırmalı bir analiz yapılmıştır. Deneysel sonuçlar, bir filmin başarısının en önemli belirleyicilerinin“oyOrtalamasi”,“oySayisi”,“gelir”ve“butce”olduğunu göstermektedir. Bunun yanı sıra Rastgele Orman, diğer makine öğrenme yöntemleri arasında film başarısını tahmin etmede %96 doğruluk (accuracy) oranıyla başarılı olmuştur. Destek Vektör Regresyon, diğer regresyon yöntemleri arasında film başarı tahmin etmede 1.77 Kök Ortalama Kare Hatası (Root Mean Square Error, RMSE) değeri ile başarılı olmuştur.
Özet (Çeviri)
In the movie industry, huge investments have been made to shoot a successful motion picture. However, despite large investments, there are some movie examples that cannot be successful as expected. Therefore, predicting the success of a movie is so important on a large scale for the movie producers before releasing the movie. In this study, a classification-based prediction model is aimed to develop for providing a foresight to the producers about investing on a movie. Different statistical analysis and machine learning approaches were used in the proposed model for predicting success of a movie. We mainly focus on detecting which movie attribute is highly correlated with the success of the movie and which machine learning technique is better at predicting the movie success. To do so, firstly a statistical analysis was conducted by using chi-square analysis and analysis of variance test. Then a comparative analysis was performed by using different machine learning techniques including Random Forest, Support Vector Machine and Artificial Neural Network, and Multiple Linear Regression, Support Vector Regression and Random Forest Regression methods as regression methods. The experimental results indicate that the most important predictors of a movie's success are“voteAverage”,“voteCount”,“revenue”and "budget. In addition to this, Random Forest has become successful by the accuracy of 96% in predicting movie success among other machine learning methods, and Support Vector Regression has become successful by the Root Mean Square Error (RMSE) 1.77 in predicting movie success among other regression methods.
Benzer Tezler
- Pre-release forecasting of imdb movie ratings using multi-view data
Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi
BEYZA ÇİZMECİ
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ÖĞÜDÜCÜ
- Isı pompalı çamaşır kurutma makinesinin sistem tasarım parametreleri optimizasyon modelinin oluşturulması
Development of an optimization model of system design parameters of heat pump clothes dryer
GÖKHAN SIR
Doktora
Türkçe
2023
Makine MühendisliğiYıldız Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. ŞEVKET ÖZGÜR ATAYILMAZ
- Hata içeren yazılım modüllerinin tespitinde kullanılan makine öğrenme algoritmalarının çok kriterli karar verme yöntemleriyle sıralanması
Ranking of machine learning algorithms used to detect bug-containing software modules with multi-criteria decision making methods
MERVE ALPER IŞIK
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELMAS BURCU MAMAK EKİNCİ
- Classification of abnormal respiratory sounds using deep learning techniques
Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması
AHAMADI ABDALLAH IDRISSE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ
- Yüksek gerilim doğru akım enerji iletiminde meydana gelen arızaların sayısal koruma yöntemleri ile belirlenmesi
Determining faults in high voltage direct current transmission by using numerical protection methods
FATİH ÜNAL
Yüksek Lisans
İngilizce
2016
EnerjiFırat ÜniversitesiEnerji Sistemleri Mühendisliği Ana Bilim Dalı
PROF. DR. SAMİ EKİCİ