Geri Dön

Gözetimli öğrenme yöntemlerinin kullanımı ile filmlerin IMDB puanlama sistemine göre derecelendirilmesini yapan modelin oluşturulması

Creating a model that grades movies according to the IMBD scoring system using supervised learning methods

  1. Tez No: 767969
  2. Yazar: OGTAY SAFARALİYEV
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÜYESİ PERİ GÜNEŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: İstanbul Aydın Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 72

Özet

Film prodüksiyonu en pahalı yatırım alanlarından biridir ve büyük miktarda finansal zarara veya kâr neden olabilir. Bu tür yatırımlardan kaynaklanabilecek büyük kayıplar göz önüne alındığında, yatırımcıların ve yapım şirketlerinin belirli bir filme yatırım yapıp yapmama kararı vermesi kritik önem taşıyor. Bu nedenle, yatırımcı şirketlere karar verme süreçlerinde yardımcı olacak bir model oluşturmak çok tasarrufludur. Konu üzerinden bu zamana kadar farklı yöntemlerin uygulandığı çalışmalara yazıda yer verilmiştir. Google trendler, veri madeciliği gibi tekniklerin olduğu makalelerin içeriği daha kapsamlı şekilde incelenmiştir. Makine öğrenmesi, çeşitli alanlarda karar verme modellerinde sık kullanılmaktadır. Bundan başka öneri sistemlerini oluşturmadaki etkinliğini farklı araştırmalarla kanıtlamıştır. Başarı tahmin etme alanında bu tarz metodların kullanımı için veri toplama, özellik seçimi, veri ön işleme ve veri temizleme gibi işlemler yapılmıştır. Bu çalışmada, bir filmin yapım öncesi başarısının bir göstergesi olan IMDB (İnternet Film Veritabanı) derecelendirmesini kullanarak tahmin etmek için bir Genetik algoritma ile birlikte birkaç Makine öğrenmesi tekniğini (K-Nearest Neighbors, Support Vectors Machine, Decision Tree (C5)) kullanılmıştır. Genetik algoritma diğer algoritmalarla eğitim verilerinin doğruluğu (97,2% oranıyla) ve test verilerinin doğruluğu (90,5%) üzerinden karşılaştırıldıkta daha başarılı performans sergiliyor. Kullanılan KNN ise bu teknikler arasında en başarısız yöntem olmuştur. Filmin başarısı arttıkça gişe hasılatı da artıyor. Böylece gişe hasılatı ile film başarısı arasında bir ilişki olduğu varsayabiliriz. Ancak bu tahmin çok zor, çünkü bir filmi başarılı kılan faktörleri ayırt etmek zor ve insanların görüşlerini tespit etmek çok sübjektif bir konudur. Çalışmanın son bölümünde bu ilişki grafikle gösterilmektedir. Sonuçlar, makine öğreniminin bu alanda faydalı olduğunu ve nispeten iyi performansa sahip başarı tahmin modelleri oluşturmak için GA'nın kullanılabileceğini göstermektedir. Ve son olarak tezin başka buna benzer çalışmalarda ne tarz katkı sağlayabileceğine değinilmiştir.

Özet (Çeviri)

Film production is one of the most expensive investment areas and can result in substantial financial loss or profit. Given the huge losses that can result from such investments, it is critical for investors and production companies to decide whether to invest in a particular film. Therefore, it is very cost-effective to create a model to assist investor companies in their decision-making processes. Studies on the subject in which different methods have been applied so far are included in the article. The content of the articles with techniques such as Google trends, data mining has been examined more comprehensively. Machine learning is frequently used in decision making models in various fields. Moreover, it has proven its effectiveness in creating recommendation systems with different studies. For the use of such methods in the field of success estimation, data collection, feature selection, data preprocessing and data cleaning have been performed. In this study, several Machine Learning methods (K-Nearest Neighbors, Support Vectors Machine, Decision Tree (C5)) along with a (GA) Genetic Algorithm are used to predict a movie using IMDB (Internet Movie Database) rating, which is an indicator of pre-production success. The genetic algorithm performs better when compared with other algorithms on the accuracy of the training data (97.2%) and the accuracy of the test data (90.5%). The KNN used was the most unsuccessful among these techniques. As the success of the movie increases, so does the box office revenue. Thus, we can assume that there is a relationship between the box office revenue and the success of the movie. However, this estimate is very difficult, because it is difficult to discern the factors that make a film successful, and it is very subjective to determine people's opinions. In the last part of the study, this relationship is shown graphically. The results show that machine learning is useful in this area and GA can be used to build success prediction models with relatively good performance. And finally, it has been mentioned how the thesis can contribute to other similar studies.

Benzer Tezler

  1. Cryptocurrency price prediction by using social media data

    Makine öğrenmesi teknikleri kullanılarak sosyal medya verileri ile kripto para fiyat tahmini

    ÖZLEM GÜL PAMUK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DOÇ. DR. SEFER BADAY

  2. Derin öğrenme yöntemi ile optik uydu görüntülerinden gemi tespiti

    Ship detection by optical satellite images with deep learning method

    OSMAN DUMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. MESUT KARTAL

  3. Performance assessment of physiotherapy and rehabilitation exercises with deep learning

    Derin öğrenme ile fizyoterapi ve rehabilitasyon egzersizleri için performans değerlendirme

    İLHAN AYTUTULDU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TARKAN AYDIN

  4. Player modeling by using unsupervised learning methods

    Gözetimsiz öğrenme yöntemleri ile oyuncu modelleme

    MEHMET FATİH KAVUM

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Oyun ve Etkileşim Teknolojileri Ana Bilim Dalı

    DOÇ. DR. SANEM SARIEL UZER

  5. Developing a life insurance recommendation system using machine learning methods

    Makine öğrenme yöntemleri kullanarak hayat sigortası öneri sistemi geliştirmesi

    ASLI HAZAL AKALTUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı

    DOÇ. DR. TEVFİK AYTEKİN