Gözetimli öğrenme yöntemlerinin kullanımı ile filmlerin IMDB puanlama sistemine göre derecelendirilmesini yapan modelin oluşturulması
Creating a model that grades movies according to the IMBD scoring system using supervised learning methods
- Tez No: 767969
- Danışmanlar: DR. ÖĞR. ÜYESİ ÜYESİ PERİ GÜNEŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Aydın Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 72
Özet
Film prodüksiyonu en pahalı yatırım alanlarından biridir ve büyük miktarda finansal zarara veya kâr neden olabilir. Bu tür yatırımlardan kaynaklanabilecek büyük kayıplar göz önüne alındığında, yatırımcıların ve yapım şirketlerinin belirli bir filme yatırım yapıp yapmama kararı vermesi kritik önem taşıyor. Bu nedenle, yatırımcı şirketlere karar verme süreçlerinde yardımcı olacak bir model oluşturmak çok tasarrufludur. Konu üzerinden bu zamana kadar farklı yöntemlerin uygulandığı çalışmalara yazıda yer verilmiştir. Google trendler, veri madeciliği gibi tekniklerin olduğu makalelerin içeriği daha kapsamlı şekilde incelenmiştir. Makine öğrenmesi, çeşitli alanlarda karar verme modellerinde sık kullanılmaktadır. Bundan başka öneri sistemlerini oluşturmadaki etkinliğini farklı araştırmalarla kanıtlamıştır. Başarı tahmin etme alanında bu tarz metodların kullanımı için veri toplama, özellik seçimi, veri ön işleme ve veri temizleme gibi işlemler yapılmıştır. Bu çalışmada, bir filmin yapım öncesi başarısının bir göstergesi olan IMDB (İnternet Film Veritabanı) derecelendirmesini kullanarak tahmin etmek için bir Genetik algoritma ile birlikte birkaç Makine öğrenmesi tekniğini (K-Nearest Neighbors, Support Vectors Machine, Decision Tree (C5)) kullanılmıştır. Genetik algoritma diğer algoritmalarla eğitim verilerinin doğruluğu (97,2% oranıyla) ve test verilerinin doğruluğu (90,5%) üzerinden karşılaştırıldıkta daha başarılı performans sergiliyor. Kullanılan KNN ise bu teknikler arasında en başarısız yöntem olmuştur. Filmin başarısı arttıkça gişe hasılatı da artıyor. Böylece gişe hasılatı ile film başarısı arasında bir ilişki olduğu varsayabiliriz. Ancak bu tahmin çok zor, çünkü bir filmi başarılı kılan faktörleri ayırt etmek zor ve insanların görüşlerini tespit etmek çok sübjektif bir konudur. Çalışmanın son bölümünde bu ilişki grafikle gösterilmektedir. Sonuçlar, makine öğreniminin bu alanda faydalı olduğunu ve nispeten iyi performansa sahip başarı tahmin modelleri oluşturmak için GA'nın kullanılabileceğini göstermektedir. Ve son olarak tezin başka buna benzer çalışmalarda ne tarz katkı sağlayabileceğine değinilmiştir.
Özet (Çeviri)
Film production is one of the most expensive investment areas and can result in substantial financial loss or profit. Given the huge losses that can result from such investments, it is critical for investors and production companies to decide whether to invest in a particular film. Therefore, it is very cost-effective to create a model to assist investor companies in their decision-making processes. Studies on the subject in which different methods have been applied so far are included in the article. The content of the articles with techniques such as Google trends, data mining has been examined more comprehensively. Machine learning is frequently used in decision making models in various fields. Moreover, it has proven its effectiveness in creating recommendation systems with different studies. For the use of such methods in the field of success estimation, data collection, feature selection, data preprocessing and data cleaning have been performed. In this study, several Machine Learning methods (K-Nearest Neighbors, Support Vectors Machine, Decision Tree (C5)) along with a (GA) Genetic Algorithm are used to predict a movie using IMDB (Internet Movie Database) rating, which is an indicator of pre-production success. The genetic algorithm performs better when compared with other algorithms on the accuracy of the training data (97.2%) and the accuracy of the test data (90.5%). The KNN used was the most unsuccessful among these techniques. As the success of the movie increases, so does the box office revenue. Thus, we can assume that there is a relationship between the box office revenue and the success of the movie. However, this estimate is very difficult, because it is difficult to discern the factors that make a film successful, and it is very subjective to determine people's opinions. In the last part of the study, this relationship is shown graphically. The results show that machine learning is useful in this area and GA can be used to build success prediction models with relatively good performance. And finally, it has been mentioned how the thesis can contribute to other similar studies.
Benzer Tezler
- Cryptocurrency price prediction by using social media data
Makine öğrenmesi teknikleri kullanılarak sosyal medya verileri ile kripto para fiyat tahmini
ÖZLEM GÜL PAMUK
Yüksek Lisans
İngilizce
2019
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
DOÇ. DR. SEFER BADAY
- Derin öğrenme yöntemi ile optik uydu görüntülerinden gemi tespiti
Ship detection by optical satellite images with deep learning method
OSMAN DUMAN
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. MESUT KARTAL
- Performance assessment of physiotherapy and rehabilitation exercises with deep learning
Derin öğrenme ile fizyoterapi ve rehabilitasyon egzersizleri için performans değerlendirme
İLHAN AYTUTULDU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TARKAN AYDIN
- Player modeling by using unsupervised learning methods
Gözetimsiz öğrenme yöntemleri ile oyuncu modelleme
MEHMET FATİH KAVUM
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiOyun ve Etkileşim Teknolojileri Ana Bilim Dalı
DOÇ. DR. SANEM SARIEL UZER
- Developing a life insurance recommendation system using machine learning methods
Makine öğrenme yöntemleri kullanarak hayat sigortası öneri sistemi geliştirmesi
ASLI HAZAL AKALTUN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBüyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
DOÇ. DR. TEVFİK AYTEKİN