Geri Dön

Türk sinemasında aktör-film işbirliği ağının analizi ve makine öğrenmesi ile hasılat tahmini

Analyzing the Turkish actor-film collaboration network with complex network analysis methods

  1. Tez No: 952588
  2. Yazar: ELANUR GÜL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SAİT DEMİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 79

Özet

Bu çalışmada, 2012-2022 yılları arasında Türkiye'de çekilmiş sinema filmlerine ait aktör-film işbirliği ağı oluşturulmuştur. Veriler Box Office Türkiye isimli internet sitesinden derlenmiştir. Çalışma kapsamında aktör-film işbirliği ağı kompleks ağ analizi yöntemleriyle incelenmiştir. Ayrıca graf tabanlı derin öğrenme ve makine öğrenmesi teknikleri kullanılarak film hasılat tahmini yapılmıştır. Çalışma içerisinde 1803 adet farklı sinema filmi incelenmiştir. Oluşturulan aktör-film işbirliği ağı 5182 düğüm (oyuncu) ve 55216 bağlantı (aynı filmde birlikte oynama) içermektedir. Yapılan ağ tabanlı analizlerde öncelikle ağın özellikleri ortaya çıkarılmıştır. Düğüm derece dağılımı, ortalama en kısa yol uzunluğu, derece merkeziliği, ortalama kümelenme katsayısı ve ağ yoğunluğu gibi metrikler hesaplanmıştır. Buna göre, ağın ortalama en kısa yolu 3,3 , çapı 8, oyuncuların ortalama derece değeri 21,3 , ortalama kümeleşme katsayısı 0,774 ve ağ yoğunluğu 0,004 olarak bulunmuştur. Bu sonuçlar, oluşturulan oyuncu-film iş birliği ağının yüksek kümelenme, düşük ortalama kısa yol uzunluğu ve yüksek dereceli merkezi düğümler gibi gerçek dünyadaki kompleks ağların temel özelliklerini taşıdığını göstermektedir. Ayrıca ağ, Force Atlas 2 ve Spring Layout görselleştirme algoritmaları ile görselleştirilmiş; topluluk yapıları ve düğüm derece dağılımı log-log eksende gösterilmiştir. Çalışmanın devamında, bu ağ yapısından elde edilen bilgiler kullanılarak filmlerin hasılat başarısını tahmin etmeye yönelik bir sınıflandırma problemi ele alınmıştır. Bu amaçla, grafik tabanlı veriler üzerinde çalışan bir derin öğrenme yöntemi olan Grafik Evrişimsel Ağlar (Graph Convolutional Networks - GCN) kullanılmıştır. GCN modeline ek olarak K-Nearest Neighbors (KNN), Lojistik Regresyon (LR), Support Vector Machine (SVM), XGBoost, Naive Bayes ve Random Forest gibi klasik makine öğrenmesi yöntemleri de uygulanmış ve sonuçlar karşılaştırılmıştır. 50x50, 100x100 ve 200x200 boyutlarında oluşturulan oyuncu-temelli matrislerle yapılan sınıflandırma deneylerinde, en başarılı sonuçlar GCN ve Lojistik Regresyon modelleri tarafından elde edilmiştir. Özellikle GCN modeli, 200x200 matris boyutunda %98,49 doğruluk (accuracy), %98,49 geri çağırma (recall), %98,50 kesinlik (precision), %98,50 F1 skoru ve %99,95 ROC AUC değeriyle en yüksek performansı göstermiştir. Benzer şekilde, Lojistik Regresyon modeli de aynı matris boyutunda %98,49 doğruluk, %98,49 geri çağırma, %98,50 kesinlik, %98,50 F1 skoru ve %99,83 ROC AUC ile benzer derecede yüksek bir başarı elde etmiştir. Bu bulgular, grafik temelli derin öğrenme modellerinin ve lojistik regresyon gibi güçlü lineer yöntemlerin film sektöründeki başarım tahmini gibi görevlerde etkili ve uygulanabilir olduğunu ortaya koymaktadır.

Özet (Çeviri)

In this study, an actor-film collaboration network was constructed based on Turkish cinema films produced between 2012 and 2022. The data were compiled from the website Box Office Türkiye. The actor-film collaboration network was analyzed using complex network analysis methods. Additionally, graph-based deep learning and machine learning techniques were applied to predict the box office success of the films. A total of 1,803 different films were examined within the scope of the study. The constructed actor-film collaboration network consists of 5182 nodes (actors) and 55216 edges (co-appearances in the same film). In the network-based analysis, key structural properties were calculated, including node degree distribution, average shortest path length, degree centrality, average clustering coefficient, and network density. The results revealed that the network has an average shortest path length of 3,3 , a diameter of 8, an average node degree of 21,3 , an average clustering coefficient of 0,774 , and a network density of 0,004. These findings indicate that the actor-film collaboration network exhibits fundamental characteristics of real-world complex networks, such as high clustering, short average path lengths, and the presence of highly connected central nodes. The network was also visualized using the Force Atlas 2 and Spring Layout algorithms, and its community structures and degree distribution were displayed on a log-log scale. In the subsequent part of the study, a classification task was conducted to predict the box office success of films based on information derived from the network structure. To this end, Graph Convolutional Networks (GCN), a deep learning method designed for graph-structured data, was employed. In addition to GCN, traditional machine learning models such as K-Nearest Neighbors (KNN), Logistic Regression (LR), Support Vector Machine (SVM), XGBoost, Naive Bayes, and Random Forest were also implemented for comparison. Classification experiments were performed using actor-based matrices of sizes 50x50, 100x100, and 200x200. The most successful results were obtained by the GCN and Logistic Regression models. Specifically, the GCN model achieved the highest performance on the 200x200 matrix, with an accuracy of 98,49%, recall of 98,49%, precision of 98,50%, F1-score of 98,50%, and a ROC AUC score of 99,95%. Similarly, the Logistic Regression model reached comparable success with an accuracy of 98,49%, recall of 98,49%, precision of 98,50%, F1-score of 98,50%, and a ROC AUC of 99,83%. These results demonstrate that graph-based deep learning models and powerful linear methods like logistic regression are highly effective and applicable in tasks such as predicting the commercial success of films in the cinema industry.

Benzer Tezler

  1. Feyzi Tuna ve Türk sinemasındaki yeri

    Feyzi Tuna and his role in Turkish cinema

    NİLGÜN TUĞÇE DURAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Güzel SanatlarMimar Sinan Güzel Sanatlar Üniversitesi

    Sinema Televizyon Ana Sanat Dalı

    PROF. ZEYNEP YÜKSEL AKTAŞ

  2. Sinemada kültürel mirasın korunması ve devletlerin tutumu

    Başlık çevirisi yok

    MELİS TURHAN

    Sanatta Yeterlik

    İngilizce

    İngilizce

    2004

    ArşivMimar Sinan Güzel Sanatlar Üniversitesi

    Sinema Televizyon Ana Sanat Dalı

    PROF. SAMİ ŞEKEROĞLU

  3. 1970-2000 yılları arasında konut arayışları ve iç mekan dönüşümlerini Türk sineması merceğinden okumak

    Reading residential searches and interior transformations between the years 1970-2000 from the center of Turkish cinema

    MELEK BAYRAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İç Mimari ve DekorasyonFatih Sultan Mehmet Vakıf Üniversitesi

    İç Mimarlık Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SALİH SALBACAK

  4. Türk sinemasında trajik öykü anlayışı örnek Yılmaz Güney

    Conception of tragic narratives in Turkish cinema Example: Yılmaz Güney

    YÜKSEL AKSU

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Sahne ve Görüntü SanatlarıDokuz Eylül Üniversitesi

    Sinema Televizyon Ana Bilim Dalı

    PROF. DR. OĞUZ ADANIR

  5. Türk sinemasında kadınlar 'Bedia Muvahhit' [Film (VHS video kaset)]

    Bedia Muvahhit 'she is a venüs'

    MÜJGAN YILDIRIM

    Sanatta Yeterlik

    Türkçe

    Türkçe

    1999

    Sahne ve Görüntü SanatlarıMarmara Üniversitesi

    Sinema Televizyon Ana Sanat Dalı

    PROF. ZAFER DOĞAN