Geri Dön

Constructing a recommendation system based on movie reviews

Film incelemelerine dayalı bir öneri sistemi oluşturma

  1. Tez No: 781815
  2. Yazar: MUHAMMET AYKAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ERHAN ÇENE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Matematik, İstatistik, Mathematics, Statistics
  6. Anahtar Kelimeler: öneri sistemleri, içerik bazlı filtreleme, işbirlikçi filtreleme hibrit filtreleme, tekil değer ayrışımı, recommendation system, content-based filtering, collaborative filtering, hybrid filtering, singular value decomposition
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 45

Özet

Son on yılda, hem endüstride hem de akademide yeni tavsiye sistemi teknikleri oluşturmak için çok çaba sarf edildi. Bu alana olan ilginin yüksek olması, zengin bir araştırma alanına sahip olması ve kişiye özel öneriler oluşturan uygulamaların bolluğu ile alakalıdır. Çoğu kullanıcı kendilerine uygun içeriği bulmak için çok zaman harcar. Bu sorunun en çok yaşandığı durumlardan biri de film ya da televizyon programı seçimidir. Film ve televizyon programlarının artması, içeriğin internet ile entegrasyonu ve her alanda film/dizi izleme kolaylığı ile birlikte izleyici sayısı da artmıştır. Buna bağlı olarak izleyiciyi içerikle eşleştirmek için tavsiye sistemlerinin kullanılması önem kazanmıştır. Bu sayede kullanıcılar bir çok içerik arasında kaybolmak yerine kendi zevklerine göre içeriklere kolayca ulaşabilmektedir. Bu çalışmada öncelikle tavsiye sistemlerinden bahsedilmiştir. Daha sonra ağ kazıma yöntemleri ve film öneri sistemi algoritmaları anlatılarak film öneri sistemi oluşturulmuştur. Yaklaşık 500 kullanıcı ve kullanıcılar tarafından değerlendirilen 10000 farklı film için içerik tabanlı ve işbirlikçi filtreleme yöntemleri kullanılarak öneri sistemi oluşturulmuştur. BeautifulSoup kütüphanesi yardımıyla toplanan veri seti toplamda yaklaşık 100.000 yorumdan oluşmaktadır. 27 farklı film türünün ve 443 farklı film türü kombinasyonunun yer aldığı veri setinde her filmin 1 ile 10 arasında bir reytingi bulunuyor. Ayrıca veri setinde filmlerin oyuncu kadrosu, yönetmeni, çıkış yılı ve reytingleri de yer alıyor. Her kullanıcının ortalama 220 filmi değerlendirdiği veri setinde %40 oranında 7 ve 8 puan bulunurken, ortalama reyting 6,6 oldu. Bu içerikler doğrultusunda film öneri sistemi oluşturulmuştur. Bu çalışmada her iki yöntemin bir arada kullanıldığı hibrit bir model ve kullanıcı bazlı bir film öneri sistemi oluşturulmuştur. Farklı modellerin de test edildiği tez çalışmasında, son model olarak matris çarpanlara ayırma yöntemi ve içerik tabanlı yöntem kullanılarak her kullanıcı için film önerileri oluşturulmuş ve değerlendirme ölçütleri olarak kök ortalama kare hata ve ortalama mutlak hata kullanılmıştır. İçerik tabanlı öneri sistemlerinden biri olan tekil değer ayrıştırma ve matris çarpanlarına ayırma yöntemleri kullanılarak geliştirilen son modelde kök ortalama karesel hata 1,76 ve ortalama mutlak hata 1,33 olarak bulunmuştur.

Özet (Çeviri)

Over the past ten years, a lot of effort has been done on creating novel recommender system techniques in both the industry and academia. The high interest in this field is related to the fact that it has a rich research area and the abundance of applications that create personal recommendations. Most users spend a lot of time finding content that suits them. One of the situations where this problem is experienced most is the selection of a movie or television program. With the increase in movies and television programs, the integration of content with the internet, and the ease of watching movies/series in any area, the number of viewers has also increased. Accordingly, the use of recommendation systems to match the audience with the content has become important. In this way, users can easily access the content according to their taste, instead of getting lost among many contents. In this study, first of all, recommendation systems are mentioned. Then, movie recommendation system was constructed by explaining the web scraping methods and the movie recommendation system algorithms. Recommendation system was constructed by using content-based and collaborative filtering methods for approximately 500 users and 10000 different movies evaluated by users. The dataset collected with the help of the BeautifulSoup library consists of approximately 100000 reviews in total. In the dataset, which includes 27 different movie genres and 443 different movie genre combinations, each movie has a rating between 1 and 10. In addition, the data set includes the cast, director, release year and rating of the movies. In the data set, in which each user evaluated 220 movies on average, there were 40% 7 and 8 points, while average rating was 6.6. In line with these contents, a movie recommendation system was constructed. In this study, a hybrid model in which both methods are used together, and a user-based movie recommendation system were constructed. In the thesis study, in which different models were also tested, movie recommendations were created for each user by using matrix factorization method and content-based method as the final model, and root mean square error and mean absolute error were used as evaluation criteria. Root mean square error was 1.76 and mean absolute error was 1.33 in the latest model developed using singular value decomposition, one of the content based recommendation system and matrix factorization methods.

Benzer Tezler

  1. EN 16432-2'de verilen tasarım yöntemlerinin Ankara-Sivas YHT hattı tünellerinde uygulanan balastsız demiryolu üstyapısı üzerinden incelenmesi

    Analysis of design methods covered in EN16432-2 on ballastless railway track implemented in Ankara Sivas high-speed line tunnels

    BEYAZIT ÖLÇER

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Ulaşımİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. ZÜBEYDE ÖZTÜRK

  2. Betonarme endüstriyel binalarda yapısal yangın güvenliğinin ulusal ve uluslararası standardlar kapsamında incelenmesi

    Investigation of structural fire safety in reinforced concrete industrial buildings within the scope of national and international standards

    GÖKTUĞ ŞEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA GENÇOĞLU

  3. Internet based movie genre suggestion model considering demographical information of users

    Kullanıcıların demografik bilgilerine dayalı internet tabanlı film turu öneri modeli

    TUNA HACALOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. SEVGİ ÖZKAN

  4. Zemin etüdü ve ıslahı işlerinde maliyet planlaması, analizi ve tahmini

    Cost planning, analysis and estimation in soil investigation and improvement works

    AHMET ERTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Yapı Mühendisliği Ana Bilim Dalı

    DOÇ. DR. G. EMRE GÜRCANLI

  5. Kırıklı, çatlaklı kayada açılacak derin yarma şevlerin tasarımı: Vaka analizi, Suudi Arabistan, Riyad örneği

    Design of deep cut slopes in fractured, jointed rocks: Case study of Riyadh, Saudi Arabia

    ÇİÇEK ÜSTÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Jeoloji Mühendisliğiİstanbul Teknik Üniversitesi

    Jeoloji Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERKAN BOZKURTOĞLU