Geri Dön

Matrix factorization with stochastic gradient descent for recommender systems

Öneri sistemleri için olasılıksal eğim iniş ile matris çarpanlarına ayırma

  1. Tez No: 540065
  2. Yazar: ÖMER FARUK AKTULUM
  3. Danışmanlar: PROF. DR. CEVDET AYKANAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Matris çarpanlarına ayırma gerçek dünya verilerinin gizli özelliklerini ortaya çıkarmak için kullanılan verimli bir tekniktir. Bu teknik, metin madenciliği, görüntü analizi, sosyal ağlar ve son zamanlarda yaygın olarak öneri sistemleri gibi alanlarda uygulanmaktadır. Birbirini izleyen en küçük karaler (ALS), olasılıksal egim iniş (SGD) ve koordinat iniş (CD) genis matrisleri çarpanlarına ayırırken kullanılan yöntemler arasındadır. Bu üç yöntem arasında, SGD'ye dayalı çarpanlarına ayırma yöntemi, Netflix ve KDDCup yarısmalarından sonra en basarılı yöntem olarak ispatlanmıştır. Sonrasında, SGD'nin paralelleştirilmesi yaygınlasmış ve literatürde geniş bir biçimde çalışılmıştır. Biz paylaşımlı ve dağıtık bellek sistemleri için geliştirilmiş paralel SGD algoritmalarına odaklanıyoruz. Paylaşımlı bellek paralelleştirmeleri HogWild, FPSGD ve MLGF-MF gibi çalışmalar içerirken dağıtık bellek paralelleştirmeleri DSGD, GASGD ve NOMAD gibi çalısmalar içermektedir. Biz bu çalışmaların detaylı analizini içeren bir araştırma metni oluşturuyoruz, sonrasında ayrıntılı olarak DSGD'ye odaklanıp bu algoritmayı mesaj aktarma yaklaşımı ile uyguluyoruz ve performansını yakınsama ve hızlanma yönünden test ediyoruz. Mevcut çalışmaların aksine deneylerde kendi ürettiğimiz çok sayıda gerçek dünya veri kümeleri kullanıyoruz. DSGD'nin geniş ölçekli veri kümeleri için dirençli bir algoritma olduğunu ve hızlı yakınsama değerleri ile birlikte doğrusala yakın hızlanmayı başardığını gösteriyoruz.

Özet (Çeviri)

Matrix factorization is an efficient technique used for disclosing latent features of real-world data. It finds its application in areas such as text mining, image analysis, social network and more recently and popularly in recommendation systems. Alternating least squares (ALS), stochastic gradient descent (SGD) and coordinate descent (CD) are among the methods used commonly while factorizing large matrices. SGD-based factorization has proven to be the most successful among these methods after Netflix and KDDCup competitions where the winners' algorithms relied on methods based on SGD. Parallelization of SGD then became a hot topic and studied extensively in the literature in recent years. We focus on parallel SGD algorithms developed for shared memory and distributed memory systems. Shared memory parallelizations include works such as HogWild, FPSGD and MLGF-MF, and distributed memory parallelizations include works such as DSGD, GASGD and NOMAD. We design a survey that contains exhaustive analysis of these studies, and then particularly focus on DSGD by implementing it through message-passing paradigm and testing its performance in terms of convergence and speedup. In contrast to the existing works, many real-wold datasets are used in the experiments that we produce using published raw data. We show that DSGD is a robust algorithm for large-scale datasets and achieves near-linear speedup with fast convergence rates.

Benzer Tezler

  1. İşbirlikçi filtreleme yöntemlerinin geliştirilen bir uygulama ile karşılaştırılması

    Comparison of collaborative filtering methods with an application developed

    GİZEM ZEYNEP PARİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NEVCİHAN DURU

  2. Besinsel liflere bağlı biyoaktif maddelerin antioksidan kapasitesi ve rejenerasyon davranışının quencher metoduyla belirlenmesi

    Determination of antioxidant capacity and regeneration behaviour of bioactive materials bound to dietary fibers with quencher procedure

    ECEM EVRİM ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Gıda MühendisliğiHacettepe Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    PROF. DR. VURAL GÖKMEN

  3. Orta doğu'da yeni stratejik çevreleme girişimlerinin Türk dış politikasına etkisi: Suriye örneği

    The effects of strategic containment attempts in the middle east on turkish foreign policy: The example of Syria

    OĞUZHAN ERGÜN

    Doktora

    Türkçe

    Türkçe

    2013

    Kamu YönetimiDokuz Eylül Üniversitesi

    Kamu Yönetimi Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET NAZMİ ÜSTE

  4. Treatment of multiple gingival recessions with two different approaches

    Çoklu dişeti çekilmelerinin tedavisinde farklı iki tedavi yaklaşımı

    İLKNUR ÖZENCİ

    Doktora

    İngilizce

    İngilizce

    2014

    Diş HekimliğiYeditepe Üniversitesi

    Periodontoloji Ana Bilim Dalı

    PROF. DR. RECEP SELÇUK YILMAZ

  5. Deneysel hipertiroidi oluşturulmuş gebe sıçanların uterus ve plasenta dokularında osteonektin (SPARC) ve TGFβ-1 dağılımının immünohistokimyasal olarak incelenmesi

    The immunohistochemical analysis of osteonectin (SPARC) ve TGFβ-1 distribution in the placenta and uterin tissues of pregnant rats with experimentally induced hyperthyroid

    RUKİYE KARABACAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Histoloji ve EmbriyolojiTrakya Üniversitesi

    Morfoloji (Histoloji ve Embriyoloji) Ana Bilim Dalı

    PROF. DR. TURAN KARACA