Matrix factorization with stochastic gradient descent for recommender systems
Öneri sistemleri için olasılıksal eğim iniş ile matris çarpanlarına ayırma
- Tez No: 540065
- Danışmanlar: PROF. DR. CEVDET AYKANAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 85
Özet
Matris çarpanlarına ayırma gerçek dünya verilerinin gizli özelliklerini ortaya çıkarmak için kullanılan verimli bir tekniktir. Bu teknik, metin madenciliği, görüntü analizi, sosyal ağlar ve son zamanlarda yaygın olarak öneri sistemleri gibi alanlarda uygulanmaktadır. Birbirini izleyen en küçük karaler (ALS), olasılıksal egim iniş (SGD) ve koordinat iniş (CD) genis matrisleri çarpanlarına ayırırken kullanılan yöntemler arasındadır. Bu üç yöntem arasında, SGD'ye dayalı çarpanlarına ayırma yöntemi, Netflix ve KDDCup yarısmalarından sonra en basarılı yöntem olarak ispatlanmıştır. Sonrasında, SGD'nin paralelleştirilmesi yaygınlasmış ve literatürde geniş bir biçimde çalışılmıştır. Biz paylaşımlı ve dağıtık bellek sistemleri için geliştirilmiş paralel SGD algoritmalarına odaklanıyoruz. Paylaşımlı bellek paralelleştirmeleri HogWild, FPSGD ve MLGF-MF gibi çalışmalar içerirken dağıtık bellek paralelleştirmeleri DSGD, GASGD ve NOMAD gibi çalısmalar içermektedir. Biz bu çalışmaların detaylı analizini içeren bir araştırma metni oluşturuyoruz, sonrasında ayrıntılı olarak DSGD'ye odaklanıp bu algoritmayı mesaj aktarma yaklaşımı ile uyguluyoruz ve performansını yakınsama ve hızlanma yönünden test ediyoruz. Mevcut çalışmaların aksine deneylerde kendi ürettiğimiz çok sayıda gerçek dünya veri kümeleri kullanıyoruz. DSGD'nin geniş ölçekli veri kümeleri için dirençli bir algoritma olduğunu ve hızlı yakınsama değerleri ile birlikte doğrusala yakın hızlanmayı başardığını gösteriyoruz.
Özet (Çeviri)
Matrix factorization is an efficient technique used for disclosing latent features of real-world data. It finds its application in areas such as text mining, image analysis, social network and more recently and popularly in recommendation systems. Alternating least squares (ALS), stochastic gradient descent (SGD) and coordinate descent (CD) are among the methods used commonly while factorizing large matrices. SGD-based factorization has proven to be the most successful among these methods after Netflix and KDDCup competitions where the winners' algorithms relied on methods based on SGD. Parallelization of SGD then became a hot topic and studied extensively in the literature in recent years. We focus on parallel SGD algorithms developed for shared memory and distributed memory systems. Shared memory parallelizations include works such as HogWild, FPSGD and MLGF-MF, and distributed memory parallelizations include works such as DSGD, GASGD and NOMAD. We design a survey that contains exhaustive analysis of these studies, and then particularly focus on DSGD by implementing it through message-passing paradigm and testing its performance in terms of convergence and speedup. In contrast to the existing works, many real-wold datasets are used in the experiments that we produce using published raw data. We show that DSGD is a robust algorithm for large-scale datasets and achieves near-linear speedup with fast convergence rates.
Benzer Tezler
- İşbirlikçi filtreleme yöntemlerinin geliştirilen bir uygulama ile karşılaştırılması
Comparison of collaborative filtering methods with an application developed
GİZEM ZEYNEP PARİM
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NEVCİHAN DURU
- Besinsel liflere bağlı biyoaktif maddelerin antioksidan kapasitesi ve rejenerasyon davranışının quencher metoduyla belirlenmesi
Determination of antioxidant capacity and regeneration behaviour of bioactive materials bound to dietary fibers with quencher procedure
ECEM EVRİM ÇELİK
Yüksek Lisans
Türkçe
2013
Gıda MühendisliğiHacettepe ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
PROF. DR. VURAL GÖKMEN
- Orta doğu'da yeni stratejik çevreleme girişimlerinin Türk dış politikasına etkisi: Suriye örneği
The effects of strategic containment attempts in the middle east on turkish foreign policy: The example of Syria
OĞUZHAN ERGÜN
Doktora
Türkçe
2013
Kamu YönetimiDokuz Eylül ÜniversitesiKamu Yönetimi Ana Bilim Dalı
YRD. DOÇ. DR. AHMET NAZMİ ÜSTE
- Treatment of multiple gingival recessions with two different approaches
Çoklu dişeti çekilmelerinin tedavisinde farklı iki tedavi yaklaşımı
İLKNUR ÖZENCİ
Doktora
İngilizce
2014
Diş HekimliğiYeditepe ÜniversitesiPeriodontoloji Ana Bilim Dalı
PROF. DR. RECEP SELÇUK YILMAZ
- Deneysel hipertiroidi oluşturulmuş gebe sıçanların uterus ve plasenta dokularında osteonektin (SPARC) ve TGFβ-1 dağılımının immünohistokimyasal olarak incelenmesi
The immunohistochemical analysis of osteonectin (SPARC) ve TGFβ-1 distribution in the placenta and uterin tissues of pregnant rats with experimentally induced hyperthyroid
RUKİYE KARABACAK
Yüksek Lisans
Türkçe
2015
Histoloji ve EmbriyolojiTrakya ÜniversitesiMorfoloji (Histoloji ve Embriyoloji) Ana Bilim Dalı
PROF. DR. TURAN KARACA