Geri Dön

Modeling bounded data with sum conditioned poisson factorization

Sınırlı veriyi toplama koşullu poısson ayrıştırma ile modelleme

  1. Tez No: 474370
  2. Yazar: TAHA YUSUF CERİTLİ
  3. Danışmanlar: DOÇ. DR. ALİ TAYLAN CEMGİL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Negatif olmayan matrisler, veri örneklerinin negatif olmayan sınırlı değerler aldığı kalem önerme ve ses sinyali işleme gibi birçok alanda karşımıza ̧çıkmaktadır. Olasılıksal yaklaşımlar bu alanlardaki birçok görev için kullanılmakta ve matris ayrıştırma modelleri bu alandaki en ileri metodlar arasında yer almaktadır. Bunlardan biri Poisson Ayrıştırma adında gözlemleri Poission dağlımıyla modelleyen bir saklı değişken modelidir. Ancak bu şekilde, değer aralığı sınırlı olan gözlemlere, Poisson dağılımıyla sınırlı olmayan değer aralığı verilmektedir. Bu çalışmada, Poisson Ayrıştırma genişletilmiş ve gözlemler Bernoulli, İkiterimli, Kategorik ve Çok terimli gibi sınırlı değer aralığına sahip dağılımlarla modellenmiştir. Ortaya çıkan model, birçok Poisson Ayrıştırmanın, kendilerinin toplamlarına koşullandırılmasıyla oluşturulduğundan Toplama Koşullu Poisson Ayrıştırması olarak adlandırılmıştır. Toplama Koşullu Poisson Ayrıştırması modelinde çıkarım için iki algoritma sunuyoruz: Gibbs örnekleyicisi ve Beklenti-Enbüyütme. Algoritmalar ve model, benzeştirilmiş ve gerçek veri kümeleriyle test edilmiştir. İlk olarak, üretici modellen elde edilen sentetik veriyle, iki algoritmayı kıyaslıyoruz. Daha sonra, Swimmer adında bir veri kümesinde modelin yorumlanabilirliğini gösteriyoruz. Modelin sıralama ölçekli puanlama verisindeki performansı ölçmek içinse MovieLens 500-K adında kullanıcı film puan veri setini kullanıyoruz. Sonuçclar önerilen modelin, mevcut diğer modellerden test puanlarını tahmin etmede ve üst-K önermede daha üstün olduğunu gösteriyor. Son olarak, modelin zaman serisindeki kullanımını araştırmak için Bach Korallerinden çıkarılan piyano rulo verisiyle deney yapıyoruz. Burada, modelin zaman serisi analizinde önsel dağılımlar için kullanılabilecek parametreler sağladığını göstermekteyiz.

Özet (Çeviri)

Non-negative matrices appear in many domains from item recommendation, audio signal processing to computer vision in which data instances have a bounded non-negative range. For various tasks in these areas, probabilistic approaches have been widely applied where matrix factorizations are among the state-of-the-art meth- ods. A particular one is a latent variable model called Poisson Factorization which models bounded data with Poisson distribution assigning them unbounded ranges. In this work, we extend Poisson Factorization to model bounded data with bounded distributions such as Bernoulli, Binomial, Categorical and Multinomial. The resulting model is named as Sum Conditioned Poisson Factorization as the model is constructed by conditioning multiple Poisson Factorizations on their sum. We present two algorithms for inference in Sum Conditioned Poisson Factorization: Gibbs sampler and Expectation-Maximization. The algorithms and the model are tested with simulated and real data sets. First, we compare the algorithms with data generated from the model synthetically. Then, we demonstrate the interpretability of the model on a binary valued data set named Swimmer. In order to measure the performance of the model on ordinal rating data, we use MovieLens 500-K. The results indicate that the proposed model outperforms Poisson Factorization and other models in terms of predictive performance for test ratings and top-K recommendation. Finally, we conduct experiments on piano roll data extracted from Bach Chorales for investigating the use of the model in time series. The experiments reveal that the model provides parameters that can be used for prior distribution in time series analysis.

Benzer Tezler

  1. Kıyıboyu katı madde modelleriyle Doğu Karadeniz bölgesinde kıyı çizgisi değişimlerinin incelenmesi

    Investigation of the shorline change at the black sea region with longshore sediment transport models

    MUSTAFA ŞAŞAL

    Doktora

    Türkçe

    Türkçe

    2000

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. NECATİ AĞIRALİOĞLU

  2. An optimization model to control the flow of relief commodities in humanitarian supply chain under uncertainty

    Belirsiz koşullarda insani yardım tedarik zinciri malzeme akışını kontrol etmede optimizasyon modeli

    ISRAA ISMAIL

    Doktora

    İngilizce

    İngilizce

    2021

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ESRA BAŞ

  3. Temelband iletişim sistemlerinde kafes kodlama tekniğine dayanan yeni hat kodlarının tasarımı

    Design of new line codes in baseband transmission systems based on trellis coding technique

    ÜMİT AYGÖLÜ