Modeling bounded data with sum conditioned poisson factorization
Sınırlı veriyi toplama koşullu poısson ayrıştırma ile modelleme
- Tez No: 474370
- Danışmanlar: DOÇ. DR. ALİ TAYLAN CEMGİL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 77
Özet
Negatif olmayan matrisler, veri örneklerinin negatif olmayan sınırlı değerler aldığı kalem önerme ve ses sinyali işleme gibi birçok alanda karşımıza ̧çıkmaktadır. Olasılıksal yaklaşımlar bu alanlardaki birçok görev için kullanılmakta ve matris ayrıştırma modelleri bu alandaki en ileri metodlar arasında yer almaktadır. Bunlardan biri Poisson Ayrıştırma adında gözlemleri Poission dağlımıyla modelleyen bir saklı değişken modelidir. Ancak bu şekilde, değer aralığı sınırlı olan gözlemlere, Poisson dağılımıyla sınırlı olmayan değer aralığı verilmektedir. Bu çalışmada, Poisson Ayrıştırma genişletilmiş ve gözlemler Bernoulli, İkiterimli, Kategorik ve Çok terimli gibi sınırlı değer aralığına sahip dağılımlarla modellenmiştir. Ortaya çıkan model, birçok Poisson Ayrıştırmanın, kendilerinin toplamlarına koşullandırılmasıyla oluşturulduğundan Toplama Koşullu Poisson Ayrıştırması olarak adlandırılmıştır. Toplama Koşullu Poisson Ayrıştırması modelinde çıkarım için iki algoritma sunuyoruz: Gibbs örnekleyicisi ve Beklenti-Enbüyütme. Algoritmalar ve model, benzeştirilmiş ve gerçek veri kümeleriyle test edilmiştir. İlk olarak, üretici modellen elde edilen sentetik veriyle, iki algoritmayı kıyaslıyoruz. Daha sonra, Swimmer adında bir veri kümesinde modelin yorumlanabilirliğini gösteriyoruz. Modelin sıralama ölçekli puanlama verisindeki performansı ölçmek içinse MovieLens 500-K adında kullanıcı film puan veri setini kullanıyoruz. Sonuçclar önerilen modelin, mevcut diğer modellerden test puanlarını tahmin etmede ve üst-K önermede daha üstün olduğunu gösteriyor. Son olarak, modelin zaman serisindeki kullanımını araştırmak için Bach Korallerinden çıkarılan piyano rulo verisiyle deney yapıyoruz. Burada, modelin zaman serisi analizinde önsel dağılımlar için kullanılabilecek parametreler sağladığını göstermekteyiz.
Özet (Çeviri)
Non-negative matrices appear in many domains from item recommendation, audio signal processing to computer vision in which data instances have a bounded non-negative range. For various tasks in these areas, probabilistic approaches have been widely applied where matrix factorizations are among the state-of-the-art meth- ods. A particular one is a latent variable model called Poisson Factorization which models bounded data with Poisson distribution assigning them unbounded ranges. In this work, we extend Poisson Factorization to model bounded data with bounded distributions such as Bernoulli, Binomial, Categorical and Multinomial. The resulting model is named as Sum Conditioned Poisson Factorization as the model is constructed by conditioning multiple Poisson Factorizations on their sum. We present two algorithms for inference in Sum Conditioned Poisson Factorization: Gibbs sampler and Expectation-Maximization. The algorithms and the model are tested with simulated and real data sets. First, we compare the algorithms with data generated from the model synthetically. Then, we demonstrate the interpretability of the model on a binary valued data set named Swimmer. In order to measure the performance of the model on ordinal rating data, we use MovieLens 500-K. The results indicate that the proposed model outperforms Poisson Factorization and other models in terms of predictive performance for test ratings and top-K recommendation. Finally, we conduct experiments on piano roll data extracted from Bach Chorales for investigating the use of the model in time series. The experiments reveal that the model provides parameters that can be used for prior distribution in time series analysis.
Benzer Tezler
- Kıyıboyu katı madde modelleriyle Doğu Karadeniz bölgesinde kıyı çizgisi değişimlerinin incelenmesi
Investigation of the shorline change at the black sea region with longshore sediment transport models
MUSTAFA ŞAŞAL
- Gemilerin ısar ile görüntülenmesinde radar saçılma yüzeylerinin fizik optik yardımıyla modellenmesi
Başlık çevirisi yok
E.ELİF TEPELİ
Yüksek Lisans
Türkçe
1995
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. ERCAN TOPUZ
- Özgün veri modelleme yöntemleri : Empedans ve saçılma parametreli yaklaşımlar
Başlık çevirisi yok
ALİ KILINÇ
- An optimization model to control the flow of relief commodities in humanitarian supply chain under uncertainty
Belirsiz koşullarda insani yardım tedarik zinciri malzeme akışını kontrol etmede optimizasyon modeli
ISRAA ISMAIL
Doktora
İngilizce
2021
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ESRA BAŞ
- Temelband iletişim sistemlerinde kafes kodlama tekniğine dayanan yeni hat kodlarının tasarımı
Design of new line codes in baseband transmission systems based on trellis coding technique
ÜMİT AYGÖLÜ
Doktora
Türkçe
1989
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. ERDAL PANAYIRCI