Geri Dön

Model selection for relational data factorization models

İlişkisel veri ayrıştırılmasında model seçimi

  1. Tez No: 650745
  2. Yazar: ÇAĞLAR HIZLI
  3. Danışmanlar: PROF. DR. ALİ TAYLAN CEMGİL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

İlişkisel veri ayrıştırılmasında üretken modeller ilkeli bir yaklaşım sunar, ve ayrıştırma görevini Bayesçi istatistiğin olasılıksal çerçevesi içinde genişletmeye izin verir. Bu modellerin en bilinen örneği, ilişkisel veri üzerinde tanımlı bir Bernoulli karışım modeli olan raslantısal öbek modelidir. Bu çalışmada, karışık üyelikli raslantısal öbek modelinin (MMSB) üretken sürecini Bayesçi atama modelinin (BAM) genel atama çerçevesinde yeniden oluşturan BAM-MMSB modelini öneriyoruz. Geleneksel öbek modellerin aksine, BAM-MMSB gözlemleri temel bir Poisson süreci tarafından üretilen ve MMSB'nin üreteç modeline göre işaretlenmiş Poisson sayımları olarak kabul eder. İlişkisel verileri ayrıştırmak için kayda değer miktarda algoritma önerilmiştir. Ancak, bu modeller için model seçimi hala açık bir problemdir. Çalışmanın devamında, her model boyutu için marjinal olabilirliğin varyasyonel yaklaşımlarını hesaplayarak, BAM-MMSB modelinde eniyi topluluk sayısını tahmin ediyoruz. Çalışmamızda sadece model boyutu seçimi görevini yerine getirmemize rağmen, BAM'ın genel atama perspektifinin yalnızca model boyutunu değil aynı zamanda en iyi ayrıştırma modelini seçtiğimiz genelleştirilmiş bir model seçimi çözümü vaat ettiğine inanıyoruz. Çalışmada önce önerilen modeli açıklıyoruz ve çıkarım algoritmalarını türetiyoruz. Daha sonra, ilişkisel verileri atama modelinde Poisson sayıları olarak temsil ettiğimiz deneysel kurumu anlatıyoruz. Son olarak, model çıktısının yorumlanabilirliği ve model seçimi performansı açısından algoritmamızı, sentetik ve gerçek dünya veri kümeleri üzerinde yapılan deneylerle değerlendiriyoruz.

Özet (Çeviri)

For relational data factorization, generative models provide a statistically principled approach that allows for extending the factorization task in the probabilistic framework of Bayesian statistics. The most well-known example of such models is the stochastic blockmodel which is a mixture of Bernoullis defined for relational data. In this work, we propose the model BAM-MMSB which replicates the generative process of the mixed-membership stochastic block model (MMSB) within the generic allocation framework of Bayesian allocation model (BAM). In contrast to traditional blockmodels, BAM-MMSB considers the observations as Poisson counts generated by a base Poisson process and marked according to the generative process of MMSB. A considerable amount of algorithms have been proposed to factorize relational data. However, model selection for this task is still an open problem. In the sequel, we estimate the optimal number of communities for BAM-MMSB by computing the variational approximations of the marginal likelihood for each model order. Although we only perform the model order selection task in our work, we believe that the generic allocation perspective of BAM promises a generalized model selection solution where we not only select the model order but also choose the best factorization. We describe the proposed model and derive the inference algorithms. Next, we display the experimental setup where we represent relational data as Poisson counts of the allocation model. Later, we assess our variational inference algorithm in terms of interpretability of the model output and block recovery and model selection performance by the experiments on synthetic and real-world datasets.

Benzer Tezler

  1. Denizcilik aile işletmelerinde kurumsallaşma

    Institutionalization in maritime family-owned businesses

    BARIŞ DEMİR

    Doktora

    Türkçe

    Türkçe

    2022

    Denizcilikİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    PROF. DR. LEYLA TAVACIOĞLU

  2. Yazılı para transferi talimatları üzerinden bilgi çıkarımı

    Information extraction from written money transfer orders

    BERKE ORAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bankacılıkİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLŞEN ERYİĞİT

  3. Multiculturalism, division and planning: Lessons for urban integration and the case of Nicosia

    Çok kültürlülük, bölünme ve planlama: Kentsel bütünleşme için dersler ve Lefkoşa örneği

    GİZEM CANER

    Doktora

    İngilizce

    İngilizce

    2014

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    PROF. DR. FULİN BÖLEN

  4. Nosql veritabanı sistemlerinin performans karşılaştırılması ve analizi

    Comparison and analysis of the performance of nosql database systems

    SÜLEYMAN ÖNDER

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULLAH SEVİN

  5. Çok kriterli karar verme yöntemleri kullanılarak personel seçim kriterlerinin ağırlıklandırılması ve terfi için personel seçimi

    Weighting personnel selection criteria and personnel selection for promotion by using multi criteria decision making methods

    KEMAL GÖKHAN NALBANT

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Endüstri ve Endüstri MühendisliğiYıldız Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    Prof. Dr. HÜSEYİN BAŞLIGİL