Adopting several models to alleviate sparsity and cold-start problems using data mining techniques for recommendation systems
Tavsiye sistemi için veri madenciliği tekniklerini kullanarak veri seyrekliğini ve soğuk başlatma sorunlarını hafifletmek için çeşitli modeller
- Tez No: 668247
- Danışmanlar: DR. ÖĞR. ÜYESİ YUSUF ERKAN YENİCE, DOÇ. DR. HACER KARACAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Aksaray Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 203
Özet
Web 2.0'ın geliştirilmesi ve elde edilebilir verilerin hızlı artışı bilgi aşırı yüklemesinin üstesinden gelebilen çoklu sistemlerin ve onlar arasında da Tavsiye Sistemleri'nin evrilmesine yol açmıştır. Tavsiye Sistemleri'nin performansının büyük ölçüde seyreklik ve soğuk-başlatma problemleri tarafından sınırlandırılmış olması nedeniyle, mevcut araştırma bu problemlerin hafifletilmesini temel bir amaç olarak benimsemiştir. Bu amacın gerçekleştirilmesi için, şu dört veri madenciliği tekniği önerilmiştir: çok-aşamalı kaynak ayırma - tekil değer ayrışması (MSRA-SVD), MSRA-SVD++, kümelenen topluluk tespiti ve örtüşen topluluk tespiti. İlk iki model veri seyrekliği probleminin üstesinden gelme amacına adanmışken, kalan modeller ise soğuk-başlatma kullanıcılarının problemlerinin hafifletilmesi amacıyla benimsenmektedir. İlk iki modelin temel stratejisi sosyal ağdaki gizli ilişkilerin belirlenmesi için (MSRA) yönteminin kullanılmasıdır. MSRA yöntemi ilişki olasılığının belirlenmesi amacıyla uygulanır. Eğer olasılık bir eşik düzeyini aşarsa, bu durumda yeni bir ilişki kurulmuş olacaktır. İkinci model için (MSRA-SVD++), derecelendirme bilgileri yoluyla elde edilebilecek olan örtük geribildirim kaynağı ek bir bilgi kaynağı olarak kullanılır. Buna ek olarak, ve örtüşme modelleri de soğuk-başlatma kullanıcılarının problemlerinin hafifletilmesi amacıyla benimsenmektedir. Bu modellerin ardında yatan kümelenme temel düşünce kullanıcıların çeşitli topluluklar halinde kümelenmesi için bir kümeleme tekniğinin uygulanmasıdır. Bunun elde edilebilmesi için de, güven değerine sahip olan açık ve örtük sosyal ilişkiler entegre edilerek uzaklık değerleri hesaplanır. Buna ek olarak, medoidler etrafındaki bölüntülenme ile ilgili olarak da kümelenme algoritması benimsenir. Daha sonra, son model için tüm kümelerin ortalama uzaklıkları hesaplanır. Tüm kullanıcılar için, kullanıcılar ve belli bir kümenin merkez düğümü arasındaki mesafe hesaplanır. Eğer bu mesafe söz konusu kümenin ortalamasından daha azsa, o küme için yeni bir kullanıcı eklenecektir. Dahası, tahmin değerinin hesaplanması amacıyla her bir küme için SVD++ yöntemi kullanılır. Önerilen modeller üç adet gerçek-dünya veri kümesi kullanılarak değerlendirilir. Sonuç olarak, bulgular önerilen modellerin çeşitli en yeni çalışmaları tahmin doğruluğu bakımından nasıl geride bıraktıklarına dair kayda değer bir anlayışı sergilemiştir.
Özet (Çeviri)
The development of Web 2.0 and the rapid growth of available data have led to the evolution of multiple systems among them the Recommendation Systems (RSs) which can handle the information overload. Due to the fact that, RSs performance is substantially limited by sparsity and cold-start problems; this research study takes the route for a major objective to attenuate these problems. To realize this objective, four data mining techniques are proposed namely: multi-steps resource allocation- singular value decomposition (MSRA-SVD), MSRA-SVD++, clustering community detection, and overlapping community detection. The first two models are dedicated to tackle the data sparsity problem whereas the rest models are adopted to alleviate cold-start users' problem. The core strategy of the first two models is to use the (MSRA) method to identify hidden relations in social network. the MSRA method is applied to determine the probability of their relation. If the probability exceeds a threshold, a new relationship will be established. For the second model (MSRA-SVD++), an implicit feedback source is exploited as an additional source of information, which can be extracted via rating information. Additionally, clustering and overlapping models are adopted to overcome cold-start user problem. The main idea of these models is to apply a clustering technique to group users into several communities. In order to attain that, explicit and implicit social relations with the confidence values are integrated to compute distance values. Additionally, the partitioning around medoids (PAM) clustering algorithm is adopted. Later, for the last model, the average distances of all clusters are computed. For all users, the distance between users and the center node of a particular cluster is computed. If the distance is less than the average of this cluster, a new user for this cluster will be added. Moreover, the SVD++ method is employed for each cluster to compute the prediction value. The proposed models are evaluated through the usage of three real-world datasets. Ultimately, findings exhibited a great deal of insights on how the proposed models outperformed a number of the state-of-the-art studies in terms of prediction accuracy.
Benzer Tezler
- Exploring the enablers and barriers of circular economy and blockchain adoption in the construction industry
İnşaat sektörünün blok zinciri ve döngüsel ekonomiye geçişini engelleyen ve destekleyen faktörlerin incelenmesi
UFUK ŞAHİN
Yüksek Lisans
İngilizce
2023
İnşaat MühendisliğiOrta Doğu Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜZİDE ATASOY ÖZCAN
- A stress testıng framework for the Turkısh bankıng sector: an augmented approach
Türk bankacılık sektörü için bir stres testi çerçevesi: Bir genişletilmiş yaklaşım
BAHADIR ÇAKMAK
Doktora
İngilizce
2014
BankacılıkOrta Doğu Teknik Üniversitesiİktisat Ana Bilim Dalı
PROF. DR. NADİR ÖCAL
- Music emotion recognition: A multimodal machine learning approach
Müzik duygusu tanıma: Çok-modlu makine öğrenmesi yaklaşımı
CEMRE GÖKALP
Yüksek Lisans
İngilizce
2019
Bilim ve TeknolojiSabancı ÜniversitesiYönetim Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM
DOÇ. ABDULLAH DAŞCI
- Modeling of thermo-mechanical and irradiation behavior of metallic and oxide fuels for sodium fast reactors
Başlık çevirisi yok
AYDIN KARAHAN
Doktora
İngilizce
2009
Nükleer MühendislikMassachusetts Institute of TechnologyDOÇ. DR. JACOPO BUONGIORNO
- Gezgin satıcı araç turu belirleme problemleri için yeni alt tur engelleme kısıtları
The New subtour elimination constratins for traveling salesman and vehicle routing problems
AYDIN SİPAHİOĞLU
Doktora
Türkçe
1996
Endüstri ve Endüstri MühendisliğiEskişehir Osmangazi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
İMDAT KARA