A new weighting approach to solve data sparsity problem in collaborative filtering
İşbirlikçi filtreleme yöntemi ile seyrek veri problemini çözmek için yeni bir ağırlık benzetim yaklaşımı
- Tez No: 478574
- Danışmanlar: DOÇ. DR. MİNE ELİF KARSLIGİL YAVUZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Kullanıcı tabanlı işbirlikçi filtreleme yöntemlerinde, bir ögenin tahmini puanının belirlenmesi kullanıcıların benzerliğine bağlı olduğundan ötürü, benzerlik ölçümünün nasııl yapıldığı önemli bir etmendir. Bu tez çalışmasında, işbirlikçi filtrelerin doğruluğunu arttırmak için, benzerlik ölçümünde kullanılacak yeni bir ağırlıklandırma yöntemi önerilmiştir. Bu yöntemde,her kategorinin kullanıcı ağırlığı, bu kategorilere ait ögelerin puanları kullanılarak hesaplanır. Bu işlem, kullanıcı-öge modelini kullanıcı kategori modeline dönüştürür. İki kullanıcının modelleri arasındaki farkların toplamı, ağırlığın ilk kısmını oluşturur ve bir benzerlik ölçüsü olarak kullanılabilir. Ağırlığın ikinci kısmı, puanı tahmin edileceki ögenin kategorilerine, aktif kullanıcının ağırlığına ve bu kategorilerin benzer kullanıcılarının ağırlıklarına bağlı olarak üretilir.Bu ağırlığı bir benzerlik ölçütü olarak kullanıp kosinüs benzerliği sonucu ile çarparak sistem başarısı ölçülmüştür., Her seferinde 4 kullanıcı ekleyerek MovieLens 100K veri seti için benzer kullanıcı sayısını 4-20 arasında değiştirerek yapılan testlerde, işbirlikçi filtrelemenin doğruluk değerinin % 2-a% 0,6 arasında değiştiği gözlenmiştir. Kullanıcılar tarafından puanlanan ögelerin sayısının, toplam öge sayısına oranla çok küçük değerlerde olmasına seyrek veriproblem denir. Seyrek veri konusu, işbirlikçi filtreleme yönteminde karşılaşılan en önemli sorunlardan biridir.. Bu tez çalışmasında, seyrek very sorununu çözmek veya en azından işbirlikçi filtreleme yönteminin başarısı üzerindeki etkisini azaltmak amacıyla,her kategoriye ait ögelerin yüzdelerini, kullanıcı kategorisi matrisindeki her bir kategorinin ağırlığı olarak kullanarak, eksik puanlarıdeğiştirmek için bir değer oluşturulmuştur. Bu değer kullanılarak, eksik puanların çoğunluğu oluşturduğu durumlarda seyrek verilerin ortalama mutlak hatası yarıya düşürülmüş ve öneri doğruluğu iyileştirilmiştir.
Özet (Çeviri)
Similarity measure is an important part of user-based collaborative filtering, where the prediction of the rank of the item depends on the similarity between users. In this thesis, a novel weighting technique for the similarity measure is proposed in order to increase the accuracy of collaborative filtering. In this technique, the user weight of each category is calculated using the ranks of items that belong to these categories. This process converts the user-item model to user-category model. The sum of the differences between two users' models forms the first part of the weight and it can be used as a similarity measure. The second part of the weight is generated depending on the categories of the item that its rank will be predicted, the active user's weights and the similar users' weights of these categories. Using this weight as a similarity measure then multiplied it with the cosine similarity has improved the collaborative filtering accuracy almost between 2% and 0.6% by changing the number of similar users for MovieLens 100K dataset between 4 and 20 by adding 4 users each time. Data sparsity problem is one of the biggest problems that faces the collaborative filtering algorithm. It means missing data and it almost happens when users do not rank the items they watched or bought. In order to solve this problem or at least to decrease its effects on collaborative filtering accuracy, using the percentages of the items that belong to each category as a weight of each category in the user-category matrix, a value has been generated to replace the missing ranks. Using this value, the mean absolute error of the sparse data has been decreased almost to the half in cases of high percentages of missing ranks and it improve the recommendation accuracy to a good extent in cases of low percentages of sparse data.
Benzer Tezler
- Generating solutions for data-driven decision making problems based on Bayesian models
Veri güdümlü karar verme problemlerine Bayesçi modellerle çözümler sunulması
SEDEF ÇALI
Doktora
İngilizce
2023
Endüstri ve Endüstri MühendisliğiDokuz Eylül ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ADİL BAYKASOĞLU
- Parçacık sürü optimizasyonu ile pareto yaklaşımının birleştirilerek çok amaçlı optimizasyon problemlerinin çözümü ve Çanakkale-Tuzla hidrotermal sistemin manyetotellürik verileri ile modellenmesi
Solution of multi-objective optimization problems by combining particle swarm optimization with pareto approach and modeling of Çanakkale-Tuzla hydrothermal system with magnetotelluric data
ERSİN BÜYÜK
Doktora
Türkçe
2020
Jeofizik Mühendisliğiİstanbul Teknik ÜniversitesiJeofizik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH KARAMAN
- Transfer öğrenmede yeni yaklaşımlar
New approaches in transfer learning
BARIŞ KOÇER
Doktora
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ARSLAN
- Development a new fuzzy multiple attribute decision making approach and its application to decision making in ship design and shipbuilding
Yeni bir bulanık çok öz-nitelikli karar verme tekniğinin geliştirilmesi ve gemi inşaatı ve dizaynı karar verme problemlerine uygulanması
AYKUT İBRAHİM ÖLÇER
- Mekansal analiz teknikleri ile çok kriterli karar verme yaklaşımı kullanılarak raylı sistem güzergah analizi
Rail system route analysis using multi criteria decision making with spatial analysis techniques
BERNA ÇALIŞKAN
Doktora
Türkçe
2023
Ulaşımİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ OSMAN ATAHAN