Improvements in recommender systems: Addressing data sparsity and class imbalance with attribute integration and network science
Tavsiye sistemlerinde iyileştirmeler: Veri seyrekliği ve sınıf dengesizliğinin öznitelik entegrasyonu ve ağ bilimi ile ele alınması
- Tez No: 877300
- Danışmanlar: DOÇ. DR. GÜNCE KEZİBAN ORMAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Galatasaray Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 126
Özet
Tavsiye sistemleri, veri kıtlığı ve sınıf dengesizliğinden etkilenir, bu da kullanıcı tavsiyelerinin kalitesini düşürür ve sistemin tüm öğe envanterini kullanma kapasitesini sınırlar. Bu sorunların giderilmesi, tavsiye doğruluğunu artırmak ve kullanıcılara uygun öneriler sunmak için kritiktir. Bu tez, işbirlikçi filtreleme (CF) algoritmalarını iyileştirmek için öğe özniteliklerini kullanıcı-öğe etkileşimine dahil ederek ve negatif örnekleme için ağ bilimini kullanarak yenilikçi yollar tanıtmaktadır. Öncelikle, CF algoritması içinde öğe özniteliklerini farklı detay seviyelerinde entegre eden bir veri granülerlik çerçevesi önerdik. Öğelerin özniteliklerinin doğrudan öğe düğümlerine dahil edildiği iki taraflı ağlar oluşturuyoruz. Bu, öğe düğümlerini detaylı bilgilerle zenginleştirir ve CF algoritmalarının veri kıtlığının olumsuz etkilerini en aza indirmesini sağlar. İkinci olarak, kullanıcı-öğe etkileşimlerinden oluşturulan iki taraflı ağ yapısını kullanarak daha bilgilendirici negatif örnekler seçerken ağ yönelimli negatif örnekleme stratejileri tasarladık. Geleneksel yöntemlerin aksine, bu stratejiler her kullanıcı için seçim sürecini kişiselleştirir ve negatif öğeleri düğüm mesafesi ve bağlantı yoğunluğu gibi faktörlere göre önceliklendirir. Bu yaklaşımlar, negatif örneklerin daha alakalı ve öneri modelini geliştirmede daha etkili olmasını sağlar. Negatif örnekleme yöntemlerimizi Grafik Konvolüsyonel Ağlar (GCN) tabanlı CF yöntemleriyle entegre ettik ve veri granülerliği üzerinde deneyler yaptık. Sonuçlar, yaklaşımlarımızın veri kıtlığı ve sınıf dengesizliğinin olumsuz etkilerini hafiflettiğini ve daha sağlam önerilere yol açtığını göstermektedir. Bu bulgular, bu alanda yeni gelişmelere zemin hazırlayabilir.
Özet (Çeviri)
Recommendation systems suffer greatly from data sparsity and class imbalance, which reduces the quality of user recommendations and limits the system's capacity to use the entire item inventory. Addressing these issues is crucial for improving recommendation accuracy and delivering well-suited suggestions to users. This thesis introduces novel ways to improve recommendation accuracy by incorporating item attributes into user-item interaction and using network science in negative sampling in collaborative filtering (CF) algorithms. Firstly, we proposed a data granularity framework that systematically integrates item attributes at different levels of detail within the bipartite network structure. This enriches the item nodes with detailed information, hence enabling the CF algorithms to potentially minimize the negative effects of data sparsity on the recommendations. Secondly, we designed network-oriented negative sampling strategies that leverage user-item interaction structure while selecting more informative negative samples for the CF algorithm's learning task. Unlike traditional negative sampling, these strategies personalize the selection process for each user and prioritize negative items according to different network-related factors like node distance and link density. For the two problems mentioned, i.e. data sparsity and class imbalance, we tested our proposed solutions, i.e. the data granularity framework and network-oriented negative sampling, respectively, with large sets of experiments. The results show that our approaches mitigate the negative effects of the data sparsity and class imbalance, leading to more robust recommendations. These findings may pave the way for new developments in this field.
Benzer Tezler
- Mesken elektrik aboneleri için enerji yönetimi sistemi kullanımı
Utilization of energy management systems for residential electricity consumers
HÜSNÜ ALAY
Yüksek Lisans
Türkçe
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. BELGİN TÜRKAY
- Savunma sanayi sektöründe faaliyet gösteren bir firmaya değer akış haritalama ile bulanık htea entegrasyonu
Fuzzy fmea integration with value flow mapping for a company operating in the defense industry sector
MERVE UZUN
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SAFİYE SENCER
- Özel bir piston ve kilit mekanizmasına sahip yüksek başlangıç ivmeli göğüs kompresyon cihazının tasarımı, simülasyonu ve üretimi
Design, simulation, and fabrication of a high initial acceleration automatic chest compression device with a special piston and locking mechanism
AHMET KAĞIZMAN
Doktora
Türkçe
2024
Biyomühendislikİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. VOLKAN SEZER
- Plant-wide process analysis targeting reliable estimation of biogas production from anaerobic sludge digestion
Anaerobik çamur çürütme prosesinden biyogaz üretiminin güvenilir tahminine yönelik tesis geneli proses analizi
GÖKŞİN ÖZYILDIZ
Doktora
İngilizce
2024
Çevre Mühendisliğiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRETTİN GÜÇLÜ İNSEL
- Yatçıların uzun süreli tekne bağlama yeri tercih sürecine etki eden faktörlerin analizi
Analysis of the factors affecting yachtsmen's long-term boat berthing location preference process
SİNEM ÇALIŞKAN UYANIK
Yüksek Lisans
Türkçe
2024
Denizcilikİstanbul Teknik ÜniversitesiDenizcilik Çalışmaları Ana Bilim Dalı
PROF. DR. LEYLA TAVACIOĞLU