Enhancing cross-market recommendation system using graph isomorphism networks
Çizge izomorfizm ağları kullanarak çapraz pazar tavsiye sistemi geliştirme
- Tez No: 886909
- Danışmanlar: PROF. DR. ŞULE ÖĞÜDÜCÜ, DR. RESUL TUGAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 81
Özet
Yapay zeka ve makine öğrenmesi modellerinin hızla gelişmesi, çeşitli sektörlerdeki uygulamalarını önemli ölçüde artırmıştır. Bu ilerlemeler, birçok endüstride daha sofistike tahmin modellerinin oluşturulmasına yol açmıştır. Dünyanın giderek dijitalleştiği ve veri odaklı hale geldiği bu dönemde, şirketlerin rekabet avantajını sürdürmek ve kârlılıklarını artırmak için bu çözümleri benimsemeleri yaygın hale gelmiştir. Sonuç olarak, veri hacmindeki artışla birlikte ileri düzey tahmin modellerine olan ihtiyaç da artmıştır. Tavsiye sistemleri, tahmin modellerinin önemli bir uygulama alanıdır. Bu sistemler, kullanıcıların tercihlerine ve önceki davranışlarına dayalı olarak kişiselleştirilmiş öneriler sunarak büyük miktardaki bilgi arasında gezinmelerine yardımcı olur. Bu tez, Çizge İzomorfizm Ağları (GIN) kullanarak çapraz pazar tavsiye sistemlerini geliştirmeye odaklanmaktadır. Bu sistemler, grafik yapılarında yakalanan karmaşık ilişkilerden yararlanarak doğru ve kişiselleştirilmiş öneriler sunmak için kritik öneme sahiptir. Geleneksel tavsiye yöntemleri, özellikle veri kıtlığı ve kullanıcı etkileşimlerinin karmaşıklığı gibi sorunlarla, özellikle çapraz pazar ortamlarında sıklıkla mücadele eder. Bu zorlukların üstesinden gelmek için, bu tez GIN'leri kullanarak tavsiye sistemlerinin performansını artırmayı amaçlayan yenilikçi bir yaklaşım önermektedir. Kullanıcı-öğe etkileşimlerinden iki parçalı bir grafik oluşturarak, düğümler kullanıcılar ve öğeler olarak temsil edilir ve etkileşimler (örneğin, satın alma veya derecelendirme) kenarları oluşturur, model verinin içindeki karmaşık ilişkileri yakalar. Önerilen modelin ana bileşeni, kullanıcılar ve öğeler için gömmeler oluşturan ve özellikleri kendi mahallelerinden toplayıp dönüştüren GINConv katmanıdır. Grafiğin adjacency matrisi, öğrenme sürecini dengelemek ve yüksek bağlantı derecelerine sahip düğümlere karşı önyargıları azaltmak için normalleştirilir. Bu normalleştirme işlemi, her düğümün derecesini hesaplamayı, derece matrisinin tersini hesaplamayı ve ardından adjacency matrisini ters derece matrisi ile çarparak normalleştirmeyi içerir. GINConv katmanları tarafından üretilen gömmeler, etkileşim puanlarını tahmin etmek için kullanılır ve bu puanlar, önerilerin temelini oluşturur. Bu puanlar, kullanıcı ve öğe gömmelerini birleştirip bir Multi-Layer Perceptron (MLP) modeline besleyerek hesaplanır. MLP, kullanıcılar ve öğeler arasındaki etkileşim olasılığını tahmin eder, bu da öneri sürecinin temelini sağlar. Modelin performansını değerlendirmek için Hit Rate (HR) ve Normalized Discounted Cumulative Gain (NDCG) gibi çeşitli ölçütler kullanılır. Bu ölçütler, en iyi 10 öneriye odaklanarak, modelin kullanıcı tercihlerini doğru bir şekilde tahmin etme ve öğeleri etkili bir şekilde sıralama yeteneğinin kapsamlı bir değerlendirmesini sağlar. Deney sonuçları, GIN tabanlı çerçevenin geleneksel yöntemlere kıyasla çapraz pazar tavsiye sistemlerinin performansını önemli ölçüde iyileştirdiğini göstermektedir. Bu tezin önemli bulgularından biri, grafik gömmelerinin kullanımının GIN tabanlı modelin karmaşık kullanıcı-öğe ilişkilerini yakalamasına ve daha doğru ve kişiselleştirilmiş öneriler sunmasına olanak tanımasıdır. Bu yaklaşım, genellikle daha basit yöntemlere dayanan ve mevcut verileri tam olarak kullanamayan geleneksel tavsiye sistemlerinin sınırlamalarını etkili bir şekilde ele alır. Tavsiye doğruluğunu artırmanın yanı sıra, GIN tabanlı modelin veri kıtlığı ve pazar spesifik varyasyonları etkili bir şekilde ele alma yeteneği de gösterilmiştir. Grafik verilerindeki yapısal bilgileri kullanarak, model kullanıcı etkileşimlerinin seyrek olduğu veya pazarlarda önemli ölçüde farklılık gösterdiği durumlarda bile mevcut verileri daha iyi kullanabilir. Bu uyarlanabilirlik, çeşitli ve dinamik ortamlarda ilgili ve kişiselleştirilmiş öneriler sunmak için kritik öneme sahiptir. Bu tezde ayrıca geleneksel tavsiye yöntemleriyle (ItemCF ve UserCF gibi işbirlikçi filtreleme teknikleri ve Neural Matrix Factorization (NMF) ve Generalized Matrix Factorization (GMF++) gibi diğer makine öğrenmesi modelleri) yapılan karşılaştırmalı analizler de yer almaktadır. Sonuçlar, GIN tabanlı modelin doğruluk ve verimlilik açısından bu geleneksel yöntemleri sürekli olarak aştığını göstermektedir. Bu, GIN'lerin kullanıcı tercihleri ve davranışlarını anlamada daha sofistike ve etkili bir yaklaşım sunma potansiyelini vurgulamaktadır. Bu tezde, önerilen GIN tabanlı modelin geleneksel tavsiye yöntemleriyle karşılaştırılmasının yanı sıra, modelin hiperparametre optimizasyonu da incelenmiştir. Modelin performansını maksimize etmek için çeşitli hiperparametre ayarları test edilmiştir. Bu ayarlar arasında, öğrenme oranı, mini-batch boyutu, ve düzenleme katsayısı gibi parametreler bulunmaktadır. Hiperparametre optimizasyonu, modelin genel performansını önemli ölçüde artırmış ve en iyi sonuçların elde edilmesini sağlamıştır. Modelin eğitim süreci, çeşitli veri kümeleri kullanılarak gerçekleştirilmiştir. Bu veri kümeleri, farklı pazarlardan gelen kullanıcı etkileşimlerini içermekte ve modelin performansını değerlendirirken gerçek dünya senaryolarını yansıtmaktadır. Veri kümeleri, kullanıcıların belirli öğelerle olan etkileşimlerini içermekte ve bu etkileşimler, modelin öğrenme sürecine rehberlik etmektedir. Önerilen GIN tabanlı model olan CrossGR, çeşitli kaynak ve hedef pazar çiftlerinde değerlendirilmiştir. Deney sonuçları, modelin farklı kombinasyonlarda tutarlı bir performans sergilediğini göstermektedir. Özellikle, kaynak pazar s1 üzerinde eğitim alıp hedef pazar t1'de test edildiğinde, model NDCG@10 değerinde 0.6066 ve HR@10 değerinde 0.7138 elde etmiştir. Bu, modelin bir pazardan diğerine iyi bir şekilde genelleme yapabildiğini göstermektedir. Ayrıca, modelin birleşik veri kümeleri üzerinde eğitildiğinde performansının arttığı gözlemlenmiştir. Örneğin, s1s2 üzerinde eğitilip t1'de test edildiğinde, NDCG@10 değeri 0.6317 ve HR@10 değeri 0.7370 olarak elde edilmiştir. Bu sonuçlar, modelin çapraz pazar verilerindeki çeşitlilikten faydalandığını göstermektedir. Bu tez, grafik tabanlı modellerin tavsiye sistemleri üzerindeki etkisini ortaya koymakta ve gelecekteki araştırmalara ışık tutmaktadır. Grafik yapılarının kullanımı, tavsiye sistemlerinin doğruluğunu ve kişiselleştirme yeteneklerini önemli ölçüde artırabilir. Bu nedenle, grafik tabanlı yaklaşımlar, tavsiye sistemleri alanında yeni fırsatlar sunmakta ve kullanıcı deneyimini iyileştirmek için güçlü bir araç olarak karşımıza çıkmaktadır. Gelecekteki çalışmalar, modelin farklı veri kümeleri ve senaryolar üzerindeki performansını değerlendirmeye devam edebilir. Ayrıca, GIN'lerin diğer makine öğrenmesi ve derin öğrenme teknikleriyle entegrasyonu, modelin performansını daha da artırabilir. Bu bağlamda, GIN'lerin çok yönlülüğü ve adaptasyon yetenekleri, çeşitli uygulama alanlarında geniş çapta fayda sağlayabilir. Bu tez, Çizge İzomorfizm Ağlarının tavsiye sistemlerinde kullanımının büyük bir potansiyel taşıdığını ve bu alandaki gelecekteki yenilikler için sağlam bir temel oluşturduğunu göstermektedir. Grafik tabanlı modeller, veri kıtlığı ve pazar spesifik varyasyonlar gibi zorluklarla başa çıkmada etkili çözümler sunarak, tavsiye sistemlerinin genel performansını ve kullanıcı memnuniyetini artırmaktadır. Bu nedenle, GIN'ler ve diğer grafik tabanlı yaklaşımlar, tavsiye sistemleri alanında önemli bir yenilik olarak değerlendirilmektedir.
Özet (Çeviri)
The rapid development of artificial intelligence and machine learning models has significantly expanded their applications across various sectors. These advancements have led to the creation of more sophisticated forecasting models in numerous industries. As the world becomes increasingly digital and data-driven, the adoption of these models by companies to maintain a competitive edge and enhance their profitability has become more prevalent. Consequently, the need for advanced predictive models has grown, especially with the surge in data volume. In recommendation systems, predictive models play a crucial role in helping users navigate vast amounts of information by providing personalized suggestions based on their preferences and previous behaviors. This thesis focuses on improving cross-market recommendation systems using Graph Isomorphism Networks (GINs). These systems are essential for delivering accurate and personalized recommendations by leveraging the complex relationships captured in graph structures. Traditional recommendation methods often struggle with data sparsity and the complexity of user interactions, particularly in cross-market environments where data characteristics can vary significantly. To address these challenges, this thesis proposes a novel approach that utilizes GINs to enhance the performance of recommendation systems. By constructing a bipartite graph from user-item interactions, where nodes represent users and items, and edges represent interactions such as purchases or ratings, the model captures the intricate relationships within the data. The core component of the proposed model is the GINConv layer, which generates embeddings for users and items by aggregating and transforming features from their respective neighborhoods. The adjacency matrix of the graph is normalized to ensure balanced learning and to mitigate biases towards nodes with higher degrees of connectivity. This normalization process involves calculating the degree of each node, computing the inverse of the degree matrix, and then normalizing the adjacency matrix by multiplying it with the inverse degree matrix. The embeddings generated by the GINConv layers are used to predict interaction scores, which form the basis for making recommendations. These scores are computed by concatenating the user and item embeddings and feeding them into a Multi-Layer Perceptron (MLP). The MLP predicts the likelihood of interaction between users and items, providing the foundation for the recommendation process. To evaluate the performance of the GIN-based model, various metrics are used, including Hit Rate (HR) and Normalized Discounted Cumulative Gain (NDCG). These metrics focus on the top-10 recommendations, providing a comprehensive assessment of the model's ability to accurately predict user preferences and rank items effectively. The experimental results demonstrate that the GIN-based framework significantly improves the performance of cross-market recommendation systems compared to traditional methods. One of the key findings of this study is that the use of graph embeddings allows the GIN-based model to capture complex user-item relationships, resulting in more accurate and personalized recommendations. This approach effectively addresses the limitations of traditional recommendation systems, which often rely on simpler methods that do not fully utilize the available data. In addition to improving recommendation accuracy, the GIN-based model also shows a strong capability to handle data sparsity and market-specific variations. By leveraging the structural information in graph data, the model can make better use of the available data, even when user interactions are sparse or vary significantly between markets. This adaptability is crucial for providing relevant and personalized recommendations in diverse and dynamic environments. The study includes a comparative analysis with traditional recommendation methods, such as collaborative filtering techniques (ItemCF and UserCF) and other machine learning models like Neural Matrix Factorization (NMF) and Generalized Matrix Factorization (GMF++). The results consistently show that the GIN-based model outperforms these traditional methods in terms of both accuracy and efficiency. This highlights the potential of GINs to revolutionize recommendation systems by offering a more sophisticated and effective approach to understanding user preferences and behaviors. In conclusion, this thesis demonstrates the significant advantages of using Graph Isomorphism Networks in cross-market recommendation systems. By effectively utilizing graph-structured data, GINs can provide more accurate, personalized, and context-aware recommendations, enhancing the overall user experience and satisfaction. This study paves the way for further research and development in the field of recommendation systems, particularly in exploring the full potential of graph-based models and their applications across various domains. Future research could explore the integration of additional data sources, such as user demographic information or social network data, to further enhance the model's accuracy and personalization capabilities. Additionally, extending the model to other types of recommendation systems, such as content-based or hybrid systems, could provide valuable insights into the versatility and scalability of GINs in different recommendation scenarios. Overall, this thesis contributes to the growing body of knowledge in the field of recommendation systems and highlights the promising potential of graph-based approaches in improving recommendation accuracy and user satisfaction.
Benzer Tezler
- Türkiye Gün İçi Piyasası'nın Avrupa ile karşılaştırmalı analizi
Comparative analysis of Turkiye's Intraday Market with Europe
ZEYNEP ÖZMEN
Yüksek Lisans
Türkçe
2024
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
PROF. DR. SERMİN ONAYGİL
- Sınır ötesi elektrik ticaretinin gün öncesi piyasası fiyat oynaklığı üzerindeki etkisi: Türkiye örneği
Impact of cross-border electricity trade on day-ahead market price volatility: A case study of Turkey
MUSTAFA EMİN MALKOÇ
Yüksek Lisans
Türkçe
2024
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
PROF. DR. SERMİN ONAYGİL
- From data to action: Transforming pressure testing in manufacturing with machine learning for enhancing energy efficiency
Veriden aksiyona: Üretimdeki basınç testini makine öğrenimiyle dönüştürmek ve enerji verimliliğini artırmak
ERHAN YILDIZ
Yüksek Lisans
İngilizce
2024
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN
- Understanding the effect of supplier relations and market orientation on firm performance: Evidence from Turkey
Tedarikçi ilişkileri ve pazar odaklığının işletme performansı üzerindeki etkisinin anlaşılması: Türkiye'den kanıtlar
SEDA BAYRAKTAR
Yüksek Lisans
İngilizce
2024
İşletmeYeditepe Üniversitesiİşletme (İngilizce) Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZGE KİREZLİ
- İmalat sanayiinde rekabet edebilirilik ve karmaşıklık: Ülkelerarası bir analiz
Competitiveness and complexity in manufacturing industry: A cross-country analysis
UĞUR AYTUN