Geri Dön

Enhancing book recommendation systems using collaborative filtering and deep learning

İşbirlikçi filtreleme ve derin öğrenme ile kitap öneri sistemleri geliştirilmesi

  1. Tez No: 959171
  2. Yazar: HÜSEYİN TUNÇ
  3. Danışmanlar: DOÇ. DR. ÖMER FARUK BEYCA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Endüstri ve Endüstri Mühendisliği, Computer Engineering and Computer Science and Control, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Büyük Veri ve İş Analitiği Ana Bilim Dalı
  12. Bilim Dalı: Büyük Veri ve İş Analitiği Bilim Dalı
  13. Sayfa Sayısı: 109

Özet

Günümüzde, dijital çağın getirdiği yoğun rekabet ortamında müşterilere doğru ürünü kişisel bir dokunuşla önermek işletmeler için kritik hale gelmiştir. Özellikle geniş ürün yelpazesine sahip kitap sektöründe, okurlara ilgi duyabilecekleri yeni kitapları önermek, hem müşteri memnuniyetini artırmak hem de satışları yükseltmek için önemli bir araçtır. İş dünyasında, müşterilerle kişisel biçimde etkileşim kurmanın ne kadar önemli olduğu bilinen bir gerçektir. Bu nedenle, ölçeklenebilir ve akıllı tavsiye motorlarına sahip olmanın karma kitap satışlarında son derece önemli olduğu düşünülmektedir. Nitelikli bir tavsiye sistemi, çevrimiçi bir mağazada her müşteriye adeta bir satış danışmanının kişisel ilgisini sunarak kullanıcının aradığı kitapları daha kolay bulmasını sağlayabilir ve böylece müşteri sadakatini ve satışları artırabilir. Bu çalışma, ileri kitap tavsiye sistemlerinin geliştirilmesini ve değerlendirilmesini, üç farklı makine öğrenmesi yaklaşımını (İçerik Tabanlı Filtreleme (CBF), Alternating Least Squares (ALS) kullanan İşbirlikçi Filtreleme ve Sinirsel Matris Faktörleştirme (NeuMF)) karşılaştırmalı uygulama yoluyla kullanarak incelemektedir. Bu üç yaklaşım, içerik odaklı öneriden kullanıcı davranışlarına dayalı işbirlikçi yaklaşıma ve en gelişmiş derin öğrenme tabanlı modele uzanan geniş bir yelpazeyi temsil etmektedir. Geçmiş veriler ve modern makine öğrenmesi araçlarıyla bu çalışma, kullanıcılara en iyi ve en ilgili tavsiyeleri sunmanın yolunu bulmaya odaklanmaktadır. Yani, sistem geçmiş kullanıcı verilerinden ders çıkararak ve ileri algoritmaları kullanarak her bir okura en uygun ve ilgisini çekecek kitapları bulup önermeyi amaçlamaktadır. Bu araştırmada, 595.000'den fazla kitap ve çok sayıda anonim kullanıcı-kitap etkileşimi barındıran büyük bir Türk kitap perakendecisinden alınan veri seti kullanılmıştır. Veri setindeki eksik bilgiler uygun tekniklerle giderilmiş ve her kitap için sayısal ile metinsel çeşitli özellikler oluşturularak kapsamlı bir ön işleme uygulanmıştır. Bu hazırlık sürecinin ardından, üç algoritmanın tümü de aynı koşullar altında eğitilmiş ve ortaya koydukları sonuçlar tutarlı bir şekilde karşılaştırılarak değerlendirilmiştir. İçerik Tabanlı Filtreleme (CBF) yöntemi, kitap adı, yazar, dil ve kategori gibi içerik bilgilerini kullanarak benzer ürünler önermiştir. Bu yöntemde her kitabın içeriğindeki önemli anahtar kelimeler TF-IDF tekniğiyle belirlenmiş ve kitaplar arasındaki benzerlik bu anahtar kelime profillerine dayanarak kosinüs benzerliği ölçütüyle hesaplanmıştır. Sonuç olarak kullanıcıya, içerik açısından geçmişte ilgi gösterdiği kitaplara en çok benzeyen yeni kitaplar önerilmiştir. Alternating Least Squares (ALS) algoritmasına dayalı işbirlikçi filtreleme yaklaşımı ise kullanıcı-öğe etkileşim matrisini belirli sayıda gizli faktöre ayırmıştır. Bu sayede her kullanıcı ve her kitap, birkaç sayısal özellik (gizli faktör) ile temsil edilmiş ve model, kullanıcının geçmişte satın alıp beğendiği kitapların bu faktör profiline benzer özellikler taşıyan diğer kitapları tahmin ederek önermiştir. NeuMF (Sinirsel Matris Faktörleştirme) yaklaşımı ise matris faktörleştirmenin avantajlarını yapay sinir ağlarının esnekliğiyle birleştirerek, kullanıcılar ve kitaplar arasındaki daha karmaşık ilişkileri yakalamaya çalışmıştır. Bu model, matris faktörleştirme ile elde edilen gizli kullanıcı ve ürün özelliklerini çok katmanlı bir sinir ağı yapısında işleyerek daha ince kalıpları öğrenebilmiştir. Böylece NeuMF, önceki iki yöntemin güçlü yönlerini bir araya getirip veri içindeki örtük ilişkileri de keşfederek kullanıcılara daha isabetli öneriler sunma potansiyeli göstermiştir. Örneğin, içerik tabanlı yaklaşımda eğer bir kullanıcı daha önce bilim kurgu türünde bir roman okumuşsa, sistem ona yine bilim kurgu kategorisinde, benzer temalara sahip başka bir roman önerebilir. Buna karşılık, ALS tabanlı işbirlikçi filtrelemede aynı kullanıcıya önerilecek kitaplar sadece bilim kurgu ile sınırlı kalmaz; bu model, benzer bilim kurgu romanlarını okuyan diğer kullanıcıların ayrıca hangi farklı türde kitapları beğendiğine de bakarak, kullanıcıya örneğin fantastik kurgu gibi farklı bir türden, ancak ilgisini çekebilecek bir kitap da önerebilir. Modellerin başarımını değerlendirmek için, öneri listesi uzunluğu K = 10, 50 ve 100 olacak şekilde Recall@K, Precision@K, Hit Rate@K ve NDCG@K gibi yaygın ölçütler kullanılmıştır. Recall@K, bir kullanıcının beğenebileceği tüm ürünlerin yüzde kaçının öneri listesinde yer aldığını gösterir. Precision@K ise öneri listesinde sunulan K adet ürünün ne kadarının kullanıcı için gerçekten ilgili olduğunu belirtir. Hit Rate@K, her bir kullanıcı için K uzunluğundaki öneri listesinde en az bir tane isabetli öneri bulunup bulunmadığını ölçerek listelerin başarı oranını ortaya koyar. NDCG@K (Normalized Discounted Cumulative Gain) ise listede bulunan ilgili ürünlerin sıralamasına duyarlı bir metriktir ve ilgili kitapların üst sıralarda yer alıp almadığını yansıtır. NeuMF, test edilen neredeyse her K değeri için diğer modellerden daha iyi performans göstermiştir. Örneğin, öneri listesi uzunluğunun K = 100 olduğu durumda NeuMF modeli 0.11 Recall, 0.006 Precision, 0.35 Hit Rate ve 0.05 NDCG değerlerini elde etmiştir. Bu sonuç, NeuMF'nin yaptığı önerilerin, diğer modellerin önerilerine kıyasla çok daha ilgili ve listelerde üst sıralarda olduğunu göstermektedir. NeuMF'nin sonuç metriklerinde gösterdiği üstünlük, uzun tavsiye listeleri sunarken bile oldukça ilgili öğeleri seçebildiğini kanıtlamaktadır. Bu tutarlılık, modelin karmaşık kalıpları keşfedebilmesini ve farklı kullanıcı davranışlarına iyi uyum sağlayabilmesini mümkün kılar. Ayrıca, elde edilen sonuçların güvenilirliğini sınamak amacıyla 8 katlı çapraz doğrulama (cross-validation) yapılmıştır. NeuMF modelinin her bir doğrulama diliminde tutarlı bir performans sergilemesi, bu modelin farklı kullanıcı gruplarında da benzer şekilde başarılı olabildiğini ortaya koymuştur. Bu bulgu, NeuMF'nin büyük ve çeşitlilik içeren veri setlerini barındıran gerçek dünya işletme ortamlarında yaygın kullanım için daha uygun bir model olduğunu göstermektedir. Bunun yanında, öneri sistemlerinin yalnızca algoritmik doğrulukla değil, kullanıcı deneyimiyle de bütünleşmesi gerektiği unutulmamalıdır. Bu bağlamda yapılan önerilerin ne kadar isabetli olduğu kadar, kullanıcıların bu önerilere verdiği tepkiler de önemlidir. Bir sistem yalnızca doğru kitapları önermekle kalmamalı, aynı zamanda kullanıcıyı yeni türlerle tanıştırmalı, arama zahmetini azaltmalı ve keşif duygusunu da beslemelidir. Örneğin, önerilen bir kitap sadece önceki tercihlerle değil, aynı zamanda kullanıcının göz ardı etmiş olabileceği benzer ilgi alanlarıyla da bağlantı kurarak daha kapsayıcı sonuçlar sunabilir. Bu yönüyle, tavsiye motorlarının sadece teknik bir araç değil, kullanıcıyla sistem arasında bir köprü işlevi gördüğü söylenebilir. Özetle bu araştırma sonuçları, geleneksel CBF yönteminin yeterli veri kaynağı olmadığında yeteri kadar iyi performans gösteremediğini fakat ALS ve NeuMF gibi işbirlikçi filtreleme yöntemlerinin özellikle bol veri bulunduğunda tatmin edici sonuçlar verebildiğini göstermiştir. NeuMF yaklaşımının standart ALS yaklaşımından daha iyi performans göstermesi, gelişmiş tavsiye ve derin öğrenme teknolojilerinin kullanılmasıyla kullanıcı etkileşimini artırmayı hedefleyen modern perakende platformları için daha uygun bir yöntem olduğunu da doğrulamaktadır. Genel olarak bu çalışma, yeterli veri mevcut olduğu takdirde, işletmelerin geleneksel yöntemlerden ziyade daha gelişmiş makine öğrenimi ve derin öğrenme tabanlı tavsiye sistemlerine yönelmelerinin faydalı olacağını göstermektedir.

Özet (Çeviri)

This study investigates the development and evaluation of advanced book recommendation systems using three distinct machine learning approaches—Content-Based Filtering (CBF), Collaborative Filtering using Alternating Least Squares (ALS), and Neural Matrix Factorization (NeuMF)—through comparative application. Given the importance of personalized customer interactions in the business world, scalable and intelligent recommendation engines are argued to be critical for hybrid book sales. Utilizing historical data and modern machine learning tools, this research focuses on determining effective ways to offer users the most relevant and optimal recommendations. The research uses a dataset sourced from a major Turkish book retailer, encompassing more than 595,000 books and numerous anonymized user-book interactions. Following proper preprocessing, including handling missing values and creating numerical and textual attributes, the three algorithms were constructed under identical conditions, and their results were tested and compared. Content-Based Filtering, applying TF-IDF and cosine similarity on book titles, authors, languages, and categories, provided recommendations of similar titles. ALS enabled collaborative predictions based on users' past purchase histories by decomposing the user-item matrix into latent factors. NeuMF aimed to capture multiple relationships between users and items by combining the strengths of matrix factorization and neural networks. Models were evaluated using Recall@K, Precision@K, Hit Rate@K, and NDCG@K metrics for K values of 10, 50, and 100. NeuMF outperformed the other models across nearly all tested K values. Specifically, at K = 100, NeuMF achieved metrics of 0.11 Recall, 0.006 Precision, 0.35 Hit Rate, and 0.05 NDCG, demonstrating that its recommendations are highly relevant and ranked superiorly compared to other models. NeuMF's superior results demonstrate its ability to select highly relevant items, even when presenting long recommendation lists. This consistency highlights the model's capability to detect complex patterns and adapt effectively to varied user behaviors. The reliability of the results was assessed using 8-fold cross-validation; NeuMF showed minimal performance variation across folds, indicating consistent performance across different user groups. This suggests NeuMF's suitability for businesses needing to handle extensive and diverse datasets. In addition to algorithm performance, the study also discusses how having the correct infrastructure and toolset contributes significantly to the system's success. In summary, this research indicates that traditional CBF approaches perform inadequately in situations with insufficient data resources, while collaborative filtering methods such as ALS and NeuMF can yield satisfactory outcomes, particularly when abundant data is available. NeuMF's superior performance over the standard ALS approach confirms its appropriateness for modern retail platforms aiming to enhance user engagement through advanced recommendation and deep learning technologies.

Benzer Tezler

  1. Mesleki gelişim yöntemi olarak uygulanan mesleki öğrenme topluluklarının öğretmen görüşlerine göre değerlendirilmesi

    Evaluating professional learning communities implemented as a method for professional development according to teachers' views

    GAMZE ÖZER

    Doktora

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimGazi Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. SABRİ ÇELİK

  2. Türk denizcilik eğitimi için sistem planlaması

    A System planning for Turkish maritime education

    ÖZKAN POYRAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Eğitim ve Öğretimİstanbul Teknik Üniversitesi

    DOÇ.DR. SADETTİN ÖZEN

  3. Banka sermayesi ve risk

    Bank kapital and risk

    LEMAN SORUKLU

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    BankacılıkMarmara Üniversitesi

    Bankacılık Ana Bilim Dalı

    PROF. DR. İLHAN ULUDAĞ

  4. Yazınsal metinlerle 7. sınıf öğrencilerinin söz varlığının artırılması

    Improving the vocabulary of 7th grade students with literary texts

    MAHİR KAVUN

    Doktora

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimAtatürk Üniversitesi

    Türkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı

    PROF. DR. OSMAN MERT

  5. Türkiye'de küçük çocuğu olan annelerle çevrimiçi olarak uygulanan etkileşimli kitap okuma müdahale programının etkisinin değerlendirilmesi

    Evaluation of the effect of an interactive book reading intervention program applied online with mothers of young children in Turkey

    ELİF ÖZEN

    Doktora

    Türkçe

    Türkçe

    2025

    PsikolojiMaltepe Üniversitesi

    Psikoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NİHAL YENİAD