Geri Dön

A frequency-based weighting mechanism for data embedding methodologies

Veri gömme yöntemleri için sıklık tabanlı ağırlıklandırma mekanizması

  1. Tez No: 945902
  2. Yazar: NAİL TAŞGETİREN
  3. Danışmanlar: PROF. DR. MEHMET SIDDIK AKTAŞ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 171

Özet

Dijital platformların yaygınlaşması ve e-ticaretin hızlı büyümesiyle birlikte, kullanıcıların gezinme davranışlarını anlamaya yönelik çalışmalar kritik bir araştırma alanı hâline gelmiştir. Kullanıcıların web sayfaları arasında gerçekleştirdiği ardışık geçişleri kaydeden tıklama verileri, kullanıcı davranışlarını modellemek, niyetlerini belirlemek ve kişiselleştirilmiş deneyimler sunmak açısından zengin bir veri kaynağı sunar. Ancak bu verilerin karmaşık ve yüksek boyutlu yapısı, daha sağlam ve gelişmiş modelleme tekniklerini gerekli kılmaktadır. Bu tez, beşi de yayımlanmış ve her biri bir tez bölümü olarak yapılandırılmış çalışmaları bir araya getirerek; literatür analizi, grafik tabanlı gömme yöntemleri, frekans temelli temsil stratejileri, zamana duyarlı modelleme ve derin öğrenme yaklaşımlarını birleştiren bütüncül bir çerçeve sunmaktadır. Tezin ilk katkısı, kullanıcı davranışı madenciliği alanını haritalayan kapsamlı bir sistematik literatür taramasıdır. Bu çalışma, kullanılan başlıca veri türlerini, yaygın modelleme yaklaşımlarını, temel uygulama alanlarını ve literatürdeki önemli boşlukları belirlemektedir. Çalışma, mevcut literatürü tematik ve yöntemsel olarak sınıflandırarak tıklama verisi temelli davranış analizine yönelik gelecekteki araştırmalar için bir yol haritası ortaya koymaktadır. Bu temel üzerine inşa edilen ikinci katkı, gezinme benzerliklerine göre kullanıcı oturumlarını kümelendiren bir iş süreç yazılım mimarisidir. Bu mimari, Node2Vec, DeepWalk ve Struc2Vec gibi grafik tabanlı gömme tekniklerini kullanarak kullanıcı oturumlarını sabit uzunlukta vektörlere dönüştürmektedir. Bu yöntemlerin, kullanıcı gezinme desenlerindeki yapısal ve ardışık ilişkileri etkili bir şekilde temsil ettiği gösterilmiştir. Gerçek dünya e-ticaret verileri üzerinde gerçekleştirilen prototip uygulama, mimarinin uygulanabilirliğini ortaya koymakta ve kümeleme başarımını içsel kalite ölçütleri ile değerlendirmektedir. Temsil kalitesini artırmak amacıyla, tezde Olay Frekansı–Ters Oturum Frekansı adını taşıyan özgün bir ağırlıklandırma mekanizması önerilmektedir. EF-ISF, oturumlar arasında nadir fakat anlamlı kullanıcı eylemlerini öne çıkararak temsil vektörlerinin bilgi içeriğini zenginleştirmektedir. Bu yöntem, özellikle sayfa yenilemeleri veya geri dönüş hareketleri nedeniyle tekrarlanan olayların bulunduğu ve dağılımın seyrek olduğu veri kümelerinde etkili olmaktadır. Tezde ayrıca, kullanıcıların davranışlarının zamansal yönünü yansıtmak amacıyla yaşlanma temelli dinamik bir ağırlıklandırma stratejisi geliştirilmiştir. Bu yöntemde, kullanıcıya ait daha yeni oturumlara daha yüksek ağırlık verilerek oturumlar arasında zaman duyarlılığı sağlanmaktadır. Bu sayede kullanıcı profilleri, güncel davranış eğilimlerini daha doğru biçimde yansıtarak sınıflandırma performansını anlamlı ölçüde artırmaktadır. Tezin son bölümünde, oturum tabanlı sınıflandırma görevleri için derin öğrenme tabanlı yöntemler ele alınmaktadır. Word2Vec, Node2Vec ve LSTM oto kodlayıcı gibi gömme teknikleri değerlendirilmiş; özellikle oturumlar içindeki zamansal bağımlılıkları modelleme becerileri incelenmiştir. Gerçek dünya e-ticaret veri kümeleri üzerinde yapılan deneyler, LSTM oto kodlayıcı yönteminin ardışık davranışları modellemede geleneksel yöntemleri geride bıraktığını ortaya koymuştur. Ayrıca yaşlanma temelli ağırlıklandırma, zamansal modellerle birlikte kullanıldığında sınıflandırma doğruluğunu belirgin şekilde artırmaktadır. Logistic Regression, Random Forest ve Gaussian Naive Bayes gibi geleneksel sınıflandırıcılarla yapılan karşılaştırmalar, önerilen çerçevenin üstünlüğünü açıkça göstermektedir. Bu tez, e-ticaret ortamlarında kullanıcı davranışı modellemesi için bütünleşik ve genişletilebilir bir çerçeve sunmaktadır. Grafik tabanlı gömme tekniklerinin, frekans-temelli ve zamana duyarlı ağırlıklandırma stratejileri ile entegrasyonu; davranışsal analiz, öneri sistemleri ve kullanıcı deneyimi optimizasyonu gibi alanlara hem teorik hem de pratik katkılar sağlamaktadır.

Özet (Çeviri)

With the increasing popularity of digital platforms and the widespread growth of e-commerce, understanding user navigational behavior has become a critical research area. Clickstream data, which records users' sequential transitions across web pages, serves as a rich source for modeling behavior, identifying user intent, and delivering personalized experiences. However, the complex and high-dimensional nature of such data necessitates robust modeling techniques. This thesis brings together five original and published studies, each forming a chapter of the dissertation, and presents a holistic framework that combines literature analysis, graph-based embeddings, frequency-aware representations, temporal modeling, and deep learning methods for user behavior modeling. The first contribution of the thesis is a comprehensive systematic literature review that maps out the field of user behavior mining. This study identifies the major data types used, the most common modeling approaches, key application areas, and critical research gaps. By categorizing existing work thematically and methodologically, it provides a research roadmap for subsequent studies in clickstream-based behavior analysis. Building on this foundation, a business process software architecture is proposed to cluster user sessions based on their navigational similarities. This architecture leverages graph-based embedding techniques such as Node2Vec, DeepWalk, and Struc2Vec to transform user sessions into fixed-length vectors. These embeddings are shown to effectively capture structural and sequential relationships in user navigation patterns. A prototype implementation demonstrates the viability of this architecture on real-world e-commerce datasets and evaluates clustering performance using internal quality metrics. To improve representation quality, the thesis introduces a novel Event Frequency–Inverse Session Frequency (EF-ISF) weighting mechanism. EF-ISF enhances the informativeness of user behavior vectors by highlighting rare yet important actions across sessions. This approach is particularly effective in datasets with sparse event distributions and repeated page visits due to refreshes or back-navigation behavior. Temporal dynamics are further addressed through the development of an aging-based weighting strategy. In this method, more recent sessions are assigned higher weights when aggregating multiple sessions for a single user. This dynamic weighting reflects current behavioral tendencies more accurately and significantly improves performance in classification tasks. The final part of the thesis focuses on session-based classification using deep learning techniques. Embedding methods such as Word2Vec, Node2Vec, and LSTM Autoencoders are evaluated, with a particular focus on capturing temporal dependencies within sessions. Experimental results on real-world e-commerce datasets reveal that LSTM Autoencoders outperform conventional methods in modeling sequential behavior. Moreover, the aging-based weighting mechanism boosts classification accuracy when combined with temporal models. Comparative analyses with traditional classifiers including Logistic Regression, Random Forest, and Gaussian Naive Bayes demonstrate the superiority of the proposed framework. This thesis presents a unified and extensible framework for user behavior modeling in e-commerce environments. By integrating graph-based embeddings, frequency- and time-aware weighting schemes, and deep learning models, it provides both theoretical and practical contributions to the fields of behavioral analytics, recommendation systems, and user experience optimization.

Benzer Tezler

  1. Deniz taşımacılığında emniyet esaslı akıllı gemi denetim analitiği

    Safety based intelligent ship inspection analytics for maritime transportation

    SEYİD MAHMUD ESAD DEMİRCİ

    Doktora

    Türkçe

    Türkçe

    2023

    Deniz Bilimleriİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    DOÇ. DR. KADİR ÇİÇEK

  2. Güvenlik operasyonu merkezlerinde olayların önceliklendirilmesi ve analist atamasına yönelik çok kriterli bir karar destek çerçevesi

    A multi-criteria decision support framework for incident prioritization and analyst assignment in security operations centers

    EYÜP CAN KILINÇDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BARIŞ ÇELİKTAŞ

  3. Startup evaluation criteria and startup selection model for corporate incubators

    Kurumsal kuluçka merkezleri için girişim değerlendirme kriterleri ve girişim seçme modeli

    YUSUF MAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NİHAN YILDIRIM

  4. Novel approaches to radar signal deinterleaving and geolocation in the framework of optimization and deep learning

    Radar sinyal ayrıştırma ve konum bulma için optimizasyon ve derin öğrenme tabanlı yeni yaklaşımlar

    MUSTAFA ATAHAN NUHOĞLU

    Doktora

    İngilizce

    İngilizce

    2025

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN ALİ ÇIRPAN

  5. Seyir uygunsuzluklarının sebeplerinin analitik olarak incelenmesi

    Analytical evaluation of the cause of navigational non comformities

    ALPER SEYHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Denizcilikİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖZCAN ARSLAN