A frequency-based weighting mechanism for data embedding methodologies
Veri gömme yöntemleri için sıklık tabanlı ağırlıklandırma mekanizması
- Tez No: 945902
- Danışmanlar: PROF. DR. MEHMET SIDDIK AKTAŞ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 171
Özet
Dijital platformların yaygınlaşması ve e-ticaretin hızlı büyümesiyle birlikte, kullanıcıların gezinme davranışlarını anlamaya yönelik çalışmalar kritik bir araştırma alanı hâline gelmiştir. Kullanıcıların web sayfaları arasında gerçekleştirdiği ardışık geçişleri kaydeden tıklama verileri, kullanıcı davranışlarını modellemek, niyetlerini belirlemek ve kişiselleştirilmiş deneyimler sunmak açısından zengin bir veri kaynağı sunar. Ancak bu verilerin karmaşık ve yüksek boyutlu yapısı, daha sağlam ve gelişmiş modelleme tekniklerini gerekli kılmaktadır. Bu tez, beşi de yayımlanmış ve her biri bir tez bölümü olarak yapılandırılmış çalışmaları bir araya getirerek; literatür analizi, grafik tabanlı gömme yöntemleri, frekans temelli temsil stratejileri, zamana duyarlı modelleme ve derin öğrenme yaklaşımlarını birleştiren bütüncül bir çerçeve sunmaktadır. Tezin ilk katkısı, kullanıcı davranışı madenciliği alanını haritalayan kapsamlı bir sistematik literatür taramasıdır. Bu çalışma, kullanılan başlıca veri türlerini, yaygın modelleme yaklaşımlarını, temel uygulama alanlarını ve literatürdeki önemli boşlukları belirlemektedir. Çalışma, mevcut literatürü tematik ve yöntemsel olarak sınıflandırarak tıklama verisi temelli davranış analizine yönelik gelecekteki araştırmalar için bir yol haritası ortaya koymaktadır. Bu temel üzerine inşa edilen ikinci katkı, gezinme benzerliklerine göre kullanıcı oturumlarını kümelendiren bir iş süreç yazılım mimarisidir. Bu mimari, Node2Vec, DeepWalk ve Struc2Vec gibi grafik tabanlı gömme tekniklerini kullanarak kullanıcı oturumlarını sabit uzunlukta vektörlere dönüştürmektedir. Bu yöntemlerin, kullanıcı gezinme desenlerindeki yapısal ve ardışık ilişkileri etkili bir şekilde temsil ettiği gösterilmiştir. Gerçek dünya e-ticaret verileri üzerinde gerçekleştirilen prototip uygulama, mimarinin uygulanabilirliğini ortaya koymakta ve kümeleme başarımını içsel kalite ölçütleri ile değerlendirmektedir. Temsil kalitesini artırmak amacıyla, tezde Olay Frekansı–Ters Oturum Frekansı adını taşıyan özgün bir ağırlıklandırma mekanizması önerilmektedir. EF-ISF, oturumlar arasında nadir fakat anlamlı kullanıcı eylemlerini öne çıkararak temsil vektörlerinin bilgi içeriğini zenginleştirmektedir. Bu yöntem, özellikle sayfa yenilemeleri veya geri dönüş hareketleri nedeniyle tekrarlanan olayların bulunduğu ve dağılımın seyrek olduğu veri kümelerinde etkili olmaktadır. Tezde ayrıca, kullanıcıların davranışlarının zamansal yönünü yansıtmak amacıyla yaşlanma temelli dinamik bir ağırlıklandırma stratejisi geliştirilmiştir. Bu yöntemde, kullanıcıya ait daha yeni oturumlara daha yüksek ağırlık verilerek oturumlar arasında zaman duyarlılığı sağlanmaktadır. Bu sayede kullanıcı profilleri, güncel davranış eğilimlerini daha doğru biçimde yansıtarak sınıflandırma performansını anlamlı ölçüde artırmaktadır. Tezin son bölümünde, oturum tabanlı sınıflandırma görevleri için derin öğrenme tabanlı yöntemler ele alınmaktadır. Word2Vec, Node2Vec ve LSTM oto kodlayıcı gibi gömme teknikleri değerlendirilmiş; özellikle oturumlar içindeki zamansal bağımlılıkları modelleme becerileri incelenmiştir. Gerçek dünya e-ticaret veri kümeleri üzerinde yapılan deneyler, LSTM oto kodlayıcı yönteminin ardışık davranışları modellemede geleneksel yöntemleri geride bıraktığını ortaya koymuştur. Ayrıca yaşlanma temelli ağırlıklandırma, zamansal modellerle birlikte kullanıldığında sınıflandırma doğruluğunu belirgin şekilde artırmaktadır. Logistic Regression, Random Forest ve Gaussian Naive Bayes gibi geleneksel sınıflandırıcılarla yapılan karşılaştırmalar, önerilen çerçevenin üstünlüğünü açıkça göstermektedir. Bu tez, e-ticaret ortamlarında kullanıcı davranışı modellemesi için bütünleşik ve genişletilebilir bir çerçeve sunmaktadır. Grafik tabanlı gömme tekniklerinin, frekans-temelli ve zamana duyarlı ağırlıklandırma stratejileri ile entegrasyonu; davranışsal analiz, öneri sistemleri ve kullanıcı deneyimi optimizasyonu gibi alanlara hem teorik hem de pratik katkılar sağlamaktadır.
Özet (Çeviri)
With the increasing popularity of digital platforms and the widespread growth of e-commerce, understanding user navigational behavior has become a critical research area. Clickstream data, which records users' sequential transitions across web pages, serves as a rich source for modeling behavior, identifying user intent, and delivering personalized experiences. However, the complex and high-dimensional nature of such data necessitates robust modeling techniques. This thesis brings together five original and published studies, each forming a chapter of the dissertation, and presents a holistic framework that combines literature analysis, graph-based embeddings, frequency-aware representations, temporal modeling, and deep learning methods for user behavior modeling. The first contribution of the thesis is a comprehensive systematic literature review that maps out the field of user behavior mining. This study identifies the major data types used, the most common modeling approaches, key application areas, and critical research gaps. By categorizing existing work thematically and methodologically, it provides a research roadmap for subsequent studies in clickstream-based behavior analysis. Building on this foundation, a business process software architecture is proposed to cluster user sessions based on their navigational similarities. This architecture leverages graph-based embedding techniques such as Node2Vec, DeepWalk, and Struc2Vec to transform user sessions into fixed-length vectors. These embeddings are shown to effectively capture structural and sequential relationships in user navigation patterns. A prototype implementation demonstrates the viability of this architecture on real-world e-commerce datasets and evaluates clustering performance using internal quality metrics. To improve representation quality, the thesis introduces a novel Event Frequency–Inverse Session Frequency (EF-ISF) weighting mechanism. EF-ISF enhances the informativeness of user behavior vectors by highlighting rare yet important actions across sessions. This approach is particularly effective in datasets with sparse event distributions and repeated page visits due to refreshes or back-navigation behavior. Temporal dynamics are further addressed through the development of an aging-based weighting strategy. In this method, more recent sessions are assigned higher weights when aggregating multiple sessions for a single user. This dynamic weighting reflects current behavioral tendencies more accurately and significantly improves performance in classification tasks. The final part of the thesis focuses on session-based classification using deep learning techniques. Embedding methods such as Word2Vec, Node2Vec, and LSTM Autoencoders are evaluated, with a particular focus on capturing temporal dependencies within sessions. Experimental results on real-world e-commerce datasets reveal that LSTM Autoencoders outperform conventional methods in modeling sequential behavior. Moreover, the aging-based weighting mechanism boosts classification accuracy when combined with temporal models. Comparative analyses with traditional classifiers including Logistic Regression, Random Forest, and Gaussian Naive Bayes demonstrate the superiority of the proposed framework. This thesis presents a unified and extensible framework for user behavior modeling in e-commerce environments. By integrating graph-based embeddings, frequency- and time-aware weighting schemes, and deep learning models, it provides both theoretical and practical contributions to the fields of behavioral analytics, recommendation systems, and user experience optimization.
Benzer Tezler
- Deniz taşımacılığında emniyet esaslı akıllı gemi denetim analitiği
Safety based intelligent ship inspection analytics for maritime transportation
SEYİD MAHMUD ESAD DEMİRCİ
Doktora
Türkçe
2023
Deniz Bilimleriİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
DOÇ. DR. KADİR ÇİÇEK
- Güvenlik operasyonu merkezlerinde olayların önceliklendirilmesi ve analist atamasına yönelik çok kriterli bir karar destek çerçevesi
A multi-criteria decision support framework for incident prioritization and analyst assignment in security operations centers
EYÜP CAN KILINÇDEMİR
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BARIŞ ÇELİKTAŞ
- Startup evaluation criteria and startup selection model for corporate incubators
Kurumsal kuluçka merkezleri için girişim değerlendirme kriterleri ve girişim seçme modeli
YUSUF MAZ
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. NİHAN YILDIRIM
- Novel approaches to radar signal deinterleaving and geolocation in the framework of optimization and deep learning
Radar sinyal ayrıştırma ve konum bulma için optimizasyon ve derin öğrenme tabanlı yeni yaklaşımlar
MUSTAFA ATAHAN NUHOĞLU
Doktora
İngilizce
2025
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN ALİ ÇIRPAN
- Seyir uygunsuzluklarının sebeplerinin analitik olarak incelenmesi
Analytical evaluation of the cause of navigational non comformities
ALPER SEYHAN
Yüksek Lisans
Türkçe
2017
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖZCAN ARSLAN