Mining user access patterns and identity information from web logs for effective personalization
Etkili kişiselleştirme için web günlüklerinin veri madenciliği yöntemi ile analizi
- Tez No: 112559
- Danışmanlar: PROF. DR. H. ALTAY GÜVENİR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Kişiselleştirme, Web Kullanım Analizi, Kullanıcı Erişim Örüntüleri
- Yıl: 2001
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 104
Özet
ÖZET ETKİLİ KİŞİSELLEŞTİRME İÇİN WEB GÜNLÜKLERİNİN VERİ MADENCİLİĞİ YÖNTEMİ İLE ANALİZİ Esra Satıroğlu Bilgisayar Mühendisliği, Yüksek Lisans Tez Yöneticisi: Prof. Dr. Halil Altay Güvenir Eylül, 2001 Web, her gün milyonlarca kişi tarafından ziyaret edilmesi nedeniyle kullanımı açısından büyük bir veri kaynağıdır. Kullanım verileri, web dağıtıcılarına ulaşan her türlü veri isteğinin kaydedildiği web günlüklerinde saklanmaktadır. Yakın geçmişte, bu veri topluluğunun kullanıcı davranış örüntülerini anlamak amacı ile analiz edilmesinin önemli sonuçlar doğurabileceği anlaşıldı. Kullanıcıların davranışsal örüntülerinin anlaşılması özellikle web aracılığı ile müşteri kazan maya ve ürünlerini satmaya çalışan elektronik ticaret şirketleri için önemlidir. Kullanıcılarını tanıyabilen ve kendisini kullanıcılarına göre kişiselleştirebilen etkileşimli web sitelerine sahip olmak şirketlerin oldukça önemli miktarlarda kar etmesini sağlayabilir. Kullanıma dayanan kişiselleştirme, kişiselleştirilmiş web siteleri üretmeye yönelik araştırma alanının genel adıdır. Bu tezde, kul lanıma dayanan yeni bir kişiselliştirme sistemi tanıtılacaktır. Bizim tarafımızdan tasarlanıp gerçekleştirilen bu sistem, bir web sitesinin ziyaretçilerinin ziyaret lerinin geri kalan kısmında talep edebilecekleri web sayfalarını tahmin etme yeteneğine sahiptir. Sistem, bu sayfalardan en yüksek skorlu olanları zi yaretçilerin görüntüledikleri sayfalara ekler. Tasarlayıp gerçekleştirdiğimiz bu sis temin iki ana modülü bulunmaktadır. Çevrimdışı modül web günlük dosyalarını eski kullanıcıların davranışsal örüntülerini keşfetmek amacı ile çevrimdışı olarak analiz eder. Çevrimdışı modül tarafından elde edilen bilgiler yeni ziyaretçileri tanımak ve onlar için öneriler üretmek amacı ile çevrimiçi modül tarafından kul lanılır. Yeni ziyaretçileri tanımak amacı ile kullanılan ilk kriter bu ziyaretçilerin web sitesinde izledikleri yollardır. Yol, bir ziyaretçinin web sitesine ziyareti süresinde görüntülediği sayfalardan oluşur. Yeni ziyaretçileri tanımak amacı ilekullanılan diğer bir kriterde bu ziyaretçilerin siteye bağlandıkları makinanın kim lik bilgisidir. Kimlik bilgisi, makinanın İP adresi veya etki alanı ismidir. Kim lik bilgilerini kullanarak ziyaretçinin kendisinin veya benzer etki alanlarında bu lunan ziyaretçilerin eski tercihlerini öğrenmek mümkün hale gelmektedir. İki etki alanı arasındaki benzerlik etki alanı sıradüzeni yardımı ile belirlenir. Etki alanı sıradüzeni, sıradüzensel ağaç yapısı ile temsil edilebilir. Bu ağacın en alt seviyesindeki düğümler Internet'e bağlanan makinaların etki alanı isimlerini içerir. Diğer düğümler ise com veya edu.tr gibi genel etki alanlarını kapsar. Bu sıradüzende, iki etki alanı arasındaki benzerlik bu etki alanlarının ortak ata düğüm sayısı arttığı sürece artar. Bu bilgilerin ışığında, tasarladığımız sistem bir ziyaretçinin hangi sayfaları talep edebileceğini anlamak için bu zi yaretçinin İnternet'e bağlanmak için kullandığı makinanın etki alanının ata etki alanlarına ait olan kullanıcıların ortak davranışsal yönsemelerinden yararlanmak tadır. Bu sistem, Bilkent Üniversitesi Bilgisayar Mühendisliği bölümünün web sitesi üzerinde test edilmiş ve sonuçlar sistemin verimliliğini ve kullanılabilirliğini kanıtlamıştır.
Özet (Çeviri)
ABSTRACT MINING USER ACCESS PATTERNS AND IDENTITY INFORMATION FROM WEB LOGS FOR EFFECTIVE PERSONALIZATION Esra Satır oğlu M.S. in Computer Engineering Supervisor: Prof. Dr. Halil Altay Güvenir September, 2001 Web is a huge source of data in terms of its usage as a result of being visited by millions of people on each day. Its usage data is stored in web server logs which contain a detailed description of every single hit taken by the corresponding web server. Recently, it has been discovered that analysis of this data for understand ing the user behavioral patterns may have critical implications. Understanding the behavioral patterns of visitors is especially important for e-commerce compa nies which try to gain customers and sell products through the web. Interactive sites that recognize their customer and customize themselves accordingly may save lots of money to the companies. Usage Based Personalization is a study on designing such personalized sites. In this thesis, we present a new usage based personalization system. The system we designed and implemented is capable of guessing the web pages that may be requested by the on-line visitors during the rest of their visits. The system shows the subset of these pages with highest scores as recommendations to the visitors as being attached to the original pages. The system has two major modules. The off-line module mines the log files off-line for determining the behavioral patterns of the previous visitors of the web site considered. The information obtained by the off-line module is utilized by the on-line module of the system for recognizing new visitors and producing on-line recommendations. The first criterion for identifying on-line visitors is the paths followed by them. A path of a particular visitor consists of pages retrieved by him throughout his visit to the web site. Another criterion considered by the system is the identity information (IP address or domain name) of the visitors. By using identity information, it is possible to learn old preferences of the visitor himself or visitors from similar domains. The similarity between domains is determined iii
Benzer Tezler
- Clustering web usage transactions for efficient association rule mining
Verimli eşleştirme sorgusu çıkarımı için web günlük hareketlerinin gruplandırılması
MEHMET ULUER
Yüksek Lisans
İngilizce
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYDIN HÜSEYNOV
- Mobil aygıtlar üzerinde kişiselleştirilmiş reklam için etmen tabanlı çerçeve tasarımı
An agent-based framework for personalized advertisement on mobile devices
RESUL ŞAHİN
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. NADİA ERDOĞAN
- Veri ambarı oluşumunda kullanılan teknolojilerin incelenmesi ve veri ambarlarının kişiye özel üretimde kullanımı
Examination of technologies used for building data warehouses and use of data warehouses in mass customization
ŞEFİK EĞRİBOZ
Yüksek Lisans
Türkçe
2002
İşletmeİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DR. HALİL HALEFŞAN SÜMEN
- TV ve set üstü cihaz arayüz kullanılabilirlik ölçümü
Usability evaluation of TV and set-top box interfaces
AYCAN PEKPAZAR
Doktora
Türkçe
2021
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM ALTIN GÜMÜŞSOY
- Makine öğrenmesi algoritmalarının hibrit yaklaşımı ile ağ anomalisi tespiti
Network anomaly detection with a hybrid approach of machine learning algorthms
FEYZA ÖZGER
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. HALİT ÖZTEKİN