Web kullanıcı erişim kütüklerinden bilgi çıkarımı
Knowledge extraction from Web user access logs
- Tez No: 222086
- Danışmanlar: DOÇ. DR. İBRAHİM TÜRKOĞLU, PROF. DR. MUSTAFA POYRAZ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bölümü
- Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 151
Özet
Son yıllarda İnternet'in hızlıca gelişmesi ve yaygın kullanımı ile Web, dünyada erişilebilir en geniş veri kaynağı haline gelmiştir. Internet'teki bilgi yığınları aşırı şekilde artarken, Web ziyaretçi isteklerine uygun hizmetlerin sağlanabilmesi, Web site yapısının iyileştirilmesi, geliştirilmesi ve etkin olarak kullanılması gibi amaçları sağlamak için Web Madenciliği gittikçe daha ilgi çeken bir konu olarak görülmektedir.Bu tez çalışmasında, metin tabanlı web kullanıcı erişim kütüklerinin temizlenmesine yönelik yeni bir süreç önerilmiştir. Önerilen sürecin uygulaması ve program kodlamaları JAVA tabanlı SAS Base yazılım ortamında geliştirilmiştir. Büyük boyutlardaki kütük dosyalarının temizlenmesinde geliştirilen veri temizleme süreci hız yönünden diğer yöntemlere göre üstünlük sağlamıştır.Temizlenmiş kullanıcı erişim kütüklerinden anlamlı ve ilginç bilgilerin çıkarılması için üç farklı çalışma yapılmıştır;?Yol analizi yöntemi ile web kullanıcı erişim kütük dosyalarından anlamlı ve ilginç örüntüleri içeren bilgiler çıkarılmıştır. Literatürde geçen ve başka alanlarda uygulaması yapılan yol analizi yönteminin, web kullanıcı erişim kütüklerine uygulaması yapılarak, anlamlı ve ilginç örüntüleri içeren bilgiler çıkarılmasın da başarılı bir şekilde kullanılabileceği gösterilmiştir.?Aynı veri tabanı verilerine birliktelik kuralı yöntemi uygulanarak Web sayfaları arasındaki ilişkileri belirleyen bilgiler çıkarılmıştır.?İstatistiksel analiz ile Web sitesinin üç aylık bir süre içerisindeki genel kullanımına ilişkin detaylı istatistikî bilgiler çıkarılmıştır.Gerçekleştirilen tüm uygulama çalışmaları sonucunda, elde edilen bilgiler kullanılarak web sitesinin iyileştirilmesine, geliştirilmesine, kullanılabilirliğine ve yapısal organizasyonuna katkı sağlamak için web site tasarımcılarına ve yöneticilerine öneriler sunulmuştur. Ayrıca, HTTP durum kodları analiz edilerek web sitesi ve sunucusunun başarımını arttırmaya yönelik çözüm önerileri oluşturulmuştur. Oluşturulan öneriler ziyaretçi memnuniyetini arttırmaya yönelik kazanımları da amaçlamaktadır.
Özet (Çeviri)
Recently, by rapidly developing and common usage of the Internet, Web has been largest accessible data source in the world. While extremely growing the knowledge masses up on the Internet by passing time, Web Mining has been seeing as more attractive subject more and more to cope with goals such as improving, growing healthy and using effectiveness of web site structure and to provide appropriate web service to the web clients requests.In this thesis, a new process intended for purifying of text-based web user access logs are proposed. The implementation and code of the proposed process have been designed on Java-based SAS software environment. Purifying high dimensional data access logs, the improved data cleaned process is superior to the other methods in speed aspect.Extracting meaningful and interesting knowledge from the purified user access logs, three different implementations have been realized.?Knowledge contained the meaningful and interesting patterns from web user access log files have been extracted by using Path Analysis Method. The implementation of web user access logs of Path Analysis Method, present in the literature and implemented in different fields, has successfully shown that it can be used in extracting meaningful and interesting knowledge.?Relation knowledge between web sites by applying Association Rules Method on the same dataset is extracted.?The detailed statistical knowledge regarding three months usage of the Web site has been extracted by using Statistical Analysis Method.In the end of all implementation, web site designers and managers are given suggestions about improvement, grow healthy and being usable of the web site and to contribute its structural organization by using obtained meaningful and pure knowledge. Furthermore, some solution suggestions with relation to increase successfulness of web site and server by analyzing HTTP state codes have been formed. The formed suggestions are intended for increase the visitor pleasure.
Benzer Tezler
- Kırıkkale üniversitesi web sitesinin kullanıcı örüntülerinin web madenciliği ile analizi
Analysis of user patterns of the web site of kirikkale university with web mining
KADİR CAN BURÇAK
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN ERBAY
- Mining user access patterns and identity information from web logs for effective personalization
Etkili kişiselleştirme için web günlüklerinin veri madenciliği yöntemi ile analizi
ESRA SATIROĞLU
Yüksek Lisans
İngilizce
2001
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. H. ALTAY GÜVENİR
- Site içi arama optimizasyonunun bir web sitesi trafiğinde neden olduğu değişimlerin ölçümlenmesi
Measurement of changes in a website traffic caused by search engine optimization
HANDE KOÇ
Yüksek Lisans
Türkçe
2019
Bilim ve TeknolojiDokuz Eylül ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM TARHAN
- SDCA : A secure and privacy preserving data retrieval architecture on cloud computing
SDCA : Bulut bilişimde güvenli ve mahremiyet korumalı veri getirme mimarisi
BÜŞRANUR BÜLBÜL
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. DENİZ TURGAY ALTILAR
- Transcoding Web pages for energy saving on the client-side
Web sayfalarının kullanıcı tarafında enerji tasarrufu için dönüştürülmesi
EDA KÖKSAL AHMED
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiSürdürülebilir Çevre ve Enerji Sistemleri Ana Bilim Dalı
YRD. DOÇ. DR. YELİZ YILMAZ