Web kullanım madenciliğinde birliktelik kurallarının uygulanması
Implementation of association rules in web usage mining
- Tez No: 268305
- Danışmanlar: YRD. DOÇ. DR. SONGÜL ALBAYRAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Web kullanım madenciliği, Web madenciliği, Veri madenciliği, Apriori algoritması, Log dosya formatları, TFPR algoritması, Web usage mining, Web mining, Data mining, Apriori algorithm, Log file formats, TFPR algorithm
- Yıl: 2010
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Bilgisayar ve teknolojinin hayatımızın her anında bizimle birlikte olması, ihtiyaç duyulan her türlü bilginin bilgisayar ortamında aranmasına ve saklanmasına sebep olmaktadır. Aranan bilginin bulunabileceği en derin kaynak ise Internet' tir. İçeriği katlandıkça artan bu bilgi haznesindeki verilerin kullanılabilir kısmı son kullanıcı için anlamlıyken, bu kullanılabilir verilerin arkasındaki saklanmış, anlamsız veriler ise işlenmeye hazır olarak beklemektedir. Veri madenciliği de bu ihtiyacı karşılamak üzere ortaya atılan bir disiplindir. Veri madenciliği birliktelik kuralları, sınıflandırma, kümeleme gibi yöntemlerle anlamsız verilerden anlamlı, faydalı bilgileri çıkararak; bu faydalı bilgilerin daha sonra alınacak kararlarda, yapılacak iyileştirme çalışmalarında kullanılmasına rehberlik etmektedir.Internet' in her yerden erişilebilmesi ve istenilen her türlü bilgiyi insanlara sağlayabilmesi, gözlerin web sitelerine çevrilmesine neden olmuştur. Web sitesi yöneticileri rekabet ortamında, site içeriği ve teknik altyapı açısından da web sitelerinin güçlü olması için çalışmalar yapmaktadır. Bu noktada, web sitelerindeki anlamsız verilerden faydalı bilgiyi üretmek için web madenciliği kavramı ortaya çıkmıştır. Web madenciliği, web sitesi verilerine veri madenciliği yöntemlerinin uygulanması işlemidir. Web madenciliğinin üç çeşidi olan ?web kullanım madenciliği?, ?web içerik madenciliği? ve ?web yapı madenciliği? bölümlerinden en çok üzerinde çalışma yapılan ve bu tez çalışmasının da konusu olan web kullanım madenciliğidir. Web kullanım madenciliği ile siteyi ziyaret eden kullanıcıların profillerinin değişimleri takip edilebilir. Ayrıca sitede beğenilen ya da beğenilmeyen köşeler ortaya çıkarılarak site tasarımı buna göre güncellenerek daha çok kullanıcının web sitesini ziyaret etmesi sağlanabilir.Bu tez çalışmasındaki amaç, çok ziyaret edilen, güncel bir portal sitesinden alınan kullanıcı log kayıtları üzerinde web kullanım madenciliği yöntemini uygulayarak, saklı bilgileri ortaya çıkarmaktır. Bunu gerçekleştirmek için, veri madenciliği yöntemlerinden olan birliktelik analizinin en sık kullanılan algoritması Apriori algoritması ile bazı bilim adamları tarafından ortaya atılan TFPR algoritması seçilmiştir. Apriori algoritması ile sonuçlara ve kurallara ulaşılmış, TFPR algoritması ile de en sık ziyaret edilen ve edilme olasılığı en yüksek olan sayfalar bulunmuştur.
Özet (Çeviri)
Information that is needed is found and recorded in a computer environment because of computers and technology are always with us in our lives. The deepest source where the information being searched can be found at, is Internet. While useful part of data in this information source that has a content increasing many times more is meaningful for the end user; hidden and meaningless data behind this useful data is ready to be processed. Data mining is a discipline that meets this need. Data mining guides to use this useful data for making decisions and improving workings by finding out meaningful, useful data from meaningless data using the methods like association rules, classification and clustering.Accessing Internet from everywhere and Internet supplying every kind of wanted information to people, caused people? eyes turning to web sites. In a competition environment, web site administrators are working to make their web sites to be more powerful with the site content and the technical background. At this point, to produce meaningful data from meaningless data in web sites, the term, web mining arised. Web mining is a process of applying data mining techniques to web sites data. Web usage mining is the one that the most workings are being done about it and it is the subject of this thesis among the three types of web mining; web usage mining, web content mining and web structure mining. With web usage mining, user profile changes of who visits the web site can be tracked. Also, by finding the liked and disliked parts of the web site, web site design can be improved to make more users visiting the web site.The purpose of this thesis is to find out the hidden information by using web usage mining at the user log records of a live, frequently visited portal site. To achieve this, the most frequently used algorithm of one of the techniques in data mining, that is the association rules, Apriori algorithm and TFPR algorithm that was proposed by a few scientists were chosen. By applying Apriori algorithm, rules and results were discovered and by TFPR algorithm, the most frequent visited and the most probable being visited pages were found.
Benzer Tezler
- Implementation of some medical data in Apriori algorithm
Apriori algoritmasının bazı tıbbı verilere uygulanması
FAWAD SADIQMAL
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NILÜFER YURTAY
- Paralel programlama ile web madenciliğinde log analizi
Log analysis in web mining with parallel programming
GÜNCEL SARIMAN
Yüksek Lisans
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUNCAY YİĞİT
- Metin madenciliği teknikleri kullanılarak kulak burun boğaz hasta bilgi formlarının analizi
Analysis of otolaryngology patient information forms using text mining techniques
BAŞAK OĞUZ
Yüksek Lisans
Türkçe
2009
Bilim ve TeknolojiAkdeniz ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
YRD. DOÇ. DR. UĞUR BİLGE
- Web usage mining and recommendation with semantic information
Anlamsal bilgiler ile web kullanım madenciliği ve önerim
SÜLEYMAN SALIN
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Bölümü
YRD. DOÇ. DR. PINAR ŞENKUL
- A new reactive method for processing web usage data
Web kullanım verilerini işlemek için sonradan aktif yeni bir metod
MURAT ALİ BAYIR
Yüksek Lisans
İngilizce
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSMAİL HAKKI TOROSLU