Geri Dön

Paralel programlama ile web madenciliğinde log analizi

Log analysis in web mining with parallel programming

  1. Tez No: 309705
  2. Yazar: GÜNCEL SARIMAN
  3. Danışmanlar: DOÇ. DR. TUNCAY YİĞİT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Süleyman Demirel Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 103

Özet

Son yıllarda internetin yaşamımızın önemli bir bölümünü oluşturmasıyla web sitelerine olan ihtiyaç giderek artmaktadır. Bilgiye erişimin en kolay yolu olan internet bir süre sonra bilgi yığını haline gelmektedir. Bu bilgileri kullanmanın yanında web sitelerinden yeni bilgi keşifleri web madenciliği kavramıyla sağlanmaktadır. Web madenciliği kavramı site yapısının iyileştirilmesi ve sitenin etkin olarak kullanılmasını sağladığı için araştırmacılar tarafından son yıllarda dikkat çeken konuların başında gelmektedir. Web madenciliği web dokümanlarından ve servislerden otomatik bilgi çıkarmak ve yeni bilgiler keşfetmek için veri madenciliği tekniklerinin kullanıldığı bir yöntemdir. Web madenciliği araştırdığı konular bakımından web içerik, web yapı ve web kullanım madenciliği olmak üzere üç ana bölümde incelenmektedir.Bu çalışmada Süleyman Demirel Üniversitesi kurumsal web sitesinin 1 Ocak-31 Ağustos 2010 tarihleri arasındaki erişim kayıtlarının web kullanım madenciliği ile çeşitli veri madenciliği teknikleriyle analiz edilmesi için yazılım geliştirilmiştir. Mevcut yazılımlarla uzun zaman alan web erişim kütük analizinin daha kısa sürede tamamlanması amacıyla geliştirilen uygulamada paralel programlama teknikleri kullanılmıştır. Çalışmada erişim kütüklerinden ilginç ve anlamlı bilgilerin çıkarılması dört ana bölümde gerçekleştirilmiştir. Ön işleme aşamasında erişim kütükleri gürültülü verilerden ayıklanmıştır. Birliktelik kuralları analizinde birlikte ziyaret edilen sayfalarla ilgili bilgiler keşfedilmiştir. Genetik algoritma aşamasında ise en sık ziyaret edilen 3'lü sayfa gruplarının bilgisi keşfedilmiştir. Çalışmanın son bölümünde erişim kayıtlarıyla ilgili istatiksel analiz gerçekleştirilmiştir. Tüm analizler paralel ve seri algoritmalarla çalıştırılarak çalışma süreleri üzerinde karşılaştırma yapılmıştır. Gerçekleştirilen çalışmalar web sitesinin geliştirilmesine, site kullanılabilirliğine katkı sağlamaktadır.

Özet (Çeviri)

Recently, via the demand of web sites, internet is an important part of our lives. The easiest way to access data from the internet after a while becomes a mass of facts. In addition to using this information, discoveries of new information from websites provided by web mining. Because of the concept of web mining to provide effective use of the site structure and site improvement, web mining is one of the important issues by researchers in recent years. Web mining is described as using data mining techniques to explore and extract information from web documents and web services. Web mining is studied in three main parts in terms of investigating issues as web content, web structure and web usage mining.In this study, software is creation the covering all phases in web usage mining between 1 January and 31 August 2010 user access logs belonging to the web site of Süleyman Demirel University were analyzed in web usage mining with data mining techniques. The current web access logs analysis software for a long time to in runtime so that in this study, parallel programming techniques are used for completing in less time. In study to be obtained interesting and meaningful information, performed in four main sections. In pre-processing phase the noisy data Access logs sorted. With analysis of association rules, information is discovered about the page visited together. In genetic algorithm the most frequently 3- stage visited page groups? information was discovered. The last part of the study statistical analysis is carried out about Access log files. All analysis algorithms running in parallel and serial and comparison was carried out on working time. Developed studies contribute to the availability of the site and web site development.

Benzer Tezler

  1. ITU-PRP: Parallel running platform a parallel programming framework for java

    ITU-PRP : Paralel i̇şlem platformu Java i̇çi̇n paralel programlama aracI

    ENIS SPAHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DENİZ TURGAY ALTILAR

  2. Üniversite bilgi sistemleri için REST tabanlı bir web servis platformunun tasarımı ve geliştirilmesi

    Design and development of a REST-based web service platform for university information systems

    CÜNEYT ALTINKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FERHAT BOZKURT

  3. ASP. NET MVC 4 teknolojilerini kullanarak bir e-ticaret sitesi uygulamasının geliştirilmesi

    ASP. NET MVC 4 application development technologies using an e-commerce site

    FAİK TURAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    İşletmeBeykent Üniversitesi

    İşletme Yönetimi Ana Bilim Dalı

    YRD. DOÇ. DR. TALAT FİRLAR

  4. Textile based sensing system for leg motion monitoring

    Bacak hareketi izleme için tekstil tabanlı algılama sistemi

    KADİR ÖZLEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE

  5. GPU-based parallel computing methods for constructing covering arrays

    GPU tabanlı paralel hesaplama yontemleri ile kapsayan diziler oluşturma

    HANEFİ MERCAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CEMAL YILMAZ

    YRD. DOÇ. DR. KAMER KAYA