Geri Dön

Parallel CLOSET+ algorithm for finding frequent closed itemsets

Koşut CLOSET+ algoritması ile sık kapalı nesne kümelerinin bulunması

  1. Tez No: 255283
  2. Yazar: TAYFUN ŞEN
  3. Danışmanlar: DR. CEVAT ŞENER, PROF. DR. İSMAİL HAKKI TOROSLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Verinin, önce bilgisayarla³ma, sonra da internetleşme sayesinde çok yüksek bir hızda arttığı günümüzde veri madenciliği çok önemli bir alan olarak öne çıkmaktadır. Öte yandan, ucuz donanım kullanılarak kurulan küme hesaplama sistemleri ve çok çekirdekli işlemciler yaygınlaşmaktadırlar. Bu yüksek hesaplama gücü veri madenciliği ile birleştirilerek büyük miktardaki verinin işlenmesi ve bilgiye ulaşılması amaçlanmaktadır. Sık nesne kümeleri madenciliği, birçok veri madenciliği alanının gerekli bir parçası olması nedeniyle önemli bir alt alandır. Sık nesne kümeleri madenciliği başta ilişkisel kural madenciliği alanında olmak üzere birçok veri madenciliği algoritması için gerekli bir ön iştir. Bu nedenle, bu alt alan geçmişte sıkça araştırılmıştır. Bu tezde, sık kapalı nesne kümelerinin bulunmasında kullanılan bir algoritma olan CLOSET+ algoritmasının koşut bir sürümü sunulacaktır. CLOSET+ algoritması, birden fazla işlemcide koşut bir şekilde çalışacak şekilde değiştirilmiş, böylece sonuçlara daha hızlı ulaşılması amaçlanmıştır. Farklı işlemlerin iletişimi için Open MPI ve Boost kütüphaneleri kullanılmış, program farklı veriler ve değişkenler açısından incelenmiştir. Deneysel sonuçlar programın yoğun veritabanlarında ve belirli bir destek değerinden yüksek durumlarda yüksek bir hızlanma ve verimlilik ile çalıştığını göstermektedir. Bu tezde anlatılan koşut algoritma düşük ile orta sayıdaki kapalı sık nesne kümelerinin hızlı bir şekilde bulunmasının gerektiği uygulama alanlarında faydalı olabilir. Örnek bir alan çevrimiçi uygulamaların benzer gerekliliklere sahip olduğu Genel Ağdır.

Özet (Çeviri)

Data mining is proving itself to be a very important field as the data available is increasing exponentially, thanks to first computerization and now internetization. On the other hand, cluster computing systems made up of commodity hardware are becoming widespread, along with the multicore processor architectures. This high computing power is synthesized with data mining to process huge amounts of data and to reach information and knowledge. Frequent itemset mining is a special subtopic of data mining because it is an integral part of many types of data mining tasks. Often this task is a prerequisite for many other data mining algorithms, most notably algorithms in the association rule mining area. For this reason, it is studied heavily in the literature. In this thesis, a parallel implementation of CLOSET+, a frequent closed itemset mining algorithm, is presented. The CLOSET+ algorithm has been modified to run on multiple processors simultaneously, in order to obtain results faster. Open MPI and Boost libraries have been used for the communication between different processes and the program has been tested on different inputs and parameters. Experimental results show that the algorithm exhibits high speedup and eficiency for dense data when the support value is higher than a determined value. Proposed parallel algorithm could prove to be useful for application areas where fast response is needed for low to medium number of frequent closed itemsets. A particular application area is the Web where online applications have similar requirements.

Benzer Tezler

  1. Constitutive failure modelling and analysis of steel wire rope structures subjected to impact loading

    Çelik tel halat yapılarının darbe yükü altında hasar modellenmesi ve incelenmesi

    ADEM CANDAŞ

    Doktora

    İngilizce

    İngilizce

    2021

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. CEVAT ERDEM İMRAK

  2. Uyarlamalı süzgeçler

    Adaptive filters

    RIDVAN AYSEL

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. AHMET H. KAYRAN

  3. Hücresel yapay sinir ağları için iki öğrenme algoritması ve görüntü işleme uygulamaları

    Two learning algorithms for cellular neural networks and their image processing applications

    SİNAN KARAMAHMUT

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    DOÇ.DR. CÜNEYT GÜZELİŞ

  4. Lojik fonksiyonlarda izole mintermlerin tespiti ve etkin bir sadeleştirme algoritmasının geliştirilmesi

    Finding isolated minterms in logic functions and developing an efficient simplification algorithm

    HAKAN AKAR

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FATİH BAŞÇİFTÇİ

  5. Paralel bağlı senkron generatörlerin öz değerler metodu ile dinamik kararlılık incelemesi

    Dynamic stability of parallel connected synchronous generators by the eigenvalue method

    ENDER ÖZCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. M. EMİN TACER