Geri Dön

Sık öğe kümesi madenciliği algoritmalarının karşılaştırılması

Comparison of frequent itemset mining algorithms

  1. Tez No: 823542
  2. Yazar: SALİHA AKSOY
  3. Danışmanlar: PROF. DR. NEVCİHAN DURU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Apriori, FP-Growth, FP-Max, Sık Öğe Kümesi Madenciliği, SOM, Apriori, FP-Growth, FP-Max, Frequent Itemset Mining, SOM
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 145

Özet

Birliktelik Kuralları, bir veri setindeki öğeler arasındaki ilginç ilişkileri keşfetmek için kullanılan popüler bir veri madenciliği yöntemidir. Birliktelik Kuralları yöntemi ile kural bulma iki aşamada ele alınabilir. Birinci aşamada, seçilen minimum destek değerine sahip sık öğe kümeleri bulunur. İkinci aşamada ise bulunan sık öğe kümelerinden güçlü kurallar elde edilir. Bu tez çalışmasında yaygın kullanılan sık öğe kümesi madenciliği klasik algoritmalarından Apriori, FP-Growth ve FP-Max algoritmalarının performans karşılaştırması yapılmıştır. Bu karşılaştırmayı gerçekleştirmek için, satır sayısı, satır uzunluğu, öğe sayısı ve sık öğe kümesi yoğunluğu kontrol edilebilen 60'tan fazla yapay veri seti üretilmiştir. Algoritmalar bu veri setleri üzerinde çalıştırılmıştır. Ayrıca algoritmalar üretilen veri setlerinin biri üzerinde farklı destek değerleri ile de çalıştırılmıştır. Algoritmaların performansı iki adet gerçek veri seti üzerinde de karşılaştırılmıştır. Bu veri setlerindeki sık öğe kümeleri bulunmuştur. Bulunan sık öğe kümelerinden güçlü birliktelik kuralları elde edilerek Birliktelik Kuralı yönteminin ikinci aşaması gerçekleştirilmiştir. Algoritmaların çalışma süresi ve maksimum bellek kullanımlarının, her bir parametredeki değişimden ne şekilde etkilendiği bulunmuştur. Bulunan sonuçlar karşılaştırılmıştır. Ayrıca Yapay Sinir Ağı algoritmalarından biri olan SOM ile de sık öğe kümesi madenciliği gerçekleştirilerek, sonuçlar klasik algoritmalarla karşılaştırılmıştır.

Özet (Çeviri)

Association Rules is a popular data mining method for discovering interesting relations between items in a data set. Discovering rules with the Association Rules method can be handled in two stages. In the first stage, frequent itemsets with selected minimum support value are found. In the second stage, strong rules are obtained from the frequent itemsets found. In this thesis, a performance comparison of the commonly used frequent itemset mining algorithms Apriori, FP-Growth and FP-Max algorithms has been performed. To perform this comparison, more than 60 different synthetic datasets, whose row counts, row lengths, item counts, and frequent itemset densities can be controlled, were generated. Algorithms were run on these datasets. In addition, the algorithms were run on one of the generated data sets with different support values. The performances of the algorithms were also compared on two real data sets. Frequent itemsets were found in these data sets. The second stage of the Association Rule method was carried out by obtaining strong association rules from the frequent itemsets found. It has been found out how the execution times and maximum memory usages of the algorithms are affected by the changes in each parameter. The results found out were compared. In addition, frequent item set mining was performed with SOM, one of the Artificial Neural Network algorithms, and the results were compared with classical algorithms.

Benzer Tezler

  1. BGP anomaly detection using association rule mining algorithms

    İlişkilendirme kuralı madenciliği algoritmasını kullanarak BGP anomali tespiti

    MUBAARAK ABDULLAH AL-TAMIMI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ZAFER ALBAYRAK

  2. Privacy preserving data analysis for information systems

    Bilgi sistemleri için gizliliği koruyan veri analizi

    BARIŞ YILDIZ

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. RECEP ALP KUT

  3. Discovering users' usage patterns of web log through association rules mining methodology

    Kullanıcıların web log kullanım şekillerinin ilişkili kurallar madencilik metodolojisiyle keşfi

    AHMAD HISHAM ARNAOUT

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilim ve TeknolojiBahçeşehir Üniversitesi

    Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TAMER UÇAR

  4. Fast and efficient frequent itemset detection by a novel clustering method

    Yeni bir kümeleme metodu ile hızlı ve etkili şekilde sık rastlanan öğe seti bulunması

    HÜSEYİN ARIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SELİM NECDET MİMAROĞLU

  5. Öbek bilgisayarlarda paralel FP-growth gerçekleştirimi

    Implementation of parallel FP-growth algorithm on cluster computers

    GÜLİSTAN ÖZDEMİR ÖZDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. OSMAN ABUL