Sık öğe kümesi madenciliği algoritmalarının karşılaştırılması
Comparison of frequent itemset mining algorithms
- Tez No: 823542
- Danışmanlar: PROF. DR. NEVCİHAN DURU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Apriori, FP-Growth, FP-Max, Sık Öğe Kümesi Madenciliği, SOM, Apriori, FP-Growth, FP-Max, Frequent Itemset Mining, SOM
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 145
Özet
Birliktelik Kuralları, bir veri setindeki öğeler arasındaki ilginç ilişkileri keşfetmek için kullanılan popüler bir veri madenciliği yöntemidir. Birliktelik Kuralları yöntemi ile kural bulma iki aşamada ele alınabilir. Birinci aşamada, seçilen minimum destek değerine sahip sık öğe kümeleri bulunur. İkinci aşamada ise bulunan sık öğe kümelerinden güçlü kurallar elde edilir. Bu tez çalışmasında yaygın kullanılan sık öğe kümesi madenciliği klasik algoritmalarından Apriori, FP-Growth ve FP-Max algoritmalarının performans karşılaştırması yapılmıştır. Bu karşılaştırmayı gerçekleştirmek için, satır sayısı, satır uzunluğu, öğe sayısı ve sık öğe kümesi yoğunluğu kontrol edilebilen 60'tan fazla yapay veri seti üretilmiştir. Algoritmalar bu veri setleri üzerinde çalıştırılmıştır. Ayrıca algoritmalar üretilen veri setlerinin biri üzerinde farklı destek değerleri ile de çalıştırılmıştır. Algoritmaların performansı iki adet gerçek veri seti üzerinde de karşılaştırılmıştır. Bu veri setlerindeki sık öğe kümeleri bulunmuştur. Bulunan sık öğe kümelerinden güçlü birliktelik kuralları elde edilerek Birliktelik Kuralı yönteminin ikinci aşaması gerçekleştirilmiştir. Algoritmaların çalışma süresi ve maksimum bellek kullanımlarının, her bir parametredeki değişimden ne şekilde etkilendiği bulunmuştur. Bulunan sonuçlar karşılaştırılmıştır. Ayrıca Yapay Sinir Ağı algoritmalarından biri olan SOM ile de sık öğe kümesi madenciliği gerçekleştirilerek, sonuçlar klasik algoritmalarla karşılaştırılmıştır.
Özet (Çeviri)
Association Rules is a popular data mining method for discovering interesting relations between items in a data set. Discovering rules with the Association Rules method can be handled in two stages. In the first stage, frequent itemsets with selected minimum support value are found. In the second stage, strong rules are obtained from the frequent itemsets found. In this thesis, a performance comparison of the commonly used frequent itemset mining algorithms Apriori, FP-Growth and FP-Max algorithms has been performed. To perform this comparison, more than 60 different synthetic datasets, whose row counts, row lengths, item counts, and frequent itemset densities can be controlled, were generated. Algorithms were run on these datasets. In addition, the algorithms were run on one of the generated data sets with different support values. The performances of the algorithms were also compared on two real data sets. Frequent itemsets were found in these data sets. The second stage of the Association Rule method was carried out by obtaining strong association rules from the frequent itemsets found. It has been found out how the execution times and maximum memory usages of the algorithms are affected by the changes in each parameter. The results found out were compared. In addition, frequent item set mining was performed with SOM, one of the Artificial Neural Network algorithms, and the results were compared with classical algorithms.
Benzer Tezler
- BGP anomaly detection using association rule mining algorithms
İlişkilendirme kuralı madenciliği algoritmasını kullanarak BGP anomali tespiti
MUBAARAK ABDULLAH AL-TAMIMI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ZAFER ALBAYRAK
- Privacy preserving data analysis for information systems
Bilgi sistemleri için gizliliği koruyan veri analizi
BARIŞ YILDIZ
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. RECEP ALP KUT
- Discovering users' usage patterns of web log through association rules mining methodology
Kullanıcıların web log kullanım şekillerinin ilişkili kurallar madencilik metodolojisiyle keşfi
AHMAD HISHAM ARNAOUT
Yüksek Lisans
İngilizce
2021
Bilim ve TeknolojiBahçeşehir ÜniversitesiBüyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TAMER UÇAR
- Fast and efficient frequent itemset detection by a novel clustering method
Yeni bir kümeleme metodu ile hızlı ve etkili şekilde sık rastlanan öğe seti bulunması
HÜSEYİN ARIK
Yüksek Lisans
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SELİM NECDET MİMAROĞLU
- Öbek bilgisayarlarda paralel FP-growth gerçekleştirimi
Implementation of parallel FP-growth algorithm on cluster computers
GÜLİSTAN ÖZDEMİR ÖZDOĞAN
Yüksek Lisans
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. OSMAN ABUL