Nicel değerli veri kümelerinden sıralı örüntülerin çıkarılması için FP-Growth tabanlı bir yöntem
A FP-Growth based method for extraction of sequential patterns from quantitative databases
- Tez No: 259261
- Danışmanlar: DOÇ. DR. MEHMET KAYA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
Sıralı örüntüler zaman damgası ile sıralanmış bir veritabanında yaygın öğeler kümesinin bir başka yaygın öğe kümesi tarafından izlenmesidir. Sıralı örüntülerin keşfedilmesi için şimdiye kadar birçok algoritma önerilmiştir. Bu algoritmalar içinde en etkili olanlardan biri de FP-Growth algoritması kullanarak bu örüntülerin elde edilmesidir. Buna karşılık FP-Growth yaklaşımı, karmaşık veri yapısı kullanması ve alt ağaçların oluşturulması için özyineli bazı işlemlere gerek duyması gibi önemli dezavantajlar da içermektedir. Dahası mevcut FP-Growth yaklaşımlarında veri tabanı hep ikili veri kümesi olarak ele alınmıştır. Halbuki gerçek hayattaki veritabanlarının büyük çoğunluğu nicel değerli öğe kümelerinden oluşmaktadır.Bu tezde, yukarıda belirtilen problemlerin üstesinden gelebilmek için öncelikle FP-Growth algoritması gibi düşünen fakat FP-ağacı oluşturulurken özyineleme yerine öğe tabanlı aday küme üretimi kullanan yeni bir yöntem önerilmiştir. Bu yöntem daha sonra nicel değerli veritabanlarında sıralı örüntülerin bulunması için uyarlanmıştır.Dicle Üniversitesi Tıp Fakültesi Merkez laboratuarındaki verilerden elde edilen sonuçlar yöntemin uygulanabilirliğini ve klasik FP-Growth algoritmasına olan üstünlüğünü göstermektedir.
Özet (Çeviri)
The problem of discovering sequential patterns is to find inter-transaction patterns such that the presence of a set of items is followed by another item in the time-stamp ordered transaction set. So far, many methods have been proposed to discover the sequential patterns. One of the effective approaches within them is to extract the patterns by using FP-Growth. However, FP-Growth approach contains important disadvantages; including the use of complex data structures and the requirement of some recursive processes to extract sub-trees. Moreover, in the past, many algorithms were proposed for mining sequential patterns, most of which were based on items with binary value. Transactions with quantitative values are, however, commonly seen in real-world applications.In this thesis, in order to overcome the problems mentioned above, first, using item-based candidate generation instead of recursive processes, a FP-growth based novel approach is proposed. This method is then adapted to find sequential pattern in databases with quantitative item. The experimental results conducted on real data set of Dicle University, Faculty of Medicine, Center Laboratory show the applicability and the superiority of the proposed method.
Benzer Tezler
- Kaba kümeler yardımıyla önemsiz ve kayıp türdeki eksik verilerden bulanık kuralların çıkarılması
Extraction of fuzzy rules from incomplete data with do not care and lost value by rough sets
GÜLNUR AVŞAR
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MEHMET KAYA
- Yazılım destekli aydınlatma kalitesi ve verimliliği arttırma uygulaması
Lighting quality supported by software and increasing of productivity application
MUSTAFA ZEYTİN
Yüksek Lisans
Türkçe
2012
Elektrik ve Elektronik MühendisliğiBilecik Şeyh Edebali ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NAZIM İMAL
- Performance evaluation of preprocessing to PCA combined machine learning techniques on pharmaceutical and mineral samples by laser-induced breakdown spectroscopy
Lazer kaynaklı kırılma spektroskopisiyle farmasötik ve mineral numuneleri üzerinde PCA kombine makine öğrenme tekniklerine ön işleme yapılmasının performans değerlendirmesi
GÖKTUĞ YAZICI
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik MühendisliğiAtılım ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. REŞAT ÖZGÜR DORUK
- Gizliliği koruyan bulanık veri madenciliği yöntemlerinin geliştirilmesi
Development of privacy preserving fuzzy data mining methods
TOLGA BERBEROĞLU
Yüksek Lisans
Türkçe
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MEHMET KAYA
- The development of a listening test for learners of Turkish as a foreign language
Yabancı dil olarak Türkçe dinleme sınavı geliştirilmesi
EMEL TOZLU
Yüksek Lisans
İngilizce
2017
Eğitim ve ÖğretimBoğaziçi Üniversitesiİngiliz Dili Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. AYLİN ÜNALDI