Data mining for rule discovery in relational databases
İlişkisel veri tabanlarında veri madenciliği ile kurallar bulunması
- Tez No: 153126
- Danışmanlar: DOÇ. DR. FERDA NUR ALPASLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: İlişkisel Veri Madenciliği, Ortak Kurallar, İlişkisel Veri Ta banları, Apriori Algoritması, Bölümleme, Özyinelemeli İlişkiler, Relational Data Mining, Association Rules, Relational Databases, Apriori Algorithm, Discretization, Recursive Relations
- Yıl: 2004
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
Öz İLİŞKİSEL VERİ TABANLARINDA VERİ MADENCİLİĞİ İLE KURALLAR BULUNMASI Toprak, Serkan Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Doç. Dr. Ferda Nur Alpaslan Eylül 2004, 53 sayfa Günümüzde veri genellikle ilişkisel veri tabanlarında saklanmaktadır. Buna rağmen çoğu veri madenciliği algoritması ilişkisel veri tabanlarındaki veri ile doğrudan çalışamamaktadır. Dolayısıyla bu algoritmaları ilişkisel veri üzerinde çalıştırabilmek için ilişkisel veriyi ön işlemeyle algoritmaların anlayacağı biçime çevirmek gerekmektedir. Ayrıca birçok veri madenciliği algoritması tek ilişki kullanan çözümler sunmaktadır. Dolayısıyla çoklu ilişkisel yapıda olan gizli kalmış değerli bir bilgiyi bu algoritmaları kullanarak elde etmek mümkün olmamak tadır. Bu çalışma kapsamında ilişkisel veri tabanları üzerinde çoklu ilişkisel yapıdaki ortak kuralları bulmayı sağlayan bir uygulama geliştirilmiştir. Uygu lama altyapısı olarak ilişkisel veri tabanlarındaki desenleri tanımlayabilen, bu de senleri eklerle geliştirebilen ve bu desenlerin çeşitli ölçmeleri için gerekli sayımları veri tabanından temel yetilerle alan bir yapı kullanılmıştır. Bu altyapı, veri tabanının tanımında yer alan bilgileri kullanarak arama alanının daraltılmasını sağlamıştır. Bu çalışma, Apriori algoritmasını arama alanını daha da küçültmekiçin kullanarak ve altyapı tarafından desteklenmeyen özyinelemeli desenlerin bulunmasını sağlayarak altyapıya yenilikler getirmiştir. Apriori algoritması her tablo üzerinde sık karşılaşılan desenleri bulmak için kullanılmış ve bu algoritmanın gerekli destek değerini bulma yöntemi değiştirilmiştir. Veri tabanındaki özyinelemeli ilişkileri belirlemek için bir yöntem sunulmuş ve uygulama bu durumlar için tablo kısaltmalarının kullanıldığı bir çözüm sağlamıştır. Veri tabam alanlarında saklanan sürekli değerleri bölümleyebilmek için eşit derinlik yöntemi kullanılmıştır. Uygulama bir veri madenciliği yarışması olan KDD Cup 2001'den alman örnek bir genlerde yer tahmini problemi ile test edilmiş ve ortaya çıkan sonuçlar yarışmayı kazanan yaklaşımın sonuçlarıyla karşılaştırılmıştır.
Özet (Çeviri)
ABSTRACT DATA MINING FOR RULE DISCOVERY IN RELATIONAL DATABASES Toprak, Serkan M.Sc, Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Ferda N. Alpaslan September 2004, 53 pages Data is mostly stored in relational databases today. However, most data mining algorithms are not capable of working on data stored in relational databases directly. Instead they require a preprocessing step for transforming relational data into algorithm specified form. Moreover, several data mining algorithms provide solutions for single relations only. Therefore, valuable hidden knowledge involving multiple relations remains undiscovered. In this thesis, an implemen tation is developed for discovering multi-relational association rules in relational databases. The implementation is based on a framework providing a repre sentation of patterns in relational databases, refinement methods of patterns, and primitives for obtaining necessary record counts from database to calculate measures for patterns. The framework exploits meta-data of relational databases for pruning search space of patterns. The implementation extends the frame work by employing Apriori algorithm for further pruning the search space and discovering relational recursive patterns. Apriori algorithm is used for finding large itemsets of tables, which are used to refine patterns. Apriori algorithm IVis modified by changing support calculation method for itemsets. A method for determining recursive relations is described and a solution is provided for handling recursive patterns using aliases. Additionally, continuous attributes of tables are discretized utilizing equal-depth partitioning. The implementation is tested with gene localization prediction task of KDD Cup 2001 and results are compared to those of the winner approach.
Benzer Tezler
- An ILP-based concept discovery system for multi-relational data mining
Çok ilişkili veri madenciliği için tümevaran mantıksal programlama tabanlı konsept tanımlama sistemi
YUSUF KAVURUCU
Doktora
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. PINAR ŞENKUL
- A new hybrid multi-relational data mining technique
Yeni bir melez çok ilişkili veri madenciliği tekniği
SEDA DAĞLAR TOPRAK
Yüksek Lisans
İngilizce
2005
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSMAİL HAKKI TOROSLU
- A knowledge discovery approach to urban analysis the Beyoğlu preservation area as a data mine
Kent analizinde bir bilgi keşfi yaklaşımı bir veri madeni olarak Beyoğlu kentsel koruma alanı
AHU SÖKMENOĞLU SOHTORİK
Doktora
İngilizce
2016
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. GÜLEN ÇAĞDAŞ
PROF. DR. İKBAL SEVİL SARIYILDIZ
- Veri tabanından bilgi tabanına geçişte bulanık bir araç
A Fuzzy tod for extracting knowledge-base from database
CEM TUTAR
- Efficient parallel frequency mining based on a novel top-down partitioning scheme for transactional data
Yeni bir işlem verisi parçalama şeması tabanlı etkin paralel frekans tarama
ERAY ÖZKURAL
Yüksek Lisans
İngilizce
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. CEVDET AYKANAT