Geri Dön

Data mining for rule discovery in relational databases

İlişkisel veri tabanlarında veri madenciliği ile kurallar bulunması

  1. Tez No: 153126
  2. Yazar: SERKAN TOPRAK
  3. Danışmanlar: DOÇ. DR. FERDA NUR ALPASLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: İlişkisel Veri Madenciliği, Ortak Kurallar, İlişkisel Veri Ta banları, Apriori Algoritması, Bölümleme, Özyinelemeli İlişkiler, Relational Data Mining, Association Rules, Relational Databases, Apriori Algorithm, Discretization, Recursive Relations
  7. Yıl: 2004
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 66

Özet

Öz İLİŞKİSEL VERİ TABANLARINDA VERİ MADENCİLİĞİ İLE KURALLAR BULUNMASI Toprak, Serkan Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Doç. Dr. Ferda Nur Alpaslan Eylül 2004, 53 sayfa Günümüzde veri genellikle ilişkisel veri tabanlarında saklanmaktadır. Buna rağmen çoğu veri madenciliği algoritması ilişkisel veri tabanlarındaki veri ile doğrudan çalışamamaktadır. Dolayısıyla bu algoritmaları ilişkisel veri üzerinde çalıştırabilmek için ilişkisel veriyi ön işlemeyle algoritmaların anlayacağı biçime çevirmek gerekmektedir. Ayrıca birçok veri madenciliği algoritması tek ilişki kullanan çözümler sunmaktadır. Dolayısıyla çoklu ilişkisel yapıda olan gizli kalmış değerli bir bilgiyi bu algoritmaları kullanarak elde etmek mümkün olmamak tadır. Bu çalışma kapsamında ilişkisel veri tabanları üzerinde çoklu ilişkisel yapıdaki ortak kuralları bulmayı sağlayan bir uygulama geliştirilmiştir. Uygu lama altyapısı olarak ilişkisel veri tabanlarındaki desenleri tanımlayabilen, bu de senleri eklerle geliştirebilen ve bu desenlerin çeşitli ölçmeleri için gerekli sayımları veri tabanından temel yetilerle alan bir yapı kullanılmıştır. Bu altyapı, veri tabanının tanımında yer alan bilgileri kullanarak arama alanının daraltılmasını sağlamıştır. Bu çalışma, Apriori algoritmasını arama alanını daha da küçültmekiçin kullanarak ve altyapı tarafından desteklenmeyen özyinelemeli desenlerin bulunmasını sağlayarak altyapıya yenilikler getirmiştir. Apriori algoritması her tablo üzerinde sık karşılaşılan desenleri bulmak için kullanılmış ve bu algoritmanın gerekli destek değerini bulma yöntemi değiştirilmiştir. Veri tabanındaki özyinelemeli ilişkileri belirlemek için bir yöntem sunulmuş ve uygulama bu durumlar için tablo kısaltmalarının kullanıldığı bir çözüm sağlamıştır. Veri tabam alanlarında saklanan sürekli değerleri bölümleyebilmek için eşit derinlik yöntemi kullanılmıştır. Uygulama bir veri madenciliği yarışması olan KDD Cup 2001'den alman örnek bir genlerde yer tahmini problemi ile test edilmiş ve ortaya çıkan sonuçlar yarışmayı kazanan yaklaşımın sonuçlarıyla karşılaştırılmıştır.

Özet (Çeviri)

ABSTRACT DATA MINING FOR RULE DISCOVERY IN RELATIONAL DATABASES Toprak, Serkan M.Sc, Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Ferda N. Alpaslan September 2004, 53 pages Data is mostly stored in relational databases today. However, most data mining algorithms are not capable of working on data stored in relational databases directly. Instead they require a preprocessing step for transforming relational data into algorithm specified form. Moreover, several data mining algorithms provide solutions for single relations only. Therefore, valuable hidden knowledge involving multiple relations remains undiscovered. In this thesis, an implemen tation is developed for discovering multi-relational association rules in relational databases. The implementation is based on a framework providing a repre sentation of patterns in relational databases, refinement methods of patterns, and primitives for obtaining necessary record counts from database to calculate measures for patterns. The framework exploits meta-data of relational databases for pruning search space of patterns. The implementation extends the frame work by employing Apriori algorithm for further pruning the search space and discovering relational recursive patterns. Apriori algorithm is used for finding large itemsets of tables, which are used to refine patterns. Apriori algorithm IVis modified by changing support calculation method for itemsets. A method for determining recursive relations is described and a solution is provided for handling recursive patterns using aliases. Additionally, continuous attributes of tables are discretized utilizing equal-depth partitioning. The implementation is tested with gene localization prediction task of KDD Cup 2001 and results are compared to those of the winner approach.

Benzer Tezler

  1. An ILP-based concept discovery system for multi-relational data mining

    Çok ilişkili veri madenciliği için tümevaran mantıksal programlama tabanlı konsept tanımlama sistemi

    YUSUF KAVURUCU

    Doktora

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. PINAR ŞENKUL

  2. A new hybrid multi-relational data mining technique

    Yeni bir melez çok ilişkili veri madenciliği tekniği

    SEDA DAĞLAR TOPRAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2005

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İSMAİL HAKKI TOROSLU

  3. A knowledge discovery approach to urban analysis the Beyoğlu preservation area as a data mine

    Kent analizinde bir bilgi keşfi yaklaşımı bir veri madeni olarak Beyoğlu kentsel koruma alanı

    AHU SÖKMENOĞLU SOHTORİK

    Doktora

    İngilizce

    İngilizce

    2016

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. GÜLEN ÇAĞDAŞ

    PROF. DR. İKBAL SEVİL SARIYILDIZ

  4. Veri tabanından bilgi tabanına geçişte bulanık bir araç

    A Fuzzy tod for extracting knowledge-base from database

    CEM TUTAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2000

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    DOÇ.DR. GAZANFER ÜNAL

  5. Efficient parallel frequency mining based on a novel top-down partitioning scheme for transactional data

    Yeni bir işlem verisi parçalama şeması tabanlı etkin paralel frekans tarama

    ERAY ÖZKURAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. CEVDET AYKANAT