Geri Dön

Graph based concept discovery for multi relational data mining

Çok ilişkili veri madenciliği için çizge tabanlı konsept tanımlama

  1. Tez No: 386948
  2. Yazar: MAHMUT İĞDE
  3. Danışmanlar: YRD. DOÇ. DR. YUSUF KAVURUCU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Deniz Harp Okulu Komutanlığı
  10. Enstitü: Deniz Bilimleri ve Mühendisliği Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 75

Özet

Teknolojinin ve özellikle de bilgisayarın hayatın her alanına girmesi ile birlikte birçok alanda verilerin depolanması ihtiyacı ortaya çıkmıştır. Bu ihtiyaç verilerin kullanışlı şekilde depolandığı veritabanı kavramının doğmasına yol açmıştır. Veritabanında veriler aralarındaki ilişkiye göre mantıksal olarak dosya/dosyalar halinde bir araya getirilmiştir. Hastaneler, labaratuvarlar, bankalar, sanal alışveriş siteleri veritabanlarından faydalanılan yerlere birkaç örnek olarak gösterilebilir. Önemli hususlardan birisi de verileri kullanışlı ve eksiksiz bir şekilde tutan veritabanlarından bilginin çıkarılmasıdır. Bu süreç veri madenciliği olarak adlandırılır. Veri madenciliğinin ana hedefi veritaban(lar)ında depolanan muazzam ve ilk bakıldığında anlamsız veri topluluğundan üstü kapalı ve yararlı bilginin çıkarılmasıdır. Çok ilişkili veritabanları verilerin birden fazla tabloda (ilişkide) gösterildiği veritabanlarıdır. Bu tablolar arasındaki ilişkiler veri tabanında ayrıca tablo (ilişki) olarak tutulur. Daha etkili ve yaygın bilinen Çok İlişkili Veri Madenciliği (ÇİVM) yaklaşımı Tümevaran Mantıksal Programlama (TMP) üzerine kurulmuştur. TMP tümevaran öğrenme ve mantıksal programlama konseptlerini içermektedir. Bu açıdan bakıldığında, ÇİVM'nin asıl amacı üstü kapalı ve az önemli görünen bilginin TMP yaklaşım ve teknikleri kullanılarak ilşkisel veritabanlarından ortaya çıkarılmasıdır. Çizge tabanlı yaklaşım veritabanlarında bilgi keşfi için diğer bir metottur. Bu yaklaşımda veriler çizge yapısında tutulur ve çizge madenciliği teknikleri ile bilgi keşfi yapılır. vi Çok ilişkili veri madencilinde Konsept tanımlamanın hedefi ilişki hedef ilişki olarak adlandırılan, bir ilişkiyi ifade eden ilişkisel kuralların geri plan bilgisi olarak adlandırılan veritabanındaki diğer ilişkiler açısından tanımlanmasıdır. Bu çalışmada konsept tanımlama için çizge tabanlı konsept tanımlama metodu anlatılmıştır. Ortaya konulan metod, Ç-KTS(Çizge tabanlı Konsept tanımlama Sistemi), hem altyapı tabanlı hem de yol bulma tabanlı yaklaşımları kullanmakta olduğundan hibrid metod olarak kabul edilebilir. Ç-KTS başlangıçta ilişkisel bir veritabanında tutulan her bir hedef ilişki ve onunla bağlantılı arka plan gerçekleri için bağımsız çizge yapıları oluşturur ve bir özet çizge oluştururken onlardan faydalanır. Özet çizge yapısı konsept tanımlayıcıları bulma amaçlı taranır. Farklı öğrenme problemlerine ait veri setleri üzerinde birkaç set deney yapılmıştır. Deney sonuçları Ç-KTS nin farklı öğrenme problemlerine ait hedef ilişkilerin tanımlamalarını öğrenebilmekte yeterli olduğunu göstermiştir.

Özet (Çeviri)

Developments in technology, especially in computer science created the need of storing data in variety of areas. This need created the term database where the data is stored in a useful form. In the database data is logically integrated in a file/files according to relations among them. Hospitals, laboratories, banks, online shopping sites are just a few examples where databases are necessarily used. One of the important issue is to extract knowledge from these databases that hold data in a useful and complete form. This process is called as data mining. The main objective of data mining is to extract implicit and useful knowledge from huge and at first glance meaningless mass of data that is stored in database(s). Multi-Relational databases are the ones in which the data is stored in multiple tables (relations). The relationships between those tables are also stored as tables (relations) in the database. The more effective and commonly known approach for Multi-Relational Data Mining (MRDM) techniques are based on Inductive Logic Programming (ILP). ILP contains concepts from Inductive Learning and Logic Programming. From this point, the main purpose of MRDM is extracting implicit and trivial knowledge from relational database(s) using ILP approaches and techniques. Graph based approach is another method for knowledge discovery in databases. In this approach, data is stored in graph structures and graph mining techniques used for viii knowledge discovery. Concept discovery in multi-relational data mining aims to find relational rules that best describe a relation, called target relation, in terms of other relations in the database, called background knowledge. In this study, a graph-based concept discovery method for concept discovery is presented. The proposed method, namely G-CDS (Graph-based Concept Discovery System), utilizes methods both from substructure-based and path-finding based approaches, hence it can be considered as a hybrid method. G-CDS generates disconnected graph structures for each target relation and its related background knowledge, which are initially stored in a relational database, and utilizes them to guide generation of a summary graph. The summary graph is traversed to find concept descriptors. A set of experiments is conducted on datasets that belong to different learning problems. The experimental results show that G-CDS is capable of learning definitions of target relations that belong to different learning problems.

Benzer Tezler

  1. Head Output Connected ilişkiler için çizge tabanlı bir kavram keşif sistemi

    A graph based concept discovery system for Head Output Connected relations

    NURAN PEKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ALEV MUTLU

  2. Çizge veritabanlarında kavram keşfi

    Concept discovery in graph databases

    FURKAN GÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ALEV MUTLU

  3. Aktivite bazlı kalite maliyetleme sistemi

    Activity based quality costs system

    BEYTULLAH ÖMER MUTLUGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    İşletmeİstanbul Üniversitesi

    YRD. DOÇ. DR. NECDET ÖZÇAKAR

  4. A novel method for detection and analysis in a network of overlappable communities

    Başlık çevirisi yok

    BASHAR TUAMA

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Polimer Bilim ve TeknolojisiAltınbaş Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULLAHİ IBRAHİM

  5. Improving the efficiency of ILP-based and graph-based concept discovery systems

    Çizge tabanlı kavram keşfi sistemlerinin verimliliğinin artırılması

    NAZMİYE CEREN ABAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR KARAGÖZ