Graph based concept discovery for multi relational data mining
Çok ilişkili veri madenciliği için çizge tabanlı konsept tanımlama
- Tez No: 386948
- Danışmanlar: YRD. DOÇ. DR. YUSUF KAVURUCU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Deniz Harp Okulu Komutanlığı
- Enstitü: Deniz Bilimleri ve Mühendisliği Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 75
Özet
Teknolojinin ve özellikle de bilgisayarın hayatın her alanına girmesi ile birlikte birçok alanda verilerin depolanması ihtiyacı ortaya çıkmıştır. Bu ihtiyaç verilerin kullanışlı şekilde depolandığı veritabanı kavramının doğmasına yol açmıştır. Veritabanında veriler aralarındaki ilişkiye göre mantıksal olarak dosya/dosyalar halinde bir araya getirilmiştir. Hastaneler, labaratuvarlar, bankalar, sanal alışveriş siteleri veritabanlarından faydalanılan yerlere birkaç örnek olarak gösterilebilir. Önemli hususlardan birisi de verileri kullanışlı ve eksiksiz bir şekilde tutan veritabanlarından bilginin çıkarılmasıdır. Bu süreç veri madenciliği olarak adlandırılır. Veri madenciliğinin ana hedefi veritaban(lar)ında depolanan muazzam ve ilk bakıldığında anlamsız veri topluluğundan üstü kapalı ve yararlı bilginin çıkarılmasıdır. Çok ilişkili veritabanları verilerin birden fazla tabloda (ilişkide) gösterildiği veritabanlarıdır. Bu tablolar arasındaki ilişkiler veri tabanında ayrıca tablo (ilişki) olarak tutulur. Daha etkili ve yaygın bilinen Çok İlişkili Veri Madenciliği (ÇİVM) yaklaşımı Tümevaran Mantıksal Programlama (TMP) üzerine kurulmuştur. TMP tümevaran öğrenme ve mantıksal programlama konseptlerini içermektedir. Bu açıdan bakıldığında, ÇİVM'nin asıl amacı üstü kapalı ve az önemli görünen bilginin TMP yaklaşım ve teknikleri kullanılarak ilşkisel veritabanlarından ortaya çıkarılmasıdır. Çizge tabanlı yaklaşım veritabanlarında bilgi keşfi için diğer bir metottur. Bu yaklaşımda veriler çizge yapısında tutulur ve çizge madenciliği teknikleri ile bilgi keşfi yapılır. vi Çok ilişkili veri madencilinde Konsept tanımlamanın hedefi ilişki hedef ilişki olarak adlandırılan, bir ilişkiyi ifade eden ilişkisel kuralların geri plan bilgisi olarak adlandırılan veritabanındaki diğer ilişkiler açısından tanımlanmasıdır. Bu çalışmada konsept tanımlama için çizge tabanlı konsept tanımlama metodu anlatılmıştır. Ortaya konulan metod, Ç-KTS(Çizge tabanlı Konsept tanımlama Sistemi), hem altyapı tabanlı hem de yol bulma tabanlı yaklaşımları kullanmakta olduğundan hibrid metod olarak kabul edilebilir. Ç-KTS başlangıçta ilişkisel bir veritabanında tutulan her bir hedef ilişki ve onunla bağlantılı arka plan gerçekleri için bağımsız çizge yapıları oluşturur ve bir özet çizge oluştururken onlardan faydalanır. Özet çizge yapısı konsept tanımlayıcıları bulma amaçlı taranır. Farklı öğrenme problemlerine ait veri setleri üzerinde birkaç set deney yapılmıştır. Deney sonuçları Ç-KTS nin farklı öğrenme problemlerine ait hedef ilişkilerin tanımlamalarını öğrenebilmekte yeterli olduğunu göstermiştir.
Özet (Çeviri)
Developments in technology, especially in computer science created the need of storing data in variety of areas. This need created the term database where the data is stored in a useful form. In the database data is logically integrated in a file/files according to relations among them. Hospitals, laboratories, banks, online shopping sites are just a few examples where databases are necessarily used. One of the important issue is to extract knowledge from these databases that hold data in a useful and complete form. This process is called as data mining. The main objective of data mining is to extract implicit and useful knowledge from huge and at first glance meaningless mass of data that is stored in database(s). Multi-Relational databases are the ones in which the data is stored in multiple tables (relations). The relationships between those tables are also stored as tables (relations) in the database. The more effective and commonly known approach for Multi-Relational Data Mining (MRDM) techniques are based on Inductive Logic Programming (ILP). ILP contains concepts from Inductive Learning and Logic Programming. From this point, the main purpose of MRDM is extracting implicit and trivial knowledge from relational database(s) using ILP approaches and techniques. Graph based approach is another method for knowledge discovery in databases. In this approach, data is stored in graph structures and graph mining techniques used for viii knowledge discovery. Concept discovery in multi-relational data mining aims to find relational rules that best describe a relation, called target relation, in terms of other relations in the database, called background knowledge. In this study, a graph-based concept discovery method for concept discovery is presented. The proposed method, namely G-CDS (Graph-based Concept Discovery System), utilizes methods both from substructure-based and path-finding based approaches, hence it can be considered as a hybrid method. G-CDS generates disconnected graph structures for each target relation and its related background knowledge, which are initially stored in a relational database, and utilizes them to guide generation of a summary graph. The summary graph is traversed to find concept descriptors. A set of experiments is conducted on datasets that belong to different learning problems. The experimental results show that G-CDS is capable of learning definitions of target relations that belong to different learning problems.
Benzer Tezler
- Head Output Connected ilişkiler için çizge tabanlı bir kavram keşif sistemi
A graph based concept discovery system for Head Output Connected relations
NURAN PEKER
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ALEV MUTLU
- Çizge veritabanlarında kavram keşfi
Concept discovery in graph databases
FURKAN GÖZ
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ALEV MUTLU
- A novel method for detection and analysis in a network of overlappable communities
Başlık çevirisi yok
BASHAR TUAMA
Yüksek Lisans
İngilizce
2022
Polimer Bilim ve TeknolojisiAltınbaş ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ABDULLAHİ IBRAHİM
- Improving the efficiency of ILP-based and graph-based concept discovery systems
Çizge tabanlı kavram keşfi sistemlerinin verimliliğinin artırılması
NAZMİYE CEREN ABAY
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR KARAGÖZ