New heuristics for performance improvement of ilp-based concept discovery systems

Tümevaran mantık programlama tabanlı sistemler için zaman performansını iyileştirme amaçlı yeni sezgizel yöntemler

PDF İndir

Tez No: 416633
Yazar: ABDULLAH DOĞAN
Danışmanlar: DOÇ. DR. PINAR KARAGÖZ, YRD. DOÇ. ALEV MUTLU
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2015
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 75

Özet

Günlük hayatta çok miktarda değerli bilgi ilişkisel veri tabanlarında tutulmaktadır. Çok fazla bilginin toplanması, ilişkisel veri tabanlarında değerli modellerin bulunmasını teşvik etmektedir. Tümevaran mantık programlama tabanlı keşif sistemlerinde, çoklu tablolarda tutulan arkaplan bilgisi ve hedef örnekleri kullanılarak hipotezler üretilir. Bu çoklu tablolardaki çoklu argümanlar hipotez üretirken geniş arama alanlarına dolayısıyla hesaplama verimliliği problemlerine sebep olurlar. Bu tezde, Apriori tabanlı özelleştirme operatörü kullanan ve ilişkisel tablolar üzerinde çalışan keşif sistemleri üzerinde yoğunlaştık. Bu sistemlerdeki zaman verimliliği veritabanı yönetim sisteminde çalışan sorgu sayısı ile doğru orantılıdır. Bu sorgular genellikle arama alanında oluşan aday kavram kurallarının kapsam ve doğruluk hesaplama sorgularıdır. Bu sistemdeki çalışan sorguları azaltarak zaman verimliliğini arttırmayı amaçlıyoruz. Özellikle hipotez üretilmesi sırasında Apriori-tabanlı özelleştirme kullanan Kavram Kural Tümevarım Sistemi (CRIS) üzerinde çalıştık. Geliştirdiğimiz yöntemler CRIS ile aynı sonuçları üretmektedir. Dolayısıyla doğruluğu olumsuz etkilemeden verimliliği arttırmaktadır. İlk metodda kavram tanımlayıcılarını destek ölçütü kapsama kümelerini kullanarak budadık. Bu kümeler CRIS'te tablolama desteği için kullanılmaktadır. Metodumuzda varolan bu kümeleri, arama alanında da budama gerçekleştirecek şekilde kullandık. İkinci budama metodunda, ön işleme olarak tabloların tüm niteliklerinin kosinüs benzerliği matrisi oluşturduk. Kavram tanımlayıcılarının özelleştirmesi aşamasında kosinüs matrisini kullanarak arama alanında budama yaptık. Son olarak bir tümevaran mantık programramı olan CRIS'in bir NoSQL sistemi olan MongoDB ve NewSQL sistemi olan VoltDB'yi depolama alanı olarak kullanabilirliğini araştırdık.

Özet (Çeviri)

A large amount of the valuable data in daily life is stored in relational databases. The accumulation of so much information motivates the need for extracting valuable patterns in relational databases. Background knowledge and a set of target examples that are stored in multiple tables are used to produce hypothesis for ILP-based concept discovery systems. Multiple arguments on these multiple tables end up large search spaces while building the hypothesis that arise computational efficiency problems. In this thesis we focus on concept discovery systems that use Apriori-based specialization operator and work directly on relational tables. Time efficiency of these ILP systems is directly proportional to the number of queries running on DBMS. These queries mostly involve support and confidence calculation queries of candidate concept rules generated on the search space. We aim to increase time efficiency by reducing the number of running queries on these systems. Particularly, we worked on Concept Rule Induction System (CRIS), which uses Apriori-based specialization in hypothesis construction. The methods we propose generate the same solutions as in CRIS. Therefore, we improve the efficiency without affecting the accuracy negatively. In the first method, we prune the concept descriptors using support coverage sets. These sets are stored for memoization support of CRIS. We use the existing sets in our proposed method so that they are also used for pruning the search space. In the second pruning method, we build cosine similarity matrix of attributes of each predicate in pre-processing step. During the specialization of concept descriptors, we prune the search space by utilizing this similarity matrix. Finally we examine the applicability of using NoSQL system MongoDB and a NewSQL system VoltDB as a storage for ILP system CRIS.

Benzer Tezler

Tez No
855505
Takım çalışması esaslı demontaj hattı işgören atama ve dengeleme problemi için oyun teorisi odaklı yaklaşımlar
Game theory-oriented approaches for multi-manned disassembly line worker assignment and balancing problem
YILDIZ KÖSE
Doktora
Türkçe
2023
Endüstri ve Endüstri Mühendisliği İstanbul Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
PROF. DR. EMRE ÇEVİKCAN
DR. ÖĞR. ÜYESİ SİNAN ERTEMEL
Tez No
676401
Adaptive equivalent consumption minimization strategy with driving pattern recognition for hybrid electric vehicles
Hibrit elektrikli araçlar için sürüş tanıma ile uyarlanabilir eşdeğer yakıt tüketimi minimizasyonu stratejisi
BARIŞ KALAYCI
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Mekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. VOLKAN SEZER
Tez No
305336
Perakende endüstrisinde raf alanı yönetimine veri madenciliği esaslı analitik bir yaklaşım
An analytic approach based on data mining to shelf space management in retail industry
TUNCAY ÖZCAN
Doktora
Türkçe
2011
Endüstri ve Endüstri Mühendisliği İstanbul Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ŞAKİR ESNAF
Tez No
418950
Bir montaj hattının yeniden tasarımı ve tavşan kovalama yönteminin uygulaması
Redesign of an assembly line and application of rabit chasing assembly method
MEHMET TAYFUN DİKER
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri Mühendisliği İstanbul Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET BÜLENT DURMUŞOĞLU
Tez No
199181
A new approach to generating non-permutation schedules for flowshops with missing operations
Eksik operasyonlar içeren akış tipi çizelgeleme problemlerinde permütasyon tipi olmayan iş sıralarının oluşturulmasında yeni bir yaklaşım
METİN TABALU
Yüksek Lisans
İngilizce
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ÖMER KIRCA

Geri Dön