Geri Dön

New heuristics for performance improvement of ilp-based concept discovery systems

Tümevaran mantık programlama tabanlı sistemler için zaman performansını iyileştirme amaçlı yeni sezgizel yöntemler

  1. Tez No: 416633
  2. Yazar: ABDULLAH DOĞAN
  3. Danışmanlar: DOÇ. DR. PINAR KARAGÖZ, YRD. DOÇ. ALEV MUTLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 75

Özet

Günlük hayatta çok miktarda değerli bilgi ilişkisel veri tabanlarında tutulmaktadır. Çok fazla bilginin toplanması, ilişkisel veri tabanlarında değerli modellerin bulunmasını teşvik etmektedir. Tümevaran mantık programlama tabanlı keşif sistemlerinde, çoklu tablolarda tutulan arkaplan bilgisi ve hedef örnekleri kullanılarak hipotezler üretilir. Bu çoklu tablolardaki çoklu argümanlar hipotez üretirken geniş arama alanlarına dolayısıyla hesaplama verimliliği problemlerine sebep olurlar. Bu tezde, Apriori tabanlı özelleştirme operatörü kullanan ve ilişkisel tablolar üzerinde çalışan keşif sistemleri üzerinde yoğunlaştık. Bu sistemlerdeki zaman verimliliği veritabanı yönetim sisteminde çalışan sorgu sayısı ile doğru orantılıdır. Bu sorgular genellikle arama alanında oluşan aday kavram kurallarının kapsam ve doğruluk hesaplama sorgularıdır. Bu sistemdeki çalışan sorguları azaltarak zaman verimliliğini arttırmayı amaçlıyoruz. Özellikle hipotez üretilmesi sırasında Apriori-tabanlı özelleştirme kullanan Kavram Kural Tümevarım Sistemi (CRIS) üzerinde çalıştık. Geliştirdiğimiz yöntemler CRIS ile aynı sonuçları üretmektedir. Dolayısıyla doğruluğu olumsuz etkilemeden verimliliği arttırmaktadır. İlk metodda kavram tanımlayıcılarını destek ölçütü kapsama kümelerini kullanarak budadık. Bu kümeler CRIS'te tablolama desteği için kullanılmaktadır. Metodumuzda varolan bu kümeleri, arama alanında da budama gerçekleştirecek şekilde kullandık. İkinci budama metodunda, ön işleme olarak tabloların tüm niteliklerinin kosinüs benzerliği matrisi oluşturduk. Kavram tanımlayıcılarının özelleştirmesi aşamasında kosinüs matrisini kullanarak arama alanında budama yaptık. Son olarak bir tümevaran mantık programramı olan CRIS'in bir NoSQL sistemi olan MongoDB ve NewSQL sistemi olan VoltDB'yi depolama alanı olarak kullanabilirliğini araştırdık.

Özet (Çeviri)

A large amount of the valuable data in daily life is stored in relational databases. The accumulation of so much information motivates the need for extracting valuable patterns in relational databases. Background knowledge and a set of target examples that are stored in multiple tables are used to produce hypothesis for ILP-based concept discovery systems. Multiple arguments on these multiple tables end up large search spaces while building the hypothesis that arise computational efficiency problems. In this thesis we focus on concept discovery systems that use Apriori-based specialization operator and work directly on relational tables. Time efficiency of these ILP systems is directly proportional to the number of queries running on DBMS. These queries mostly involve support and confidence calculation queries of candidate concept rules generated on the search space. We aim to increase time efficiency by reducing the number of running queries on these systems. Particularly, we worked on Concept Rule Induction System (CRIS), which uses Apriori-based specialization in hypothesis construction. The methods we propose generate the same solutions as in CRIS. Therefore, we improve the efficiency without affecting the accuracy negatively. In the first method, we prune the concept descriptors using support coverage sets. These sets are stored for memoization support of CRIS. We use the existing sets in our proposed method so that they are also used for pruning the search space. In the second pruning method, we build cosine similarity matrix of attributes of each predicate in pre-processing step. During the specialization of concept descriptors, we prune the search space by utilizing this similarity matrix. Finally we examine the applicability of using NoSQL system MongoDB and a NewSQL system VoltDB as a storage for ILP system CRIS.

Benzer Tezler

  1. Takım çalışması esaslı demontaj hattı işgören atama ve dengeleme problemi için oyun teorisi odaklı yaklaşımlar

    Game theory-oriented approaches for multi-manned disassembly line worker assignment and balancing problem

    YILDIZ KÖSE

    Doktora

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. EMRE ÇEVİKCAN

    DR. ÖĞR. ÜYESİ SİNAN ERTEMEL

  2. Adaptive equivalent consumption minimization strategy with driving pattern recognition for hybrid electric vehicles

    Hibrit elektrikli araçlar için sürüş tanıma ile uyarlanabilir eşdeğer yakıt tüketimi minimizasyonu stratejisi

    BARIŞ KALAYCI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VOLKAN SEZER

  3. Perakende endüstrisinde raf alanı yönetimine veri madenciliği esaslı analitik bir yaklaşım

    An analytic approach based on data mining to shelf space management in retail industry

    TUNCAY ÖZCAN

    Doktora

    Türkçe

    Türkçe

    2011

    Endüstri ve Endüstri Mühendisliğiİstanbul Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞAKİR ESNAF

  4. Bir montaj hattının yeniden tasarımı ve tavşan kovalama yönteminin uygulaması

    Redesign of an assembly line and application of rabit chasing assembly method

    MEHMET TAYFUN DİKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET BÜLENT DURMUŞOĞLU

  5. A new approach to generating non-permutation schedules for flowshops with missing operations

    Eksik operasyonlar içeren akış tipi çizelgeleme problemlerinde permütasyon tipi olmayan iş sıralarının oluşturulmasında yeni bir yaklaşım

    METİN TABALU

    Yüksek Lisans

    İngilizce

    İngilizce

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖMER KIRCA