Geri Dön

Yüksek ortalama-faydalı örüntü madenciliği için yeni tekniklerin geliştirilmesi

Developing new techniques for high average-utility itemset mining

  1. Tez No: 608366
  2. Yazar: İRFAN YILDIRIM
  3. Danışmanlar: DOÇ. DR. METE ÇELİK
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Erciyes Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 142

Özet

Büyük veri kümeleri içindeki yüksek ortalama-faydalı örüntü (YOFÖ)'lerin doğru ve eksiksiz bir şekilde keşfedilmesi sürecine yüksek ortalama-faydalı örüntü madenciliği (YOFÖM) problemi denilmektedir. YOFÖM, arama uzayının genişliğinden dolayı çözülmesi zor ve karmaşık bir problemdir. Literatürde, çeşitli üst-limit modelleri, arama uzayı budama stratejileri ve veri yapıları gibi farklı teknikler kullanan YOFÖM yöntemleri bulunmaktadır. Ancak var olan YOFÖM yöntemleri yürütme zamanı ve bellek ihtiyacı açısından oldukça maliyetlidirler ve veri kümesinin hacminin artmasına bağlı olarak ölçeklenebilir değillerdir. Ayrıca, veri kümelerinin sadece pozitif faydalı ögeler içerebileceği varsayıma göre tasarlanmışlardır. Hâlbuki birçok gerçek dünya veri kümesi aynı zamanda negatif faydalı ögeler de içermektedir. Bu tez çalışmasında, YOFÖM probleminin etkili bir şekilde çözülmesi için çeşitli teknikler kullanan üç farklı yöntem geliştirilmiştir. Geliştirilen her yöntem farklı tipteki YOFÖM probleminin daha etkili çözülmesi için tasarlanmıştır. Geliştirilen ilk yöntem, klasik YOFÖM probleminin daha etkili bir şekilde çözülmesi için dört yeni üst-limit modeli, dört yeni budama stratejisi, iki yeni veri yapısı ve bir algoritma (YOFL-Büyüme) önermektedir. Geliştirilen ikinci yöntem, negatif faydalı YOFÖM probleminin daha etkili bir şekilde çözülmesi için bir yeni üst-limit modeli, üç yeni budama stratejisi, bir yeni veri yapısı ve bir algoritma (NYOFÖ-Keşif) önermektedir. Geliştirilen üçüncü yöntem, artırımlı YOFÖM problemindeki aday örüntülerin daha etkili bir şekilde bulunması için bir yeni veri yapısı ve bir algoritma (HAYOFÖM) önermektedir. Önerilen yöntemlerin başarımlarını değerlendirmek için sentetik ve gerçek veri kümeleri kullanılarak çeşitli deneyler yapılmıştır. Deneysel sonuçlar, önerilen yöntemlerin literatürdeki benzerlerine göre daha etkili bir şekilde çalıştıklarını göstermiştir. Bu tez çalışmasında, YOFÖM probleminin etkili bir şekilde çözülmesi için çeşitli teknikler kullanan üç farklı yöntem geliştirilmiştir. Geliştirilen her yöntem farklı tipteki YOFÖM probleminin daha etkili çözülmesi için tasarlanmıştır. Geliştirilen ilk yöntem, klasik YOFÖM probleminin daha etkili bir şekilde çözülmesi için dört yeni üst-limit modeli, dört yeni budama stratejisi, iki yeni veri yapısı ve bir algoritma (YOFL-Büyüme) önermektedir. Geliştirilen ikinci yöntem, negatif faydalı YOFÖM probleminin daha etkili bir şekilde çözülmesi için bir yeni üst-limit modeli, üç yeni budama stratejisi, bir yeni veri yapısı ve bir algoritma (NYOFÖ-Keşif) önermektedir. Geliştirilen üçüncü yöntem, artırımlı YOFÖM problemindeki aday örüntülerin daha etkili bir şekilde bulunması için yeni bir veri yapısı ve bir algoritma (HAYOFÖM) önermektedir. Önerilen yöntemlerin başarımlarını değerlendirmek için sentetik ve gerçek veri kümeleri kullanılarak çeşitli deneyler yapılmıştır. Deneysel sonuçlar, önerilen yöntemlerin literatürdeki benzerlerine göre daha etkili bir şekilde çalıştıklarını göstermiştir.

Özet (Çeviri)

The process of discovering the complete and correct set of high-average utility itemsets (HAUIs) in large datasets is called the high average-utility itemsets mining (HAUIM) problem. HAUIM is a complex and difficult problem to solve since its search space is large. In the literature, there are several HAUIM methods that use different techniques such as various upper-bound models, search space pruning strategies, and data structures. However, the existing HAUIM methods are very costly in terms of execution time and memory and are not scalable based on increase in the volume of datasets. Besides, they are designed based on the assumption that datasets can only contain items with positive utilities. But many real-world datasets also contain items with negative utilities. In this thesis, three different methods have been developed which use various techniques in order to solve HAUIM problem effectively. Each method is designed to solve different types of HAUIM problems more effectively. The first method proposes four new upper-bound models, four new pruning strategies, two new data structures, and an algorithm (HAUL-Growth) to solve the classical HAUIM problem more effectively. The second method proposes a new upper-bound model, three new pruning strategies, a new data structure, and an algorithm (MHAUIPNU) to solve HAUIM problem with negative utilities more effectively. The third method proposes a new data structure and an algorithm (FIMHAUI) in order to find out the candidate patterns in the incremental HAUIM problem more effectively. In order to evaluate the performance of the proposed methods, various experiments were conducted using synthetic and real datasets. Experimental results showed that the proposed methods work more effectively than their counterparts in the literature.

Benzer Tezler

  1. Negatif faydaya sahip veri kümelerinde yüksek ortalama faydalı örüntü madenciliği için tekniklerin geliştirilmesi

    Developing techniques for high average utility pattern mining in datasets with negative utility

    AYŞE ERDOĞMUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. METE ÇELİK

    DR. ÖĞR. ÜYESİ İRFAN YILDIRIM

  2. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  3. Kümeleme yöntemleri ile müşteri kanal göçü analizi

    Customer channel migration analysis with clustering methods

    GİZEM ÇALIŞKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET YASİN ULUKUŞ

  4. District-based urban sprawl monitoring and modelling using CA-Markov model: application in two mega cities

    İlçe bazlı kentsel yayılma izleme ve CA-Markov model ile modelleme: iki mega şehirde uygulama

    ANALI AZABDAFTARI

    Doktora

    İngilizce

    İngilizce

    2022

    İletişim Bilimleriİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. AYŞE FİLİZ SUNAR

  5. Investigation of effect of novel technologies' implementation to future internal combustion engines

    Yeni teknolojilerin geleceğin içten yanmalı motorlarına uyarlanmasının etkilerinin incelenmesi

    ANIL ALAGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Enerjiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HİKMET ARSLAN