Geri Dön

Fast and efficient frequent itemset detection by a novel clustering method

Yeni bir kümeleme metodu ile hızlı ve etkili şekilde sık rastlanan öğe seti bulunması

  1. Tez No: 292753
  2. Yazar: HÜSEYİN ARIK
  3. Danışmanlar: YRD. DOÇ. DR. SELİM NECDET MİMAROĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Veri Madenciliği, Kümeleme, Sık Rastlanan Öğe Kümeleri Tespiti, Birleşme Kuralları Madenciliği, İkili Değer Metotları, Data Mining, Clustering, Frequent Item Set Detection, Association Rule Mining, BinaryMethods
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 95

Özet

Veritabanı ve depolama teknolojilerindeki ilerlemeler firmaları ve kurumları kısa zaman içerisinde büyük miktarlarda veri depolamasına olanak sağlar hale getirmiştir. Saklanan bu veri kümelerinin içerisinden şirket ve kurumlara faydalı olacak bilgiye ulaşmak için kullanılacak tekniklerin geleneksel veri analizi metotlarından ileri durumda olması gerekmektedir. Bu yüzden geleneksel veri analizi metotlarının ilerletilerek etkinlik ve performans penceresinden bakıldığında çok daha ileri olan teknikler geliştirilmeye çalışılmıştır. Veri kümelerinin ele alınarak bu kümelerden bilgiyi ortaya çıkarma çalışmalarından birini sık rastlanan öğe kümesi tespiti konusu oluşturmaktadır. Sık rastlanan öğe kümeleri tespiti pazarlama, satış, telekomünikasyon, tıp, biyoloji ve mühendislik alanlarındaki pek çok uygulamada karşılaşılan bir problemdir. Uygulama içeriğine bağlı olarak bir öğe ölçü, ürün, servis vb. olabilir. Birbirinden farklı n adet öğe içeren bir veri kümesi, 2^n adet sık rastlanan öğe kümesine sahiptir. Bu nedenle tüm sık rastlanan öğe kümelerini bulmak üssel zaman karmaşıklığı içeren karmaşık bir bilgi sistemi oluşturur. Bu çalışmada, bir veri kümesi içerisinde sık rastlanan öğe kümelerinin önemli bir kısmının hızlı bir şekilde bulunması için yeni bir algoritma tanıtmaktayız. Bu metot sık rastlanan öğe kümelerini tespit etmek için tasarlanmış yeni bir kümeleme algoritmasıdır. Sık rastlanan öğe kümeleri tespiti için kümeleme yapmanın iki avantajı vardır. İlki, zaman karmaşıklığını azaltarak oldukça kısa bir sürede sonuçlarının elde edilmesidir. ikincisi ise birbirine benzer sık rastlanan öğe kümeleri elde etmektir. Karmaşık bilgi sistemi içerisinde sık rastlanan öğe kümelerinin üretilmesi çok uzun zaman alması ve gereğinden fazla sık rastlanan öğe kümelerinin bulunması nedeniyle bu avantajların her ikisi de çok önemlidir.

Özet (Çeviri)

Advancements in database and storage technology have enabled the enterprises collect large amounts of data in a short amount of time. Methods and techniques for obtaining information from very large data sets should be more advanced compared to the traditional data analysis techniques. Frequent item set detection is one of these subjects which deals with very large data sets and reveals useful information for enterprises. Frequent item set detection is an important problem having numerous applications in marketing, sales, telecommunication, medicine, biology, and engineering. Depending on the application context, an item may be a measurement, good, service etc., and a data set with n distinct items can have 2^n frequent item sets. Therefore, finding all the frequent item sets constitutes a complex information system with exponential time complexity. This thesis presents a novel algorithm for quickly finding preponderant part of the frequent item sets in a data set, which is a new clustering algorithm designed for detecting frequent item sets. Advantages of clustering for frequent item set detection are twofold. First one is to produce results in considerably short amount of time by reducing the time complexity. Second advantage is to obtain frequent item sets that are similar to each other. Both of these advantages are vital, since in a complex information system generating all the frequent item sets takes a lot of time and there are many redundant frequent item sets.

Benzer Tezler

  1. Data distribution and performance optimization models for parallel data mining

    Koşut veri madenciliği için veri dağıtımı ve başarım optimizasyon modelleri

    ERAY ÖZKURAL

    Doktora

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. CEVDET AYKANAT

  2. Bilgisayar destekli modellemede çözüm ağı üretimi ve düzgünleştirme teknikleri

    Mesh generation and smoothing tecniques in computer aided modelling

    KEMAL EBİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ.DR. AHMET ARSLAN

  3. Portföy yönetiminde dinamik varlık yönetim stratejileri

    Dynamic asset allocation strategies in portfolio management

    MUSTAFA DUMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2000

    BankacılıkMarmara Üniversitesi

    Sermaye Piyasası ve Borsa Ana Bilim Dalı

    YRD. DOÇ. DR. ÖZLEM KOÇ

  4. Düşük Reynolds sayılı aerodinamik analizde girdap kafes ve panel yöntemlerinin karşılaştırılması

    The comparison of vortex lattice and panel methods in low Reynolds number aerodynamic analysis

    MEHMET MURAT AKÇAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Havacılık ve Uzay MühendisliğiEskişehir Osmangazi Üniversitesi

    Havacılık Bilimi ve Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÇİSİL TİMURALP

    DR. ÖĞR. ÜYESİ ZAFER ÖZNALBANT

  5. Kurumların ürettiği konumsal verilerin coğrafi bilgi sistemleri organizasyonu ile en uygun biçimde kullanımı

    The optimum use of the spatial data produced by the institutions using geographical information systems

    BURCU ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET SITKI KÜLÜR