Geri Dön

Modeling interestingness of streaming association rules as a benefit maximizing classification problem

Akan ilişkisel kuralların ilginçliğini fayda maksimizasyonu tabanlı bir sınıflandırma problemi olarak modelleme

  1. Tez No: 246611
  2. Yazar: TOLGA AYDIN
  3. Danışmanlar: PROF. DR. HALİL ALTAY GÜVENİR
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 111

Özet

Market sepet verisinden ilişkisel kural öğrenme gibi tipik bir uygulamada, sabit bir zaman dilimi için toplanan işlemler kümesi kural öğrenme algoritmalarına girdi olarak kullanılır. Örneğin, yaygın olarak bilinen Apriori algoritması böyle bir işlem kümesinden ilişkisel kural kümesi öğrenmek üzere uygulanabilir. Ancak, işlemler kümesinden ilişkisel kurallar öğrenme işlemi bir kerelik bir işlem değildir. Örneğin, herhangi bir market yöneticisi her ay bir kez, son bir ay süresince toplanan işlemler kümesi üzerinde ilişkisel kural öğrenme işlemini gerçekleştirebilir. Bu nedenden dolayı, işlem kümelerinin sisteme akan paketler şeklinde girdi olduğu bir problemi ele alacağız. İşlemler kümeleri değişiklik gösteren büyüklükte ve zaman dilimlerinde sisteme gelebilir. Herhangi bir işlemler kümesi sisteme vardığında, ilişkisel kural öğrenme algoritması bu son işlemler kümesi üzerinde çalıştırılarak yeni ilişkisel kurallar öğrenilir. Bu yüzden, öğrenilen ilişkisel kurallar kümesi zaman içinde gitgide büyümekte ve bunların içinden ilginç olanlarının elde edilmesi uzmanlar için pratik bir işlem olmaktan çıkmaktadır. Bu kurallar dizisinden“ilişkisel kural kümesi akımı”veya“akan ilişkisel kurallar”olarak bahsedebiliriz ve bu araştırmamızın ardındaki ana motivasyon, ilginç kural seçme probleminin üstesinden gelebilecek bir teknik geliştirmektir. Başarılı bir ilişkisel kural madenciliği sistemi ilginç kuralları seçerek konunun uzmanlarına sunabilmelidir. Ancak, belli bir alanda ilişkisel kuralların ilginçliğinin tanımı uzmandan uzmana ve hatta aynı uzman için zaman içinde farklılık gösterebilir. Bu tezde, akan ilişkisel kuralların ilginçlik konsepti tanımı için kişisel bir model öğrenmek üzere sonradan-işlemli bir metod önermekteyiz. Önerilen metodun eşsizliği ilişkisel kuralların ilginçlik kavramını fayda maksimizasyonu tabanlı bir sınıflandırma problemi olarak formüle edebilme ve her bir kullanıcı için farklı bir ilginçlik modeli elde edebilme yeteneğidir. Bu yeni sınıflandırma planında, belirleyici öznitelikler ilişkisel kuralların ilginçliği ile alakalı seçici nesnel ilginçlik faktörleridir ve hedef öznitelik adı geçen kuralların ilginçlik etiketinden oluşmaktadır. Önerilen metod artımlı bir şekilde çalışarak belli bir seviyede kullanıcı etkileşimi içermektedir. Metod gerçek bir market veri kümesi üzerinde değerlendirilmekte ve sonuçlar modelin ilginç kuralları başarılı bir biçimde seçebildiğini göstermektedir.

Özet (Çeviri)

In a typical application of association rule learning from market basket data, a set of transactions for a fixed period of time is used as input to rule learning algorithms. For example, the well-known Apriori algorithm can be applied to learn a set of association rules from such a transaction set. However, learning association rules from a set of transactions is not a one-time only process. For example, a market manager may perform the association rule learning process once every month over the set of transactions collected through the previous month. For this reason, we will consider the problem where transaction sets are input to the system as a stream of packages. The sets of transactions may come in varying sizes and in varying periods. Once a set of transactions arrive, the association rule learning algorithm is run on the last set of transactions, resulting in a new set of association rules. Therefore, the set of association rules learned will accumulate and increase in number over time, making the mining of interesting ones out of this enlarging set of association rules impractical for human experts. We refer to this sequence of rules as“association rule set stream”or“streaming association rules”and the main motivation behind this research is to develop a technique to overcome the interesting rule selection problem. A successful association rule mining system should select and present only the interesting rules to the domain experts. However, definition of interestingness of association rules on a given domain usually differs from one expert to the other and also over time for a given expert. In this thesis, we propose a post-processing method to learn a subjective model for the interestingness concept description of the streaming association rules. The uniqueness of the proposed method is its ability to formulate the interestingness issue of association rules as a benefit-maximizing classification problem and obtain a different interestingness model for each user. In this new classification scheme, the determining features are the selective objective interestingness factors, including the rule's content itself, related to the interestingness of the association rules; and the target feature is the interestingness label of those rules. The proposed method works incrementally and employs user interactivity at a certain level. It is evaluated on a real market dataset. The results show that the model can successfully select the interesting ones.

Benzer Tezler

  1. İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti

    Anomaly detection with machine learning on air conditioning systems

    REFİK KİBAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK

    DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR

  2. Analysis and applications of data mining algorithms

    Veri madenciliği algoritmalarının analizi ve uygulanması

    NESLİHAN DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    İşletmeBoğaziçi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. ZUHAL TANRIKULU

  3. Modeling of tunnel form buildings by equivalent frame method

    Başlık çevirisi yok

    NASEİM GHUNEİM

    Yüksek Lisans

    İngilizce

    İngilizce

    1999

    İnşaat MühendisliğiOrta Doğu Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. ERGİN ATIMTAY

  4. Modeling of Akarşen (Murgul-Artvin) volcanogenic massive sulfide deposit

    Akarşen (Murgul-Artvin) volkanojenik masif sülfit yatağının modellenmesi

    ASLI HARMANLI

    Yüksek Lisans

    İngilizce

    İngilizce

    1999

    Jeoloji MühendisliğiOrta Doğu Teknik Üniversitesi

    Jeoloji Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NİLGÜN GÜLEÇ

  5. Modeling and simulation of the TÜRKSAT 1B satellite using artificial neural networks

    Yapay sinir ağları kullanılarak TÜRKSAT 1B uydusunun yörüngesinin modellenmesi

    ALİ TÜRKER KUTAY

    Yüksek Lisans

    İngilizce

    İngilizce

    1999

    Uçak MühendisliğiOrta Doğu Teknik Üniversitesi

    Havacılık Mühendisliği Ana Bilim Dalı

    PROF. DR. YURDANUR TULUNAY