Geri Dön

Improving collective classification by incorporating directed links, feature enrichment and classifier combination

Yönlü bağlantılar, öznitelik zenginleştirme ve sınıflandırıcı birleştirme ıle kolektif sınıflandırma başarımının iyileştirilmesi

  1. Tez No: 353805
  2. Yazar: ABDULLAH SÖNMEZ
  3. Danışmanlar: DOÇ. DR. ZEHRA ÇATALTEPE
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 202

Özet

Bu çalışmada, ağ bilgisi olan veri kümelerinde sınıflandırma başarımının arttırılması amacıyla bir dizi çalışma gerçekleştirilmiştir. Öncelikle çizge özellikleri ve çizge özellikleri arasındaki ilişkiler irdelenmiştir. Bu kapsamda literatürde yer alan çizge özelliklerine ek olarak, eğitim kümesindeki komşuların ortalama homofilisi ve başarımı gibi yeni çizge özellikleri de kullanılmıştır. Çizge özelliklerinin birbirleri ile ilişkileri görselleştirilmiş ve aralarındaki korelasyonlar hesaplanmıştır. Sonrasında içerik ve bağlantılar için ayrı sınıflandırıcıların eğitilmesi ve genetik algoritma tabanlı bir seçme algoritması ile bu heterojen sınıflandırıcıların birleştirilmesine yönelik yeni bir algoritma tanıtılmıştır. Tanıtılan bu yeni yöntem ile kullanılan bütün veri kümelerinde en iyi baz sınıflandırıcının başarımından daha yüksek başarım elde edilmiştir. Bundan sonra kolektif sınıflandırmada yön bilgisinin kullanılmasının sınıflandırıcı başarımı üzerine etkisi araştırılmıştır. Yön bilgisinin kullanılması ile özellikle ilişkisel sınıflandırıcının başarımında ciddi bir artış kaydedilmiştir, ayrıca kolektif sınıflandırma başarımında da bir miktar artış görülmüştür. Ardından kolektif sınıflandırma için farklı nitelik zenginleştirme ve seçme yöntemleri araştırılmıştır. Zenginleştirilmiş niteliklerle gerçekleştirilen sınıflandırmada elde edilen başarımın, orijinal özniteliklerle gerçekleştirilen içerik sınıflandırma ve kolektif sınıflandırma ile elde edilen başarımdan çok daha yüksek olduğu gösterilmiştir. Son olarak da sınıf homofilileri heterojen, çoklu sınıflı veri kümeleri üzerinde bire-karşı-hepsi metodunun kolektif sınıflandırmada kullanılabilmesi için yeni bir algoritma tanıtılmıştır. Bire-karşı-hepsi sınıflandırma ile elde edilen sonuçların hem içerik sınıflandırıcısında hem de kolektif sınıflandırmada elde edilen sonuçlardan daha iyi olduğu gösterilmiştir.

Özet (Çeviri)

In this study, with the purpose of improving test classification accuracy, a number of different directions for collective classification are investigated. First of all, graph properties and their correlations are investigated. Not only the graph properties existing in the literature are used, but also some new graph properties such the average homophily and classifier accuracy on the training set neighbors of a node. Visualization of these properties with respect to each other and correlations between graph properties are presented. Next, a new method for training separate classifiers for content and link views and combining these heterogeneous classifiers with a genetic algorithm based selection algorithm, is introduced. The experiments on the datasets used show that the proposed method outperforms best of the base classifiers. Next, the effect of using link direction information on collective classification performance is explored. It has been shown that by using directed graphs, significant performance increase is obtained when link only classifier is used. This useful information also results in better accuracies for collective classification. Different feature enrichment and selection methods for collective classification are also investigated. Experimental results on three different network datasets show that classification accuracies obtained using network enriched and selected features are comparable or better than content only or collective classification. At last, a new algorithm for utilization of one against all collective classification for multi-class datasets with heterogeneous class homophilies is introduced. Experimental results show that one-against-all content only and collective classification is better than single classifier content only and collective classification.

Benzer Tezler

  1. Sample selection for engagement-related EEG recordings

    Odaklanmayla ilgili EEG kayıtlarından örnek seçimi

    MUSTAFA TURAN ARSLAN

    Doktora

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAdana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ESEN YILDIRIM

  2. Kolektif öğrenmede alt küme bölümlendirmesine yenilikçi bir yaklaşım

    An innovative approach to subset partitioning in ensemble learning

    MEERIM KUBATOVA

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AYDIN ÇETİN

  3. Makine öğrenme problemlerinde konveks olmayan optimizasyon modellerinin iki konveks fonksiyonunun farkı ve ikinci derece konik progromlama ile modellenmesi

    Difference of convex functions programming and second-order conic programming modelling of non-convex optimization problems in machine learning

    DUYGU ÜÇÜNCÜ

    Doktora

    Türkçe

    Türkçe

    2024

    MatematikYıldız Teknik Üniversitesi

    Matematik Ana Bilim Dalı

    PROF. DR. ERDAL GÜL

    PROF. DR. SÜREYYA AKYÜZ

  4. Döngüsel ekonomi bağlamında yağmur suyu hasadı pratiklerinin kentsel açık alanlardaki performansının ölçülmesi

    Measuring the performance of rainwater harvesting practices in urban open spaces within the context of circular economy

    ŞAZİYE LOFCALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Peyzaj Mimarlığıİstanbul Teknik Üniversitesi

    Peyzaj Mimarlığı Ana Bilim Dalı

    PROF. DR. HAYRİYE EŞBAH TUNÇAY

  5. Eğitimsel veri madenciliği ve bir uygulaması

    Educational data mining and an application

    YASEMİN YAKUPOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAŞAR ÖZTAYŞİ