Improving collective classification by incorporating directed links, feature enrichment and classifier combination
Yönlü bağlantılar, öznitelik zenginleştirme ve sınıflandırıcı birleştirme ıle kolektif sınıflandırma başarımının iyileştirilmesi
- Tez No: 353805
- Danışmanlar: DOÇ. DR. ZEHRA ÇATALTEPE
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 202
Özet
Bu çalışmada, ağ bilgisi olan veri kümelerinde sınıflandırma başarımının arttırılması amacıyla bir dizi çalışma gerçekleştirilmiştir. Öncelikle çizge özellikleri ve çizge özellikleri arasındaki ilişkiler irdelenmiştir. Bu kapsamda literatürde yer alan çizge özelliklerine ek olarak, eğitim kümesindeki komşuların ortalama homofilisi ve başarımı gibi yeni çizge özellikleri de kullanılmıştır. Çizge özelliklerinin birbirleri ile ilişkileri görselleştirilmiş ve aralarındaki korelasyonlar hesaplanmıştır. Sonrasında içerik ve bağlantılar için ayrı sınıflandırıcıların eğitilmesi ve genetik algoritma tabanlı bir seçme algoritması ile bu heterojen sınıflandırıcıların birleştirilmesine yönelik yeni bir algoritma tanıtılmıştır. Tanıtılan bu yeni yöntem ile kullanılan bütün veri kümelerinde en iyi baz sınıflandırıcının başarımından daha yüksek başarım elde edilmiştir. Bundan sonra kolektif sınıflandırmada yön bilgisinin kullanılmasının sınıflandırıcı başarımı üzerine etkisi araştırılmıştır. Yön bilgisinin kullanılması ile özellikle ilişkisel sınıflandırıcının başarımında ciddi bir artış kaydedilmiştir, ayrıca kolektif sınıflandırma başarımında da bir miktar artış görülmüştür. Ardından kolektif sınıflandırma için farklı nitelik zenginleştirme ve seçme yöntemleri araştırılmıştır. Zenginleştirilmiş niteliklerle gerçekleştirilen sınıflandırmada elde edilen başarımın, orijinal özniteliklerle gerçekleştirilen içerik sınıflandırma ve kolektif sınıflandırma ile elde edilen başarımdan çok daha yüksek olduğu gösterilmiştir. Son olarak da sınıf homofilileri heterojen, çoklu sınıflı veri kümeleri üzerinde bire-karşı-hepsi metodunun kolektif sınıflandırmada kullanılabilmesi için yeni bir algoritma tanıtılmıştır. Bire-karşı-hepsi sınıflandırma ile elde edilen sonuçların hem içerik sınıflandırıcısında hem de kolektif sınıflandırmada elde edilen sonuçlardan daha iyi olduğu gösterilmiştir.
Özet (Çeviri)
In this study, with the purpose of improving test classification accuracy, a number of different directions for collective classification are investigated. First of all, graph properties and their correlations are investigated. Not only the graph properties existing in the literature are used, but also some new graph properties such the average homophily and classifier accuracy on the training set neighbors of a node. Visualization of these properties with respect to each other and correlations between graph properties are presented. Next, a new method for training separate classifiers for content and link views and combining these heterogeneous classifiers with a genetic algorithm based selection algorithm, is introduced. The experiments on the datasets used show that the proposed method outperforms best of the base classifiers. Next, the effect of using link direction information on collective classification performance is explored. It has been shown that by using directed graphs, significant performance increase is obtained when link only classifier is used. This useful information also results in better accuracies for collective classification. Different feature enrichment and selection methods for collective classification are also investigated. Experimental results on three different network datasets show that classification accuracies obtained using network enriched and selected features are comparable or better than content only or collective classification. At last, a new algorithm for utilization of one against all collective classification for multi-class datasets with heterogeneous class homophilies is introduced. Experimental results show that one-against-all content only and collective classification is better than single classifier content only and collective classification.
Benzer Tezler
- Makine öğrenme problemlerinde konveks olmayan optimizasyon modellerinin iki konveks fonksiyonunun farkı ve ikinci derece konik progromlama ile modellenmesi
Difference of convex functions programming and second-order conic programming modelling of non-convex optimization problems in machine learning
DUYGU ÜÇÜNCÜ
Doktora
Türkçe
2024
MatematikYıldız Teknik ÜniversitesiMatematik Ana Bilim Dalı
PROF. DR. ERDAL GÜL
PROF. DR. SÜREYYA AKYÜZ
- Eğitimsel veri madenciliği ve bir uygulaması
Educational data mining and an application
YASEMİN YAKUPOĞLU
Yüksek Lisans
Türkçe
2018
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. BAŞAR ÖZTAYŞİ
- Humanitarian assistance policies of the European Union towards syrian refugees in Turkey
Avrupa Birliği'nin Türkiye'deki Suriyeli mültecilere yönelik insani yardım politikaları
CANSU ÇELİKER
Yüksek Lisans
İngilizce
2018
Siyasal BilimlerOrta Doğu Teknik ÜniversitesiSiyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı
DOÇ. DR. BAŞAK KALE LACK
- Orta düzey yöneticilerin beş faktör kişilik özelliklerinin iş sağlığı ve güvenliği açısından belirlenmesi
Determining the five factor personality characteristics of mid-level managers in terms of occupational health and safety
CİHAN İMRE
Yüksek Lisans
Türkçe
2018
Çalışma Ekonomisi ve Endüstri İlişkileriİstanbul Gedik Üniversitesiİş Sağlığı ve Güvenliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA MERAL
- İş ve Sosyal Güvenlik Hukuku bakımından dijital platform çalışanlarının hukuki statüsü
Legal status of digital platform workers in terms of Labour and Social Security Law
HAZAL TOLU YILMAZ