Özellikleri bağımsız olmayan veri kümeleri için Naive Bayes sınıflandırıcılar
Naive Bayes classifiers for datasets with dependent attributes
- Tez No: 747329
- Danışmanlar: DOÇ. DR. FERKAN YILMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 77
Özet
Naive Bayes (NB) sınıflandırması, yüksek verimliliği ve özelliklerin koşullu bağımsızlığına dayalı yapısal basitliği nedeniyle veri madenciliği ve makine öğreniminde en yaygın kullanılan algoritmalardandır. Çalışmada, özellikler arasındaki bağımlılığı ölçmek için bir bağımlılık metriği sunuyoruz. NB'de daha az belirleyici özellikleri keşfetmek için Nitelik-Nitelik Önemi [Feature-Feature Significance (FFS)] ve Nitelik-Sınıf Önemi [Feature-Class Significance (FCS)] öneriyoruz. FFS ve FCS'den özellik ağırlıklarının nasıl alınacağını gösteriyoruz ve yeni bir Bağımlı Özellik Ağırlıklandırmalı [Dependent Feature Weighting (DFW)] NB öneriyoruz. Performansı daha da artırmak için niteliklerin homojen olmayan bağımlılığı nedeniyle ilgilenilen rastgele örneğin kümelenmesini ve koşullu bağımsızlık varsayımını hafifletmek için özellik ağırlıklandırma kullanılmasını öneriyoruz. Sonuç olarak, rastgele alt örneklerin DFW filtrelerini doğruluklarına göre ağırlıklandırmayı ve performansı arttırmak için birleştirmenin sonucu olarak Küme-tabanlı DFW [Cluster-based DFW (CDFW)] NB öneriyoruz. Deneysel sonuçlar, DFW filtreli NB'nin, geleneksel NB ve diğer özellik ağırlıklandırma tekniklerine göre performansı arttırdığını göstermektedir.
Özet (Çeviri)
Naive Bayes (NB) classification is one of the most extensively used algorithms in data mining and machine learning due to its high efficiency and structural simplicity based on conditional independence of attributes. In this paper, we present a dependence metric to quantify the dependence among attributes and class attributes and propose feature-feature significance (FFS) and feature class significance (FCS) to discover highly predictive attributes over less predictive ones in NB classification. We show how to get feature weights from FFS and FCS and propose a novel dependent feature weighted (DFW) NB classification. To increase performance further, we recommend clustering the random sample of interest due to the non-homogeneous dependence nature of features, and then using feature weighting to alleviate the conditional independence. As a consequence, we propose a cluster-based DFW (CDFW) NB as a result of weighting the DFW filters of random sub-samples by their accuracy and then merging them for performance augmentation. The experimental results show that the NB with DFW filter provides goods results while compared to the conventional NB and all other feature weighting techniques.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Profiling developers to predict vulnerable code changes
Güvenlik açığı kod değişikliklerini öngörmek için geliştiricilerin profilini oluşturma
TUĞÇE COŞKUN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞE TOSUN KÜHN
- Independent task assignment for heterogeneous systems
Heterojen sistemler için bağımsız iş atama
ERTUĞRUL KARTAL TABAK
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. CEVDET AYKANAT
- New proposed methods for synthetic minority over-sampling technique
Sentetik azınlık aşırı örnekleme tekniği için yeni önerilen yöntemler
HAKAN KORUL
Yüksek Lisans
İngilizce
2024
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiVeri Mühendisliği ve İş Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN
- Les applications de régression floue et d'optimisation floue aux problemes de sélection de la technologie
Bulanık regresyon ve bulanık optimizasyonun teknoloji seçimi problemlerine uygulamaları
ZEYNEP YILMAZ
Yüksek Lisans
Fransızca
2005
Endüstri ve Endüstri MühendisliğiGalatasaray ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF.DR. ERTUĞRUL KARSAK