Fuzzy Neighborhood GMDBSCAN using Representative points
Temsilci nokta kullanımı ile bulanık komşuluk ızgara tabanlı çok-yoğunluklu dbscan
- Tez No: 444747
- Danışmanlar: YRD. DOÇ. DR. OĞUZ ALTUN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 64
Özet
Kümeleme işleme veri madenciliğinde önemli işlemlerden biridir. Çok bilinen algoritmalardan biri Gürültülü Uygulamanın Yoğunluk Temelli Uzamsal Kümelemesi (DBSCAN) algoritmasıdır. Bu, yoğunluk bazlı komşu kümelerini belirlemek için komşuluk fonksiyonu kullanan bir algoritmadır. Davranışı iki veri nesnesi arasındaki uzaklığı ölçmeye yerayan uzaklık fonksiyonuna bağlıdır. Bu algoritma bulanık kümeleme verisetindeki bir noktanın diğer tüm noktalar ile bir üyelik derecesi tutmasına izin veren bir bulanık komşuluk fonksiyonu kullanır. Bulanık kümelemede komşuluk kümesi çevresindeki veri nesnelerinin katkısına bağlıdır. Bu çalışmada DBSCAN algoritmasının hızı ile bulanık kümelemenin doğruluğunu birleştiren bir algoritma öneriyoruz. FNGMDBSCAN-UR algoritması temsilci noktalar kullanan bulanık komşuluk ızgara bazlı çok yoğunluklu bir DBSCAN algoritmasıdır. Veri setini küçük networklere ayırmak için ızgara bazlı bir komşuluk kullanır. Kümeler için çekirdek noktalar ve komşuluk kümeleri oluşturmak için bulanık komşuluk fonksiyonu kullanır. Algoritmayı hızlandırmak için veri setinden temsilci noktalar kullanır. Veri seti ikiye bölünür: Birinci kısım önkümeleme için kullanılır. Bu kısmın veri setini temsil edebilmesi ve iyi yayılmış olması gerekir. İkinci kısım kümeleme işlemi sonunda önişleme ve kümeleri birleştirme için kullanılır. FNGMDBSCAN-UR algoritmasının iç içe şekiller ve çok yoğunluklu verileri kümelemede DBSCAN algoritmasından daha başarılı olduğu gözlemlenmiştir.
Özet (Çeviri)
Clustering process is considered as one of the important parts in data mining. One of the famous algorithms is Density-Based spatial Clustering of Application with Noise (DBSCAN). It is a density-based clustering algorithm that uses a crisp neighborhood function to calculate the neighbor sets. Its behavior depends on distance function between two data objects. Fuzzy clustering uses a fuzzy neighborhood function that allows a node in the dataset to have a membership degree at each point in the dataset. The neighborset for a node in fuzzy clustering depends on the contribution of the data objects around it. In this work, we propose a new algorithm that combines the speed of DBSCAN with the accuracy of fuzzy clustering. The algorithm is a fuzzy neighborhood grid-based multi-density DBSCAN using representative points. It uses grid-based neighborhood to separate the dataset to small nets. It uses fuzzy neighborhood function to create neighborhood sets and core points for clusters. Also to speed up the algorithm we use representative points from the data set. We divide the dataset into two parts: We use the first part for pre-clustering. It must be well scattered and present the shape of the dataset. The second part is used for preprocessing and merging the clusters by the end of the clustering process. It is noticeable that FNGMDBSCAN-UR is more accurate than crisp DBSCAN with nested shapes and multi-dense datasets.
Benzer Tezler
- Genelleştirilmiş fuzzy komşuluk sistemlerinin bazı özellikleri
Some properties of generalized fuzzy neighbourhood systems
EDA YAZAR KOÇYİĞİT
- Construction and analysis of clustering algorithms based on fuzzy relations and their applications to EEG data
Bulanık ilişkilere dayalı kümeleme algoritmalarının oluşturulması ve analizi ve EEG verilerine uygulamaları
GÖZDE ULUTAGAY
- Usage of fuzzy logic based data mining methods in analysis of public transportation data
Toplu ulaşım verilerinin analizinde bulanık mantığa dayalı veri madenciliği yöntemlerinin kullanımı
AHMET CAN DİKER
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. EFENDİ NASİBOĞLU