Çok değişkenli verilerin modele dayalı kümeleme analizinde kümeleme etkinliğinin arttırılması
Improving effectiveness of clustering on model-based cluster analysis of multivariate data
- Tez No: 499520
- Danışmanlar: DOÇ. DR. MURAT ERİŞOĞLU
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Selçuk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 89
Özet
Doğal küme yapısı bilinmeyen veri setlerinin kümelenmesinde modele dayalı kümeleme analizi yaygın olarak kullanılmaktadır. Modele dayalı kümeleme, veri setini oluşturan kümelerin (bileşenlerin) her birinin tek ya da çok değişkenli dağılımlar ile modellenmesidir. Model tabanlı kümeleme analizinde en önemli problemlerden birisi de küme sayısının belirlenmesidir. Bu tez çalışmasında, çok değişkenli verilerin modele dayalı kümeleme analizinde kümeleme etkinliğinin arttırılması için yeni yaklaşımlar önerilmiştir. Bu amaçla birinci bölümde kümeleme analizi hakkında ön bilgi ve kaynak araştırmasına değinilmiştir. İkinci bölümde modele dayalı kümeleme hakkında temel tanım ve kavramlardan bahsedilmiştir. Ayrıca çok değişkenli normal dağılımların karmasına dayalı kümelemede, küme sayısının belirlenmesinde yaygın olarak kullanılan bilgi kriterlerinin etkinlikleri karşılaştırılmıştır. Üçüncü bölümde çok değişkenli normal dağılımların karmasına dayalı kümeleme analizinde, çok kriterli karar verme (ÇKKV) yöntemleri ile küme sayısının belirlenmesi için yeni bir yaklaşım önerilmiştir. Dördüncü bölümde Eliptik Gamma Dağılımını (EGD) temel alan karma kümeleme yaklaşımı ortaya konulmuştur. Son bölümde ise sonuçlar ve öneriler tartışılmıştır.
Özet (Çeviri)
Model-based clustering analysis is commonly used in clustering multivariate data whose natural cluster structure is unknown. Model-based clustering is the modeling of each of the clusters (components) that create the data with univariate or multivariate distributions. One of the most important problems in model-based clustering analysis is to determine the number of clusters. In this thesis study, new approaches are proposed to improve the effectiveness of clustering on model-based cluster analysis of multivariate data. For this purpose, in the first section, preliminary information and resource research about clustering analysis are mentioned. In the second section, basic definitions and concepts about model-based clustering are presented. In addition, the effectiveness of commonly used information criteria in determining the number of clusters in the clustering, based on the mixture of the multivariate normal distributions is compared. In the third section, a new approach is proposed to determine the number of clusters with multiple-criteria decision making (MCDM) methods in clustering analysis based on the mixture of multivariate normal distributions. In the fourth section, a mixture clustering approach based on Elliptical Gamma Distribution (EGD) is presented. In the last part, the results and suggestions are discussed.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Derin öğrenme ile cerrahi video anlama
Surgical video understanding with deep learning
ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DUYGU SARIKAYA
- Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators
Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi
MAHMUT SAMİ SİVRİ
Doktora
İngilizce
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Coğrafi bilgi sistemleri entegreli makine öğrenmesine dayalı toplu taşınmaz değerleme modelinin geliştirilmesi
Development of mass property valuation model based on geographic information systems integrated machine learning methods
MUHAMMED OĞUZHAN METE
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. TAHSİN YOMRALIOĞLU
- Koyun-keçi vebası virus (PPRV; peste des petits ruminants virus) enfeksiyonuna etki eden risk faktörlerinin mekânsal analiz yöntemleri ile belirlenmesi
Determination of risk factors affecting peste des petits ruminants virus (PPRV) infection by spatial analysis methods
TUBA BAYİR
Doktora
Türkçe
2022
BiyoistatistikAnkara ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. İSMAYİL SAFA GÜRCAN