Geri Dön

Çok değişkenli verilerin modele dayalı kümeleme analizinde kümeleme etkinliğinin arttırılması

Improving effectiveness of clustering on model-based cluster analysis of multivariate data

  1. Tez No: 499520
  2. Yazar: SERKAN AKOĞUL
  3. Danışmanlar: DOÇ. DR. MURAT ERİŞOĞLU
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Selçuk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 89

Özet

Doğal küme yapısı bilinmeyen veri setlerinin kümelenmesinde modele dayalı kümeleme analizi yaygın olarak kullanılmaktadır. Modele dayalı kümeleme, veri setini oluşturan kümelerin (bileşenlerin) her birinin tek ya da çok değişkenli dağılımlar ile modellenmesidir. Model tabanlı kümeleme analizinde en önemli problemlerden birisi de küme sayısının belirlenmesidir. Bu tez çalışmasında, çok değişkenli verilerin modele dayalı kümeleme analizinde kümeleme etkinliğinin arttırılması için yeni yaklaşımlar önerilmiştir. Bu amaçla birinci bölümde kümeleme analizi hakkında ön bilgi ve kaynak araştırmasına değinilmiştir. İkinci bölümde modele dayalı kümeleme hakkında temel tanım ve kavramlardan bahsedilmiştir. Ayrıca çok değişkenli normal dağılımların karmasına dayalı kümelemede, küme sayısının belirlenmesinde yaygın olarak kullanılan bilgi kriterlerinin etkinlikleri karşılaştırılmıştır. Üçüncü bölümde çok değişkenli normal dağılımların karmasına dayalı kümeleme analizinde, çok kriterli karar verme (ÇKKV) yöntemleri ile küme sayısının belirlenmesi için yeni bir yaklaşım önerilmiştir. Dördüncü bölümde Eliptik Gamma Dağılımını (EGD) temel alan karma kümeleme yaklaşımı ortaya konulmuştur. Son bölümde ise sonuçlar ve öneriler tartışılmıştır.

Özet (Çeviri)

Model-based clustering analysis is commonly used in clustering multivariate data whose natural cluster structure is unknown. Model-based clustering is the modeling of each of the clusters (components) that create the data with univariate or multivariate distributions. One of the most important problems in model-based clustering analysis is to determine the number of clusters. In this thesis study, new approaches are proposed to improve the effectiveness of clustering on model-based cluster analysis of multivariate data. For this purpose, in the first section, preliminary information and resource research about clustering analysis are mentioned. In the second section, basic definitions and concepts about model-based clustering are presented. In addition, the effectiveness of commonly used information criteria in determining the number of clusters in the clustering, based on the mixture of the multivariate normal distributions is compared. In the third section, a new approach is proposed to determine the number of clusters with multiple-criteria decision making (MCDM) methods in clustering analysis based on the mixture of multivariate normal distributions. In the fourth section, a mixture clustering approach based on Elliptical Gamma Distribution (EGD) is presented. In the last part, the results and suggestions are discussed.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  3. Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators

    Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi

    MAHMUT SAMİ SİVRİ

    Doktora

    İngilizce

    İngilizce

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALP ÜSTÜNDAĞ

  4. Coğrafi bilgi sistemleri entegreli makine öğrenmesine dayalı toplu taşınmaz değerleme modelinin geliştirilmesi

    Development of mass property valuation model based on geographic information systems integrated machine learning methods

    MUHAMMED OĞUZHAN METE

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. TAHSİN YOMRALIOĞLU

  5. Koyun-keçi vebası virus (PPRV; peste des petits ruminants virus) enfeksiyonuna etki eden risk faktörlerinin mekânsal analiz yöntemleri ile belirlenmesi

    Determination of risk factors affecting peste des petits ruminants virus (PPRV) infection by spatial analysis methods

    TUBA BAYİR

    Doktora

    Türkçe

    Türkçe

    2022

    BiyoistatistikAnkara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. İSMAYİL SAFA GÜRCAN