Geri Dön

Karma veriler üzerinde etkin kümeleme algoritmalarının geliştirilmesi

Development of effective clustering algorithms on mixed data

  1. Tez No: 479796
  2. Yazar: ELVIN NASIBOV
  3. Danışmanlar: DOÇ. DR. BURAK ORDİN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 118

Özet

Veri madenciliği yöntemlerinden biri olan Kümeleme Analizi, verilerin özelliklerini göz önüne alarak, birbirleri ile benzer olan verileri alt kümelere ayırmayı sağlayan çok boyutlu veri analiz yöntemidir. Kümeleme analizi yöntemleri, kümelenecek verilerin boyutu, ortamı ve özellikle de türüne göre çeşitlilik göstermektedir. Kümeleme analizinde kullanılan veri setleri, çeşitli yöntemlerle toplanan verilerin özelliklerini içermektedir. Toplanan veriler hesaplanabilir nümerik değerlerle beraber, üzerinde matemetiksel işlemlerin kısıtlı yapılabildiği kategorik özellikler de içermektedir. Bu tezde, hem nümerik, hem kategorik veriler içeren veri setleri için kümeleme algoritmaları ve onların geliştirilmiş versiyonları incelenmiştir. Literatürde yer alan algoritmaların lokal minimumlarda iyi sonuçlar vermesine karşılık global çözümler için yeterli olmaması nedeniyle, kümeleme analizi probleminin global çözümü için artımlı ve karma veriler ile çalışan yeni bir algoritma önerilmiştir. Önerilen artımlı yöntem C# dilinde MS SQL Server Veri Tabanı Yönetim Sistemi imkanları kullanılarak programlanıp, 16 gerçek veri seti üzerinde hesaplama denemeleri yapılmıştır. Önerilen algoritma k-Prototypes algoritması ile kıyaslandığında yöntemin yararlılığı açıkça gösterilmiştir.

Özet (Çeviri)

The Clustering Analysis is one of the main techniques of data mining and it is also the method of analysis of multidimensional databases which divides the data set into clusters based on the similarity of data points. Clustering analysis methods vary according to the size, environment and especially the type of data to be aggregated. Data sets used in the clustering analysis contain the characteristics of data gathering and giving in various ways collected data features include computable numerical values as well as categorical attributes on which mathematical operations can be restricted. In this thesis, exact clustering algorithms for data sets containing both numerical and categorical data and their improved versions are investigated. Since existing algorithms provide good results at local minimums but are not sufficient for global solutions, a new algorithm for global solution of cluster analysis problem, working with incremental and mixed data, has been proposed. The proposed incremental method is programmed in C# language using MS SQL Server Database Management System facilities and calculation experiments are performed on 16 real data sets. The proposed algorithm clearly shows the usefulness of the method when compared to the k-Prototypes algorithm.

Benzer Tezler

  1. Core network anomaly detection using the LSTM model and comparison with various unsupervised learning methods

    Telekomünikasyon merkezi şebekelerinde LSTM model ile anomali tespiti ve bazı denetimsiz öğrenme metotları ile kıyaslanması

    SAMED ÇALIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Büyük Veri ve İş Analitiği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN

  2. Developing a crime analysis simulator using machine learning methods

    Makine öğrenme yöntemlerini kullanarak bir suç analizi simülatörünün geliştirilmesi

    MEHMET SAİT VURAL

    Doktora

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik MühendisliğiÇukurova Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA GÖK

  3. Anomaly detection scenarios in cyber-physical systems

    Siber-fiziksel sistemlerde anomali tespit senaryoları

    AYŞE SAYIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. MEHMET TAHİR SANDIKKAYA

  4. Comperative evaluation of unsupervised fraud detection algorithms with feature extraction and scaling in purchasing domain

    Satın alma alanında özellik çıkarma ve ölçekleme ile denetimsiz sahtekarlık tespit algoritmalarının karşılaştırmalı değerlendirmesi

    YİĞİT CAN TAŞOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Veri Analitiği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN

  5. Bilgi merkezi hizmetlerinin kullanıcılar tarafından kullanım tepki durumlarının veri madenciliği yaklaşımı ile incelenmesi

    Examination of user response states to information center services using a data mining approach

    ENGİN DAYAN

    Doktora

    Türkçe

    Türkçe

    2025

    Dokümantasyon ve EnformasyonVan Yüzüncü Yıl Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. MAHMUT KARA